alakxender
/

mms-tts-div-ft-spk01-m01

Model card Files Files and versions

alakxender commited on Jun 12

Commit

ba93104

·

verified ·

1 Parent(s): 179c646

Update README.md

Files changed (1) hide show

README.md +5 -5

README.md CHANGED Viewed

@@ -10,11 +10,11 @@ language:
 base_model:
 - facebook/mms-tts-div
 ---
-# 🎙️ Divehi TTS – Male Voice (VITS-based)
 This is a fine-tuned VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) model for Divehi speech synthesis. The model produces Male voice audio from Thaana-scripted Divehi text. Fine-tuned from Meta’s MMS-TTS architecture using a curated dataset of synthetic Divehi speech.
-## 🧠 Model Details
 | Field                 | Value                                           |
 |----------------------|-------------------------------------------------|
@@ -27,7 +27,7 @@ This is a fine-tuned VITS (Variational Inference with adversarial learning for e
 | **Inference Engine** | Transformers (🤗 Hugging Face)                  |
-## 🚀 Usage
 ```python
 from transformers import VitsModel, VitsTokenizer
@@ -43,7 +43,7 @@ waveform = model.generate(**inputs).waveform[0]
 torchaudio.save("output.wav", waveform.unsqueeze(0), 16000)
 ```
-## 📊 Evaluation Summary
 - **Model**: `alakxender/mms-tts-div-ft-spk01-m01`
 - **Evaluated Samples**: 3
@@ -65,7 +65,7 @@ torchaudio.save("output.wav", waveform.unsqueeze(0), 16000)
-## 🙏 Acknowledgements
 - [Meta MMS-TTS](https://github.com/facebookresearch/fairseq/tree/main/examples/mms)
 - [Tarepan's SpeechMOS](https://github.com/Tarepan/SpeechMOS)

 base_model:
 - facebook/mms-tts-div
 ---
+# Divehi TTS – Male Voice (VITS-based)
 This is a fine-tuned VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) model for Divehi speech synthesis. The model produces Male voice audio from Thaana-scripted Divehi text. Fine-tuned from Meta’s MMS-TTS architecture using a curated dataset of synthetic Divehi speech.
+## Model Details
 | Field                 | Value                                           |
 |----------------------|-------------------------------------------------|
 | **Inference Engine** | Transformers (🤗 Hugging Face)                  |
+## Usage
 ```python
 from transformers import VitsModel, VitsTokenizer
 torchaudio.save("output.wav", waveform.unsqueeze(0), 16000)
 ```
+## Evaluation Summary
 - **Model**: `alakxender/mms-tts-div-ft-spk01-m01`
 - **Evaluated Samples**: 3
+## Acknowledgements
 - [Meta MMS-TTS](https://github.com/facebookresearch/fairseq/tree/main/examples/mms)
 - [Tarepan's SpeechMOS](https://github.com/Tarepan/SpeechMOS)