pierreguillou's picture
Update README.md
d70fa49 verified
---
title: Transcrição, Diarização e Conversão MP3
emoji: 🎧
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 4.19.2
app_file: app.py
pinned: false
---
# 🎧 Transcrição, Diarização e Conversão de Áudio para MP3
Este aplicativo permite transcrever, identificar diferentes falantes (diarização) e converter qualquer arquivo de áudio para o formato MP3 de alta qualidade. Ideal para transcrever notas de voz do WhatsApp, reuniões, aulas e muito mais.
* **Modelos utilizados:**
* **Transcrição:** `openai/whisper-medium`
* **Diarização:** `pyannote/speaker-diarization-3.1`
* **Detecção de Idioma:** `openai/whisper-tiny`
## 🚀 Como usar o aplicativo
1. **Envie um arquivo de áudio:** Você pode carregar arquivos em diversos formatos, como `.opus` (áudios do WhatsApp), `.mp3`, `.wav`, `.m4a`, entre outros.
2. **Aguarde a detecção do idioma:** O aplicativo analisará os primeiros segundos do áudio para detectar o idioma principal. Se preferir, você pode selecionar o idioma manualmente na lista.
3. **Ative ou desative a "Diarização":** Marque esta opção se desejar que o aplicativo identifique e separe as falas de cada pessoa (`[00:00:01] FALANTE_01: ...`).
4. **Clique em "Transcrever":** O processo será iniciado. O tempo de processamento pode variar dependendo da duração do seu áudio.
5. **Receba os resultados:** Ao final, você terá:
* A **transcrição completa** do áudio.
* A **transcrição diarizada** (se a opção foi ativada).
* O **áudio original convertido para `.mp3`**, que você pode ouvir diretamente na página ou baixar.
* Arquivos `.txt` para download das transcrições.
6. **Clique em "Resetar"** para limpar todos os campos e enviar um novo arquivo.