|
|
--- |
|
|
title: Transcrição, Diarização e Conversão MP3 |
|
|
emoji: 🎧 |
|
|
colorFrom: blue |
|
|
colorTo: purple |
|
|
sdk: gradio |
|
|
sdk_version: 4.19.2 |
|
|
app_file: app.py |
|
|
pinned: false |
|
|
--- |
|
|
|
|
|
# 🎧 Transcrição, Diarização e Conversão de Áudio para MP3 |
|
|
|
|
|
Este aplicativo permite transcrever, identificar diferentes falantes (diarização) e converter qualquer arquivo de áudio para o formato MP3 de alta qualidade. Ideal para transcrever notas de voz do WhatsApp, reuniões, aulas e muito mais. |
|
|
|
|
|
* **Modelos utilizados:** |
|
|
* **Transcrição:** `openai/whisper-medium` |
|
|
* **Diarização:** `pyannote/speaker-diarization-3.1` |
|
|
* **Detecção de Idioma:** `openai/whisper-tiny` |
|
|
|
|
|
## 🚀 Como usar o aplicativo |
|
|
|
|
|
1. **Envie um arquivo de áudio:** Você pode carregar arquivos em diversos formatos, como `.opus` (áudios do WhatsApp), `.mp3`, `.wav`, `.m4a`, entre outros. |
|
|
2. **Aguarde a detecção do idioma:** O aplicativo analisará os primeiros segundos do áudio para detectar o idioma principal. Se preferir, você pode selecionar o idioma manualmente na lista. |
|
|
3. **Ative ou desative a "Diarização":** Marque esta opção se desejar que o aplicativo identifique e separe as falas de cada pessoa (`[00:00:01] FALANTE_01: ...`). |
|
|
4. **Clique em "Transcrever":** O processo será iniciado. O tempo de processamento pode variar dependendo da duração do seu áudio. |
|
|
5. **Receba os resultados:** Ao final, você terá: |
|
|
* A **transcrição completa** do áudio. |
|
|
* A **transcrição diarizada** (se a opção foi ativada). |
|
|
* O **áudio original convertido para `.mp3`**, que você pode ouvir diretamente na página ou baixar. |
|
|
* Arquivos `.txt` para download das transcrições. |
|
|
6. **Clique em "Resetar"** para limpar todos os campos e enviar um novo arquivo. |