A newer version of the Gradio SDK is available:
6.0.1
metadata
title: Transcrição, Diarização e Conversão MP3
emoji: 🎧
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 4.19.2
app_file: app.py
pinned: false
🎧 Transcrição, Diarização e Conversão de Áudio para MP3
Este aplicativo permite transcrever, identificar diferentes falantes (diarização) e converter qualquer arquivo de áudio para o formato MP3 de alta qualidade. Ideal para transcrever notas de voz do WhatsApp, reuniões, aulas e muito mais.
- Modelos utilizados:
- Transcrição:
openai/whisper-medium - Diarização:
pyannote/speaker-diarization-3.1 - Detecção de Idioma:
openai/whisper-tiny
🚀 Como usar o aplicativo
- Envie um arquivo de áudio: Você pode carregar arquivos em diversos formatos, como
.opus(áudios do WhatsApp),.mp3,.wav,.m4a, entre outros. - Aguarde a detecção do idioma: O aplicativo analisará os primeiros segundos do áudio para detectar o idioma principal. Se preferir, você pode selecionar o idioma manualmente na lista.
- Ative ou desative a "Diarização": Marque esta opção se desejar que o aplicativo identifique e separe as falas de cada pessoa (
[00:00:01] FALANTE_01: ...). - Clique em "Transcrever": O processo será iniciado. O tempo de processamento pode variar dependendo da duração do seu áudio.
- Receba os resultados: Ao final, você terá:
- A transcrição completa do áudio.
- A transcrição diarizada (se a opção foi ativada).
- O áudio original convertido para
.mp3, que você pode ouvir diretamente na página ou baixar. - Arquivos
.txtpara download das transcrições.
- Clique em "Resetar" para limpar todos os campos e enviar um novo arquivo.