pierreguillou's picture
Update README.md
d70fa49 verified

A newer version of the Gradio SDK is available: 6.0.1

Upgrade
metadata
title: Transcrição, Diarização e Conversão MP3
emoji: 🎧
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 4.19.2
app_file: app.py
pinned: false

🎧 Transcrição, Diarização e Conversão de Áudio para MP3

Este aplicativo permite transcrever, identificar diferentes falantes (diarização) e converter qualquer arquivo de áudio para o formato MP3 de alta qualidade. Ideal para transcrever notas de voz do WhatsApp, reuniões, aulas e muito mais.

  • Modelos utilizados:
  • Transcrição: openai/whisper-medium
  • Diarização: pyannote/speaker-diarization-3.1
  • Detecção de Idioma: openai/whisper-tiny

🚀 Como usar o aplicativo

  1. Envie um arquivo de áudio: Você pode carregar arquivos em diversos formatos, como .opus (áudios do WhatsApp), .mp3, .wav, .m4a, entre outros.
  2. Aguarde a detecção do idioma: O aplicativo analisará os primeiros segundos do áudio para detectar o idioma principal. Se preferir, você pode selecionar o idioma manualmente na lista.
  3. Ative ou desative a "Diarização": Marque esta opção se desejar que o aplicativo identifique e separe as falas de cada pessoa ([00:00:01] FALANTE_01: ...).
  4. Clique em "Transcrever": O processo será iniciado. O tempo de processamento pode variar dependendo da duração do seu áudio.
  5. Receba os resultados: Ao final, você terá:
    • A transcrição completa do áudio.
    • A transcrição diarizada (se a opção foi ativada).
    • O áudio original convertido para .mp3, que você pode ouvir diretamente na página ou baixar.
    • Arquivos .txt para download das transcrições.
  6. Clique em "Resetar" para limpar todos os campos e enviar um novo arquivo.