transcricao_diarizacao_conversao_mp3

Sleeping

App Files Files Community

transcricao_diarizacao_conversao_mp3 / README.md

pierreguillou

Update README.md

d70fa49 verified 3 months ago

preview code

raw

history blame contribute delete

1.77 kB

	---
	title: Transcrição, Diarização e Conversão MP3
	emoji: 🎧
	colorFrom: blue
	colorTo: purple
	sdk: gradio
	sdk_version: 4.19.2
	app_file: app.py
	pinned: false
	---

	# 🎧 Transcrição, Diarização e Conversão de Áudio para MP3

	Este aplicativo permite transcrever, identificar diferentes falantes (diarização) e converter qualquer arquivo de áudio para o formato MP3 de alta qualidade. Ideal para transcrever notas de voz do WhatsApp, reuniões, aulas e muito mais.

	* Modelos utilizados:
	* Transcrição: `openai/whisper-medium`
	* Diarização: `pyannote/speaker-diarization-3.1`
	* Detecção de Idioma: `openai/whisper-tiny`

	## 🚀 Como usar o aplicativo

	1. Envie um arquivo de áudio: Você pode carregar arquivos em diversos formatos, como `.opus` (áudios do WhatsApp), `.mp3`, `.wav`, `.m4a`, entre outros.
	2. Aguarde a detecção do idioma: O aplicativo analisará os primeiros segundos do áudio para detectar o idioma principal. Se preferir, você pode selecionar o idioma manualmente na lista.
	3. Ative ou desative a "Diarização": Marque esta opção se desejar que o aplicativo identifique e separe as falas de cada pessoa (`[00:00:01] FALANTE_01: ...`).
	4. Clique em "Transcrever": O processo será iniciado. O tempo de processamento pode variar dependendo da duração do seu áudio.
	5. Receba os resultados: Ao final, você terá:
	* A transcrição completa do áudio.
	* A transcrição diarizada (se a opção foi ativada).
	* O áudio original convertido para `.mp3`, que você pode ouvir diretamente na página ou baixar.
	* Arquivos `.txt` para download das transcrições.
	6. Clique em "Resetar" para limpar todos os campos e enviar um novo arquivo.