AI & ML interests
None defined yet.
Recent Activity
Organization Card
🎙️ TDH-ASR-TTS: 语音识别与方言微调项目
欢迎来到 TDH-ASR-TTS 组织。我们致力于通过最前沿的深度学习技术,解决中文多方言环境下的语音识别(ASR)难题。
🎯 项目使命
本项目旨在通过对主流 ASR 模型进行深度微调,提升模型在标准普通话以及特定地区方言(东北、中原、江淮、西南等地方语言)下的识别准确率。我们不仅关注语音到文字的转换,更注重在复杂语境下的语言理解与适配。
🚀 核心模型
本组织目前重点维护基于以下两个基础架构的微调版本:
- SenseVoice 微调系列:
- 利用 SenseVoice 强大的多语言处理能力,针对方言场景进行迁移学习。
- 支持情感识别、音频事件检测等增强功能。
- Paraformer (Seaco) 微调系列:
- 基于阿里巴巴达摩院(FunASR)的 Paraformer 架构。
- 通过定制化微调,显著提升方言环境下的解码速度与实时性。
📂 项目资源
本仓库主要包含以下资源:
- Checkpoints: 训练过程中各阶段的模型权重,方便开发者直接部署或继续训练。
- Datasets: 针对方言微调精心整理的训练数据集(包括音频与标注文本)。
- Tools: 用于方言数据预处理、模型评估的辅助脚本。
🛠️ 如何开始
你可以通过我们的模型列表找到对应的权重,配合 FunASR 或其他推理框架进行使用。
# 示例:拉取本项目中的微调模型
git lfs install
git clone https://huggingface.co/tdh-asr-tts/sensevoice-finetuned
models
0
None public yet
datasets
0
None public yet