AI & ML interests

None defined yet.

Recent Activity

xuyaya  updated a Space 5 days ago
tdh-asr-tts/README
xuyaya  published a Space 5 days ago
tdh-asr-tts/README
View all activity

🎙️ TDH-ASR-TTS: 语音识别与方言微调项目

欢迎来到 TDH-ASR-TTS 组织。我们致力于通过最前沿的深度学习技术,解决中文多方言环境下的语音识别(ASR)难题。

🎯 项目使命

本项目旨在通过对主流 ASR 模型进行深度微调,提升模型在标准普通话以及特定地区方言(东北、中原、江淮、西南等地方语言)下的识别准确率。我们不仅关注语音到文字的转换,更注重在复杂语境下的语言理解与适配。

🚀 核心模型

本组织目前重点维护基于以下两个基础架构的微调版本:

  1. SenseVoice 微调系列
    • 利用 SenseVoice 强大的多语言处理能力,针对方言场景进行迁移学习。
    • 支持情感识别、音频事件检测等增强功能。
  2. Paraformer (Seaco) 微调系列
    • 基于阿里巴巴达摩院(FunASR)的 Paraformer 架构。
    • 通过定制化微调,显著提升方言环境下的解码速度与实时性。

📂 项目资源

本仓库主要包含以下资源:

  • Checkpoints: 训练过程中各阶段的模型权重,方便开发者直接部署或继续训练。
  • Datasets: 针对方言微调精心整理的训练数据集(包括音频与标注文本)。
  • Tools: 用于方言数据预处理、模型评估的辅助脚本。

🛠️ 如何开始

你可以通过我们的模型列表找到对应的权重,配合 FunASR 或其他推理框架进行使用。

# 示例:拉取本项目中的微调模型
git lfs install
git clone https://huggingface.co/tdh-asr-tts/sensevoice-finetuned

models 0

None public yet

datasets 0

None public yet