Skip to content

沪语(上海话)ASR(语音识别)模型

Notifications You must be signed in to change notification settings

Cosmos-Break/asr

Folders and files

NameName
Last commit message
Last commit date

Latest commit

May 13, 2024
dca6aaa · May 13, 2024

History

61 Commits
Sep 6, 2022
Sep 6, 2022
Sep 6, 2022
Sep 6, 2022
Sep 9, 2022
Sep 13, 2022
Sep 6, 2022
Sep 2, 2022
Nov 9, 2022
May 13, 2024
May 13, 2024
Sep 6, 2022
Aug 24, 2022
Sep 13, 2023
Aug 31, 2022
Sep 6, 2022
Aug 26, 2022
Aug 26, 2022
Sep 2, 2022
Sep 9, 2022
Sep 13, 2023
Sep 9, 2022
Sep 13, 2023
Sep 2, 2022

Repository files navigation

使用的工具库

Huggingface的transformers和huggingsound。

沪语ASR模型

包含一个沪语ASR模型(沪语语音->沪语转写文本)和机器翻译模型(沪语转写文本->普通话文本)。

数据

包含Magichub开源数据集、喜马拉雅,shh.dict.cn,中国语言网爬取的数据集、讯飞TTS生成的wav数据。

训练脚本

train.py 用于训练ASR模型

train_translation.py 用于训练MT模型

服务

使用fastapi进行整个模型的部署,运行run_service.sh部署。

About

沪语(上海话)ASR(语音识别)模型

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published