个人技术分享

必须记住我们学习的时间是有限的。时间有限，不只由于人生短促，更由于人事纷繁。我们就应力求把我们所有的时间用去做最有益的事情。

备案号：鄂ICP备2023027962号-1

中文语音识别实战（ASR）

2024-04-25 11:46
20人已看

写在前面的话

本博客主要介绍了

1. 语音识别基础知识

2. 中文语音识别数据集

3. 语音识别常用模型方法

4. 自己训练一个中文语音识别模型

注意：代码中所涉及的模型及数据集，均可从huggingface下载得到，代码中的路劲，需要根据自身实际情况稍做调整。

目录

语音识别基础

语音识别基础

音视频开发基础入门｜声音的采集与量化、音频数字信号质量、音频码率_量化后的声音信号-CSDN博客

https://huggingface.co/learn/audio-course/chapter1/audio_data

数据集

common_voice

包含大陆，香港，台湾等地的语音数据。

https://huggingface.co/datasets/fsicoli/common_voice_17_0

其它

模型

wav2vec