LibriSpeech ASR corpus 是一个语音数据,包括 1000小时 的英文发音和对应文字。
LibriSpeech ASR语料库
标识符: SLR12
摘要:大规模(1000小时)阅读英语演讲语料库
类别:演讲
许可证: CC BY 4.0
关于此资源:
LibriSpeech是由Vassil Panayotov在Daniel Povey的协助下准备的大约1000小时16kHz读英语演讲的语料库。这些数据来自LibriVox项目的阅读有声读物,并经过精心细分和对齐。有关该数据集的声学模型可在 kaldi-asr.org上获得。
有关详细信息,请参阅文章“LibriSpeech:基于公共领域有声读物的ASR语料库”,Vassil Panayotov,Guoguo Chen,Daniel Povey和Sanjeev Khudanpur,ICASSP 2015(已提交)