LibriSpeech ASR corpus 语音数据

发布：可思数据时间：2019-10-19

数据类型：语音语料热度

文件类型：.zip 文件大小：7.5 GB

授权方式：公共开源 发布时间：2019-10-19

数据来源：Vassil Panayotov 数据语言：英文

数据介绍：

LibriSpeech ASR corpus 是一个语音数据，包括 1000小时的英文发音和对应文字。

LibriSpeech ASR语料库

标识符： SLR12

摘要：大规模（1000小时）阅读英语演讲语料库

类别：演讲

许可证： CC BY 4.0

关于此资源：

LibriSpeech是由Vassil Panayotov在Daniel Povey的协助下准备的大约1000小时16kHz读英语演讲的语料库。这些数据来自LibriVox项目的阅读有声读物，并经过精心细分和对齐。

有关该数据集的声学模型可在 kaldi-asr.org上获得。

有关详细信息，请参阅文章“LibriSpeech：基于公共领域有声读物的ASR语料库”，Vassil Panayotov，Guoguo Chen，Daniel Povey和Sanjeev Khudanpur，ICASSP 2015（已提交）

下载地址：

下载提取码：bhvx

特别声明：

人工智能交流群扫码邀请

下载帮助：

发表评论