AMI语料库
AMI会议语料库是一种多模式数据集,包含100小时的会议录音。有关语料库的温和介绍,请参阅 语料库概述。要访问数据,请发出的指示有。大约三分之二的数据是通过参与者在设计团队中扮演不同角色的场景引出的,从一开始就将设计项目从启动到完成。其余部分包括各种领域的自然会议。详细信息可在文档部分找到。
同步录音设备:
注解:
|
虽然AMI会议语料库是为了开发会议浏览技术的联盟的使用而创建的,但它被设计用于广泛的研究领域。此网站上的下载内容包括适合大多数用途的视频,但从事视频处理的研究人员可以使用更高分辨率的视频。
所有信号和转录以及一些注释都已根据 知识共享署名4.0国际许可(CC BY 4.0)公开发布。
标识符: SLR16
摘要:来自AMI语料库的声学语音数据和元数据。
类别:演讲
许可证: CREATIVE COMMONS ATTRIBUTION -NONCOMMERCIAL-SHAREALIKE v2.0 LICENSE(已修改,在许可证文件和/或AMI网页中查找更多详细信息)
关于此资源:
AMI会议语料库包含100小时的会议录音。录音使用与公共时间线同步的一系列信号。这些包括近距离和远场麦克风,个人和房间视频摄像机,以及幻灯机和电子白板的输出。在会议期间,参与者还可以使用不同步的笔来记录所写的内容。会议以英语记录,使用三个不同声学特性的房间,主要包括非母语人士。
描述数据的相关论文:- Jean Carletta(2007年)。释放杀手语料库:创建多种一切AMI会议语料库的经验。语言资源与评估期刊41(2):181-190。PDF格式
- Steve Renals,Thomas Hain和HervéBourlard(2007)。会议的认可和解释:AMI和AMIDA项目。在Proc。IEEE自动语音识别和理解研讨会(ASRU '07)。PDF格式
数据下载:
ami_manual_1.6.1.tar.gz [21M](AMI注释文件(版本1.6.1))镜像: [中国]
headset.tar.gz [24G](关闭-说话acosutic数据)镜像: [中国]
Array1-01.tar.gz [7.4G](Array1遥远的声学数据)镜像: [中国]
Array1-02.tar.gz [7.5G](Array1遥远的声学数据)镜像: [中国]
Array1-03.tar.gz [7.6G](Array1遥远的声学数据)镜像: [中国]
Array1-04.tar.gz [7.5G](Array1遥远的声学数据)镜像: [中国]
Array1-05.tar 。广州[7.5G](Array1远距离声学数据)镜像: [中国]
Array1-06.tar.gz [7.5G](Array1远距离声学数据)镜像: [中国]
Array1-07.tar.gz [7.5G](Array1遥远的声学数据)镜像: [中国]
Array1-08.tar.gz [7.6G](Array1遥远的声学数据)镜像: [中国]