该数据集最初是针对机器学习挑战来对心跳声音进行分类的。数据是从两个来源收集的:(A)通过iStethoscope Pro iPhone应用程序从公众那里获得的,以及(B)从使用数字听诊器DigiScope的医院的临床试验中获得的。这场比赛有两个挑战:
1.心音分割第一个挑战是产生一种方法,该方法可以在音频数据中定位S1(lub)和S2(dub)声音,从而对两个数据集中的Normal音频文件进行分割。
2.心音分类任务是产生一种方法,可以将真实的心音分类(也称为“心跳分类”),分为四个类别之一。
内容
数据集分为两个来源:A和B:
set_a.csv-通过iPhone应用程序从公众那里收集的心跳的标签和元数据
设置一个 timing.csv -含有金标准时序信息从集A的“正常”录音
set_b.csv-使用数字听诊器从医院的临床试验中收集的心跳的标签和元数据
音频文件 -长度不等,介于1秒和30秒之间。(已被裁剪以减少过多的噪音并提供声音的显着片段)。