原创投稿 行业报告 AI展会 数据标注
投稿发布
您的当前位置:首页 > 下载中心 > 数据工具 > 正文

praat音频标注软件

发布:可思数据 时间:2020-04-19
数据类型:工具软件 热度

文件类型:.zip              文件大小:5.9 MB

授权方式:公共开源     发布时间:2020-04-19

数据来源:praat             数据语言:英文

数据介绍:

Praat中文版是一款电脑语音分析软件,该工具可以对在线视频地址进行检测,将流媒体视频进行嗅探并下载,转存为常用的本地播放格式文件。

软件介绍

Praat中文版能够对语音信号进行分析与标注,在Praat中录音或读取音频文件后,可以按用户要求显以下多种语图,如三维语图,频谱切片,音高曲线,共振峰曲线,音强曲线等,所有的语图都可以绘制成精致的矢量图,也可以将相应的对象数据保存为磁盘文件。除直观的语图外,Praat(语音学习软件)也能通过对信号数据的计算获得各种文字情报,比如音高、时长、第一或第二共振峰频率的数值等,也同样可以根据需要输出为适当的形式。

注意事项

真正免费汉化版,绝非无良汉化加锁版!

Praat中文版图片图片1

软件功能

语音实验:嗓音分析、多重强迫选择实验、滤波、声源滤波合成、发音合成等。

辅助教学:前馈神经网、优选论学习等。

统计分析:主成分分析、多维量表、判别分析等。

软件特色

1、能够对语音信号进行分析与标注。

2、在Praat中录音或读取音频文件后,可以按用户要求显以下多种语图,如三维语图,频谱切片,音高曲线,共振峰曲线,音强曲线等。

3、所有的语图都可以绘制成精致的矢量图,也可以将相应的对象数据保存为磁盘文件。

4、除直观的语图外,Praat(语音学习软件)也能通过对信号数据的计算获得各种文字情报,比如音高、时长、第一或第二共振峰频率的数值等,也同样可以根据需要输出为适当的形式。

Praat中文版图片图片2

使用教程

Praat可以用于非常专业的语音语调分析,能很深入的应用于语言研究领域,对社会做出贡献,当然软件的使用也相当专业,初上手的用户往往难以领会使用方法,所以这里小编带来简易的入门使用教程,让你快速熟悉操作。

1、导入语音文件

点击 praat —>open —> read from file —> 找到你打开的文件 —> 打     开,文件被添加在了praat 中;

2、生成 TextGrid 文件

选中要转写的语音文件 —>  annotate - —> To TextGrid... —>语音文件分层(三层)如下图:

Praat使用教程图片1

分层

点击 OK 生成 TextGrid 文件;

3、编辑语音和 TextGrid 文件

同时选中语音文件和 TextGrid 文件 —> View & Edit;如图:

Praat使用教程图片2

转写界面

语音标注

在得到语音数据后,我们对于其分析要进行多方面的标注更利于多样的分析需求,能对声音的层次得到更好的信息,可谓是使用Praat必备操作,下面小编就对此进行教程分享:

打开文件

1. 打开Praat---Open---Read from file...---找到对应的声音或者Textrid文件,打开即可

Praat语音标注教程图片1

2. 打开到Praat窗口以后,创建一个空白的标注文件

Annotate---To TextGrid...

注意提前规划好你需要对这个声音文件标注几层信息,通常会标注音素信息,音节,或者字词信息,韵律信息,或者一些其它的信息,任意多层都可以设置,在这里只举例设置音素层和音节层。

Praat语音标注教程图片2

3. 把声音文件和TextGrid文件都选择上,点击View & Edit,就可以进行标注了,标注时,根据听辨边界,以及查看语图的信息,确定音素或者音节的边界。

Praat语音标注教程图片3

4. 认识语图上的几个主要特征,如果看不到基频线,共振峰线或者音强线,使用上面菜单上的show pitch, show formant, show intersity就可以了。

Praat语音标注教程图片4

5. 保存文件

Praat---Save---Save as text file...---将这个标注文件保存为****.TextGrid即可。

生成声调曲线教程

生成声调曲线是对语调分析结果最好的展现形式,能非常直观的对成果进行展示,尤其是在一些演讲时,曲线图能一幕了然内容,让数据分析更直观,那么Praat声调曲线如何生成呢?下面请看教程:

下面以一个小的例子,即如何绘制汉字普通话的声调图,说明如何应用这个脚本进行一些简单的操作。同样的应用可以用到如何提取汉语普通话的连读变调图,以及未知方言的声调提取,以及句子单位的语调提取都是同样的道理。

示例:

1. 标注的时候如图,只给了简单的两层,注意韵母a的标注,我刻意没有保留结尾的那段,因为为了描述大概的声调走向,只保留了比较稳定的一段,其它使用者在实际标注时可根据自己的需要确定如何标注。

Praat生成声调曲线教程图片1

2. 标注好之后,使用上述的脚本,即可提取出结果result.txt,脚本运行的时候,音段层为2,单词层是1,文件所在的目录是data,然后输入一个结果文件的正确路径和名称。

3.将结果文件都拷贝到excel里,只保留跟要绘制声调相关的韵母那些行,这样只保留了a相关的数据行,这里只是为了演示,只有两个字的数据,实际操作时,每一个韵母的每一类声调都可能有N多的数据,这样就可以放到一块,进行一下平均,平均的时候是对基频10个点分别平均,这样保证得到的是10个点的基频。这样的操作也称为对时长的归一化。如下图所示,当提取两个韵母的基频时,因为每一个情况下的发音时长是肯定不同的,即使是同一个人,在发同一个韵母的时候,也不能保证时长是相同的,在这样的情况下,只能做一个时长归一化,保证都是10个点的时长,大概的描述这个发音的时长,而归一化的方式,就是把整体时长比如平均分9份,每隔一份的间隔提取一个值,这样无论在什么情况下,每一个样本都提取10个值,这就是时长归一化。当然同样的道理,你也可以选择提取15个值,5个值。。。但是其实就稳定的发音段来说,无论多少值,都区别不大。建议在标注的时候尽量保留稳定段,而且要尽量多的数据平均,这样绘制出来的图像是更有普遍意义的。

 

4.最终当前这两个字的声调图如下:

Praat生成声调曲线教程图片3

5.目前学术研究上流行五度值描述汉语的声调,这样相当于又是一个归一化的过程,相当于把不同的人,不同的性别的人,不同地区的人,任何的差异都抹掉,全部都归一化到1-5的范围内来描述声调,这样适合于进行一个汉语方言区的调查,而条件是必须有足够多的数据,优点是更直观,描述起来大家都容易接受,缺点就是看不到个体的差异。现在比较公认是采用以下的公式进行归一化:

Value =5* (log(x)-log(min))/(log(max)-log(min))

5是归一化到1-5的范围内,而对每一个基频取log值,则是因为有学术研究表现在log域上更接受于人的听感,而max,min代表是样本整体的最大值,最小值,x是指当前原始值。

还是上述数据,经过归一化计算之后,得到如下的声调图。那么我们可以描述,阴平调为55,阳平调为15(其它地方可能描述为25,35,原因是这里只有一个字,很难代表整体,有兴趣的朋友可以多找一些样例平均)

Praat生成声调曲线教程图片4

下载地址:

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用本站来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
¤ 本站数据压缩包统一解压密码:www.sykv.com
人工智能权威社区
人工智能交流群扫码邀请

相关文章:

    无相关信息

相关推荐:

网友评论:

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

数据标注服务
sem搜索推广

Copyright©2005-2020 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注行业联盟

人工智能资讯   人工智能资讯   人工智能资讯   人工智能资讯

扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部
关闭