Praat客服语音标注

上传人:沈*** 文档编号:84472682 上传时间:2022-05-03 格式:DOC 页数:12 大小:11.65MB
收藏 版权申诉 举报 下载
Praat客服语音标注_第1页
第1页 / 共12页
Praat客服语音标注_第2页
第2页 / 共12页
Praat客服语音标注_第3页
第3页 / 共12页
资源描述:

《Praat客服语音标注》由会员分享,可在线阅读,更多相关《Praat客服语音标注(12页珍藏版)》请在装配图网上搜索。

1、word语音转写操作手册三层一、用脚本打开语音文件 1 点击praatopenread from file找到你打开的文件打 开选中同一个文件名的两个文件View & Edit; 2 Ctrl+2可以同时两层打点,Alt+Backspace可以删除时间点; 做完以后Ctrl+S 保存到根文件下面;请参看培训视频。二、开始标注语音文件 时间边界定位: 按Tab键可以播放语音,再次按Tab键/Esc键可以停止播放语音 按Ctrl+i可以放大波形;Ctrl+o可以缩小波形。建议放大12标注。 听音,在整段语音的根底上,根据语义和停顿时间等因素,在音频信号中每一句话的句首和句尾分别添加时间边界。添加时

2、间边界的方法为:将鼠标移动到语音波形的相应位置,这时会出现一条虚线以与圆圈,分别点击SPEAKER层和CONTENT层对应的圆圈即可。或者直接Ctrl+2可以自动同时在SPEAKER层和CONTENT层打上时间点。在整个语音文件中,SPEAKER层和CONTENT层的时间边界的数目是完全一致的,每一对时间边界也是完全相等的。请注意,SPEAKER层和CONTENT层的时间边界必须保持一致。也就是说不管点击哪一层的时间边界,另外一层一定是空心蓝色,而不是实心蓝色 文件标注: GLOBAL层主要标注语音文件的一些全局信息,包括说话人性别信息和语种信息方言区。标注格式如下:speaker:空格1空格

3、性别,空格2空格性别;空格language:空格1空格方言区,空格2空格方言区例如:speaker: 1 male, 2 female; language: 1 普通话, 2 普通话speaker: 1 male, 2 male; language: 1 普通话, 2 普通话speaker: 1 female, 2 female; language: 1 普通话, 2 普通话speaker: 1 female, 2 male; language: 1 普通话, 2 普通话 SPEAKER层需要标注的是说话人信息,“说话人取值为以下两种:1、2,分别表示说话人1、说话人2。说话人1、2仅标注在文

4、字段上,符号段不标注 如果是客服类对话,如此SPEAKER层的“说话人取值为1的语音,必须是话务员;用户的语音取值为2 客服定义为奇数,用户为偶数;客服一定是和用户有直接对话,否如此不算客服如果第三个人是用户的情况:speaker: 1 female, 2 female, 4 female; language: 1 普通话, 2 普通话, 4 普通话 CONTENT层需要标注的是该句对应的文字,如果是汉语交谈,如此只能用简体汉字。对于语音中的数字局部需根据发音情况转换为对应的汉字,例如“27“二十七;“我的是2381832“我的是二三八幺八三二与发音一样。 CONTENT层正常语音的标注 如果

5、此语段为某一个人的汉语对话语音,请在SPEAKER和CONTENT标注时间边界,SPEAKER层标注1或者2,CONTENT层输入相应的文本。 如果此语段为两个人交叉语音,关于重叠交叉的语音,即对于某个人的一句话未完,另一个人的一句话已经开始的情况:请在SPEAKER层和CONTENT层标注时间边界,SPEAKER层不标注内容,CONTENT层标注“+对于叠加,必须是真实的。不能将大段的听不清语音和叠加混在一起。叠加段内的非叠加局部,前后最多不得超过1个字。至于由于添加叠加的时间边界导致的半个语音即切掉头或者尾可用*或UNK来表示。*和UNK取决于是单段的听不清,还是在语音中听不清。 在整个语

6、音中,需根据说话人的变换来增加时间边界。 如果同一说话人说话时间较长,如此应根据其语义来增加时间边界,每个时间段的长度最多不能超过8s,但断句也不要太散太短。每个自然语言段平均在5-6秒左右即可。 每个时间边界的最优位置在音频能量的最低点即波谱图上黑色局部最淡的地方,如果仅有几个字包含不进来,那么建议舍弃这几个字 英文:(英文小写)【单词】对于语音中简单的英文单词,在能听懂的情况下,直接标出即可。特殊符号用发音标注,不写特殊符号。例如:“网址是三w点sina点; “二三八幺八三二艾特 点;不要写 “请以井号键完毕;不要写#【字母】每个字母中间用空格隔开。例如:good表示单词读音,g o o

7、d如此表示字母读音。例如:我的编号是f m s幺三二 如果发音是表示应答的“嗯,统一都用“嗯,不要用“恩或者“厄。其他的这种口头发音,也需要用带口字旁的汉字标注。比如哦,啊,唉等. CONTENT层短暂噪音的标注短暂噪音是指非常短暂的突发的声音,所有此类标注都是中括号与语音内容的组合,不要标注时间边界。1 听不清的一个字/英文单词直接在句子中标注UNK。 例如:二三八幺八UNK二 2 两个或者两个以上听不懂的字,标注* 听不清的长句 方言 大段的英文句子 拿着话筒和其他人说话 3 短暂的笑声:直接在句子中标注LAUGH。 4 短暂的由说话人发出的干扰浊音:直接在句子中标注SONANT 咳嗽声

8、打喷嚏 清嗓子 5 系统提示音,即系统播出的语音提示:PROMPT系统自动播放的语音内容,而非说话人的语音内容第二层不用标说话人例如:PROMPT欢迎致电我公司现在由一号客服代表为您服务 CONTENT层持续噪音的标注持续噪音是指比拟长的一段声音,所有此类标注都是单独的噪音类型,需要标注中括号和时间边界,SPEAKER层不标注内容 1 明显的静音段大于500ms:SIL如果空白段没有任何声音,可以空着,后期技术处理 2 各种垃圾声音:ENS 1连续的拍桌子 2) 连续的敲击声 3) 持续的各种环境噪音大于500ms 3 连续的笑声:LAUGH 4 持续的音乐声:MUSIC 唱歌声有歌词和旋律

9、哼唱没有歌词,但有旋律 口哨声 可能是别人唱歌、演奏,也可能是背景的电视、收音机发出的音乐和歌声 口哨声 包括持续时间较长的彩铃声 5 录音与电信系统引起的噪声:SYSTEM包括按键音dtmf、忙音 beap、录音系统的其他噪音等,都是通信系统主动发出的声音,而不是摘机、挂机或干扰带来的咔啦或呲呲杂音。一般会用的噪音符号:+,*,ENS,UNK,SONANT,LAUGH,PROMPT,SYSTEM 修改标注 去除端点:点中端点,alt_backspace 移动端点:直接用鼠标拖动 修改文字:点中语音段,在编辑框中修改 保存 Ctrl+S保存到你文件的根目录下面;三工具自查checktool1

10、先进入程序安装文件夹,安装perl和python程序。注意perl安装使用默认路径 C:Perlbinperl,python安装使用默认路径C:Python27python。 2 点击1_Textgrid_modify tmp已完成语音放tmp里面退出来一步点击run 3 把1_Textgrid_modify中tmp的语音全部复制到2_checktool的tmp中run看出错的地方,如:intervals 50,说明第50段语音有错,将对应文件的textcheck打开,查找到intervals 50,查看是什么错误,最后在里面做修改,保存即可改一个错误保存一次,再重复上面的操作改下一个错误,直到最后没有报错为止。12 / 12

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!