TTS技术支持FAQ问题汇总

上传人:zou****hua 文档编号:167027863 上传时间:2022-11-02 格式:DOCX 页数:4 大小:16.05KB
收藏 版权申诉 举报 下载
TTS技术支持FAQ问题汇总_第1页
第1页 / 共4页
TTS技术支持FAQ问题汇总_第2页
第2页 / 共4页
TTS技术支持FAQ问题汇总_第3页
第3页 / 共4页
资源描述:

《TTS技术支持FAQ问题汇总》由会员分享,可在线阅读,更多相关《TTS技术支持FAQ问题汇总(4页珍藏版)》请在装配图网上搜索。

1、TTS技术支持FAQ汇总1. 常见问题音库问题在安装TTS语音合成系统系统运行库时,如果只安装6K、8K、11K或16K采样率(Sample Rate)中的一种音库,在合成时,只会正确输出该采样率下的声音数据文件,对其它采 样率下的声音数据文件将输出不正确的声音数据。 声音数据格式系统支持的语音数据格式有PCM、aLAW、uLAW、ADPCM和Dialogic的VOX格式,支持的 语音文件有 WAV 文件和 VOX 文件。 声音数据头 在本地调用可以设置输出声音数据的数据头为44字节数据头、无数据头、标准数据头 三种 ,但在网络调用时只可生成带有44字节数据头的声音数据。纯声音数据加上数据头生

2、成声音文件,PCM格式的声音数据加上44字节数据头可以生成 Wav文件,Alaw/Ulaw格式的声音数据加上58字节的数据头也可以生成Wav文件,但是 Dialogic 语音卡的 Vox 文件是没有数据头的。TTS 语音合成系统生成的声音内存数据拼接成声音文件时需要对数据头进行正确处理, 否则生成的声音数据文件在播放时会出现杂音。 向 TTS Server 发 30 路请求,合成速度特别慢,另外连接时间长了会导致 TTS Server 已经死掉,只发一路请求都连接不上,必须重新启动才可以。在 TTS 系统多路条件下运行时,因为合成的声音数据量也较大,在网络传输时对网络带 宽要求比较高,需要10

3、0M的以太网,如果用户所使用的网络是10M网,一方面合成的 性能达不到我们的文档所描述的指标,另一方面会造成TTS系统出错。 TTS在多个线程下合成时声音数据相混杂的问题问题系统在多线程使用时,某个线程调用Connect函数后,生成的实例句柄不能被多个线程 同时使用,只能被这个线程使用(当一个线程使用完后,这个句柄才能被其它线程使用), 因此在合成时,这个线程对某个文本的合成是从头到尾进行合成。其它线程调用Connect 函数后,生成它自己的实例句柄,从头到尾地去合成一个文本。不能多个线程分割合成 一个大文本。 为什么在 KD2000Rev1.5 下开发的程序可以正确生成 Alaw 数据,在

4、InterPhonic 下运 行却生成PCM声音数据。是因为两个系统的开发接口有细微差别造成的。在KD2000Rev1.5系统存在两个发音 人的音库(女声音库A和女声音库B),在函数调用中先设置输出的声音数据格式,然 后调用SetsynthParam函数(参数为TTS_PARAM_VID)选择音库(女声音库A或女 声音库B),可以正确输出此音库下的声音数据文件,但在Inter ph onic系统中只存在 一个发音人的音库(女声音库B),设置输出的声音数据格式以后,再调用SetSynthParam函数(参数为TTS_PARAM_VID)选择音库(返回的是女声音库B下 各种不同采样率的音库,这一点

5、和1.5系统有比较大的差别),那么此时前面设置输出 的声音数据格式的函数调用将不起作用,输出的声音数据格式为新音库的缺省声音数据 格式。另外一点需要注意的是In te rPhon ic系统在安装的时候可以同时安装四种采样率 的音库(1.5系统同时只能安装一种采样率的音库),输出不同采样率音库下的声音数 据文件时,系统内部可以自动切换到需要使用的各种采样率的音库,因此在InterPhonic系统中,可以不用调用SetSynthParam函数进行音库的设置。 为什么 InterPhonic 系统在 Windows 2000 Server 和 Advance Server 上无法运行。Windows

6、 2000 Server 在安装时,如果安装 Windows Media 组件,其中的一个服务 Windows Media Unicast Server 占用的端口号和 TTS 系统的 Server Express 软件使用的端口号 是一样的,同时使用时会造成冲突,造成 Server Express 无法运行。这时只要把 Windows Media Unicast Server 服务停止掉,即可正常使用我们的语音合成系统。 TTS 系统支持的文本内码1. 现在TTS语音合成系统支持的GB2312编码包含了 GB2312-80的全部汉字(一级和二 级),汉字数量为 6762 条。2. 对于GBK

7、编码的文本,TTS系统首先通过字符集转换转成GB2312的文本,然后进行语 音合成。对于GBK中的繁体字通过转换能得到更多认识的汉字(字符集转换将繁体字转 成对应的简体字),但是有一些繁体字没有对应的简体字,就不能正确转换,对于这些 繁体汉字,系统将会读成“rong2”3. 对于BIG5编码的文本,TTS系统也是通过字符集转换转成GB2312的文本,然后进行 语音合成。如果将 BIG5 编码通过字符集转换转成对应的简体字时,一些字没有对应的 简体字,系统也会读成“rong2”4. KD2000 Rev2.0 和 InterPhonic 系统还支持 Unicode 编码,对于这样的文本,系统合

8、成时也是首先转换成为GB2312编码的文本,然后进行语音合成。 TTS 系统企业版和桌面应用版的区别?1. TTS系统企业版包含的组件有TTS语音合成运行库、TTS Server语音合成服务器、 iflyTTS语音合成开发包、HASP软件锁。而桌面应用版只包含TTS语音合成运行库和 iflyTTS语音合成开发包。2. TTS系统企业版的系统运行库及开发接口支持多个进程及多个线程同时连接到TTS系 统中,但总的连接数量受到Hasp授权数量的限制,而桌面应用版的系统运行库和开发 接口只支持单个进程或线程连接到语音系统中,其它的连接会返回错误。3. TTS系统企业版的合成开发接口提供了支持网络调用的

9、动态链接库,可以实现以 Client/Server方式进行网络调用,而桌面应用版的合成开发接口只提供了本地调用桌 面版的动态链接库,只能实现本地调用。 InterPhonic 语音合成系统的系统运行库中应用程序的作用?InterPhonic系统的系统运行库安装完成后,在安装目录的Bin文件夹下可以看到四个 应用程序,它们的作用如下:1.iFlyTTSGUI.exe是一个演示程序,可以直接运行,听InterPhonic系统的合成效果, 在其中还可以改变合成的参数,看到语音系统的功能,但它对合成参数的设置只对 iFlyTTSGUI这个程序起作用,对TTS系统实际的合成不起作用。它还有一个很重要的作

10、 用就是在音库安装完成后,检验音库是否能够正常运行、文本合成是否正常。2. TTSCtrlCenter.exe 是资源管理中心应用程序,在这里可以控制多种合成的资源,比 如说系统设置、合成参数、标点符合、加词管理、音库管理等,这里对合成参数的设置 会对TTS系统实际的合成产生影响。这个程序只出现在KD2000的2.0版本和 InterPhonic 版本中。3. HaspMan.exe 是检测加密锁是否正确安装,驱动程序是否正常加载的程序。加密锁没 有正确安装及驱动没有正确加载的话,它会提示程序无法运行;正确加载,从中可以看 到语音系统的版本信息,以及软件的授权数量。4. Hinstall.ex

11、e 程序是加密锁的安装及卸载程序 目前 TTS 系统企业版包含的组件及其作用?1. TTS 语音合成系统运行库提供实时语音合成功能,即能实时地将任何文本转换成 高自然度的连续语音输出,支持多个合成特性,是在安装时必须首先安装的组件。2语音合成服务器(TTS Server Express)是指网络中的一台主机,它能够为其他客户 机提供TTS服务,客户端应用程序通过网络开发接口与TTS服务器进行通讯。3讯飞语音合成开发包(iFly TTS SDK)是在讯飞语音合成系统基础上,为语音合成开 发者提供的一个能够使用讯飞语音合成技术进行应用开发的用户编程接口。4. HASP软件锁,必须插在计算机的并口上

12、,用于防止非法拷贝和控制授权数量。5动态负载均衡系统(LBSystem)提供了一种服务,动态监测网络中的多台TTSServer 的运行状态,获得负载最小的服务器,将当前的语音合成任务分配给该服务器,从而维 持多台 TTS Server 负载的动态均衡。它在大规模应用需要多台 TTS 语音服务器的情况 下才使用。 TTS系统的开发接口中的初始化和逆初始化函数使用的错误?TTS语音合成系统的开发接口在使用进行语音合成时,首先需要调用TTSInitialize进 行语音合成系统的全局初始化,作用是把语音合成系统使用的一些全局数据装载到系统 内存中,退出时需要进行全局逆初始化语音合成系统(TTSUni

13、nitialize),从系统内存 中移出语音合成系统。在一个应用程序中初始化和逆初始化函数允许调用一次,可以在 程序开始进行时进行初始化,在程序退出时进行逆初始化过程。如果在程序中进行多次 初始化和逆初始化,那么程序在运行时,会出现某一个连接正在合成,而另外一个连接 进行逆初始化过程,会使程序崩溃。 TTS 系统企业版的软件锁问题?1. TTS语音合成系统企业版使用HASP软件锁防止非法拷贝和控制授权数量。在TTS安装 时,必须首先把加密锁插在计算机的并口上,在TTS系统运行库安装时,系统会把加密 锁的驱动程序安装上去,这样TTS系统才能正确运行。TTS系统在运行时,加密锁必须 一直插在计算机

14、上,否则TTS系统将无法运行,会出现“HASP not found (-3)”的错 误。2. 在TTS系统KD2000 Rev2.0和Int erPhonic版本的运行库安装完成后,在安装的Bin 目录下,有一个HaspMan.exe程序,它可以检测TTS系统的加密锁是否正确安装,驱动 程序是否正常加载,如果没有正确加载,它会提示程序无法运行,正确加载就可以看到 加密锁中写入的产品的授权数量信息及产品版本信息,需要注意的是,运行这个程序时 必须要关掉VC程序。3. 另外在TTS系统运行库安装完成后,在安装的Bin目录下有一个Hinstall.exe的DOS 程序,它是进行加密锁的驱动程序安装及

15、卸载的程序,可以在 Windows 的 Dos 窗口运行, 运行时先进入程序所在的目录:加命令行参数(一i)安装加密狗驱动程序加命令行参数(一r)卸载加密狗驱动程序 使用科大讯飞的开发接口在CTI系统的IVR中如何实现语音合成和语音播放的同步进 行?建议使用语音文件链的方式实现合成与播放同步,具体实现为, IVR 的每个 Port 用两个 线程来实现服务,一个线程是用户交互线程,负责播放语音、接收用户按键;另一个线 程是合成线程,用于后台合成;具体步骤如下:1.用户交互线程需要播放文本时,先将需要合成的文本传给合成线程2合成线程将全部文本送入合成器(调用SynthChinese函数),取得第一

16、部分合成数据 后保存成语音文件链表中的第一个节点,然后向用户交互线程发送“可以播放”消息, 之后取其他合成数据,保存成语音文件链表中的对应节点。3.播放线程得到合成线程通知后,开始顺序播放文件链表上的语音文件KD2000 Revl.1/1.5 系统和 InterPhonic 的 iflyTTS 接口的区别它们的区别主要在对合成参数设置的函数上:1.InterPhonic的iFlyTTS接口增加了分句时对回车符的处理、最大分句长度、当前可 用音库列表、读出所有的标点符号、停顿风格、数字字符串的读法等很多控制合成参数 的设置,功能更强大。2. 对于合成系统输出的声音数据格式设置,由于KD2000

17、Rev1.1/1.5系统同时只能安装 一种采样率的音库,因此它只能正确输出此种采样率下的声音数据文件,输出其它采样 率下的声音数据文件会不正确。而InterPhonic系统可以同时安装一个发音人4种采样 率的音库,它可以自动在各种采样率的音库之间切换,因此可以输出文档种所列的所有 格式的声音数据文件。3在合成参数的音库设置上,KD2000 Rev1.1/1.5系统有两个发音人,音库设置即在两 个发音人之间进行选择,而现在的InterPhonic系统只存在一个发音人,音库设置返回 的是发音人各采样率的音库编号,由于InterPhonic系统可以自动在各种采样率的音库 之间进行切换,合成时此参数可以不需要进行设置。两个系统的在以上参数设置时意义有了很大变化,使用时需要特别注意它们的区别。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!