毕业设计(论文)IP电话语音质量研究

上传人:痛*** 文档编号:78189654 上传时间:2022-04-21 格式:DOC 页数:48 大小:338.50KB
收藏 版权申诉 举报 下载
毕业设计(论文)IP电话语音质量研究_第1页
第1页 / 共48页
毕业设计(论文)IP电话语音质量研究_第2页
第2页 / 共48页
毕业设计(论文)IP电话语音质量研究_第3页
第3页 / 共48页
资源描述:

《毕业设计(论文)IP电话语音质量研究》由会员分享,可在线阅读,更多相关《毕业设计(论文)IP电话语音质量研究(48页珍藏版)》请在装配图网上搜索。

1、河南理工大学毕业设计(论文)说明书目录前言21概述51.1VoIP简介51.2国内外研究动态51.3IP电话应用特点62VoIP原理与技术82.1VoIP原理82.1.1语音-数据转换92.1.2原数据到IP的转换92.1.3传送102.1.4IP包-数据的转换102.1.5从数据转换回到语音102.2VoIP相关协议112.2.1H.323协议122.2.2会话启动协议SIP122.2.3H.225.0协议142.2.4H.245协议152.2.5RTP/RTCP协议162.2.6资源预留协议RSVP163 语音质量问题193.1QoS的一般概念193.2影响语音质量的原因213.2.1压缩

2、213.2.2回声223.2.3延时233.2.4抖动243.2.5丢包253.2.6 语音活动检测254提高话音质量技术方法264.1语音压缩技术264.2静音抑制技术274.3回声消除方案274.3.1回声源较复杂274.3.2回声路径的延迟大284.3.3回声路径的延迟抖动大284.3.4自适应回声抵消原理284.4丢包解决方法294.4.1丢包的原因294.4.2丢包的修复方法304.5延时抖动的处理384.5.1处理延时抖动的一般方法384.5.2延时抖动的非适应性处理384.5.3延时抖动的适应性处理405展望IP电话的未来415.1发展现状415.2与ATM语音和帧中继语音的比较

3、425.3IP电话前景预测425.3.1IP电话能否完全替代传统电话425.3.2IP电话相关设备市场预测435.4展望未来445.4.1语音压缩技术的发展445.4.2网络承载技术的发展445.4.3IP电话发展方向446总结45致谢46参考文献47前言从电话被发明到今天,历史的脚步己匆匆走过百余年。现在电话在人们的生活和工作中起着越来越重要的作用,通过电话这种语音交互方式,人们可以迅速有效地进行交谈,以此来交流思想、表达感情;它的应用极大地拓展了人们的活动空间,削弱了由于空间间隔而造成的人与人之间的交流不便。因特网的出现到现在也有几十年了,伴随着它的发展,现代社会的人们可以共享丰富的网络资

4、源和巨大的信息量,人类社会已经跨入了信息化的时代。传统电话技术一直在发展:从人工交换到自动交换、模拟传输到数字传输、固定电话到移动通信、电路交换到信元交换。而因特网技术的发展则呈加速趋势:从最初的电子邮件到聊天室、文字信息到图像与影音。1993年WWW(World Wide Web)技术的兴起使网络的使用更加便利、内容更加丰富多彩和富有生命力,WWW技术使因特网产生了一次革命性的发展。VoIP(Voice Over IP)技术,也就是一般所说的IP电话,它出现于1996年,这是一种在IP网络上进行实时语音交互的技术。Internet是目前最大的而且分布最广泛的IP网络。因此伴随着IP电话这项新

5、技术的出现就同时引发了电话技术和Internet技术的又一次革命性的发展。在电信的角度来说,IP电话的发展甚至超过了前几年移动电话的发展,它是目前电信业务中发展最迅速的部分之一。IP电话在短短的几年内得到了非常迅速的发展,并且正在对传统的通信方式产生巨大冲击,除了IP电话采用语音压缩和统计复用技术节约带宽从而造成运营成本降低外,还有以下两个原因:电话业务历来都是各国管制最为严格的业务,但是对于IP电话各国大多是采取宽容甚至是扶持态度,因此这样庞大的通信市场潜力,必然吸引众多传统和新型的电信公司加入到IP电话的研究、开发和经营队伍中。各国国际长途电话费存在着严重的不平衡性,而且国际长途电话业务在

6、很多国家都是垄断经营的。这样,国际话费低的国家电信运营者可以利用各国对IP电话的优惠政策,通过IP电话向国际话费高的国家渗透,直接或间接进入电信市场中尚未开放国家的国际长途业务经营领域;而资费高的国家可以降低IP电话同国际回叫业务争夺用户,同时开拓新的用户群。就电话的巨大市场规模来说,如果IP电话能分流其总量的百分之几,其数字也是巨大的,也是因特网的一个巨大的成就。目前IP电话的实现和初步的成功一方面证明了Internet的实时传输信息的能力,另一方面也说明着在Internet上进行大规模视频传输的可行性。本文的研究对象是VoIP技术,也就是IP电话。由于传统的电话技术采用的是适合于实时业务的

7、电路交换,而电路交换的最主要的特点是面向连接。当呼叫开始后,它首先建立一条从发送端到接收端的虚电路,并且此次通话的语音就一直沿用此路径传输,因此传统电话就具有了时延小、语音流平稳等优点以及因带宽固定而造成的利用率不高的缺点。IP电话采用了适合于非实时业务的分组交换,分组交换的特点是没有固定的信道分配,也就没有固定的带宽占用,它是所有的信息流共享整个链路的带宽。分组交换方式适用于突发性的数据传输,具有灵活、带宽利用率高等优点,同时由于每个分组都要通过路由器的选路操作来进行路径选择,这一方面引入了时延,另一方面各个分组的时延极有可能不同。这是主要原因是因为IP协议族(及其他数据网)并不是为像语音这

8、样的同步、实时业务所设计的。除此之外,IP网络上的包丢失以及时延的大小及其抖动都会对语音和视频传输产生不利影响。时延抖动对语音来说是一个很麻烦的问题。它使接收设备还原语音变得很复杂。而且,说话者和收话者之间语音信号的时延可能非常大,这会导致信息丢失(因为迟到的样点已经不能为数模转换器所用)。在公众因特网另一个需要考虑的因素是它具有“不合作的特征”。因特网是不同网络和不同业务提供者的一个结合体,他们以一种进化和分段的方式结合在一起。不像电话网,因特网中没有一个电信部门(如邮电部、Bell公司)来定义网络的行为,例如保证电话呼叫所需的带宽。事实上因特网根本就不保证带宽,它不能保证用户所需的带宽。有

9、时你可以得到所需服务,有时又不能(平均来看,你会得到你所支付的那部分)。作为新生事务的IP电话要想在电话市场中占有一席之地、甚至超过传统电话并非易事,这是因为传统电话已有百年的历史,其成功运作尽人皆知。IP电话要达到其目的就必须拥有能赶上甚至超过传统电话的先进之处。其中,最为基本的一点是IP电话的语音服务质量要达到甚至超过传统电话,满足使用者的要求。因为在IP电话发展初期,虽然其语音质量稍差一些,但是由于其费率较低以及人们对新事物的向往,人们还是接受了它。但是正电话的服务质量问题如果长期得不到很好的解决,其发展的前途就不可想象了。IP电话的服务质量如何是IP电话能否得以大面积推广的最为重要的一

10、点。1概述1.1VoIP简介随着信息技术的发展,计算机网络与传统电信网络正逐步走向融合。基于分组交换技术的IP电话因其特殊的运营方式和成本核算方法,正以低廉的价格给传统电信市场带来强大冲击。IP电话的实现,依赖于一项技术的实现,即VoIP(Voice Over IP)也就是通过互联网的主要协议IP协议来实现话音承载的技术。VoIP技术是通过语音压缩算法对语音数据进行压缩编码处理,然后把这些语音数据进行打包,经过IP网络把数据包传输到目的地,再把这些语音数据包串起来,经过解码解压处理后,恢复成原来的语音信号,从而达到由IP网络传送语音的目的。这种以数据包传输的方式很大程度上提高了线路的利用率,从

11、而大大降低其所承载的业务的传输成本。因此,VoIP技术作为一种以IP网络为传输载体的语音和传真通信技术,以其高效的语音传输和低廉的资费,得到越来越广泛的应用,具有广阔的应用前景。1.2国内外研究动态早在1995年初,VocalTec公司推出了一种叫做Internet Phone的客户软件(现在可以称之为最早的IP电话软件),虽然当时该公司还没有提出在IP上传输话音的概念,但这确实是IP电话第一次成功的商业化和市场化。自从IP电话出现至今,它已经经历了4代演变。第一代IP电话是通过PC上的软件来实现的。通话双方必须用在线PC上相同的软件和语音压缩声卡进行通话。这是初级阶段的IP电话,它比传统的电

12、话烦琐。第二代IP电话是通过电话黑盒子实现的,在黑盒子中集成了Modem和IP电话软件的功能,通过这个黑盒子用户可以直接上网通话而不必经过PC。但是,这种方式在本质上和第一代IP电话没有区别,你仍不能和没有约好的人通话。前两代IP电话由于自身的局限性,还没能构成对传统电话的威胁。第三代IP电话是用软件进行通话,它向传统电话发起了挑战。这也是一种基于IP的通话方式,通过IP电话软件,用户可以通过PC将电话拨到任意一部普通电话机上,这时打IP电话已经没有时间限制,所要求的只是主叫方的PC在线,并且安装了IP电话软件.这种方式已经能够降低电话费用,但对用户来讲还不够方便。IP电话发展过程中的一个重大

13、突破是1996年VocalTec公司推出了“网关”服务器。网关负责将Internet和企业Intranet等数据网络与公用电话网连接起来,这样Internet电话就能通过网关从计算机传送到对方的电话机,也可以在两端都安装网关,实现从一方的电话机向另一方的电话机传送Internet电话,而费用仅为本地的电话费加上很少的服务费,于是就出现了第四代IP电话。1.3IP电话应用特点IP网络电话之所以能赢得市场,是因为它具有许多独特的应用优势。(1)价格低廉价格低廉,尤其是国际长途呼叫和传真有着明显的价格优势,这是IP电话进入市场的首要因素,其根本原因:一是IP电话均采用压缩语音编码和分组统计复用,带宽

14、利用率高;二是EP运营商都是采用租线方式进行,其成本核算和计费方法与传统电信运营商不同。(2)可以灵活的提供各种增值业务价格优势是IP网络电话进入市场的原是推动力,而增值业务才是IP电话得以发展的真正动力。典型的IP电话增值业务有:根据主叫名、呼叫优先级等进行区别性入呼叫通知;根据日程表、主叫名、当前呼叫号码等确定呼叫前转或震铃,也可以弹出窗口由用户自行选择如何处理入呼叫;可以上网浏览和电话呼叫同时进行;也可以方便的进行电话会议,在会议中传递文件,协同工作等。有些经营商还向用户提供面向对象的软件工具,供用户自行开发其语音处理应用。(3)有利于企业建立高效综合服务内部网IP网络电话引入企业网后,

15、可以将数据网和电话网合一,可以很容易的在已有数据网的平台上加入语音信箱,交互式语音提示,自动话务员等功能,构筑计算机电话集成(CTI)系统,这些功能和系统无需另外添加设备,只需要加入相应的软件应用程序即可。(4)有利于运营商开拓新的市场Internet大力发展后,许多Internet服务提供商(ISP)应运而生。IP网络电话推出后,ISP可以很方便的将网络电话业务与接入服务结合起来,增加运营收入。另外,引入IP电话后,一些新成立的小型公司都可以很容易的进入电信经营领域,既有利于电信市场的开放,也可以促进传统电信业的改造。(5)有助于和新技术的融合促进网络技术的发展首先,IP电话系统广泛采用了语

16、音压缩编码技术,实用算法的压缩码率已达PCM编码的1/10,也就是说,长途传输千线无需投资新的设备,其传输能力即可增加10倍。其次,目前正在大力开发的带宽接入技术,为IP电话的推广开创了很好的条件。这些宽带技术可以向网络终端,包括社区和家庭用户提供很宽的数据通道。2VoIP原理与技术2.1VoIP原理语音和IP技术的结合迎来了一个提供低成本高灵活性高生产率及高效率的新的网络环境,由于硬件、软件和网络协议设计方面的提高和发展,进一步推动了这个新的集成化基础设施的发展。所谓的VoIP是以IP分组交换网络为传输平台,对模拟的语音信号进行压缩、打包等一系列的特殊处理,使之可以采用无连接的UDP协议进行

17、传输。为了在一个IP网络上传送语音信号要求几个元素和功能,最简单形式的网络由两个或多个具有VoIP功能的设备组成。这些设备通过一个IP网络连接VoIP模型的基本结构,如图1所示:图1 VoIP模型的基本结构从图中可以发现VoIP设备是如何把语音信号转换成IP数据流,并把这些数据流转发到IP目的地,IP目的地又把它们转换回到语音信号。两者之间的网络必须支持IP传输,且可以是IP路由器和网络链路的任意组合,因此可以简单的将VoIP传输过程分为下列阶段:2.1.1语音-数据转换语音信号是模拟波形为了在数字数据网络上传送这些模拟波形。首先必须把它们转换成某种类型的数字格式,就是对模拟语音信号进行8位或

18、16位的量化然后送入到缓冲存储区中,缓冲器的大小可根据延迟和编码的要求进行,许多低比特率的编码器是采取以帧为单位进行编码的。典型帧长为10-30ms,考虑到传输过程中的代价语音包通常由60、120或240ms的语音数据组成,数字化可以使用各种语音编码方案来实现。源和目的地的语音编码器和语音解码器必须实现相同的算法,这样目的地的语音设备才可以还原模拟语音信号。2.1.2原数据到IP的转换一旦语音信号进行了数字编码,下一步就是对语音包以特定的帧长进行压缩编码。大部分的编码器都有特定的帧长,若一个编码器使用15ms的帧则把从第一级来的60ms的包分成4帧,并按顺序进行编码。每个帧有120个语音样点(

19、设抽样率为8KHz)。编码后,将4个压缩的帧合成一个压缩的语音包送入网络处理器。网络处理器为语音包添加包头、时标和其他信息后通过网络传送到另一端点。语音网络简单地建立通信端点之间的物理连接一条线路,并在端点之间传输编码的信号,IP网络不像电路交换网络,它不形成连接,它要求把数据放在可变长的数据报或分组中,然后给每个数据报附带寻址和控制信息,并通过网络发送,一站一站地转发到目的地。为了支持这种网络上的数字语音数据的传送,VoIP设备必须接收语音数据把它们分组成IP数据报(分组),附带寻址信息,并把它们发送到网络中。2.1.3传送在这个通道中,全部网络被看成一个整体,持续不断地从输入端接收语音包,

20、然后在一定时间(t)内将其传送到网络输出端。t可以在某个范围内变化反映了网络传输中的抖动。网络中的中间节点检查每个IP数据报附带的寻址信息,并使用这个信息把该数据报转发到目的地路径上的下一站网络链路,可以是支持IP数据流的任何拓扑结构或访问方法。2.1.4IP包-数据的转换目的地VoIP设备接收这个IP数据报并开始处理,网络级提供一个可变长度的缓冲器,用来调节网络产生的抖动。该缓冲器可容纳许多语音包,用户可选择缓冲器的大小。小的缓冲器产生延迟较小,但不能调节大的抖动。其次,解码器将经编码的语音包解压缩后产生新的语音包,这个模块也可按帧进行操作,完全和编码器的长度相同。若帧长度为15ms,则60

21、ms的语音包被分成4帧,然后它们被解码还原成60ms的语音数据流送入解码缓冲器。在数据报的处理过程中,去掉寻址和控制信息,保留原始的原数据,然后把这个原数据提供给设备解码器。2.1.5从数据转换回到语音播放驱动器将缓冲器中的语音样点(480个)取出送入声卡,通过扬声器按预定的频率(如8kHz)播出。简而言之,语音信号在IP网络上的传送要求语音信号从模拟信号到数字信号的转换、数字语音封装成IP分组、IP分组通过网络的传送、IP分组的解包和数字语音还原到模拟信号等过程。整个过程如图2所示:图2 VoIP传输过程2.2VoIP相关协议在VoIP系统中,技术标准是十分重要的。最早的VoIP产品都使用自

22、己的协议进行通信,通话的双方尤其必须使用统一产品。但随着互联网的高速发展,VoIP等各种网上增值业务展现出巨大的应用前景。在各厂商的积极努力下,推进了IP电话协议的标准化进程。目前涉及VoIP技术的主要协议如图3所示:图3 VoIP相关协议根据目前制订协议的情况和各标准化组织的工作重点,与IP电话相关的协议主要可以分为两大类:H.323协议和SIP。目前各组织在IP网络上承载实时业务(如语音、视频等)的方式大体相同,均是利用了源自IETF的RTP,但是在呼叫建立和控制方面则有着不同的方案,其代表为H.323和SIP。2.2.1H.323协议H.323定义了四个功能实体:终端(Terminal)

23、、网关(Gateway)、网守(Gatekeeper)和多点控制单元(MTU)。H.323终端是分组网络的一个端点,可以与其他H.323实体进行实时双向通信。网关可以与H.323终端、其他ITU-T终端或其他网关之间进行双向通信,它将IP网络与电路交换网络连接起来,实现H.323实体与电路交换网终端的通信。网守提供了地址解析、接入控制、带宽控制、域管理等功能。多点控制单元(MCU)功是支持在三个或三个以上终端或网关之间进行音视频多点会议的设备,它包括一个命令多点控制器(MC)和可选的多点处理器(MP)。H.323支持的压缩算法符合ITU标准。为进行语音压缩,H.323终端必须支持G.711语音

24、标准,传送和接收A律和u律。其它音频编解码器标准如G722,G723.1,G729.A,MPEG-1音频则可选择支持。编码器使用的音频算法必须由H.245来确定。H.323终端应能对本身所具有的音频编解码能力进行非对称操作,如以G711发送,以G728接收。H.323协议规定,音频和视频分组必须被封装在实时协议RTP中,并通过发送端和接收端的一个UDP的Socket对来进行承载。而实时控制协议RTCP用来评估会话和连接质量,以及在通信方之间提供反馈信息。相应的数据及其支持性的分组可以通过TCP或UDP进行操作。2.2.2会话启动协议SIPSIP(Session Initiation Proto

25、col会话启动协议)是IETF推出的初始会话协议,它是一种基于文本的协议,采用SIP规则资源定位语言描述。它提供与呼叫的建立、控制功能相关的协议。它应用于IP电话,与H.323协议相比,具有简单、灵活的特点。SIP是文本格式的客户服务器协议,客户机发起请求,服务器进行响应,SIP既可以用TCP也可以用UDP来传送。一个SIP系统主要由两部分组成:用户代理和网络服务器。用户代理分为用户代理客户机(UAC)和用户代理服务器(UAS)。UAC用于发起呼叫,UAS用于响应呼叫。网络服务器也有两类,它们是代理服务器(Proxy)和重定位服务器(Redirect),代理服务器用于在主叫用户和被叫用户之间转

26、发请求和响应报文,重定位服务器收到用户请求后,若判定自身不是目的地址,则向用户响应下一个应访问的地址,而不是转发请求报文。SIP协议对终端提出了较高的要求,即终端需要包含用户代理客户机和用户代理服务器两部分,由它们实现呼叫请求、呼叫应答和用户的其他特殊需求。在SIP系统中,这样的终端称为智能终端。SIP系统的基本结构如图4所示:UACUASIP网络UACUAS 图4 SIP系统的基本结构图中IP网络中包含了SIP系统中的各种网络服务器。一次基于SIP协议的正常接续的流程是:1.主叫UAC向网络服务器(Proxy或Redirect)发出呼叫请求;2.网络服务器通过名字查找,用户定位,最终找到被叫

27、UAS;3.被叫UAS响应用户请求(接受或拒绝请求),该响应沿原路返回;4.主叫UAC收到响应后,接通被叫或终止此次呼叫请求。SIP协议的优点包括:该协议具有可扩展特性,可以轻松定义并迅速实现新功能。可以简单易行地嵌入廉价终端用户设备。该协议可确保互操作能力,并使不同的设备进行通信。SIP协议的缺点包括:SIP问世不久,因此大多数应用尚处于原型阶段。该协议单独应用的范围较窄。但与其他协议协同使用时,具有较强的灵活性。SIP协议只是完整解决方案的一小部分,还需要许多其他的软件来构建完整的IP电话产品。2.2.3H.225.0协议H.225.0主要用于端点与网守间的通信以及呼叫的控制。在呼叫开始之

28、前,端点一般需要遵循H.225.0中的RAS协议,注册在H.323系统中的控制点网守上,以便接受网守的呼叫认证管理和地址解析服务;之后由H.225.0中的呼叫控制协议规范端点之间建立呼叫联系的交互过程。H.225.0标准描述了在无服务质量保证的局域网上对信息流进行分组与同步传输的机制。H.225.0对传输的视频、音频、数据及控制流进行格式化,然后输出到网络接口。另外,它还完成逻辑帧、顺序编号、纠错与检错功能。RAS协议RAS全称为Registration、Admission、Status(登记、接纳和状态),是端点和网守间的通信协议,它包含的过程有网守搜寻、端点注册、端点定位、呼叫认证、呼叫退

29、出、带宽管理和状态查询等。在ARQ消息中,端点给出目的端的标识,关守如果接纳呼叫,则把目的端或自己的呼叫控制信道传输层地址在ACF中返回。不但主叫发起呼叫前要发送ARQ请求,被叫在收到对端的Setup消息时也要向所属关守发送ARQ请求。呼叫控制协议H.225.0的呼叫控制协议消息主要取自Q.931和Q.932协议,Q.931和Q.932是ISDN的标准,之所以被直接借用,是为了加快H.225.0协议制定的速度、保证可靠性且便于与SCN(Switched Circuit Networks)的互通。H.225.0的呼叫控制协议按H.323协议的要求,在Q.931和Q.932协议的基础上对信令过程作

30、了筛选,增补了信令消息中用户用户信息单元(UUIE)的内容,并对消息中其它某些字段编码和定义上的扩充和界定。H.225.0呼叫信令消息主要包括Setup(呼叫建立请求)、Alerting(振铃)、Connect(呼叫接通)、Release Complete(呼叫释放)等消息。2.2.4H.245协议H.245协议是通用的多媒体通信控制协议,主要针对会议通信设计。H.323系统采用H.245协议作为控制协议,控制媒体通信信道的建立、维护和释放。在H.245协议中定义了两种信道:控制信道和逻辑信道。控制信道用来在不同H.323实体间传送H.323消息以控制媒体信道的建立和释放,它在一条专门的可靠信

31、道上传送,必须先于传送媒体流的逻辑信道建立,并在通信结束后释放。逻辑信道又称为媒体信道,用来传送用户的媒体信息。逻辑信道可以是单向信道(无连接的UDP信道),也可以为双向信道(面向连接的TCP信道),T.120数据通信协议和语音通信都要求建立双向逻辑信道。可以认为H.245控制信道是一种特殊的逻辑信道,它在整个呼叫期间始终存在,信道号为0。H.245定义的主要控制过程包括:能力交换终端通过交换能力集,让对方知道自己可以接收的信号组合,目的是为了确保对方发送的都是自己能接受和解码的多媒体信号。主从决定主从决定过程是为了避免信令过程中的冲突现象。主从状态确定后,在整个呼叫中将保持不变。逻辑信道信令

32、过程这一过程包括逻辑信道的打开和关闭。在建立双向逻辑信道时,为了避免两方同时打开信道,首先通过主从决定过程确定一个主终端,由它启动信道的打开,在双方都知道对方的逻辑信道地址并确保对方也知道自己的地址以后,才开始媒体数据的传送。H.245消息的类型消息类型有4种:请求、响应、命令和指示。请求消息要求接受方执行所要求的操作并立即响应;响应消息是对请求消息的回复,可以确认或拒绝请求;命令消息也要求接受方执行所要求的操作,但不要求回送响应消息;指示消息只是传送信息,不要求接受方执行操作,也无需返回响应。2.2.5RTP/RTCP协议RTP(Real-Time Transport Protocol,实时

33、传送协议)可以用于任何实时数据流,例如语音和视频信号。RTP使接收端能校正IP网络所造成的抖动和乱序问题,它定义了一种承载等时数据IP包的格式,包括:所传送数据的类型信息;时间戳(timestamps);序列号(sequence number);另一个协议RTCP(Real-Time Transport Control Protocol)通常和RTP一同使用,它可以用于承载关于传输质量的反馈(如抖动量、分组的平均丢失率等),也能用于传输一些参与者的有关身份信息。RTP和RTCP能让接收者通过适当的缓冲和排序从网络的抖动中恢复数据,同时也能从网络上得到更多的信息,以确定采用适当的校正量(冗余、低

34、速编解码等)。RTP和RTCP通常用在UDP(User Datagram Protocol),用户数据报协议)上,因为TCP的重发机制不适于处理等待时间很低的数据,比如交互式通信。在这种情况下,RTP一般被分配在一个偶数UDP端口上,而RTCP分配在下一个奇数UDP端口上。2.2.6资源预留协议RSVPIEFT为IP QoS的实现定义了两种机制:一是Int-Serv综合业务模型,一是Differ-Serv差分业务模型。RSVP协议可以看成是实现Int-Serv体系结构中的信令,是综合模型的核心协议。它的基本思想是为数据流分配所需带宽,进行资源预留来防止拥塞,它通过扩展的OSPF路由协议按照流量

35、的方式选择合适的路由,进行适当的流量控制。会话(session)是RSVP中对最小单位数据流的定义。一个基本的RSVP资源预留请求包括两部分:“流描述(flowspec)”和过滤描述“(filterspec)”其中流描述定义所期望得到的QoS,而过滤描述和会话标识一起定义和标识某种流。RSVP的基本特征是:RSVP仅为单向数据流请求资源;RSVP的预留请求由接收者发起;RSVP可以适应路由及广播组的变化;业务流控制和策略控制参数对于RSVP是透明的且由RSVP承载;对于不支持RSVP的路由器RSVP可以透明的通过。RSVP在源端主机、目的端主机上运行,用来为特殊的应用数据流(如VoIP语音流)

36、向网络申请特定的服务质量;在路由器上运行,用来向该数据流沿途经过的节点传送QoS请求,建立并保持一定软状态以提供所需的服务质量。实际上,RSVP就相当于网络中单纯用于资源预留的信令,负责承载数据流描述和服务质量参数。它利用其它路由协议为路由消息寻路,同时,为完成对数据流QoS的保证,还要与它上层的策略机制和其他传输协议配合使用,进行控制管理和安全等工作RSVP的工作过程如下图5所示:图5 RSVP 的工作过程(1)在一个会话之前,主机必须用带外机制分配会话标识(包括目的地址、协议标识、目的端口号)并将其通知发送者和接收者;(2)接收者可以使用IGMP(Internet Group Manage

37、ment Protocol)加入利用目的地址定义的广播组(支持广播方式);(3)发送者首先发送RSVP路径(PATH)消息给每个接收者,中间经过路由器的中间节点时,除了一般的IP包选路和转发外,还要根据消息的内容为数据流创建软状态,或更新软状态的内容;(4)接收者接收PATH消息,并根据自己现在的运行情况和配置来进行响应,发送适当的RESV预留消息承载接收端所希望得到的服务质量描述(flow-spec);(5)当预留请求RESV消息上行经过中间节点时,该路由器将进行以下操作:预留链路资源:路由器接收REVP消息,将请求发送给内部的“允许控制”进程和“策略控制”进程;“允许控制”用来判断该节点是

38、否有足够的资源来满足所要求的QoS,“策略控制”用来判定用户是否有权力预留这样的资源,涉及的问题包括用户帐号、级别和优先级排队和认证等。如果两项检查都通过,该路由器将调用和设置它的包分类机制(packet classifier),根据过滤描述来选择如何处理下面将到达的用户数据包,同时根据流描述的要求,与适当的链路层交互,以取得所需的带宽、缓冲区资源。如果两项检查有一项失败,预留消息将被拒绝,RSVP进程将返回接收者一个差错消息。上行转发请求:检查成功后,路由器根据刚才上行留下的“软”状态,找到上行的路由地址,转发REVP消息。但是,上行的REVP的预留请求可能与下行接收的请求有所不同,路由器可

39、以进行修改,这是因为路由器中的流量控制机制可能修改流描述,同时,来自不同的下行支干支往同一个上行发送者时,预留请求可能会合并,而基本的RSVP模型是面向“one pass”的,接收者只能接收到中间节点的接受或拒绝消息,而无法了解端到端的业务状况。(6)发送者接收到RESV消息开始传送数据流。3 语音质量问题过去的几年里,在呼叫的成功呼通比率和时延、抖动、丢包等服务质量方面,处于发展初期的IP电话的通话质量是不敌传统电话的通话质量的。但是由于IP电话的费率远远低于传统电话,人们在目前这个阶段还可以接受这种服务质量。但是随着传统电信公司为应对竞争而降低长途资费,IP电话的质量问题必会日益凸显出来。

40、后起之秀的IP电话要想在电话市场中赢得一席之地,甚至超过传统电话,它的QoS(Quality of Service,服务质量)水平必须提升到一个较高的水准,最起码要与传统长话质量相接近,而其最终的目标应该是达到甚至超过传统长话质量。这是决定IP电话未来命运的关键因素。IP网络固有的尽力而为的特征,使IP电话的语音数据包在网络传输时并没有得到特别的保障。因此在现阶段要改善IP电话的QoS就只能由软件来完成。3.1QoS的一般概念QoS即是指服务质量,IP网络的服务质量反映了提供给用户的网络资源的多寡和对所承诺服务的保障程度。QOS是针对用户的每一项应用来定义的,而且每一项应用的准确的QoS参数只

41、能由用户来说明,因为只有用户能清楚每一项的应用究竟需要什么样的QoS值。可用表1以下几个Qos参数来界定服务质量:表1QoS参数值带宽(最小值)64Kbit/s,1.5Mbids,45Mbit/s时延(最大值)50ms全程时延、150ms全程时延抖动(时延偏差)最大时延的10%偏差、5ms的偏差信息丢失(差错)1000个分组中丢失1个分组有效性(可靠性)99.99%的网络可靠性安全性语音流的加密与鉴权带宽:带宽是一个链路所能容纳最大信息流量的标志,是这个链路每秒可通过的字节数的限度。一般以bit/s、Kbit/s、Mbit/s此为单位进行衡量。应该指出的是带宽是指网上传输任何业务信息时每秒所能

42、传输的字节数,作为一个QoS参数,它是某种应用能够正常工作的最基本的要求时延:时延是指一个处理过程的完成所延续的时间,一段网络的时延一般是指信息从进入网络开始到离开此段网络所需要的时间。这个值与此段网络的长度、途经的路由器的工作速度、网络拥塞情况等等有关。作为QOS的两个参数,网络的带宽与时延有着密切的关系的,一般的说,如果增加带宽就可以减小时延。IP网是分组交换网络,它能根据网络应用的活跃程度和突发程度为应用提供了不同的带宽值。这种带宽的可变性意味着网络的时延也会发生变化,这就引入了另一个参数抖动。抖动:抖动意味着信息流的不同部分具有不同的时延,更确切的说是时延的变化。它代表的是一个与时延参

43、数相关的但又是相对独立的参数。对时延抖动最敏感的应用是实时信息传输,如语音及视频。而对非实时应用时延抖动的影响则不大。Internet最初的建立是为了非实时数据,所以没有对抖动做出限制;而现在的IP电话却受到抖动的影响很大,要进行语音的传输就必须解决抖动的问题。信息丢失(丢包、差错):由于网络上协同工作的器件成千上万,出现偶然的错误在所难免,所以必须对信息丢失给予妥善的处理。对于非实时信息,可以采用重发的办法解决,以补偿数据的丢失。而对于语音通信这样的实时信息则不能采用这个办法,必须采用其他的办法来解决其信息丢失的问题。有效性(可靠性):这也是网络上协同工作的器件极其众多的原因。一条链路甚至整

44、个网络发生故障是不可避免的。同时,为了控制这种局面的发生而进行的预防性检修也会经常性使某条链路不可用,这就是所谓的有效性或可靠性的问题,实际也就是可用性的问题。从单一用户角度和整个网络的角度去看网络的有效性是不一样的,而QoS的有效性参数是针对整个网络的。安全性:这是一个相对较新却很重要的一个QoS参数。安全性问题的的核心内容包括保护用户的隐私和秘密以及服务器对用户进行的身份认证。这往往涉及到密码学的加密和解密的问题。目前已有较为完善的加密和解密的算法,并且成功运用于实际网络通信中。3.2影响语音质量的原因3.2.1压缩任何压缩算法都对语音质量有所影响,忽略所有其他的衰减原因不考虑,语音质量只

45、能达到压缩算法在接收站准确重构语音信号能力的水平。MOS等级为检测每个算法执行这些任务所达到的水平提供了一个手段。选择正确的算法以满足用户团体的要求很重要。在某些情况下,如果需要很高的语音质量,就意味着只能使用标准的64kbit/sPCM。3.2.2回声影响语音在IP网络中传输的回声有两种:一种是传统的混合回声,另一种是在IP电话终端产生的声学回声。混合回声是由远端交换局内的四线/二线混合转换电路产生的信号反射造成的,这种回声在传统的电路交换网中还可以容忍,甚至可以被正常的语音所掩盖,这是因为电路交换网中的语音往返时延小于50ms。但在分组交换网中的往返时延一般大于50ms,回声影响到正常的通

46、话,因此需要在分组网络中实现回声消除功能。ITU-TG.165标准定义了回声消除的性能要求,分组语音设备可通过回声消除器来实现回声的消除。混合回声在PC-PC结构的IP电话中不存在。因特网语音传输中的第二种回声源是所谓的“声学回声”。声学回声是指扬声器播放出来的声音被麦克风拾取后发回远端,这就使得远端谈话者能听到自己的声音。声学回声又分为直接回声和间接回声。直接回声是指扬声器播放出来的声音未经任何反射直接进入麦克风。这种回声延迟最短,它与远端说话者的语音能量,扬声器与话筒之间的距离、角度、扬声器的播放音量以及话筒的拾取灵敏度等因素相关。间接回声是指扬声器播放的声音经不同的路径一次或多次反射后进

47、入麦克风所产生的回声集合。因为周围物体的变动,例如人的走动等,都会改变回声的返回路径,因此这种回声的特点是多路径、时变的。另外,背景噪声也是产生回声的因素之一。一般采用声学回声消除器(AEC, Acoustic Echo Chancellor)来消除声学回声。声学回声消除器是以扬声器信号与由它产生的多路径回声的相关性为基础,建立远端信号的语音模型,利用它对回声进行估计,并不断地修改滤波器的系数,使得估计值更加逼近真实的回声。然后,将回声估计值从话筒的输入信号中减去,从而达到消除回声的目的,AEC还将话筒的输入与扬声器过去的值相比较,从而消除延迟的多次反射的声学回声。根据存储器存放的过去的扬声器

48、的输出值的多少,AEC可以消除各种延迟的回声。3.2.3延时延时是指从发出声音到听到声音的时间间隔,与语音录制、语音信号处理和语音分组在网络上传输的不确定性有关,延时是直接影响语音质量的主要因素,过长的延时会导致讲话人的声音产生重叠和回声,更长延时甚至会使讲话者的交谈无法进行,因为它延长了对话应答之间的时间,难以保持对话同步,这就产生了与数据网络中阻塞时类似的情况,发送方等待应答的忍耐可能超出了限度,迫使他再次发问相同的问题(重新发送),尽管应答可能已经在回来的路上了。端到端的时延要求分成四个等级如表2所示:表2时延等级150ms以下最好150ms-250ms较好250ms-450ms一般45

49、0ms以上差延时可以分成两部分,即传播延时和处理延时。(1)传播延时是指电流或光子通过网络传送发送的数据的速度。传播延时非常低,因为电子或光子在传输介质中的传输速度是每秒30万里,故对于跨国界的3000英里长的传输介质大约只需30毫秒(2)处理延时是由语音传输过程中处理语音数据流的所有组件。引起的VoIP网络中一个端到端语音传输过程中引起单向延时的因素有:模拟语音信号的数字化;数字语音信号的压缩;语音数据流的分组;VoIP的排队;初始网络链路上的传输和串行化延时(其大小取决于线路的信号速率);所有中间网络部件(路由器LAN 交换机WAN 交换机LAN/WAN 链路)上的排队和串行化延时;分组在

50、目的地的接收和排队;语音数据流的解包;数字语音信号的解码;数字信号到模拟语音信号的转换;上述因素中,编码、压缩算法延时取决于所采用的语音压缩编码算法,一般来讲,比特率较高的算法相比通常编码时间更长,因此必须在话音质量、延时和比特率之间达到某种平衡。排队产生的延时是指语音信号被打成IP包后经过某个设备节点时在设备端口排队所产生的延时,如果设备忙,需要同时传输的IP包较多,IP包排队等待的延时就比较大,串行化延时是指当轮到IP包队列逐比特经过网络接口发送到IP网络中所经历的时间,这个时间一般都很小,大约几个微秒。3.2.4抖动话音包经由网络到达接收端的延迟变化的现象称为时延抖动。由于每个数据包的时

51、延不等,使得到达的数据包在时间上分布不均匀,当时延的变化超过一包语音的时间长度时,还可能导致包序错乱。这些都对话音回放的质量有很大影响。克服抖动需要在接收端设置一个抗抖动缓存器来接收并保存数据分组,如果发现包序错乱,还要对其调整。解码输出模块以均匀的速率从缓冲区中读取语音包,解码并播放。延时和抖动是一对矛盾的统一体,过大的抗抖动缓冲区将增加语音的时延,过小的缓冲区将导致语音包的丢失。为了满足对抖动和延时的需要,必须根据实际情况通过试验来调整抖动缓存器的大小。3.2.5丢包丢包是影响话音质量最严重的因素,因为IP网络不提供可靠的传输服务。目前网络中把话音包和数据包同等对待,当过载和拥挤高峰时,它

52、们有同样高的丢包概率。3.2.6 语音活动检测语音活动检测(Voice Activity Detection,VAD)是数字信号处理器应用的一个技术,它通过自动检测会话中的静音时间段,并在这些时间段暂停数据流的产生,来减少发送的语音数据量。大多数对话的大约50%-60%的时间是安静的,这是由于在一方说话时,另一方通常在安静地听着。使用VAD技术,可将由安静的语音数据使用的带宽节省下来,分配给其他数据流类型,如数据。VAD通过监视语音信号的功率及功率的变化,到达语音信号的频率和该频率的变化来工作。VAD的挑战是正确标识讲话何时停止,又何时重新开始。在检测到讲话已经停止后,在离开分组处理之前,VA

53、D大约等待200ms,这个暂停帮助防止VAD切去讲话的尾部部分,或者讲话模式中的小停顿。类似地,CODEC引入5ms的延时,在检测到讲话的情况下“保持”语音信息,这意味着在VAD确定语音信号再次出现时,前面的5ms语音随当前语音信号一起发送。这个延时减少了前端剪切(切除了讲话的开始部分),但不能消除它。4提高话音质量技术方法如何提高话音质量,是IP电话系统的关键技术要求,也是技术难点。有以下几种技术方案能够提高系统的话音质量:4.1语音压缩技术在IP电话中采用语音压缩技术,目的是为了使用较少的带宽而且产生较低的延时,从而提高话音质量.在实际选择压缩算法时,要综合考虑各种因素。例如,高比特率可以

54、保证良好的话音品质,但要占用大量的存储空间,耗费更多的系统资源;而过低的比特率又会影响话音的品质和增加延迟。所以,在较低比特率的前提下,保持较好的话音质量,是选择压缩算法的原则。最基本的语音压缩标准是ITU1972年颁布的G.711标准。1995年11月,经过较长时间的研究,ITU批准了一个被称为G.729的新的语音压缩标准。G.729采用的算法,可以仅用8kbps传输语音,这个算法提供了高质量的音质,且延时很小。G.729标准后来在1996年进一步优化改进。现在G.729是最重要的语音压缩标准。其他的语音压缩技术还有几种,采用较多的是G.729和G.723/G.723.1。4.2静音抑制技术

55、静音抑制技术是指检测到通话过程的静音时段,并在这些静音时段停止发送语音包.静音抑制的目的是从声音信号流里识别和消除长时间的静音期,以达到在不降低业务质量的情况下节省话路资源的作用,它是IP电话应用的重要组成部分。用户打电话时,并不是总在占用通话信道。根据传统电话业务的统计,一方用户实际占用通话信道的时间不会超过整个通话时间的40%。这主要包括以下几个方面的原因:一是正在听对方说话;二是由于思考、稍事休息等原因引起的一段话之间的停顿;三是说话中间的停顿,如犹豫、呼吸、口吃等。第一种情况下停顿间隙长而出现频率低;第三种情况停顿间隙短而出现频率高;第二种情况界于一、三种情况之间。在用户没有讲话时,就

56、不发送语音分组,从而可以进一步降低语音比特率,节省宝贵的带宽资源,有利于减少用户感觉到的端到端的时延。4.3回声消除方案4.3.1回声源较复杂在传统电话系统中,存在着一种所谓的“电路回声”,该回声产生的主要原因是因为在传统的电话系统中,存在2-4线的转换。电话语音在传输的过程中,完成2-4转换的混合器因阻抗的不匹配,结果造成混合器的“泄露”。从IP电话系统组成方式可以看出,IP电话网关一边连接PSTN,另一边连接因特网。尽管电路回声产生于PSTN中,但该回声同样会传至IP电话网关,影响IP电话语音质量。因此说,电路回声是IP电话系统中的回声源之一。IP电话系统中的第二种回声源是所谓的“声学回声

57、”。声学回声又分为直接回声和间接回声。直接回声是指扬声器播放出来的声音未经任何反射直接进入麦克风,这种回声延迟最短:而间接回声是指扬声器播放的声音经过不同的路径一次或多次反射后进入麦克风所产生的回声的集合,因此这种回声的特点是多路往、时变的。另外,在IP电话系统中,背景噪声也是产生回声、影响语音质量的因素之一。4.3.2回声路径的延迟大在IP电话系统中,产生延迟的延迟源有:分别是压缩延迟、分组传输延迟和各种处理延迟。其中语音压缩延迟是产生回声的主要延迟。例如:H.323协议规定,在IP电话系统中,首选的压缩标准是G.723.1,在G.723.1标准中,压缩一帧(30ms)的最大压缩延迟是37.

58、5ms。另外,分组传输延迟也是影响回声的一个很重要的因素,而且,分组的传输延迟也很大。据测试表明,端到端的最大传输延迟可达400ms以上。因此,在IP电话系统中,回声的路径延迟一般比较大。4.3.3回声路径的延迟抖动大在IP电话系统中,由于回声路径的不确定、语音压缩延迟的不确定、分组传输路径的不确定等诸多不确定因素,带来了回声延迟的不确定,而且抖动较大,一般在20-400ms之间。4.3.4自适应回声抵消原理回声抵消的基本原理是用一个自适应滤波器模拟回声路径,通过自适应滤波算法的调整,使其冲激响应与实际回声路径相逼近,从而得到回声预测信号,再将预测信号从近端采样的语音信号中减去,即可实现回声抵

59、消,如图6所示:图6 回声抵消器自适应算法的要求是:收敛速度快、计算复杂度低、稳定性好和失调误差小。虽然许多自适应算法在理论上实现回声抵消都是可行的,但在大多数情况下,简单、稳健的算法比复杂的算法更可取,如得到广泛应用的LMS自适应算法,其原理是使预测信号的均方误差最小。4.4丢包解决方法延时抖动和丢包是网络传输中影响IP实时语音服务质量(QoS)的主要因素,而包丢失是音质下降的最主要原因。下面介绍一下丢包的原因。4.4.1丢包的原因拥塞在实际过程中,数据分组(即数据包)在网络中传输时一旦遇到网络阻塞,就会滞留在各个网络节点,而数据网络将丢失分组作为解决网络拥塞的手段,因此如果相应网络节点的分

60、组数量超过其缓冲极限,就会有部分数据丢失,即丢包。超值延时实时话音业务有严格的延时限制,长时间的延迟是不能承受的,分组延迟超过了抖动缓冲区的可忍耐极限时也将被视为丢失。传输损伤由于网络中传输设备的物理问题产生的损伤,如物理线路的信号畸变导致数据丢失。4.4.2丢包的修复方法重发顾名思义就是当收端发现某个数据分组没有收到时可以要求发端重新发送该分组。由于数据在收端要连续的回放,所以必须确保重发的数据在回放之前被接收,这对收端的回放缓存和系统定时提出了更高的要求。增加冗余度在网络传输的语音包流中加入一些冗余信息,一般以冗余包的形式出现。当语音包丢失时,可通过收到的冗余包所含的信息将其恢复过来.该技

61、术实质上也属于前向纠错(FEC)技术,在发送端设置编码器,接收端设置解码器。采用FEC技术处理的语音信号传输流程如下图7所示:图7 FEC 技术中语音信号传输流程图奇偶校验法奇偶校验法是一种简单实用的丢包恢复方法,可以有效的恢复n个语音包中单个包丢失的情况,其原理示意图如下图8所示。取n为4,第四个包加一个冗余包,该包为四个数据包异或操作的结果,这样,当四个包中任一个包丢失时,仅需用冗余包替代丢包即,可这种算法计算量小,但无法解决连续多个包丢失的情况。图8 奇偶校验法原理图改进的奇偶校验法对奇偶校验法进行改进后,可纠正连续多个包丢失的差错。将三个二进制数据包当作一组数据包处理,共有三组,每组中

62、同样序列的数据包异或相加可得一个冗余包,冗余包值如下表3所示。表3异或相加冗余包A1+B1+C1X1A2+B2+C2X2A3+B3+C3X3冗余包的计算这样当这9个数据包任意连续三个包丢失时,可通过其对应序列的冗余包恢复过来,同理,我们可以将其推广到一组两包、一组四包等情况,这种方法可有效地对付突发错误引起的多包丢失,缺点是冗余度较大,增加传输时延和带宽,改进的奇偶校验法原理图如下图9所示: 图9 改进的奇偶校验法原理图双重编码纠错技术之所以称为双重编码纠错是因为此时语音编码器输出的语音包包含两部分:当前语音包编码信息(CI)和以前语音包冗余编码信息(RI)。编码输出中的第n个包包含前面第n-

63、1个包(甚至更多包,如第n-2、n-3个等)的RI信息。如果接收端发现第n-1个包丢失,那么就可以利用随后收到的第n个包附带的RI来重构丢包。CI和RI编码的算法一般并不相同,冗余信息应该以较低的速率编码来降低不必要的资源浪费,如CI可用8HzPCMu律(64Kb/s)算法压缩,RI可用GSM(13Kb/s)来压缩,如采用最新的压缩算法则增加得更少,具体算法的选择应根据具体的应用场合而定。由原理图可知,这种纠错编码技术可恢复单个包的丢失,时延很小,只有一个语音包传输的固有时延,对于交互性场合较为适用,若应用中允许大的时延,则可以延时发送语音包的RI,这样可以纠正连续多个包丢失的突发性错误。原理图如下图所示:图10 双重编码纠错技术原理图分类处理为了在收端更好地采用波形替换技术,发端可以根据语音信号的特性分类处理,Sanneck

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!