电子信息工程毕业论文设计数字化音频领域的未来

上传人：沈*** 文档编号：80579612 上传时间：2022-04-25 格式：DOC 页数：23 大小：457.02KB

收藏版权申诉举报下载

第1页 / 共23页

第2页 / 共23页

第3页 / 共23页

下载文档到电脑，查找使用更方便

10 积分

下载资源

资源描述：

《电子信息工程毕业论文设计数字化音频领域的未来》由会员分享，可在线阅读，更多相关《电子信息工程毕业论文设计数字化音频领域的未来（23页珍藏版）》请在装配图网上搜索。

1、郑州大学优秀毕业论文数字化音频领域的未来The future of digital audio field学号：学生姓名：专业：电子信息工程指导教师：提交时间：2012.4.1 摘要随着数字信号处理技术的日益推进，IT领域的科技成果越来越普遍的应用于视音频领域并大大的推动了视音频科技的进步，传统的模拟视音频产品如今逐渐退出，采用数字化技术及其相应产品已呈不可抵挡的趋势。数字化的视音频产品必将涉及将类比信号转换成数字信号后加以传输的问题。而在这种转换的过程中需要做大量的数学运算，因此必须选择运算快速的微处理器才能完成实时(real-time)的数位信号处理。而市面上的微处理有成百上千种，各

2、有其特色及对应的应用场合，DSP以其特有的优势更加适合于完成上述任务。关键词：数字化音频 DSP 多媒体ABSTRACTAlong with the daily advancement of digital signal processing technology, scientific and technological achievements in the field of IT is becoming more and more common used in audio field and greatly push the progress of the audio technolo

3、gy, traditional analog audio products now gradually exit, using digital technology and its corresponding products is a trend which can not resist. Digital audio products will involve the transmission problem of when analogy signal is converted into digital signals. And in this kind of conversion of

4、process needed to do a lot of mathematical operation, so we must choose operation quick microprocessor to complete real-time digital signal processing. And the micro in market has hundreds of kinds, each have its characteristics and corresponding applications, DSP, with its special advantages is bec

5、oming more suitable to accomplish these tasks. Keywords: digital audio DSP multimedia目录第一章绪论41. 1模拟音频数字化的过程41. 2数字化音频领域的未来6第二章数字音频协议与芯片功能介绍102. 1 TDM 数字音频协议102. 2在基于AD1941 时分复用多通道数字音频处理模块设计112. 3音频处理模块编写13第三章多媒体中数字化音频技术的应用 143. 1 计算机音乐的应用现状14第四章数字化音频的未来-DSP184. 1 DSP的优势184. 2 DSP技术的发展趋势22第五章结论

6、23致谢23第一章绪论1. 1音频数字化的概念从字面上来说，数字化 (Digital) 就是以数字来表示，例如用数字去记录一张桌子的长宽尺寸，各木料间的角度，这就是一种数字化。跟数位常常一起被提到的字是模拟 (Analog/Analogue) ，模拟的意思就是用一种相似的东西去表达，例如将桌子用传统相机将三视图拍下来，就是一种模拟的记录方式。两个概念：1、分贝(dB):声波振幅的度量单位，非绝对、非线性、对数式度量方式。以人耳所能听到的最静的声音为1dB,那么会造成人耳听觉损伤的最大声音为100dB。人们正常语音交谈大约为20dB。10dB意味着音量放大10倍，而20dB却不是20倍，而是1

7、00倍（10的2次方）。2、频率（Hz）:人们能感知的声音音高。男性语音为180Hz，女性歌声为600Hz，钢琴上C调至A调间为440Hz,电视机发出人所能听到的声音是17kHz，人耳能够感知的最高声音频率为20kHz。将音频数字化，其实就是将声音数字化。最常见的方式是透过脉冲编码调制PCM(Pulse Code Modulation) 。运作原理如下。首先我们考虑声音经过麦克风，转换成一连串电压变化的信号，如图一所示。这张图的横座标为秒，纵座标为电压大小。要将这样的信号转为 PCM 格式的方法，是先以等时距分割。我们假设用每 0.01 秒分割，则得到图二。图一图二我们把分割线与信号图形交叉处

8、的座标位置记录下来，可以得到如下资料，(0.01,11.65),(0.02,14.00),(0.03,16.00)、 (0.04,17.74) .(0.18,15.94) 、 (0.19,17.7) , (0.20,20) 。由于我们已经知道时间间隔是固定的 0.01 秒，因此我们只要把纵座标记录下来就可以了，得到的结果就是 11.65 14.00 16.00 17.74 19.00 19.89 20.34 20.07 19.44 18.59 17.47 16.31 15.23 14.43 13.89 13.71 14.49 15.94 17.70 20.00 这一数列。这一串数字就是将以上信

9、号数字化的结果。在以上的范例中，我们的采样频率是 100Hz(1/0.01 秒 ) 。其实电脑中的 .WAV 档的内容就是类似这个样子，文件头中记录了采样频率和可容许最大记录振幅，后面就是一连串表示振幅大小的数字，有正有负。常见CD唱盘是以PCM格式记录，而它的采样频率 (Sample Rate) 是 44100Hz ，振幅采样精度/数位是 16Bits ，也就是说振幅最小可达 -32768，最大可达 +32767。CD唱盘是以螺旋状由内到外储存资料，可以存储74分钟的音乐。CD唱盘的规格为什么是 44.1kHz、16Bits呢？关于 44.1kHz 这个数字的选取分为两个层面。首先人耳的聆听

10、范围是 20Hz 到 20kHz ，根据 Nyquist Functions ，理论上只要用 40kHz 以上的采样频率就可以完整记录 20kHz 以下的信号。那么为什么要用 44.1kHz 这个数字呢？那是因为在 CD 发明前硬盘还很贵，所以主要将数字音频信号储存媒体是录像带，用黑白来记录 0 与 1 。而当时的录像带格式为每秒 30 张，而一张图又可以分为 490 条线，每一条线又可以储存三个取样信号，因此每秒有 30*490*3=44100 个取样点，而为了研发的方便， CD唱盘也继承了这个规格，这就是 44.1kHz 的由来。在这里我们可以发现无论使用多么高的采样精度/数位，记录的数字

11、跟实际的信号大小总是有误差，因此数字化无法完全记录原始信号。我们称这个数字化造成失真称为量化失真。数字化的最大好处是资料传输与保存的不易失真。记录的资料只要数字大小不改变，记录的资料内容就不会改变。如果我们用传统类比的方式记录以上信号，例如使用录音带表面的磁场强度来表达振幅大小，我们在复制资料时，无论电路设计多么严谨，总是无法避免杂讯的介入。这些杂讯会变成复制后资料的一部份，造成失真，且复制越多次信噪比 ( 信号大小与噪音大小的比值 ) 会越来越低，资料的细节也越来越少。如果多次复制过录音带，对以上的经验应该不陌生。在数字化的世界里，这串数字转换为二进制，以电压的高低来判读1与0，还可以加上各

12、种检查码，使得出错机率很低，因此在一般的情况下无论复制多少次，资料的内容都是相同，达到不失真的目的。那么，数字化的资料如何转换成原来的音频信号呢？在计算机的声卡中一块芯片叫做 DAC(Digital to Analog Converter) ，中文称数模转换器。DAC的功能如其名是把数字信号转换回模拟信号。我们可以把DAC想像成 16 个小电阻，各个电阻值是以二的倍数增大。当 DAC 接受到来自计算机中的二进制 PCM 信号，遇到 0 时相对应的电阻就开启，遇到 1 相对应的电阻不作用，如此每一批 16Bits 数字信号都可以转换回相对应的电压大小。我们可以想像这个电压大小看起来似乎会像阶梯

13、一样一格一格，跟原来平滑的信号有些差异，因此再输出前还要通过一个低通滤波器，将高次谐波滤除，这样声音就会变得比较平滑了。从前面的内容可以看出，音频数字化就是将模拟的(连续的)声音波形数字化(离散化)，以便利用数字计算机进行处理的过程，主要包参数括采样频率（Sample Rate）和采样数位/采样精度（Quantizing，也称量化级）两个方面，这二者决定了数字化音频的质量。采样频率是对声音波形每秒钟进采样的次数。根据这种采样方法，采样频率是能够再现声音频率的一倍。人耳听觉的频率上限在2OkHz左右，为了保证声音不失真，采样频率应在4OkHz左右。经常使用的采样频率有11.025kHz、22.0

14、5kHz和44.lkHz等。采样频率越高，声音失真越小、音频数据量越大。采样数位是每个采样点的振幅动态响应数据范围，经常采用的有8位、12位和16位。例如，8位量化级表示每个采样点可以表示256个(0-255)不同量化值，而16位量化级则可表示65536个不同量化值。采样量化位数越高音质越好，数据量也越大。反映音频数字化质量的另一个因素是通道(或声道)个数。记录声音时，如果每次生成一个声波数据，称为单声道；每次生成二个声波数据，称为立体声(双声道)，立体声更能反映人的听觉感受。除了上述因素外，数字化音频的质量还受其它一些因素(如扬声器质量，麦克风优劣，计算机声卡A/D与D/A（模/数、数/模）

15、转换芯片品质，各个设备连接线屏蔽效果好坏等)的影响。综上所述，声音数字化的采样频率和量化级越高，结果越接近原始声音，但记录数字声音所需存储空间也随之增加。可以用下面的公式估算声音数字化后每秒所需的存储量(假定不经压缩):存储量=(采样频率*采样数位)/8(字节数)若采用双声道录音，存储量再增加一倍。例如，数字激光唱盘(CDDA，红皮书标准)的标准采样频率为44.lkHz，采样数位为16位，立体声，可以几乎无失真地播出频率高达22kHz的声音，这也是人类所能听到的最高频率声音。激光唱盘一分钟音乐需要的存储量为:44.1*1000*l6*2*60/8=10，584，000(字节)=10.584MB

16、ytes这个数值就是微软Windows系统中WAVE(.WAV)声音文件在硬盘中所占磁盘空间的存储量。由MICROSOFT公司开发的WAV声音文件格式，是如今计算机中最为常见的声音文件类型之一，它符合RIFF文件规范，用于保存WINDOWS平台的音频信息资源，被WINDOWS平台机器应用程序所广泛支持。另外，WAVE格式支持MSADPCM、CCIPTALAW、CCIPT-LAW和其他压缩算法，支持多种音频位数，采样频率和声道，但其缺点是文件体积较大，所以不适合长时间记录。因此，才会出现各种音频压缩编/解码技术的出现，例如，MP3，RM，WMA,VQF,ASF等等它们各自有自己的应用领域，并且不

17、断在竞争中求得发展。1. 2数字化音频领域的未来数字化时代对人类的发展产生了巨大的变化，我们亲身经历了数字技术的蓬勃发展，目睹了它以惊人的速度，渗透到社会与生活的方方面面。数字化技术已全面的进入到广播影视领域，正对我们的行业带来实质性的变革。清楚地把握数字音频技术的发展动向，对正确推进广播影视领域的数字化进程将有极其重要的意义。一、模拟与数字音频技术的关系和互补性把握数字音频技术发展的方向，我们必须对数字音频与模拟音频技术之间有一个科学的认识，并清楚这样一个概念：数字化是一种手段，但我们始终离不开这个模拟的世界，所以我们要清楚模拟与数字音频技术的优势和弱点。对音频的质量上来说，数字音频通过

18、模数/数模转换后，越接近模拟音质就越好。但是，数字化技术在音频的编辑、合成、效果处理，存储、传输和网络化，以及在价格等方面，有极大的优势。半导体技术高速发展的今天，在专业音频领域，为了得到温暖的模拟音质，仍旧需要采用电子管器件，如电子管话筒、电子管前置放大器和压缩器，以及功率放大器。为了与数字化音频系统配合使用，不少最新的音频专业电子管产品带有了数字接口。所以，数字化时代的音频技术，并不是弃模变数，而是两者有机的结合，取长补短，用数字化技术去追求模拟的音质，用数字化手段来弥补传统音频设备的弱点。目前世界上公认音质最好的调音台，如AMEK 9098和SSL 9000J 系列，就是模拟数控台，即

19、模拟信号流，数字化的控制系统，另外还配置了模数转换接口，这就是模拟音频技术与数字技术结合的实例。电脑技术已将人们带入了一个虚拟世界。音频领域也不例外，音频工作站的发展已越来越成熟，人们已称它为虚拟录音棚。虚拟音频制作系统中，包括了录音机、调音台、周边信号发生器、非线性编辑和数据库等。这种虚拟系统不仅有价格的优势，而且功能齐全，符合数字化，网络化发展的要求，其音频的质量可与一些高级传统音频设备抗衡。它符合数字化、网络化的要求，其价格与传统设备相比，则更有优势。近年来，虚拟音频制作系统对界面的外控操作上，正逐步向传统设备的操作概念发展。还与传统调音台有机结合。除Protools音频工作站已有了P

20、ro Controls外控操作台外，索尼公司已将DMX-100调音台与Pyramix虚拟音频制作系统结合，DMX-100调音台的48路数字音频通道可通过MADI模数/数模转换器与Pyramix连接，Pyramix可通过DMX-100的24个电动马达推子实现外部自动化控制。另外SSL 9000J 系列高级模拟数控台也可与Pyramix虚拟音频制作系统配合使用，音频信号可通过PCM/MADI转换器或DSD转换器与Pyramix连接，SSL 9000J 系列调音台上的控制键钮和推子可通过索尼422协议与Pyramix连接。上述种种可以看到，数字时代音频的发展，从音质上讲，数字与模拟的追求是一致的；从

21、数字技术在音频领域的应用来看，它仍然依托着传统的模拟设备而向前发展。二、数字音频格式PCM和DSD的发展状况PCM脉码调制数字音频格式是70年代末发展起来的，记录媒体之一的CD，80年代初由飞利浦和索尼公司共同推出。PCM的音频格式也被DVD-A所采用，它支持立体声和5.1环绕声，1999年由DVD讨论会发布和推出的。PCM的比特率，从14-bit发展到16-bit、18-bit、20-bit直到24-bit；采样频率从44.1kHz发展到192kHz。到目前为止PCM这项技术可以改善和提高的方面则越来越来小。只是简单的增加PCM比特率和采样率，不能根本的改善它的根本问题。其原因是PCM的主

22、要问题在于： 1）任何PCM数字音频系统需要在其输入端设置急剧升降的滤波器，仅让20 Hz - 22.05 kHz的频率通过（高端22.05 kHz是由于CD 44.1 kHz的一半频率而确定），这是一项非常困难的任务。2）在录音时采用多级或者串联抽选的数字滤波器（减低采样率），在重放时采用多级的内插的数字滤波器（提高采样率），为了控制小信号在编码时的失真，两者又都需要加入重复定量噪声。这样就限制了PCM技术在音频还原时的保真度。为了全面改善PCM 数字音频技术，获得更好的声音质量，就需要有新的技术来替换。近年来飞利浦和索尼公司再次联手，共同推出一种称为直接流数字编码技术DSD的格式, 其记录

23、媒体为超级音频CD即SACD，支持立体声和5.1环绕声。DSD音频格式简化了信号流程，去掉了PCM使用的多级滤波器，将模拟音频直接以2.8224MHz的高采样频率，按1-bit的数字脉冲来记录。虽然DSD格式表示的声音信号是数字化数据，但是它又与真正的声波非常接近，可完整的记录当今最佳模拟系统的信息。最好的30ips半英寸模拟录音机能记录的频率能超过50KHz，而DSD格式的频率响应指标为从DC到100KHz。能覆盖高级模拟调音台的动态范围，通过其音频频段的剩余噪声功率，保持在-120dB。DSD的频率响应和动态范围，是任何数字和模拟的录音系统无法与之比拟的。从声音的质量上来说, 数字音频技术

24、是为了接近模拟声音的质量。DSD音频格式的发展将更有利的与模拟音频系统配合。三、为何DSD音频格式是最好的数字音频格式2001年AES 110年会的报告指出DSD是最好的音频格式选择。环球而顾, EMI和Virgin也新加入了索尼和飞利浦的SACD/DSD的行列，除了华纳之外，几乎所有大唱片公司都支持SACD/DSD的格式。当前还没有真正的直接24/192kHz录音，仅仅是从24/48kHz录音转换的。真正的DVD-A出版非常少，目前还没有这种格式的市场。而在北美已超过400多版的SACD的出版，并且继续在发展。按照Stereophile（在北美高档音频杂志）的最新统计指出有高达30%的

25、读者表示将在2001年底加入SACD的行列，或者在明年初有31%的读者加入此行列。而DVD-A的百分比是12%。当问及读者支持哪一种格式时，回答是SACD。几乎所有主要的DVD-A与SACD格式的试听评价中，都由SACD取胜。这包括Stereophile、 Absoulte Sound 、Surround Sound Review和Widescreen Review音频发烧杂志以及如Bob Ludwig那样的，对录音工业有非常影响的专业工程师。在今后若干月有几个发展动向，将会有新的芯片出现可同时播放SACD和DVD-A格式，这将被用到新的DVD播放机中。主要的问题是这种多功能的芯片要兼容多格式

26、对解码的音频质量不会太好。除了音质方面的改善外，SACD的另一个关键要点是有完善的防盗版保护方式，在SACD上同时有可见和不可见的水印，SACD播放机要读到水印才能工作。SACD具有SACD和CD两层，仍旧可以汽车里的CD中播放，而DVD-A则不行。对音乐存储媒体来说，74分钟的容量是十分重要的。4.7 GB 的SACD能存储74分钟DSD 8个通道（ 2通道立体声和DSD 6通道的环绕声）。采用了一种被称为直接流数字转换（ Direct Stream Transfer）无损编码方式的飞利浦技术。这种无损编码可节省50%的存储空间。 DVD-A采用的是一种被称为MLP无损包装（Meridi

27、an Lossless Packing ）的编码技术。4.7 GB 的DVD-A 能存储55分钟20 bit,192kHz PCM 6通道的环绕声。这种无损编码可节省35%-50%的存储空间。四、DSD的应用范围DSD的脉冲序列可以直接下转为传统的PCM数字音频。目前在PCM和DSD共存的期，采用DSD下转运算技术，可以尽量保证音频信号的质量，消除内部重复量化错误，抑制波动，将混淆误差控制在最小。将DSD比特流下转为16-bit/44.1 kHz数字音频，直接记录在普通的CD上，可使16-bit的数字音频接近20到24-bit的精度，使得16-bit的CD尽可能的保持DSD的音质。 DSD选取

28、2.8224 MHz高采样频率，其优势是可高精度的按整数的乘法和除法下转当前所有PCM采样频率。以DSD格式记录既能保证音频质量，又能通过下转满足不同的应用和要求。除了用于音乐录音外，也适用于影视的音频制作，最终合成的节目可通过下转，用来传输或记录在媒体上，如5.1的节目需要进行AC-3或DTS的编码。DSD音频格式与现有的音频设备配合，不仅仅可以改善当前节目的音频质量，而且对高清晰数字电影和高清晰数字电视的音频是一个极大的支持。DSD是理想的节目素材存储格式，用于母版的保存或数据库的建立。DSD的采样频率是CD的64倍即2,822,400 Hz。但是DSD每个采样仅占用1 bit，因此每个通

29、道每秒的比特率为1 x 2,822,400 Hz或 2,822,400 bits。而CD每个采样占用16 bits，因此每个通道每秒的比特率为16 x 44,100 Hz或705,600 bits。实际上，DSD总的数据流只大于普通CD的4倍，数据量可以被当前的磁带和硬盘容纳。DSD也是保存节目的理想格式。各国音响资料馆都面临着一个共同的问题，磁带只有30年的保存期，而每种版权则有100年的保护。选择哪种方案可将原始资料较理想的保存下来？这个问题一直得不到解决的方案，而资料越积越多，部分老化的资料已无法恢复。直到SACD的出现，美国国会所属的国家档案馆首先决定采用。DSD的录音制作与传统的录音

30、制作，对设备和技术上没有重要的区别。需要增加的是DSD的模数/数模转换器和DSD录音编辑工作站，不少录音棚已经采用高级模拟调音台和现存的PCM录音设备成功的进行了DSD的录音。飞利浦发展了一种DSD录音技术的P3D的转换格式，即可以将64 DSD bits描述成3 x 24-bit AES-EBU数字节，有可能将一台24轨/24-bit 44.1 kHz PCM录音机改变成为一台8路的DSD录音机。五、 Pyramix 虚拟音频制作系统目前SACD和DVD-A都在推广之中，PCM与DSD两种数字音频格式需要一段共存期。我们必须考虑PCM/DSD的兼容和转换。因此Pyramix 虚拟音频制作系

31、统有很大的优势，它是当前仅有一个完善系统可同时完成DVD-A (24/192kHz)和SACD/DSD (1bit/2.8Mhz)的音频制作系统。上述文章已经提到索尼公司已将DMX-100调音台与Pyramix虚拟音频制作系统结合，另外，世界数字和模拟音频设计大师Ed Meitner也为Pyramix配置了当今世界最好的8路模数/数模转换器,支持DSD和PCM两种格式。由加拿大专业传媒公司和瑞士Merging Technologies共同推出的Pyramix 4 全中文版已经正式上市。Pyramix在功能上的综合优势有：兼容PCM与DSD两种数字音频格式；基于高度稳定的Win2000专业工作平

32、台，可单系统独立使用，也符合多系统网络化建设；其DSD编码格式有利与高级模拟音频系统配合；包括5.1环绕声的AC-3和DTS合成和编码；具有全套的不丢帧同步能力，支持电视、电影以及目前市场上唯一支持高清晰电视HDTV Trilevel的声音同步。再加上所有的 VITC 及LTC设置，可锁定于任何视频或音频设备。Pyramix 4中文版除了它的全新的全中文介面、全面的编辑功能、全实时的专业效果器组合、全部可自行配置及自动化控制的虚拟调音台之外，Pyramix 4还添加了：1. DSD 1bit, 2.8Mhz (SACD) 录音、制作及母版制作功能2. 支持192kHz 到 384kHz高采样频

33、率录音、制作及母版制作功能3. 特别为工作于96kHz 到 384kHz 及 DSD 采样频率而特别设计的实时效果器4. 不需要转换地直接支持OMF (Avid) 及 SD2 (Protools)的音频格式5. 新的效果器包括：实时大型、全部可自行配置的VU表指示系统实时相位表 (可配置为多声道显示) 实时录音用通路工具组件为母版制作及环绕声制作使用的实时总线工具组件新式强化的实时全自动化声像移位器，可用于双声道立体声素材及单声道素材6. 为多声道音乐录音、编辑及母版制作而强化的工具，包括节拍器轨。按照节奏及拍子的多种变化而自动调整时间线，按节奏轨自动调整时间线及节拍。7. 通过最多可

34、支持8块DSP卡，要增加Pyramix的能力，只要添加Mykerinos DSP卡。8. 支持DIRECTX插件及ASIO，可与其它专业音频效果器及应用程序相连。9. 使用不同控制协议，可通过多种控制介面控制多种外部设备。10. 直接支持新式的Sony DMX-R100 (MADI I/O 接口)调音台。Pyramix虚拟音频制作系统，是经索尼和飞利浦和公司证的DSD系统，也是世界上唯一的系统，可以有以下DSD的功能：1. 2-24 声道DSD录制及还放。2. 为DSD的多声道编辑，加上实时淡出/淡入及声音渐变效果。3. PCM到DSD 转换。4. 实时高采样率效果器，包括混响也是基于DSD模

35、式的。5. 可制作DSD环绕声。6. 为SACD 完整的D及E表指示，红皮书标准。7. DSD特有的高采频样滤波器。在广播影视领域大规模数字化进程中，我们已感受到音频制作手段的快速更新，工作效率大大提高，但对数字化后的音频质量，还须有更高的追求，高清晰度电视和数字电影更需要有与之相适应的高质量音频。飞利浦和索尼公司计划告别他们的多比特PCM格式，全面推广DSD格式。这不是一个偶然的，它关系到数字化音频发展的趋势，因此在数字化规划中，应当逐步将DSD技术应用于实际，真正走在广播影视数字化进程的前列。第二章数字音频协议与芯片功能介绍滤波/均衡器、压限器等是声频系统中常用的信号处理设备模块，其目的

36、是用以实现对音频信号实现幅度调整、频率均衡、声音效果和动态压缩/限制等处理的功能。随着数字技术的发展，与模拟音频系统相比，数字音频在处理、传输、储存等各方面都有很强的优越性。数字音频处理在现代音频处理系统中具有模拟音频处理无法比拟的优势，各种信号处理设备已逐步实现数字化。目前通用 DSP 在数字音频处理的应用中存在各个模块的算法复杂、代码移植繁琐、开发周期长等不方便的地方。而目前专用音频 DSP 地出现将使数字音频系统的开发设计工作变得更方便高效。现在已有单片集成电路上集成了多路音频专用 DSP 和高性能声频数据转换器的解决方案。以图形化的模块代替复杂的算法和繁琐的代码缩短了开发的

37、时间和精力。并且为开发人员提供了专业高品质的数字声音处理模块。2.1 TDM 数字音频协议1.TDM 数字音频协议TDM-I2S 是一种在 IIS 协议基础上的时分复用的数字音频协议。TDM-2S 串行数字总线主要由 4 条信号线组成：1）MCLK，系统时钟，其频率一般是采样频率的 256 倍。2）LRCK，帧时钟，每个 LRCK 可以传输 8 路音频信号，LRCK 的频率等于采样频率。3）BCLK，位时钟，即对应数字音频的每一位数据，每一路音频信号对应 32 个 BCLK 时钟。4）SDATA，串行数据，用二进制补码表示的音频数据。2.芯片介绍AD1940/AD1941 是 ADI 公司推

38、出的一款完整的 28 位、单芯片、多通道音频 DSP。音频的大部分处理均采用完全 56位双精度模式完成，低电平信号性能极佳，并且无极限环或空闲音。压缩器/限幅器采用高端广播压缩器常用的先进多断点算法。芯片的数字输入和输出端口可以通过多个双通道串行数据流或 TDM 数据流，与 ADC 和 DAC 实现无缝连接。2.2在基于 AD1941 时分复用多通道数字音频处理模块设计数字音频处理模块作为数字音频系统的重要模块，在数字音频系统中已经广泛应用。为了解决目前的音频处理模块存在代码编写繁琐、设计周期长的问题，提出了一种基于单芯片的图形化编程的快速设计方案。采用基于AD1941 多路数字音

39、频处理芯片与 Sigma Studio 设计工具的设计方案，实现了对多路音频数据诸如均衡、增益、压限等多种复杂的音频处理。在190- -TDM 模式下，AD1941 可以输入 8 通道或 16 通道串行数据，并且可以输出 8 通道或 16 通道串行数据。输入和输出端口配置可以分别独立设置。模块总体设计上位机通过 USB 转 IIC 下载线对 AD1941 数字音频模块芯片配置，进行诸如：音量控制、滤波、增益、压限等音频处理。如图 1 为数字音频处理模块信号流程图，外部为模块提供音频信号的主时钟 MCLK，4 路立体声数字音频通过 TDM模式传输到音频处理模块，模块对 4 路立体声音频

40、信号进行前级滤波，多段 EQ 均衡器，后增益，多频段压缩/限幅的处理。上位机可以通过 IIC 控制端口可以实现动态免点击参数更新，最后芯片模块选择通过 TDM 模式输出数字音频。 AD1941 硬件电路设计AD1941 芯片的外围电路为：输入数字信号，输出数字信号，I2C 控制，电源，芯片管脚配置。在本设计中输入数字信号既可以用标准的 IIS 信号，也可以用时分复用的 TDM-IIS信号。输出亦然。控制采用了 IIC 控制协议，用来配置内部寄存器、下载程序。在程序运行时，IIC 也可以动态调节程序参数。 ADR_SEL接上 4.7 k 电阻上拉至 3.3 V，把芯片设备地址的低位为

41、 1。把 PLL_CTRL2 上拉、PLL_CTRL1 下拉、PLL_CTRL0 上拉，配置为“101”使系统时钟（MCLK=Fs*256）。图 3 为本设计的外围电路。在 AD1941 的电路中，需要注意以下问题：1）电源与地的设计。在电源方面芯片需要 3.3 V 与2.5 V 的两组电源。电源由外部系统提供，在外部电源雨内部电源中间添加了保险管，用来防止外部电源异常时对芯片的损坏。芯片的电源管脚都采用了相应的 0.1 F 的陶瓷滤波电容。2）数字接口设计。本设计的硬件电路采用冗余的数字接口。同时兼容 IIS 与 TDM-IIS 两种数字

42、音频协议。当在 TDM-IIS协议中输入为 1941B_SIN3 管脚，输出为 1941B_SOUT0 管脚。3）阻抗匹配。为了减少传输线上的信号被反射，在信号的源端与传输线之间串接一个 33 电阻，使源端的输出阻抗与传输线的特征阻抗相匹配。软件设计系统软件使用 ADI 的音频处理芯片专用的辅助图形画编译软件 SIGMA STDIO。此软件支持下载器在线调试，设计对八路信号进行 EQ 调节，前后增益的软件。结合参数寄存器 AD1941 内核寄存器的控制打开 SIGMA STDIO 软件，在软件左边的 Tree Toolbox 下的 Communication Channel 拖入

43、 USBi 模块、Processors 下拖入AD1941 模块，用线连接 USBi 与 AD1941 并选择芯片 IIC 的从地址。点击进入 Hardware 的 Register Control ，对于输入模块把 Serial input 设置成 TDM，把 Input Serial Port to Sync 设置为 LRCLK，把 Input 配置为以 LRCLK 为同步信号的 TMD输出模式。对于输出模块把 Serial Output 的 Frame Sync Type（帧同步类型）设置成 LRCLK、Frame Sync Freq 设置成 clock/1536、MSB Po

44、sition 设置为 delay by 1、word length 设置为 24bits、最后选择 TDM enable，把 Output 配置为 TDM 输出模式。对于核寄存器把 Dsp core 的 Program Length 设置为 1536（48kHz），并选择 Zero All Registers 用于在对芯片启动前对说有的寄存器清零。通过以上的设置整个音频模块把模块配置为对频率为48 kHz，有效位为 24 bits，同步信号为 LRCLK，输入输出为TMD 模式的模块。2.3音频处理模块编写在本设计下我们要对4路立体声（8 路信号）进行 EQ 和前后增益的处理。1）

45、连接 USB 设备。当把下载线插入 USB 接口，windows可以探测到 USB 设备。打开添加硬件向导可以顺利完成 USB设备驱动的安装。2）设置输入输出。打开 SIGMA STDIO 软件，在（IC1）AD1941 的 IO 选项里面选择 Input 并添加 schematic 窗口内，把输入设置为 8 路输入。选择 Output 并添加 schematic 窗口内，把输出设置为 8 路输出。3）添加双路立体声 EQ。在 Filters 选项里面选择 SecondOrder（二阶滤波器），然后选择 Double Precision（双精度），再选择 2 Ch（双通道立体声）

46、，最后选择 Medium-sized（中等类型的）。添加到窗口里。然后把 1 路的 EQ 设置成 8 路 EQ。并设置各路 EQ 的中心频率、EQ 类型、Gain、Q 值、各段 EQ 的数值。类似的添加另外 3 路形成 4 路立体声 EQ。4）添加前后立体声增益。在 Basic DSP 选项里面选择Linear Gain，点击设置为双通路的 Gain，在每个 EQ 前后分别放置一个 Gain 模块。5）添加压限。在 Dynamic Processor 选项，里面选择 RMSDetector，点击设置压限的各种参数。6）把 8 路信号按顺序连接前增益、八段 EQ、后增益、输出。7）

47、分别按顺序执行 link project、link compile project、linkcompile download，把程序下载到芯片中。8）程序下载完成后通过图形化操作动态的调节 EQ、前后增益、压限，音频模块的参数，从而动态调节音频参数。图 4 是基于 SIGMA STUDIO 编写的音频处理模块的程序框图。其 8 路信号分成以一个立体声为一个单位的 4 组立体声音频处理单元，每路立体声分别进过前增益、EQ 均衡器、后增益、压限。图 4 数字音频处理 SIGMA STUDIO 程序框图。结论这是基于AD1941 芯片以及配套设计软件SIGMA STUDIO 的系统。以 A

48、D1941为核心，实现了前后增益、EQ 均衡器、压限等多种数字音频处理。基于PC端的SIGMA STUDIO设计软件是通过使用软件提供的各种图形化的音频处理模块，配合使用基于 IIC 协议的下载线，使数字音频设计变得方便快捷。第三章多媒体中数字化音频技术的应用人类对自然的征服和对自我的超越是永无止境的一种不可恩议的工具计算机的到来使我们的工作和学习处于一个充满幻想和创新的时代。多媒体系统的开发与应用，使计算机的应用天地更为绚丽多彩。多媒体技术的发展，最早可追溯到1984 年。APPLE公司推出的MAcINT0sH机中，引入了BITMAP(位映射)的概念，对图形进行处理并使用了窗

49、口和图标作为用户接口。此后，至1987年8月引入了HYPERcARD，使MACINTOSH机成为用户可以方便使用的能处理多种信息媒体的机器。此后，多媒体技术的不断更新发展，制定出一系列的行业标准至 1991年，在美国拉斯维加斯的电脑博览会上多媒体产品的首次推出引起了世界的轰动这对电脑多媒体技术的发展无疑起到了极大的推动作用。正是由于多媒体技术的诞生，使计算机应用于声音以至于音乐领域，有了一个关键性的开端。多媒体技术主要表现于视、听两大领域音频技术作为多媒体技术的重要组成部分，它一方面有广橱的应用领域，一方面又获得了长足的发展。声音包括频率(音高)、幅度(振幅)、长度(时值)、音色(谐波成分和

50、发声过程)几个要素。音乐就是有规律的一组声音。音乐的基本单位是音符，每个音符的高低和长短由这个声音的频率和时值来决定因此，数字化音频技术可广泛应用于音乐信号的处理。在国外，应用于音频技术的各种设备(包括MIDI设备、音响设备)正以惊人的速度发展并逐步将这些设备列人到计算机的外设中去，这是由于这些设备都可以与计算机相连。3. 1 计算机音乐的应用现状计算机音频技术的发展较计算机的其它技术发展较晚。最初设计者只是用声音信号作为操作者的提示而设计的。这种功能至今都保留在各种类型的计算机里，这些声音最初是用汇编语言控铽。伴I随着语音技术在计算机领域中的广泛应用，音乐也逐步被引人电脑。最初的引入只是

51、把音乐加人到计算机的演示节目岛去，以增强演示的效果。这种简单的、初级的音乐行为却为音乐开辟了一片广橱的天地为音频技术的发展提供了一个重要的发展方向，从而丰富和发展了多媒体技术。迄今为止，计算机音频技术已不仅在电脑本身的声音发展以及对多媒体的开发应用方面有了长足的发展，而且有了更广阔和更为专业性的应用范围以下将分别从三个方面介绍音频技术各种应用范围的设备组成及其应用方法。 1. 计算机音乐应用于创作与制作 A. 计算机作曲计算机作曲包括；利用计算机产生由音符或节奏组成的前所未有的创作乐曲，并把它演奏出来。计算机作曲可分为；随机作曲、逻辑作曲和智能作曲。随机作曲在规定了一定的音名、音高

52、范围、时值取值之后，让计算机随机产生旋律，这就是计算机随机作口在计算机音乐发起的初期，许多人都做过这种尝试。除音乐之外-也应用其它声音，或配以和弦。但迄今为止还未听到过很好的随机计算机音乐作品。逻辑作曲在随机作曲方法之上，附加上一定的逻辑，诸如规定出起始音与结柬音不准作某一种音程的进行等等-用这样的方法进行作曲就是计算机逻辑作曲。虽然用这种方法也得到了一些说得过去的旋律-但其应用价值不大。智能作曲简言之，用计算机代替作曲家作曲，就是智能作曲。这是人们梦想实现的，也作出了一些初步尝试，但与全方位地应用智能作曲还相距很远。 B. 计算机辅助作曲计算机音乐为音乐创作者。换笔提供了可

53、能，它所起到的。辅助作用使作曲家们明显感觉到已进入到一个科技新时代原来的创作方式费时、费力、费钱。假设创作一部50件乐器的交响乐，每一件乐器演奏300小节。若每一小节平均有4个音符的话，那么就要写503004=60000个音符。若每分钟可以抄20个音符的话，那么也需要50个小时(如果再加上抄错等情况。那就更难说了)。如果要交给乐队演奏，还要抄50份分谱交给每一位演奏员，其过程可想而知除此之外，若想让作品变成音响，既要支付昂贵的费用，还要付出大量的精力用于漫长的排练工作。现在有了计算机，一切工作就变得简单了。通过ENCORE等软件便可以简单地实现其创作过程。这时只需要按图1所示加以配

54、置就可工作。它不仅可以迅速地记录作曲家们的创作冲动，利于修改，而且还可以直接通过声卡听到其演奏效果。通过ENCORE辅助作曲流程图如图2所示。利用ENCORE软件我们可以进行计算机记谱I配合MIDI键盘，也可以利用通常的步进输入方法输入音符，ENCORE可以很好完成解译实时多轨演奏的工作利用与ENCORE相类似的许多软件，音乐工作者就可以完成记谱、合成、演奏、修改、打印等作曲的全过程。 C. 计算机音乐用于音乐制作此类计算机音乐的应用领域与计算机辅助作曲的区别就在于对音色的要求不同。这就要求有更高水准的设备配置。仅就声卡一样来说，现在国内市场上所见到的品牌就枚不胜数。早期的ADLIB和

55、SOUND BALASTER声卡开始在家用Pc机上使用起来。继而制定出Pc声卡的规范但这时的声卡取样频率较低，只能达AWE32声卡，在音色生成方式上从FM合成到8位(bit)的声音采样发展至今日，Greative 器技术到WAVETABLE波表合成器技术的公司在推出令人耳目一新的Sound Blaster 飞跃，可表示成一个著名的公式：Real Instrurrtents-bInexedible Sound+Speclcal Effects=AWE32 这个公式体现出了AWE32的独特性能从某种意义上说，只有AWE32才称得上是可以制作MIDI计算机音乐的第一块声卡。它的出现与应用意味着计算机

56、音乐的一个新世纪的来临之后不久，Greative公司又推出了功能更为卓越的64金卡声卡品质的提高，无疑使音色、音质发生重大的变化除了系统基本配置外，还需有扩展配置才可获得更高要求的音乐调音台、录音设备、采样器、监听音响设备等都是在音乐制作中所需的设备(见图3) 2计算机音乐应用于教学许多的音乐工作者们都用自行设计一些软件(音乐教学软件、打谱软件、简谱绘谱软件、自动配器软件和音色编辑软件等)来辅助工作-这是一片急待我们去开发的领域我们现在拥有一个巨大的资源数字化音频在录制音乐或创造音乐时将音乐转换成计算机可以识别的数字化数据，在需要听的时候再转换成声音一旦将声音转变为数宇，计算机便大有

57、用武之地，可以摘取录制品的各个部分并剪切、拷贝、粘贴和删除它们，可以切分核心内容-倒退地播放各个部分，以不同方式结合各个作品以及增加回音和其它效果。在Mac机上装上优质的声卡，计算机就变成强有力的数字化音频录制器。有了数字化音频录制器，就可以此基础上编制各种音频编辑器软件。如Sound Designer、Wave for Windows、Sound Edit 16等都是在此基础上设计的软件。在实际设计音乐软件时，并不是单一使用数字化音频技术虽然数字化音频可以录制需要的任何类型的乐器，可以按许多MIDI不能实现的方式编辑数字化音频声音文件，但是数字化音频不能改变音乐的演奏方式，不能改变作品的速度

58、和节拍，或者修改不合需要的节奏。而MIDI是合成音乐的强有力的工具，它可以使作曲家同时拥有大量随时都可以在软件中演奏的虚拟乐器，也可以利用这些乐器部件中任何东西并且可以在任何时刻编辑它。正因为如此，在编写音乐软件时，总是把MID和数字化音频巧妙地结合起来，刨造出许多美妙的旋律。第四章数字化音频的未来-DSP4. 1 DSP的优势要了解DSP的优势，就必须明白DSP与传统微处理器在硬件基本架构上的不同。 Von Neumann与Harvard基本架构所有的微处理器都是由几个基本的模块所组成：运算器以完成数学运算、存储器和解码器以完成类比信号与数位信号间的转换。在程序中，在每一周期必须告知微处

59、理器要做些什么。因此微处理器必须从储存程序的存储体取得控制指令与一些数据而加以运算。但是对于所有的微处理器并不是使用相同的方法，一般来说可分成Von Neumann与Harvard二种基本架构，同时又有取其二者优点而衍生出多种的混合改良架构，在增加存储器与周边装置后，就成为能作为数字信号处理应用的微处理控制器。 Von Neumann结构成为电脑发展上的标准已超过40年，基本结构是非常简洁，程序与数据二者能够存储在同一存储映射空间（memory-mapped space），这种结构的形成是基于大多数一般用途的程序要求，如x86系列。而其缺点是仅有一条总线来共享数据和程序地址，因此同一时间仅有一

60、数据存储单元或是程序存储单元能被进行存取操作。能在读取执行程序的同时访问数据存储空间是有效加快数据处理的重要方法，Harvard结构具有分离程序和数据的存储空间，两根总线分别处理不同的地址单元，以确保数据和程序能同时并行的存取，以增加处理速度。这种分离的总线架构可将程序执行分成寻址、解码、读取、执行四个工作阶段，每一指令必须4个指令周期才能完成，并且同一时间可以有4个指令进入微处理器内处理，当在第4个指令周期后，每一指令周期就有一个指令执行，此时程式是以最高的效率的执行。但需要指出的是，当执行选择指令如跳跃或比较指令时，由于必须等到指令执行产生的结果后，才知道要跳跃的位置与下一个指令，在此之

61、前所输入的指令会变的无效，而必须重新输入新的指令，因此会产生所谓的选择延时或选择等待等现象，使得程式执行效率大幅降低至与Von Neumann结构差不多，所以一般当程序需要大量的比较或跳跃语句的场合，如人机交互的介面（这是绝大多数PC机用户的主要操作方式）等，Harvard架构并不会比Von Neumann结构有更好的性能。毫无疑问，程序执行速度的增加的同时硬件的成本也相应的增加，分离的数据存储空间和程序存储空间就需要两个不同的数据寻址和与程序寻址的硬件接口。因此能发现在价格与性能间取得折衷的方法，才算是一个较佳的解决方案，于是产生了Modified Harvard架构，这种架构仅有一个外

62、部总线（以减少接口数），同时有程序与数据两个内部总线，可以减少成本并维持顾客对运算速度的要求。由此可见，在个人电脑这样需要大量的选择跳跃语句进行人机交互的处理器还是选择Von Neumann架构（即传统的CPU 如x86、Pentium等）更加的合理，而在数字视音频领域进行数字信号的传输处理，并不需要大量的选择语句时， Harvard架构及Modified Harvard架构就显得更加的适合。 DSP的Modified Harvard架构 DSP是属于Modified Harvard架构，即它具有两条内部总线，一个是数据总线，一个是程序总线；而传统的微处理器内部只有一条总线供数据传输与程序执

63、行使用；从上面我们已经看到Modified Harvard架构在大量数学运算方面有着强大的优势，在DSP内部具有硬件乘法器，大量的寄存器，目前最快的可在一个指令周期内完成32bit乘32bit的指令，而传统的微处理器运算系以微代码来执行，遇到乘法运算指令时就得消耗掉好几个指令周期，加上传统的微处理器中的寄存器较少，不得不经常从外部储存器传输数据来进行运算，而DSP指令具备重新执行功能，因此在数学运算速度超越一般传统的微处理器。例如当执行循环控制语句时，传统的CPU会以某一暂存器当初始循环数index，然后以比较跳跃的方式来达到循环控制的目的，此时程序会重复做比较运算直至index为0；而D

64、SP内建硬体repeat count指令来直接对硬件决定下一个循环指令的执行次数，如此可大量减少程式的执行时间。又如在做数字信号处理时最常出现乘加的运算（如ax+y），DSP针对此项需求而特别设计了一个硬件的MAC unit，使得在一个指令周期内即可完成乘加的运算，若再配合repeat指令，便可以将乘加运算的速度大大提高。同时因为DSP有分离的程序与数据的总线，所以一条指令能同时定址访问程序和数据的存储单元，完成两个变量的运算。必须注意a为一维常量放在程序存储单元，而X为一维变量放在数据存储单元；若系数a会随程序运算而变动时，DSP内建一小块Dual-Access RAM (DARAM)的存储区域，可由程序将此区域设定为程序存储区域或数据存储区域，利用此存储区域可完成可变系数的计算。归纳起来DSP具备有以下的特点：(1)内建乘法累加器；(2)指令管线化；(3

展开阅读全文

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

备案号:蜀ICP备2024067431号-1 川公网安备51140202000466号

本站为文档C2C交易模式，即用户上传的文档直接被用户下载，本站只是中间服务平台，本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私，请立即通知装配图网，我们立即给予删除！

电子信息工程毕业论文设计数字化音频领域的未来

最新文档

相关资源

相关搜索