第五章数字媒体及应用考点分析

上传人:靓*** 文档编号:87179056 上传时间:2022-05-09 格式:DOCX 页数:10 大小:59.53KB
收藏 版权申诉 举报 下载
第五章数字媒体及应用考点分析_第1页
第1页 / 共10页
第五章数字媒体及应用考点分析_第2页
第2页 / 共10页
第五章数字媒体及应用考点分析_第3页
第3页 / 共10页
资源描述:

《第五章数字媒体及应用考点分析》由会员分享,可在线阅读,更多相关《第五章数字媒体及应用考点分析(10页珍藏版)》请在装配图网上搜索。

1、第5章数字媒体及应用考核知识要点、重点、难点精解考点:1西文与汉字的编码1 .西文字符的编码在计算机中用于表示字符的二进制编码称为字符编码。目前,国际上使用最多、最普遍的字符编码是ASCII字符编码。 ASCII 码的全称是 American Standard Code for Information Interchange ,译为:美国国家信息交 换标准字符码。标准ASCII码是7位的编码,可以表示27 = 128个不同的字符,每个字符都有其不同的ASCII码值,它们的编码范围是0000000B 1111111B ( 00H 7FH )。并且,这 128个字符共分为 3类,分别是:(l)数字

2、 0 9 ;(2 ) 26个大写英文字母和26个小写英文字母;(3 )各种运算符号、标点符号和控制符号等。其中,数字、大写字母、小写字母都是按照它们的自然顺序进行排列,且小写字母的ASCII码值比其相应的大写字母的 ASCII码值大32。例如:大写字母 D的ASCII码值是68,小写字母 d的ASCII码值=68 + 32 = 100 。注意 虽然标准 ASCII码是7位的编码,但由于字节是计算机中最基本的存储和处理单位,故一般仍以一个字节来存放一个 ASCII字符.每个字节中多余出来的一位 (最高位b7 ),在计算机内部通常保持为 “0”, 而在数据传输时和用作奇偶校验位。扩充ASCII码是

3、8位,每个ASCII码字符集分别可以扩充128个字符,这些扩充字符的编码均为高位为1的8位代码(十进制指数128 255 ),称为扩展 ASCII码。2 .汉字的编码(1 ) GB2312 - 1980 汉字编码国标码为了适应计算机处理汉字信息的需要,1981年我国颁布了 信息交换用汉字编码字符集基本集(GB2312 - 80 )。简称国标码,又称汉字交换码。该标准选出6763个常用汉字和 682个非汉字字符,为每个字符规定了标准代码,以便在不同计算机系统中间进行汉字文本的交换。GB2312国际字符集由三部分组成。第一部分是字母、 数字和各种符号,包括拉丁文字母、 俄文、日文平假名、希腊字母、

4、汉语拼音等共 682个 (统称为GB2312图形符号);第二部分为一级常用汉字,共3755个,按汉语拼音排列;第三部分为二级常用字,共3008个,因不太常用,所以按偏旁部首排列。区位码在国标码中,所有的常用汉字和图形符号组成了一个94行94列的矩阵。每一行的行号称为“区号” ,每一列的列号称为“位号”。区号和位号都由两个十进制数表示,区号编号是01 94 ,位号的编号也是0194。由区号和位号组成的四位十进制编码被称为该汉字的“区位码”,其中区号在前,位号在后,并且每一个区位码对应惟一的汉字,例如:汉字“啊”的区位码是1601 ”,表示汉字“啊”位于 16区的01位。机内码区位码中,区号和位号

5、各需要 7个二进位才能表示。每个汉字的区号和位号分别使用1个字节来表示,且都从33开始编号(33 126 ),字节的最高位规定均为1 。这种高位均为 1的双字节(16位)汉字编码就称为 GB2312汉字的“机内码”,又称内码。目前 PC机中GB2312汉字的表示都是这种方式。注意 (1) GB2312国际字符集与区位码转换关系为:将区位码车t换成 GB2312国际字符集的方法如下: 将十进制的区号和位号分别转换成十六进制; 将转换成十六进制的区号和位号分别加上20H ; 将分别加上20H的区号和位号组合,得到 GB2312国际字符集。8080H(2 )汉字内码是由汉字的国标码加上8080H形成

6、,即汉字内码=国标码+【举例】 汉字“灯”的区位码是2138 ,求其国标码。【分析】 汉字“灯”白区号是 21 ,位号是38 ,转换成十六进制分别是15H、26H 。 将转换成十六进制的区号和位号分别加上20H ,得到15H + 20H = 35H ; 26H + 20H = 46H 因此,汉字“灯”的国标码是:3546H 。(2 ) GBK 汉字内码扩充规范GBK是我国1995年发布的又一个汉字编码标准,全称为 汉字内码扩展规范。它一共有21003个汉字和883个图形符号,与GB2312国标汉字字符集及其内码保持兼容,另外收录了繁体字和很多生僻的汉字。GBK字符集中的每一个汉字和图形符号也都

7、采用双字节表示,总的编码范围为8140FEFE ,首字节在81 FE之间,尾字节在40 FE之间(剔除xx7F 一条线不安排字符),总计23940个码位,共收人21886个 汉字和图形符号,未使用的区域作为用户自定义区。(3 ) GB18030 2000 编码信息产业部和国家质量技术监督局在2000年联合发布了 GB18030 2000汉字编码国家标准,并在2001年开始执行。GB18030 2000编码标准在 GB2312和GBK的基础上进行了扩充,它增加了 4字节的编码,使码位 总数达到160多万个。所包含的汉字数目也增加到27000多个,包括全部中日韩( CJK )统一汉字字符集和CJK

8、汉字扩充 A和扩充B中的所有字符。(4 )汉字字型码汉字字型码又称汉字输出码,是用于显示或打印输出汉字的汉字编码。汉字的字型通常用点阵的方式来表示的。由于不同字体的汉字有不同的要求,因此汉字的点阵也有所不同。汉字点阵可有 16x16点阵、24x24点阵、32x32点阵、128x128点阵、256x256点阵等。点阵越大,字型质量越高,同时所占用的存储空间也越大。对于NxN点阵的字型码而言, 一个汉字的每一行有 N个点,每一列也有 N个点,由于一个字节占用8个二进制位,因此每一行所占用的空间是:N + 8字节,一个汉字所占用的空间是:Nx ( N + 8 )字节。【举例】16x16 + 8 =

9、32。24x24 + 8 = 72。32x32 + 8 = 128 。16x16点阵的字型码,每个汉字所占用的字节数=24x24点阵的字型码,每个汉字所占用的字节数=32x32点阵的字型码,每个汉字所占用的字节数=考点2 :数字文本的制作与编辑1 .文本准备(1)汉字键盘输入汉字的键盘输入编码方案有几百种之多,能够被广泛接受的编码方案应具有卜列特点:易学习、易记忆、效率高(平均击键次数较少)、重码少、容量大(可输入的汉字字数多) 等。汉字输入编码大体分为 4种,分别是: 数字编码,这是使用一串数字来表示汉字的编码方法,它们难以记忆,很少使用。 字音编码,这是一种基于汉语拼音的编码方法,简单易学

10、,适合于非专业人员。 字形编码,不易掌握。音形编混合码,它吸取了字音编码和字形编码的优点,使编码规则适当简化、重码减少,但掌握起来 也不容易。汉字的输入编码与汉字的内码是不同范畴的概念,不能把它们混淆起来。 使用不同的输入编码方法向计算机输入的同一个汉字,它们的内码是相同的。(2 )联机手写汉字识别(笔输入)联机手写汉字识别输入法以平常书写的习惯,把要输入的汉字写在一块叫“书写板”的设备上,书写板将笔 尖的运动(包括抬笔、落笔、笔段轨迹以及各笔段之间的时间关系等)按时间顺序采样后发送到计算机中,由计算机软件自动进行识别,然后用该汉字(或符号)对应的代码进行保存。( 3 ) 汉语语音识别输入(

11、4 ) 印刷体汉字识别(汉字OCR )输入印刷体汉字识别是将印刷或打印在纸上的中西文字输入计算机并经过识别转换为编码表示的一种技术, 也叫 做汉字 OCR ( Optical Character Recognition ) 。( 5 ) 脱机手写汉字识别输入2 文本分类与表示文本是计算机表示文字及符号信息的一种数字媒体。使用计算机制作的数字文本有多种不同的类型:( l ) 根据它们是否具有编辑排版格式来分,可分为简单文本(纯文本)和丰富格式文本两大类。简单文本呈现为一种线性结构, 写作和阅读均按顺序进行。 经过排版处理后, 纯文本中就增加了许多格式控制和结构说明信息,称为“丰富格式文本” 。(

12、 2 ) 根据文本内容的组织方式来分,可以分为线性文本和超文本两大类。传统的纸质文本其内容的组织是线性(顺序)的,因而读者总是按顺序先读第1 页(从第一行读到最后一行),再读第2页、第3页,这就是线性文本。超文本( hypertext )概念是对传统文本的一个扩展。除了传统的顺序阅读方式之外,它还可以通过链接、跳转、导航、回溯等操作,实现对文本内容更为方便的访问。超文本采用网状结构来组织信息,一个超文本由若干文本块组成, 每个文本块中包含了一些指向其他文本块的指针, 用于实现文本阅读时的快速跳转。 这些指针称为超链( hyperlink ) 。超链是有向的,起点位置称为链源( HTML 文档中

13、称为锚) ;目的地(目标)称为链宿,它可以是文本块(本机或者网络中其他计算机的一个文件或者程序) ,也可以是文本块的同一部分。文本块可以是文字,也可以是图形、图像甚至声音或视频,这就把超文本推广到了多媒体的形式,所以有时也称为“超媒体” ( hypermedia ) 。3 3) 根据文本内容是否变化和如何变化来分,可分为静态文本、动态文本和主动文本三类。 静态文本一般情况下用得最多的是静态Web 文本, 静态文本的每次访问都返回相同结果。静态文本的优点在于它简单、可靠、访问速度快。它的主要缺点是不灵活,一旦内容变化,就必须人工修改文档,不适合内容频繁变化的应用场合。 动态文本动态 Web 文档

14、的内容是在浏览器访问 Web 服务器时由服务器创建的,文档的内容是变化的,它能向用户提供最新的信息。从浏览器的角度来看,动态文档和静态文档并无区别,它们都采用 HTML 编写,采用同样的方法进行访问,浏览器不知道(也不需要知道)服务器是从磁盘文件还是从计算机程序取得文档的。动态文档的创建比静态文档复杂,动态文档的创建者需使用脚本语言如 VBScript 、 Javascript 及 CGI 、ASP 等编写程序,并使用 SQL 查询语言通过 ODBC 、 ADO 等接口访问数据库。浏览器访问动态文档需要的时间也会稍长一些,因为服务器需要额外的时间去运行程序创建文档。动态文档的一个主要缺点是不能

15、显示变化着的信息。 与静态文档类似, 动态文档在浏览器取得文档后内容不会再改变,因而文档很快就开始过时。 主动文档相对于动态文档的优点是它能够访问信息源并连续地更新文档内容。主动文档能够自动更新文档内容的原因在于, Web 服务器传送给浏览器的中包含了一个可以本地执行的小程序( A pplet ) ,浏览器会自动启动执行这些VBSCript 或 JavaSCript 等编写的程序,需要时后者能主动与Web 服务器进行交互,并改变文档的显示内容。只要用户让程序保持运行,文档的内容就总在更新。主动文档的主要缺点是创建和运行这种文档比较复杂,同时缺少安全性。3 文本编辑与处理( 1 ) 文本编辑文本

16、编辑的主要功能包括: 对字、词、句、段落进行添加、删除、修改等操作; 字的处理:设置字体、字号、字的排列方向、间距、颜色、效果等; 段落的处理:设置行距、段间距、段缩进、对称方式等; 表格制作和绘图; 定义超链; 页面布局(排版):设置页边距、每页行列数、分栏、页眉、页脚、插图位置等。(2 )文本处理文本处理强调的是使用计算机对文本中所含文字信息的形、音、义等进行分析和处理。文本处理可以在字、 词(短语)、句子、篇章等不同的层面上进行。在字、词(短语)层面上进行的处理包括字数统计、自动分词、词性标注、词频统计、词语排序、词语 错误检测、自动建立索引、简/繁体转换、大陆/台湾编码及术语转换等;在

17、句子级别上进行的处理有语法检查、文语转换(语音合成)、文种转换(机器翻译)等;在篇章基础上进行的处理有关键词提取、文摘生成、文本分类、文本检索等。此外,为了文本的信息安全和有效地存储或传输,还需要对文本进行加密、压缩等处理。在各种文本处理应用中,我们使用最多的是文本检索。文本检索是将文本按一定的方式进行组织、储存、管 理,并根据用户的要求查找到所需文本的技术和应用。目前常用的 Web信息检索系统有 Google、Yahoo、Alta、Vista、 Infoseek、新浪、天网、百度等, 它们也称为搜索引擎。其基本原理是:预先使用软件Robot遍历 Web ,将 Web上的信息下载到本地文档库;

18、然后对文本内容进行自动分析并建立索引;在用户提出检索请求时, 搜索引擎通过检查索引找出匹配的文本(或URL地址)返回给用户。4 .文本的展现数字电子文本有两种使用方式:打印输出和在屏幕上进行阅读、浏览。由于存放在计算机存储器中的文本是不可见的,因此,不论哪种使用方式,都包含了文本的展现过程。文本展现的大致过程是:首先要对文本的格式描述进行解释,然后生成文字和图表的映像,最后再传送到显示器或打印机输出。考点3 :常用文本处理软件下面是几种常用的文本处理软件:1 .面向通信的文本处理软件包括电子邮件和网络聊天所使用的文本处理软件,它们的文本编辑器功能并不很多,但操作使用方便。2 .面向办公的文本处

19、理软件目前在PC机上使用的具有代表性的是微软公司Office套件中的 Word和我国自行开发的 WPS文本处理软件。3 .面向出版的文本处理软件面向出版的文字处理软件,除了常规的文字编辑处理功能之外,更重要的是它的排版功能,所以这一类型软件也称为“排版软件”。排版软件的主要功能是将文字、图形和图像等合理地安排在页面内。方正集团公司的“飞腾”排版软件、美国 Adobe公司的PageMaker和PDF Write都是这一类软件的代表。4 .面向网络信息发布和电子出版的文本处理软件将文本放在因特网上进行发布的最好方法是制作成网页,即所谓的HTML文件。用于制作 HTML文件的软件有很多,有微软的Fr

20、ontPage , Macromedia Dreamweaver等,使用 word也可以产生 HTML 文件输出。面向电子出版的最流行的软件是美国Adobe公司的Acrobat 。考点4 * :数字图像的获取、表示及常用图像文件格式计算机的数字图像按其生成方法可以分成两类:一类是从现实世界中通过扫描仪、 数码相机等设备获取的图像,它们称为 取样图像、点阵图像或位图图像 ,以下简称图像。另一类是使用计算机合成 (制作)的图像,它们称 为矢量图形,或简称图形。1.数字图像的获取从现实世界中获得数字图像的过程称为图像的获取。图像获取的过程实质上是模拟信号的数字化过程,它的处理步骤大体分为四步:(1)

21、扫描。将画面划分为 MxN个网格,每个网格称为一个取样点。这样,一幅模拟图像就转换为MxN个取样点组成的一个阵列。(2 )分色。将彩色图像取样点的颜色分解成三个基色(例如R、G、B三基色),如果不是彩色图像(即灰度图像或黑白图像),则不必进行分色。(3 )取样。测量每个取样点每个分量的的亮度值。(4 )量化。对取样点每个分量的亮度值进行A/D转换,即把模拟量使用数字量(一般是8位至12位的正整数)来表示。通过上述方法所获取的数字图像称为取样图像,它是静止图像的数字化表示形式,通常简称为“图像”。2 .数字图像的表示从取样图像的获取过程可以知道,一幅取样图像由M (行)x N (列)个取样点组成

22、,每个取样点是组成取样图像的基本单位,称为像素(简写为pel )。彩色图像的像素是矢量,它由多个彩色分量组成,黑白图像的像素只有一个亮度值。取样图像在计算机中的表示方法是:单色图像用一个矩阵来表示;彩色图像用一组(一般是三个)矩阵来表 示,矩阵的行数称为图像的垂直分辨率,列数称为图像的水平分辨率,矩阵中的元素是像素颜色分量的亮度值, 使用整数表示,一般是8位至12位。在计算机中存储的每一幅取样图像,除了所有的像素数据之外,至少还必须给出如下一些关于该图像的描述信息(属性):(l )图像大小,也称为图像分辨率(包括垂直分辨率和水平分辨率)。若图像大小为 400 x 300 ,则它在800x600

23、分辨率的屏幕上以 100 %的比例显示时,只占屏幕的 1 / 4 ;若图像超过了屏幕(或窗口)大小,则 屏幕(或窗口)只显示图像的一部分,用户需操纵滚动条才能看到全部图像。(2 )颜色空间的类型,指彩色图像所使用的颜色描述方法,也叫颜色模型。常用的颜色模型有RGB (红、绿、蓝)*II型、 CMYK (青、品红、黄、黑)模型、 HSV (色彩、饱和度、亮度)模型、 YUV (亮度、 色度)模型等。从理论上讲,这些颜色模型都可以相互转换的。(3 )像素深度,即像素的所有颜色分量的二进位数之和,它决定了不同颜色(亮度)的最大数目。【举例】 单色图像,若其像素深度是 8位,则不同亮度的数目为: 28

24、= 256 ;又如,由R、 G、 B 三基色组成的彩色图像,若三个分量中的像素位数分别为4、4、 4 ,则该图像的像素深度为 12 ,最大颜色数目为:24 *2 4 *24 = 212= 4096 。3 .图像的压缩编码一幅图像的数据量可按下面的公式进行计算(以字节为单位):图像数据量=图像水平分辨率x图像垂直分辨率 X像素深度/ 8为了节省存储数字图像时所需要的存储器容量,降低存储成本大幅度压缩图像的数据量是非常重要的。数据压缩可分成两种类型,一种是无损压缩,另一种是有损压缩。(1 )无损压缩是指压缩以后的数据进行图像还原(也称为解压缩)时,重建的图像与原始图像完全相同。例 如行程长度编码、

25、哈夫曼编码等。(2 )有损压缩是指使用压缩后的数据进行图像重建时,重建后的图像与原始图像虽有一定的误差,但不影响 人们对图像含义的正确理解。评价一种压缩编码方法的优劣主要看三个方面:压缩倍数的大小、重建图像的质量(有损压缩时),以及压缩算法的复杂程度。 注意 为了得到较高的数据压缩比,数字图像的压缩一般都采用有损压缩,如变换编码、矢量编码等。 4 .常用图像文件格式 目前因特网和 PC机常用的几种图像文件的格式如表5 . 1所示:表5. 1目前因特网和 PC机常用的几种图像文件的格式名称压缩编码方法性质典型应用开发组织/公司BMPRLE (行程长度编码)无损Windows应用程序Microso

26、ftTIFRTE , LZW (字典编码)无损桌面出版Aldus,MicrosoftGIFLZW无损因特网CompuServeJPEGDCT (离散余弦变换)Huffman无损/有损因特网,数码相机等ISO/IECJP2小波变换,算术编码无损/有损因特网,数码相机等ISO/IECBMP图像是微软公司在 Windows操作系统下使用的一种标准图像文件格式。不压缩的BMP文件是种通用的图像文件格式,几乎所有Windows应用软件都能支持。TIF图像文件格式大量使用于扫描仪和桌面出版,能支持多种压缩方法和多种不同类型的图像。GIF是目前因特网上广泛使用的一种图像文件格式,它的颜色数目较少(不超过25

27、6色),文件特别小,适合因特网传输,在网页制作中大量使用。考点5 :数字图像的编辑处理和应用1 .数字图像处理使用计算机对图像,进行去噪、增强、复原、分割、提取特征、压缩、存储、检索等操作处理,称为数字图 像处理。一般来讲,对图像进行处理的主要目的有以下几个方面:(1)提高图像的视感质量。如进行图像的亮度和彩色变换,增强或抑制某些成分,对图像进行几何变换,包 括特技或效果处理等,以改善图像的质量。(2 )图像复原与重建。如进行图像的校正,消除退化的影响,产生一个等价于理想成像系统所获得的图像, 或者使用多个一维投影重建该图像。(3 )图像分析。提取图像中的某些特征或特殊信息,为图像的分类、识别

28、、理解或解释创造条件。(4 )图像数据的变换、编码和数据压缩,用以更有效地进行图像的存储和传输。(5 )图像的存储、管理、检索,以及图像内容与知识产权的保护等。 注意 常用图像编辑处理软件有:美国Adobe公司的Photoshop , Windows操作系统附件中的画图软件和映像软件,office中的软件中的Microsoft Photo Editort 软件,Ulead System 公司的 Photo Impact 软彳,ACD System 公司的 ACDSee32 等。2 .数字图像的应用(l )图像通信。包括传真、可视电话、视频会议等。(2 )遥感。(3 )诊断。如通过其射线、超声、

29、计算机断层摄影(即 CT )、核磁共振等进行成像,结合图像处理与分析 技术,进行疾病的分析与诊断。(4 )生产中的应用。如产品质量检测,生产过程的自动控制等。(5 )机器人视觉。通过实时的图像处理,对三维景物进行理解与识别。(6 )军事、公安、档案管理等其他方面的应用考点6 :计算机图形的概念与应用1 .计算机图形的概念人们进行景物描述的过程称为景物的建模;根据景物的模型生成其图像的过程称为“绘制”,也叫做图像合成,所产生的数字图像称为计算机合成图像,也称为矢量图形,以区别于通常的取样图像。研究如何使用计算机 描述景物并生成其图像的原理、方法与技术称为“计算机图形学”。2 .计算机图形的应用使

30、用计算机合成图像的主要优点有:计算机不但能生成实际存在的具体景物的图像,还能生成假想或抽象景物的图像。计算机合成图像有着广泛的应用领域。例如:(l )计算机辅助设计和辅助制造(CAD / C AM(2 )利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等,既可方便、快捷地制作和更新 地图,又可用于地理信息的管理、查询和分析。(3 )作战指挥和军事训练。(4 )计算机动画和计算机艺术。除此之外,计算机合成图像在电子出版、数据处理、工业监控、辅助教学、软件工程等许多方面也有着很好 的应用。考点7 * :数字声音获取的方法和设备1 .数字声音的获取声音由振动而产生,通过空气进行传播。声音

31、是一种波,它由许多不同频率的谐波所组成。谐波的频率范围称为声音的带宽,带宽是声音的一项重要参数。多媒体技术处理的声音主要是人耳可听到的20Hz 20 kH的音频信号,其中人的说话声音是频率范围约为300 3400Hz ,称为言语,也称为话音或语音。声波是一种模拟信号。为了使用计算机进行处理,必须将它转换成数字编码的形式,这个过程称为声音信号的数字化。声音信号数字化的过程为:(l)取样。为了不产生失真,按照取样定理,取样频率不应低于声音信号最高频率的两倍。因此,语音信号 的取样频率一般为 8kHz ,音乐信号的取样频率应在40KHz以上。(2 )量化。声音信号的量化精度一般为8位、12位或16位

32、,量化精度越高,声音的保真度越好,量化精度越低,声音的保真度越差。(3 )编码。经过取样和量化后的声音,还必须按照一定的要求进行编码,即对它进行数据压缩,以减少数 据量,并按某种格式将数据进行组织,以便于计算机存储和处理,在网络上进行传输等。把模拟声音信号转换成 数字形式进行处理有许多优点:(l )数字声音重放性能好,复制时没有失真;(2 )数字声音的可编辑性强,易于进行效果处理;(3 )数字声音能进行数据压缩,传输时抗干扰能力强;(4 )数字声音容易与其他媒体相互结合(集成);(5 )它也为自动提取“元数据”和实现声音检索创造了条件。2 .数字声音的获取设备声音获取设备包括麦克风和声卡,麦克

33、风的作用是将声波转换为电信号,然后由声卡进行数字化。(1 )声卡的功能声卡既参与声音的获取也负责声音的重建,它控制并完成声音的输入与输出,主要功能包括:波形声音的获取与数字化;声音的重建与播放;MIDI声音的输入;MIDI声音的合成与播放。波形声音的获取过程就是把模拟的声音信号转换为数字形式。声源可以是话筒(麦克风)输入,也可以是线路输入(声音来自音响设备或 CD唱机等)。声卡不仅能获取单声道声音,而且还能获取双声道(立体声)的声音。(2 )声卡的组成声卡以数字信号处理器(DSP )为核心,DSP是一种专用的微处理器,它在完成数字声音的编码、解码及声音编辑操作中起着重要的作用。随着大规模集成电

34、路技术的发展,不少PC机的声卡己经与主板集成在一起,不再做成独立的插卡。注意 除了利用声卡进行在线声音获取之外,也可以使用数码录音笔进行离线声音获取,后再通过USB接口直接将己经数字化的声音数据从数码录音笔送入计算机中。考点8 :数字声音的压缩编码1 .波形声音的主要参数数字化的波形声音是一种使用二进制表示的串行的比特流,它遵循一定的标准或规范进行编码,其数据是按时间顺序组织的。波形声音的主要参数包括: 取样频率,量化位数,声道数目,使用的压缩编码方法以及比特率。比特率也称为码率,它指的是每秒钟的数据量。数字声音未压缩前,码率的计算公式为:波形声音的码率 =取样频率x量化位数x声道数压缩编码以

35、后的码率则为压缩前的码率除以压缩倍数。2 .全频带声音的压缩编码声音信号中包含有大量的冗余信息,为了降低存储成本和提高通信效率,对数字波形声音进行数据压缩是十分必要的。一个好的声音数据压缩算法通常应做到压缩倍数高,声音失真小,算法简单,编码器/解码器的成本 低。目前常用的全频带声音的编码方法如表5.2所示。表5.2全频带声音压缩编码标准名称压缩后的码率(每个声道)声道数目主要应用MPEG - l 层 1192kbps (压缩 4 倍)2数字合式录音带MPEG - 1 层 2128kbps (压缩 6 倍)2DAB, VCDMPEG - 1 层 364kbps (压缩 12 倍)2Interne

36、t , MP3 首乐MPEG - 2 audio与MPEG-l层1、层2、层3相同5.1,7.1数字合式录音带Dolby AC - 364kbps5.1,7.1DVD , DCV ,家庭影院注意 表中的MPEG 1声音压缩编码标准分为三个层次:(l)层1的编码较简单,主要用于数字盒式录音磁带;(2 )层2的算法复杂度中等,其应用包括数字音频广播( DAB )和VCD等;(3 )层3的编码较复杂,主要应用于因特网上高质量声音的传输。“ MP3音乐”就是一种采用 MPEG 一1层3编码的高质量数字音乐。3 .数字语音的压缩编码(l )数字语音在中继线上传输时采用的压缩编码方法是国际电信联盟ITU提

37、出的G711和G721标准,前者是PCM (脉冲编码调制)编码,后者是 ADPCM (自适应差分脉冲编码调制)编码。它们的码率虽然比较 高(分别为64kb / S和32kb / S ),但能保证语音的高质量,且算法简单、易实现,多年来在固定电话通信 系统中得到了广泛应用,在计算机中也被广泛使用。(2 )在移动通信和IP电话中,由于通信信道带宽较窄, 为了达到实时通信的效果, 必须采用更有效的语音 压缩编码方法。其原理是利用原始语音波形信号提取出模拟人们发声过程的“声源一滤波器”模型中的声道参数与激励信号,并使这些参数和激励信号产生的波形尽可能接近于原始语音的波形。采用此类所谓的“合成一分析”方

38、法(也称为混合编码)后,语音压缩后的码率大约在4.8kb / s到16kb / s之间,并能保证较好的语音质量。考点9 :语音合成和音乐合成的基本应用和原理1 .语音合成语音合成是根据语言学和自然语言理解的知识,使计算机模仿人的发声,自动生成语音的过程。目前主要是按照文本(书面语言)进行语音合成,这个过程称为文语转换(简称TTS)。文语转换过程原理上分成三步:(l )第一步先对文本进行分析,判断每一个字的正确读音,将文字序列转换成一串发音符号(如国际音标或汉语拼音);(2 )第二步是韵律分析,它根据文句的结构、位置、使用的标点符号以及上下文等,确定发音时语气的变 换以及读音的轻重缓急,这些都由

39、一组韵律控制参数来进行说明;(3 )第三步是语音合成,它的主要功能是:根据发音标注,从语音库中取出相应的语音基元,按照韵律控制参数的要求,利用特定的语音合成技术对语音基元进行调整和修改,最终合成出符合要求的流畅、自然的语音。语音库中存储了大量预先录制的语音基元(单音、词组、短语或句子)的波形,合成时读取语音基元的波形,将 这些波形进行拼接和韵律修饰,然后输出连续语音流。2 .音乐合成(l )音乐合成器PC机的声卡一般都带有音源,音源也称为音乐合成器,它能模仿许多乐器生成各种不同音色的音符。声卡上的音源有两种:一种是调频合成器,它是一种受控的电子振荡器(波形发生器),能模拟生成许多乐器演奏的音符

40、,不过音色单调,效果比较差些。另一种音源是波表合成器,它预先将每种乐器演奏的各个音符的波形数字化,把它们组织成一张表(称为波表),存放在ROM中,播放时根据乐器类型、音符等参数访问ROM ,取出相应的波形数据,将其修饰成所要求的音强和时长,然后播放出来,它能提供相当优美的音色,效果很好。(2 )乐谱描述语言 MIDI在计算机中描述乐谱需要有一种标准的描述语言。目前普遍使用的标准叫做MIDI 。 MIDI不仅规定了乐谱的数字表示方法(包括音符、定时、乐器等),也规定了演奏控制器、音源、计算机等相互连接时的通信规程。MIDI规定,乐谱中的音符及其定时、速度、音色(乐器)等采用 MIDI消息(MID

41、I message )进行描 述,每个 MIDI消息描述一个音乐事件,一首乐曲所对应的全部MIDI消息组成一个 MIDI文件。MIDI文件在计算机中的文件扩展名为.MIDI ,它是计算机合成音乐的交换标准,也是商业音乐作品发行的标准。注意 播放MIDI音乐的过程大体如下:媒体播放器软件首先从磁盘上读入,MID文件,把其中的一个个 MIDI消息发送给声卡上的音乐合成器,由音乐合成器解释并执行MIDI消息所规定的操作,合成出各种音色的音符,通过扬声器播放出乐曲来。考点10 :数字视须获取的方法和设备1 .数字视频的基础本书中所说的视频( video )指的是内容随时间变化的一个图像序列,也称为活动

42、图像或运动图像。常见 的视频有电视和计算机动画。(1)电视我国采用 PAL制式的彩色电视信号, 在远距离传输时,使用亮度信号 Y和两个色度信号 U、V来表示, 这种方法有两个优点: 能与黑白电视接收机保持兼容,Y分量由黑白电视接收机直接显示而无需做进一步处理; 利用人眼对两个色度信号不太灵敏的视觉特性来节省电视信号的带宽和发射功率,彩色信号的YUV表示与RGB表示可按照下面的公式进行相互转换:亮度分量 Y = 0.3 x R + 0.59 x G + 0.11 x B色度分量 U = 0.493 x ( B - Y )色度分量 V = 0.877 x ( R - Y ):(2 )计算机动画计算

43、机动画是采用计算机制作一系列可供实时演播的连续画面的一种技术。它可以辅助制作传统的卡通动画片,或逼真地模拟三维景物随时间而变化的过程,所生成的一系列画面以每秒50帧左右的速率演播时,利用人眼视觉残留效应便可产生连续运动或变化的效果。2 .数字视频获取的方法数字视频与模拟视频相比有很多优点。例如,复制和传输时不会造成质量下降,容易进行编辑修改,有利于 传输(抗干扰能力强,易于加密),可节省频率资源等。视频信号的数字化比声音要复杂,它以一帧帧画面为单位进行。由于电视图像采用YUV彩色空间,人眼对颜色信号的敏感程度远不如对亮度信号那么灵敏,所以色度信号的取样频率可以比亮度信号的取样频率低一 些,以减

44、少数字视频的数据量。目前常用的色度信号取样格式有三种:(1)4 : 4 : 4格式,色度信号的取样与亮度信号完全一样。(2 ) 4 : 2 : 2格式,每条扫描线上色度信号的取样只是亮度信号的一半。(3 ) 4 : 2 : 0格式,在水平和垂直方向上色度信号的取样都只是亮度信号的一半。表5.3视频压缩编码的标准及其应用名称原图像格式压缩后的码率主要应用MPEG -1CIF格式大约 1.2Mb / s 1.5Mb/s适用于VCD、数码相机、数 字摄像机等H.261CIF格式QCIF格式Px64kb / s(P=1、2 时,只支持 QCIF格式,P 6时, 可支持CIF格式应用于视频通信,如可视电

45、 话,会议电视等MPEG 2 (MPML)720x 5765Mb/s15Mb/s用途最广,如DVD、150路卫 星电视直播,540路CATV等MPEG 2High Profile1440x11521920x115280Mb/s100Mb/s高清晰度电视(HDTV)领域MPEG W (H.26L)多种不同的视频格式与 MPEG 1, MPEG 2相当,但最低可达到 64kb/s适合交互式多媒体应用,包括虚拟现实、远程教学 交互式电视等3 .数字视频的获取设备目前,有线电视网络和录/放像机等输出的都是模拟视频信号,它们必须数字化以后,才能由计算机存储、处理和显示。 PC机中用于视频信号数字化的插卡

46、称为视频采集卡,简称视频卡,它能将输入的模拟视频信号 (及其伴音信号)进行数字化然后存储在硬盘中。数字化的同时,视频图像经过彩色空间转换(从YUV转换为RGB ),然后与计算机图形显示卡产生的图像叠加在一起,用户可在显示器屏幕上指定窗口中监看(监听)其内容。还有一种可以在线获取数字视频的设备是数字摄像头,它通过光学镜头采集图像,然后直接将图像转换成数字信号并输入到 PC机,不再需要使用专门的视频采集卡。注意 数字摄像机是一种离线的数字视频获取设备,它的原理与数码相机类似,但具有更多的功能, 所拍摄的视频图像及记录的伴音使用M - J PEG 或MPEG -2进行压缩编码,记录在磁带或者硬盘上,

47、需要时再通过USB或IEEE1394接口输入计算机处理。考点11:数字视频的压缩编码视频信息压缩编码的方法很多,一个好的方案往往是多种算法的综合运用。目前,国际标准化组织制订的有关数字视频(及其伴音)压缩编码的几种标准及其应用范围可参见表5.3。考点12 :数字视颇的应用1 . VCD 与 DVD1994年由JVC、 Philips等公司联合定义了一种在CD光盘上存储数字视频和音频信息的规范一VideoCD (简称 VCD ),该规范规定了将 MPEG - 1音频/视频数据记录在CD光盘上的文件系统的标准,这样就使一张普通的 CD光盘可记录约 60分钟的音视频数据, 图像质量达到家用录放像机的

48、水平,可播放立体声。DVD即数字多用途光盘,其中的 DVD - Video (日常简称为 DVD )与VCD相比存储容量要大得多。 DVD 采用MPEG - 2标准压缩的视频图像, 画面品质比 VCD明显提高。 DVD - Video的伴音具有 5 . 1声道 (左、右、中、左环绕、右环绕和超重低音,简称为 5.1声道),足以实现三维环绕立体音响效果。2 .可视电话与视频会议(1 )可视电话可视电话就是在打电话的同时还可以互相看见对方的图像。根据图像显示方式的不同,可视电话分为静态图像可视电话和动态图像可视电话。前者显示的图像是静止的,图像信号和话音信号交替传送,传送图像时不能通话;后者在传输

49、话音时也传输图像,通话时图像可动态变化。可视电话的终端设备集摄像、显示、声音与图像的 编/解码等功能于一体,内置高质量的数字变焦CCD镜头及MODEM ,可连接到普通的电话线上使用。可视电话的视频编码标准为H . 263 ,图像格式为 QCIF ( CTF和SQCTF为可选),帧频不小于 10帧/秒,音频的码率为 5.3kbit/s和6.3kbit/ s两种。(2 )视频会议视频会议也叫做电视会议,它是通过数字音视频数据实时传送声音、图像使得分散在两个或多个地点的用户就地参加会议的一种多媒体通信应用。用计算机网络进行可视电话和视频会议具有使用方便、成本较低的优点。 例如微软公司免费提供的MSN

50、 Messenger就是一个可以在Internet上进行音频、视频通信的软件。3 .数字电视数字电视是数字技术的产物,它将电视信号进行数字化,然后以数字形式进行编辑、制作、传输、接收和播 放。数字电视除了具有频道利用率高、图像清晰度好等特点之外,它还可以开展交互式数据业务,包括电视购物、电视银行、电视商务、电视通信、电视游戏、实时点播电视、电视网上游览、观众参与的电视竞赛等。数字电视系统由信源编码、业务复用和信道传输与发送三个部分构成。4 .点播电视(VOD )VOD是视频点播(也称为点播电视)技术的简称,意即用户可以根据自己的需要选择电视节目。VOD技术从根本上改变了用户只能被动收看电视的状

51、况。视频点播系统可分为 TVOD( True VOD )和NVOD ( Near VOD )两种。(l)在TVOD (真视频点播)环境下,用户提出要求后即可及时从VOD系统得到服务,这种系统为每一个用户提供一个单独的连接,每个连接需要占用一定的网络带宽。5 2 ) NVOD (准视频点播)是视频点播的另一种实现方案。采用这种方案,系统可每隔一段时间(例如5分 钟)在不同的频道上开始播放同一个节目,用户选择收看时最多只要等待5分钟。这种方式不能为用户及时提供点播服务功能。视频点播系统的工作过程如下:用户在客户端发出播放请求,通过网络传送给分配服务器,经身份验证后, 系统把视频服务器中可访问的节目单发送给用户浏览,用户选择某个节目后, 视频服务器读出该节目的内容,并传送到客户端进行播放。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!