多媒体复习资料

上传人:孙哥 文档编号:154562303 上传时间:2022-09-21 格式:DOCX 页数:25 大小:185.60KB
收藏 版权申诉 举报 下载
多媒体复习资料_第1页
第1页 / 共25页
多媒体复习资料_第2页
第2页 / 共25页
多媒体复习资料_第3页
第3页 / 共25页
资源描述:

《多媒体复习资料》由会员分享,可在线阅读,更多相关《多媒体复习资料(25页珍藏版)》请在装配图网上搜索。

1、第一章 多媒体技术概述一、 媒体1. 含义:媒体(Media)就是指信息的载体,其本质是信息传播的技术和手段。2. 按照媒体的发展,媒体可以分为传统媒体和新媒体: 传统媒体:广播、电视、报刊杂志新媒体:基于互联网、 PC 和移动终端技术的数字媒体技术,包括网站、博客、微博、 微信、手机 App 等。3. 国际电信联盟(International Telecommunication Union , ITU)对媒体进行了详细的分类:1) 感觉媒体( Perception media ):指直接作用于人的感觉器官、从而为人的感知系统 所接受的信息形态或媒体形式。举例:文字、声音、图形、图像、动画、视

2、频2) 表示媒体(Presentation media):指感觉媒体在电子设备、计算机、网络等系统内 部的存在形式,即编码形态的媒体。举例: 计算机系统中的 ASCII 码、国家标准汉字字符集的区位码、 字符的点阵码、 音频、图像与视频编码。3) 表现媒体( Representation media ):指将编码形式的媒体显示成感觉媒体的设备或 技术,实际上就是指多媒体系统的输入、输出设备。举例: 显示器、 投影仪、 打印机、 绘图仪、 有源或无源音箱、 键盘、 鼠标、 摄像机、 麦克风。4) 存储媒体(Store media):指用于存放表示媒体(即编码形态的媒体)的设备或技 术。举例:内存

3、、寄存器、磁盘、磁带、光盘、 USB 盘。5) 传输媒体(Transmission media):指用于传送表示媒体的设备或技术。 举例:双绞线、电缆、光纤、空气、电磁波。二、 多媒体1. 含义:多媒体就是指能够同时处理两种以上感觉媒体的计算机系统,其目标是为用户提供更丰富的应用体验。2. 多媒体技术的特征:1) 媒体类型或媒体技术的多样性。 一个可以被称为多媒体的应用系统, 必须至少集成 了两种不同类型的媒体和其相关技术。 该特征是多媒体系统的本质特征, 也是其魅 力所在。2) 媒体内容的同步性( synchronization )。在多媒体应用系统中,多种媒体是融合在一 起的,它们是以一种

4、协同的方式工作的。3) 交 互 性 ( Interactive )。 与 交 互 性 密 切 相 关 的 另 外 两 个 概 念 是 人 机 交 互(Huma n-Computer In teracti on ,HCI)和人机界面(Huma n-Computer In terface ,HCI)。 前者是研究、 设计、 评价和实现交互式计算系统的科学。 人机界面则是人与计算机 之间传递、交换信息的媒介和对话接口,是计算机系统的重要组成部分。3. 多媒体应用:1) 大众传媒领域大众传媒(mass media )是指传播速度快、覆盖范围广、影响效果大的媒体, 主要包括报纸、广播、电视、电影、互联网

5、等。2) 消费电子领域消费电子( consumer electronics )产品是指用于个人和家庭的与广播、电视有关的各类音频和视频产品,主要包括:电视机、影碟机(VCD SVCD DVD)、录像机、摄录机、收音机、收录机、组合音响、激光唱机(CD)、视频游戏设备、智能电视机顶盒等。3) 现代教育技术领域 现代教育技术是指建立在信息与网络技术基础之上的教育教学手段构成的系 统。4) 多媒体通信领域数字通信是用数字信号作为载体来传输消息, 或用数字信号对载波进行数字调 制后再传输的通信方式。 它可传输电报、 数字数据等数字信号, 也可传输经过数字 化处理的语声和图像等模拟信号。数字通信系统通常

6、由用户设备、 编码与解码、调制和解调、加密和解密、 传输 和交换设备等组成。多媒体通信是指在一次呼叫过程中能同时提供多种媒体信息如声音、图像、 图形、数据、文本等的新型通信方式, 所以, 它是通信技术和多媒体技术相结合的产 物。视频会议是最典型的多媒体通信系统, 它由视频会议终端、 会议服务器、 多点控制单元(MCU)等子系统构成。多媒体技术在视频会议终端中占有重要地位,主要包括音视频数据的采集、编码、解码、传输与呈现等处理。5)表演与会展6)Web 应用Web 应用是指基于浏览器 / 服务器模型的应用系统,在客户端表现为浏览器页面,是一种以HTTP协议为核心的网络应用。数量最多的Web应用是

7、各类网站,如门户网站(搜狐、 163、新浪等)、搜索网站(百度等)和各种专业网站(音乐、 视频、软件、行业等等) 。7)物联网领域物联网是通过各种信息传感设备和系统(如传感器网络、射频识别(RadioFrequency Identification, RFID )、红外感应器、条码与二维码、全球定位系统、激光 扫描器等) 和其它基于物物通信模式的短距离无线传感网络, 按约定的协议, 把物 体接入互联网所形成的一个巨大的智能网络。8)军事领域首先,多媒体技术在战场信息采集和传输中具有重要的作用,例如通过图像、 视频和音频信息的采集获取战场和相关地域的直观战况和态势,能够为指挥决策提供有力支持。其

8、次, 多媒体技术在军事指挥系统中也扮演重要角色。 目前最现代化的军事指挥系统被称为 C4ISR 系统(C4 表示 Comma nd、Con trol、Commu nicati on Computer,I 表示 Information , S 代表 Surveillance, R 表示 Reconnaissance) ,以美国的国 家军事指挥中心为典型代表。第三, 军事训练中应用了大量多媒体技术。 为了提高军事训练效果、 节省训练 成本,各国军事训练系统都不同程度地采用了基于多媒体技术的各种模拟、仿真训练方法。9)游戏与软件游戏软件通常是指各种游戏规则与声音图像视频相结合的软件产品。目前, 在网

9、络上我们经常看到的大型 3D 网络游戏和网页游戏等都是通过用3DMAX、MAYA、FLASH 等多媒体软件和 JAVA、 C+、 VB、 HTML5 等程序语言相结合而开发出来的, 所以叫游戏软件。4. 多媒体技术的体系结构应用系统层端恠編辑二具梦媒体播峽器虚枢现实视颖合议名媒体椁倉燥作系魏层音频编脾码曙 视罚摘解码器网路搖口 编程接口口硬件平台层计粥平台 存储器音视規传常与釆集设备 晁示询务 通情设洛1)硬件平台层现代多媒体计算平台,从硬件配置上看,主要包括如下几个方面:a)光盘驱动器:包括可重写光盘驱动器(CD-R、WORM光盘驱动器和 CD-ROM驱动器。b)音频卡:在音频卡上连接的音频

10、输入输出设备包括话筒、音频播放设备、MIDI合成器、耳机、扬声器等。数字音频处理的支持是多媒体计算机的重要方面,音频卡具有A/D和D/A音频信号的转换功能, 可以合成音乐、混合多种声源, 还可以外接 MIDI电子音乐设备。C)图形加速卡:图文并茂的多媒体表现需要分辨率高,而且同屏显示色彩丰富的显示卡的支持,同时还要求具有Windows的显示驱动程序,并在Windows下的像素运算速度要快。所以现在带有图形用户接口GUI加速器的局部总线显示适配器使得Windows的显示速度大大加快。d)视频卡:可细分为视频捕捉卡、视频处理卡、视频播放卡以和TV编码器等专用卡,其功能是连接摄像机、VCR影碟机、T

11、V等设备,以便获取、处理和表现各种动画和数字化视频媒体。e)扫描卡:它是用来连接各种图形扫描仪的,是常用的静态照片、文字、工程图输入设备。f)打印机接口:用来连接各种打印机,包括普通打印机、激光打印机、彩色打印机等,打印机现在已经是最常用的多媒体输出设备之一了。g)交互控制接口:它是用来连接触摸屏、鼠标、光笔等人机交互设备的,这些设 备将大大方便用户对 MPC的使用。h)网络接口:是实现多媒体通信的重要MPC扩充部件。计算机和通信技术相结合的时代已经来临,这就需要专门的多媒体外部设备将数据量庞大的多媒体信 息传送出去或接收进来,通过网络接口相接的设备包括视频电话机、传真机、LAN 和 ISDN

12、 等。2) 操作系统层计算机操作系统是管理计算机软硬件资源, 控制其他程序运行, 并为用户提供 操作界面的系统软件的集合。操作系统中配置的重要多媒体组件如下:a) 编解码器( codec, coder 和 decoder 合成词语):是系统中完成媒体数据 压缩、解压缩、格式转换(转码)等操作的软件,在多媒体操作系统中居 核心地位。b) 媒体服务器 ( media server ):一种通过网络或平台向用户提供各种多媒体 业务所需的媒体资源功能的系统软件, 通常表现为操作系统中的媒体服务 (media service )组件。c) 多媒体编程接口:应用编程接口是指一组数量可观、结构复杂的子程序、

13、 函数、变量、常量、类、数据结构,是应用系统设计与实现的软件资源。 Windows 操作系统中常见的多媒体编程接口有DirectX 、 DirectShow 、Media Foundation 、SilverLight 等。 Andriod 操作系统下,开发人员可以使 用Media APIs,实现移动设备上的 MP3、MP4、高清视频播放等等。3) 应用系统层 整个多媒体技术架构的最上层是各类多媒体开发工具和应用系统。最典型的应用系统是各类多媒体著作或编辑工具,如Photoshop、 Authorware 、 Illustrator 、PowerPoint、 Premier、 3D Max 等

14、等。5. 多媒体应用系统设计面临的挑战1) 数据量大2) 实时性要求高3) 同步性要求严格4) 数据来源繁多6. 多媒体技术的核心问题暂无第章数字首频基础一、声音1. 含义:声音是物体振动形成的机械波,称为声波。声波通过介质(例如空气、水等)传播到听觉系统里产生听觉反应。声音本质上是介质的周期振动。2. 基本属性:频率和振幅频率:指振动的快慢,通常用每秒钟的振动次数表示(赫兹)。人耳可以听到的声音频率范围在20到2万赫兹之间。高于这个范围的波动称为超声波(Ultrasonic),而低于这一范围的称为次声波(Subsonic)。我们把人类听觉系统所能听到的声音称为音频(Audio)。振幅:指声波

15、在某个位置上的瞬时强弱。3. 三要素:音高、音质(音色)、音强二、从模拟到数字1. 模拟音频信号:用连续变化的电压或电流表示的音频信号。2. 数字音频信号:通过采样和量化技术获得的离散性(数字化)音频数据。3. 采样:指以一定的频率(或周期)捕获模拟音频信号,从而得到一系列离散化音频样本的过程。采样频率:单位时间内捕获的样本个数,是采样周期的倒数。采样定理:将频带为 F的模拟音频信号 f(t )采样为离散化样本序列f(tO+ t)、f(t0+2 t)f(tO+n t)后,如果1/ t (即采样频率)大于 2F,即采样频率大于模拟信号频带F的两倍,则可从离散样本序列恢复原来的信号f(t)。序号录

16、样曲半(kHz)1劝淸9kDD (HDDVD).业龙匚D2数宇电视* PVD抽&通CD唱盘斗22.05调頼广摘511 0256常见的采样频率和其应用场合f25 / 254. 量化:指用若干比特表示一个样本的过程。量化深度(bit depth ):表示一个样本所使用的比特数。采样是时间上的离散化,而量化则是空间上的离散化。5. 编码:以某种格式最终生成数字音频数据流的过程,所得到的数字音频数据将会被存储、传输或者进行各种处理。模拟音频数字化的三个步骤是采样、量化、编码。三、声卡1. 结构:2. 功能模块1) DSP Digital Signal Processor 数字信号处理负责采样、量化、编

17、码和解码、数模转换2) Syn thesizer :合成器负责将数字音频波形数据或MIDI消息合成为声音。3) ROM or/and RAM :波表 /软波表ROM存放有实际音乐设备的声音样本,用于合成,称之为波表RAM能够被新的样本数据更新,称之为软波表。4) Mixture :混声器负责过滤以降低噪音、混合不同的声音信号、单/双通道转换、音量调节四、数字音频编码1.含义:指将模拟音频转换成数字音频并以某种格式存储的技术或过程。2.种类:1)PCM(Pulse Code Modulation脉冲编码调制)编码:即通过脉冲编码调制方法生成数字音频数据的技术或格式。a)系统原理Ana4Ami曲耶

18、W肛 c FcmiC M codeSignal InputFilterWUoJc波形PCM简码较勇Siep-Sic:A系统由三个部分构成:防失真滤波器:它是一个低通滤波器,用来滤除音频信号以外的信号。波形编码器:主要完成采样任务。量化器:负责对样本进行量化,即对每一个样本赋予一个对应的二进制数据,从而得到PCM样本序列,作为系统的输出。其实,量化器输出的PCM样本序列还会进一步被编制成格式化的二进制码流,包括帧和通道的构成,这个处理可以视为狭义的编码过程。b)量化分类均匀量化(线性量化):指采用相等的量化间隔(量化阶跃)进行的量化。量化间隔:指将整个量化空间分割成若干离散的有限状态后,相邻的两

19、个离散状态值之间的差值。釜 itI;:Ji tt|量化闽禹J11111i_ 蔵择綸扎料衣茁街 XiKd Xr 脣 詹非均匀量化(非线性量化):指量化间隔在量化空间中不是一个常数的量化。一般情况下,量化间隔的大小分布服从一种非线性函数,对小的输入信号采用较小的量化间隔,大的输入信号则采用较大的量化间隔。分类:律压扩(卩-Law):所定义的函数关系如下:-1和+1之间的一个小数,X:输入信号的幅值,其大小归一化为即-1 x 1。sgn(x): x的极性,也就是信号的正负。卩:一个常量参数,由最大量化间隔和最小量化间隔之比决定,一般在100500之间取值。值越大,整个对数曲线越往上拱, 反之就越 靠

20、近45度的线性量化曲线。在具体实现时,一般取255,并把对数曲线变成8条折线以简化计算。A律压扩(A-Law):所定义的函数关系如下:F4Cv) = sgn(.v) 1 + ln /I0 |a| 1 /A |x 11x:为输入信号的幅度,归一化成为-1 x 1。Sgn( x):x的极性,也就是信号的正负。A:为确定压缩量的参数,为最大量化间隔和最小量化间隔之比。A律压扩的前一部分是线性的,以1/A为分界点,其余部分与律压扩类似,为对数函数。具体计算时,A取87.56。为简化计算,同样把整个曲线变成8条折线。2)DM(Delta Modulation增量调制)编码:通过增量起伏来记录模拟音频信号

21、实际变化 过程的数字音频编码。xQ xl zq k3 yi) / 如果实际样本值大于预测值xi = 1;/编码输出等于 1Elsexi = 0; / 否则,编码输出等于 0b) 优缺点优点数据量得到显著压缩。 DM 编码总是用一个比特来表示一个样本,即对应 一个样本的编码不是 1 就是 0。所以, DM 编码被称为一位系统。缺点?斜率过载如果输入信号变化太快,那么预测信号将不能保持对输入信号的跟踪, 因为当前预测值只能在前一次预测值的基础上加1个(或减1个厶),也就是说,由于量化阶跃固定不变,导致预测值跟不上信号的变化。这种现象称为增量调制器的 斜率过载”(slope overload ),

22、即模拟信号的斜率太大,超过了量化阶跃允许的变化幅度。一般来说,当输入信号的变化速度超过输出信号的最大变化速度时,就会出现斜率过载。?粒状噪声当输入信号变化比较平缓时, 增量调制器的编码输出为交错出现的0和1,即数字信号并不平缓,而是以量化阶跃的大小起伏变化,这 就相当于引入了噪声信号。DM编码器的这种噪声是系统固有的,不 可能彻底消除。3)ADPCM(Adaptive Differenee Pulse Code Modulation,自适应差分脉冲编码调制 ):利用样本与样本之间的高度相关性和量化阶自适应来压缩数据的一种波形编码技术a) 原理第一,使用过去的样本值估算下一个输入样本的预测值,使

23、实际样本值和预测值之间的差值总是最小,并对差值进行编码。第二,利用自适应的思想在时间维度上改变量化阶跃的大小,对小的差值使用小的量化阶跃(),对大的差值则使用大的量化阶跃进行编码。4)SB-ADPCM(Sub Ban d-ADPCM子带自适应差分脉冲编调制 ):是一种融合了子带与自适应差分脉冲编调制技术的新型编码方法。SBC(Sub Band Coding子带编码):子带编码使用一组带通滤波器(Band-Pass Filter,BPF)把输入音频信号的频带分成若干个连续的子频段,子频段又称为子带。对每个子带中的音频信号采用独立的编码方案编码。在传输编码信号时,系统会采用复用技术,将所有子带的编

24、码整合起来传输。在接收端解码时,首先进行解复用,即把各个子带信号分解出来,然后对每个子带的数据独立解码。当然,最后还原音频信号时,系统会把所有子带的解码信号融合起来,从而还原成原来的音频信号。这里的融合,实际上就是相加,即某一时刻的还原信号样本等于同一时刻所有子带样 本之和。3. 数字音频编码国际标准序号标准名称编码算法基本属性1G.711PCM(含线性、卩律以和A律PCM 编码算法)采样频率为8kHz,每样本8 bits,数据率为 64kbps2G.721ADPCM采样频率为8kHz,每样本4 bits,数据率为 32kbps3G.722SB-ADPCM采样频率为8kHz,每样本咼子带 2

25、bits ,低子带6位,数据率为64kbps4G.723ADPCM采样频率为8kHz,每样本3或5 bits,数据率为24或40kbps5G.723.1LPC提供5.3kbps、6.3kbps两种速率的配置第三章音频数据处理程序设计波形音频文件1. 含义:波形音频文件(WAVE文件)是存储数字音频样本(samples)序列的格式文件, 这些样本直接记录了音频的波形,故称波形音频文件。2. 格式标准:RIFF( Resource Interchange File Format),一个 WAVE 文件的最开头四个字 节便是“ RIFF”。3. 组成:WAVE文件是由若干个 Chunk (可以翻译为

26、块)组成的。按照在文件中的出现位置,它们分别是 RIFF WAVE Chunk Format Chunk、Fact Chunk (可选)和 Data Chunk。RIFF WAVE ChunkID - RIFF1RifTTypc = WAVE1Formal Chunk ID - TnuFiitt Chunkfoptiunid) 1D= TacfDaU ChunkID二如1) RIFF WAVE Chunk字段名称所占字节数具体内容D4 Bytes“RIFFSize4 Bytes由数据决定Typt4 BytesWAVEsize是整个wav文件大小减去ID和Size所占用的字节数,即FileLen

27、 - 8 = SizesTriict RIFF 1 (EADRRchar szifHD4 / ,R,1ir,Tr;F, DWORD duRiflSize;charszRiflFormat|4; A lW;tA,:V,:Ef2) Format Chu nk字段名称所占字节数具玮冋容ID4 BytesTml1Size4 Bytes黄值対&或18则最后有附加傳息Fonnatlag2 Bytes坞码旁式41 0x0001Channels2 Bytes声道哉目,1;单声逍,2:從声道SiimpksPerSec4 Bytes痕样频率AvgBtesPerSet4 Bytes每秒所需字节裁BIxkAlign2

28、 Bytes哉摊块对祥単血号卜采样需要的字节敕)BilsPcrSumpk2 Rytes每个耒样需要的bii戟&n2 Bytes附刼席息(可逸*通过引盘东刘斯有羌)struct WAVK FORMATWORD wFoimat fag,WORD wCliannels;DWORD d wS it mp 1 es J JerSec;DWORD du1 ?Xv gByiesIVrSec;WORD wBloGkAlign;WORD wBitsPcrSampkiI;struct FMT BLOCKchar szFiniID4;DWORD dwFmtSize;WAVE FORMAT wavFornim:3)

29、Fact Chu nk字段名#所占字节戟具休內容1P4 Bytes7acfSize4 Bytes敖值为4datj4 Hytcs同户定义Fact Chunk是可选字段,一般当wav文件由某些软件转化而成,则包含该 Chunk。struct FACT BLOCKichar szFactID4; / T/a7c1rDWQR1? dwFavlSiu;4) Data Chu nk字段名祢所占字节救具体內容ID4 BjtcschlafSize4 Bytes音频数据的大小data谊大不超过常盈所 能表示的字节數音频敎摒.是文件的主体根据Format Chunk中的声道数以和采样bit数,wav数据的bit位

30、置可以分成以下4种形式:8bit量化牌本11*2#*3样4(左)声道0(左)声道0声道Q放声遣Sbit量化蟀本1样本2(XI声這1佑)声谴0 (左)声道1(旬学声it itibit量化样本1样本2it 0 (绘)低位字布)声逍0 (A)(高位字节)o (左)(低位字句存道0 (左)商植字节)駆声道 16bit ft祥本1k*o cxJ(箴伍字节)声道0(高位字节)声遒1 (右) g宇节声道1 (右商位字节)Channel 0Sample 1Channel 0Sample 2单声道、每样本8Channel 0Sample 3Bits情形(singlechannel 8 Bits-per samp

31、le):i!Sample 1Sample 1Sample 2Sample 2双声道.每样本8 Bits情形(double channels 8 Bits per sample):单声道、每样本16 Bits情形 (single channel,16 Bits per sample):Charnel 0A Sample 1亠 Sample 2Channel 0ChaiuLel 0Channel 0*Channel 0Sample 1Channel 0双声道.每样本16 Bits情形 (doublechannels 16 Bits per sample) sChannel 1Channel 1Ch

32、annel 0Channel 0struct DATA BLOCK char szlhiliilL|4|; d/a.tVaDWORD dwDilaSie;;Sample 1Sample 2Sample 2二、音频播放程序1. 禾U用PlaySound函数播放音频文件1) 基本介绍:PlaySound是Windows系统提供的基本音频播放函数,在C/C+中使用。PlaySo und函数不仅能够播放波形音频文件,而且可以播放系统事件对应的音频。2) 原型:BOOL PlaySound(LPCTSTR. psSoutKLMODULE htiwLDWORD WwSound);pszSou nd:字符串

33、变量,指向播放的波形音频文件,可以为NULL,这时任何当前播放的音频将停止hmod :可执行文件的句柄,该可执行文件包含了需要加载的资源。一般情况下,hmod被设置为 NULL。fdwSound :播放标识,有 15种取值:?SDN_ASYNC异步播放,即调用PlaySound函数后声音开始播放,而调用立即返回,无需等待播放完毕。? SDN_SYNC同步播放,即调用要在播放完毕后才能返回。?SND_RESOURCE此时hmod设置为一个可执行文件的句柄。? SND_ALIAS此时pszSound不能是文件名,而必须是注册的事件别名。3) 核心代码:switch (wmld)case ID_DI

34、SP_SOUND: /控件 IDPlaySou nd(La ngry_bird.wav,NULL,SND_ASYNC); /播放音频break;case ID_STOP_SOUND:PlaySou nd(NULL, NULL,SND_ASYNC);停止播放break;2. 基于 MF Media Session的音频播放1) 基本框架:2) 基础过程:调用 MFStartup 函数进行 Media Foundation platform 的初始化;调用 MFCreateMediaSession 函数创建一个Media Session 对象实例;利用 Source Resolver创建媒体源。仓

35、U建Topology,并将媒体源节点与SAR节点连接起来。实际上,应用程序在这里只需要创建一个Partial Topology (部分拓扑),然后将媒体源与输出节点SAR连接,这时,Partial Topology能够自动在两者之间插入必要的解码器, 这体现出 Media Foundation的智能性;调用 IMFMediaSession:SetTopology 将 Topology 设置到 Media Session;使用 IMFMediaEventGenerator 接口从 Media Session 取得事件;调用 IMFMediaSessio n:Start 启动播放。之后, 可以调用

36、IMFMediaSessio n:Pause、IMFMediaSession:Stop 暂停、停止播放。退出应用程序时,需调用 IMFMediaSession:Close关闭Media Session。该方 法是异步的,因此,当调用完毕,Media Session发送MESessionClosed事件,并能够安全处理后面的操作。3. 音频转码程序1)功能:将 MP3、WMA以和AVI、WMV中的音频数据转换成 WAV文件输出的功2) 函数声明:include slciafx.lf#in chide Cry.hITtcinpliilc - -cliisis I ” void SaIeRcleas

37、i:t I + ppT) if(*PpT)( *ppT)-Rekiise();*ppT = NULL;HKkSULT riteWavchileHMFXurceReiider*, HANDLE, LONG);HRESULT ConfiguTcAudioStrcuiXlMFSaurccRcadcr.lMFMcdiiiTypc*); HRESULT WritcWavcHi:iidrt HANDLE, lMFMediaType*, DWORD*); DWORDCalculateMaxAudioDataSizcTFMedialypc* DWORD, DWORD);H kESULT WrileWaveDa

38、tafHANDLE, MFSouteRcadcr DWORD, DWORD*); HRESULT FixUpClmiikSiTeifHANDLE, DWORD. DWORD);HftESUJ-T K rit?TQFiMHANDLE. Acid*, DWQkD);voi d On F ileOpent HWND);、门 id rransi-odet);3) 音频数据量的计算d = 丁 乂 (/xg 址 c)令&T:转码音频片断的持续时间,以秒s为单位f:采样频率,以赫兹 Hz为单位q:音频样本的量化深度(是 16bits还是24bits),以位bit为单位c:声道数(是单身道还是双声道),1或2

39、d:音频数据量,以字节为单位最大音频数据量:cbMaxSize = MAXDWORD-cbHeader。MAXDWORD: Microsoft Visual C+ 在 winnt.h 头文件中定义的一个常量#defi ne MAXDWORD 0xffffffffcbHeader: RIFF Wave chunk的大小 +FORMAT chunk的大小 +data chunk 头部大小4)在转码程序中操作音频数据假设转码程序通过ConfigureAudioStream函数,将转码输出配置为未压缩的PCM格式音频,即采样频率为44.1kHz、量化深度为16bits、双声道的波形音频,那么,缓冲区中

40、的音频数据将按下图所示的方式排列。樺離1样茲2左声逋 慎仪宇节高僅竽节右声道他位字节商僅宇节-*int i;fbrfi=Od%4 = 0) *(pAudioDala + i) = 0;屏蔽左声道的第个字节第四章无损数据压缩一、 信息熵编码1. 基本概念1)信息量:对不确定性的度量,从数学上讲,某一事件发生的可能性越小,即概率越小,则该事件提供的信息量越大;反之,一个事件发生的概率越大,则该事件包含的信息量就越小。计算信息量的表达式:设某事件的信息量为Ii,该事件发生的概率等于 pi,则A =他M仞=確必,0Pi J2)信源:构成一类报文的基本符号的集合。这些基本符号又称为码元。3)码元:码元意

41、指基本编码单元。每一个码元都有出现的概率,因此,每一个码元都有其对应的信息量。4)信息熵:一个信源的所有码元的平均信息量就称为该信源的信息熵。5)熵编码:就是指在不丢失任何信息的前提下,基于码元的统计特性, 对码元或直接对报文本身进行编码,使得最后存储该报文所需要的平均比特数接近信源的信息熵。2. 种类1)香农-范诺编码2)霍夫曼编码3)算术编码4)行程编码:指对报文逐行进行统计,通过记录连续排列在一起的相同数据单元的数量、以和该数据单元本身,以压缩存储空间的一种编码算法。行程编码的记录方式有两种:逐行记录每个游程的终点列号:逐行记录每个游程的长度(像素数)。设有一个数据块,如下:AAABBACCCA则第一种方式下,这个栅格图形可记为:A,3,B,5A,1,C,4, A,5第二种记录方式下,可记为:A,3,B,2A,1,C,3,A,1词典编码

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!