音频数字水印技术研究

上传人:x**** 文档编号:77032133 上传时间:2022-04-19 格式:DOC 页数:61 大小:966KB
收藏 版权申诉 举报 下载
音频数字水印技术研究_第1页
第1页 / 共61页
音频数字水印技术研究_第2页
第2页 / 共61页
音频数字水印技术研究_第3页
第3页 / 共61页
资源描述:

《音频数字水印技术研究》由会员分享,可在线阅读,更多相关《音频数字水印技术研究(61页珍藏版)》请在装配图网上搜索。

1、. . . . 分类号 UDC密 级学 号硕士学位论文音频数字水印技术研究51 / 61学位论文原创性声明本人重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名: 日期: 年 月 日学位论文使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权大学可以将本学位论文的全部或部分

2、容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名:日期: 年 月 日导师签名: 日期: 年 月 日论文题目:音频数字水印技术研究摘要随着信息技术和计算机网络技术的飞速发展,数字多媒体信息(图像、文本、音频和视频等)的存储、复制和传播变得非常容易,但这给我们带来方便的同时也带来一些副作用,一些不法分子在没有经过作品所有者许可的情况下,随意复制、篡改和散布有的作品。因此,对多媒体容的保护与容鉴别已成为亟待解决的问题。随着数字音乐作品的广泛传播,对音频作品的保护也显得非常重要。音频数字水印技术就是针对音频作品进行保护的,该技术通过在音

3、频文件中嵌入秘密信息来达到保护和掩蔽通信的目的。本文论述了数字音频水印技术,提出了两种音频数字水印算法,全文的主要工作如下:(1)较为全面地综述了音频数字水印的概念、框架、要求、人类听觉系统特性特别是掩蔽特性、常见的音频数字水印的攻击与几种评价标准,同时介绍了几种典型的音频水印算法。(2)提出了一种基于能量比较的时域音频数字水印算法。该算法利用Arnold置乱变换对要嵌入的水印图像进行加密处理。首先对音频信号分段,计算每段音频的能量,然后根据比较结果,通过不改变或缩小音频信号能量的方法嵌入水印。该算法具有较好的安全性,对不同的音乐和话音都具有良好的感知透明性。能够抵抗裁剪、滤波、加噪、压缩等攻

4、击,鲁棒性较好。(3)提出了一种基于小波变换的频域音频数字水印算法。该算法利用混沌序列对水印信息加密,先对音频信号分段,每段实施离散小波变换,比较每两段音频精细分量的能量,然后根据比较的结果和一定的规则嵌入水印信息。实验证明,该算法具有较好的感知透明性、安全性,含水印音频能够抵抗基本的信号处理操作,鲁棒性较好。本文提出的算法都是盲水印算法,可以对音频文件实施有效的保护,具有很好的实用价值。关键词:数字音频水印;能量比较;离散小波变换;感知透明性;鲁棒性Title:RESEARCHON AUDIO DIGITAL WATERMARKING TECHNOLOGYMajor:Computer App

5、lication TechnologyName: Tingting CHAOSignature:Supervisor:ProfXinfang WANGSignature:AbstractWith the rapid development of information technology and computer network, the storage, duplication and communication of digital multimedia information (images, texts, audios and videos) have become very eas

6、y, this has brought us convenience, but at the same time, it also has brought some side effects, some pirates copying, tampering and broadcasting the digital works without the permission of the authors. Therefore, copyright protection and content identification of multimedia have become an urgent pr

7、oblem to be solved. With the widespread dissemination of digital music, copyright protection of audio has become more and more important. Audio digital watermarking technique is to protect audio works copyright, we can embed secreted information into audio files using the technology, so as to get th

8、e purpose of secreted communication and copyright protection. The thesis talked audio digital watermarking technology, designed two different watermarking algorithms. The main research work is as follows:(1)Described the concept,framework, requirements,characteristics of the Human Auditory System es

9、pecially masking, main attacks, some benchmarks of audio watermarking techniques, finally introduced several kinds of existent audio watermarking algorithms. (2)Designed a time-domain digital audio watermarking algorithm based on energy comparison. Using the Arnold transform to encrypted the secret

10、information. At the first, we divided the audio signal into some segments, calculated each segments energy, and compared the energy of each two segments. Then according to the results of the comparison, embedded the watermark by the way of not changing or reducing the energy. The algorithm had good

11、security, took a good perception of transparency for different types of music and voice. It had good robustness, because it could resist the attacks such as compressing, adding noise, filtering and cutting.(3) Designed a frequency domain audio watermarking algorithm by using the transform ofDWT. At

12、the first, using chaotic sequencer to encrypt the secret information .Then divided the original audio signal into some segments, carried on the wavelet transformation to the each segments and gained the audio fine, compared the energy of audio fine of each two segments, embedded the watermark accord

13、ing to the results of the comparison and certain rules. The experiment results showed the algorithm had good transparency and security. Watermarked audio signal could resist the basic signal processing operations, the algorithm had good robustness.The two digital audio watermarking algorithms which

14、are mentioned above are blind watermarking algorithm, can protect the copyright of audio files effectively, and have good practical value.Key words: Digital Audio Watermarking; Energy Comparison; Discrete Wavelet Transform; Transparency;Robustness目录1绪论11.1研究背景11.2音频数字水印的国外研究现状21.3本文主要工作与容安排31.3.1本文的

15、主要工作31.3.2本文的容安排32音频数字水印技术52.1数字音频基本理论52.1.1人类听觉特性52.1.2音频信号的数字化62.1.3常用音频信号的编码格式72.2音频数字水印系统基本构架82.3音频数字水印系统的要求92.4音频数字水印技术的应用102.5常见的音频数字水印攻击112.6典型的音频数字水印算法122.6.1时域音频数字水印算法122.6.2变换域音频数字水印算法132.6.3压缩域音频数字水印算法142.7音频数字水印的评价标准142.7.1感知透明性评价方法152.7.2鲁棒性评价方法162.8WAVE音频文件格式与解析172.9本章小结203基于能量比较的时域音频数

16、字水印算法213.1引言213.2算法概述213.3算法实现223.3.1水印预处理223.3.2水印的嵌入233.3.3水印的提取243.4实验设计253.4.1水印的设计253.4.2实验容设计263.5实验结果分析263.5.1感知透明性检测263.5.2安全性检测273.5.3鲁棒性检测283.6本章小结294基于小波变换的音频数字水印算法314.1小波变换基础理论314.1.1连续小波变换314.1.2离散小波变换324.2算法概述324.3算法实现334.3.1水印预处理334.3.2水印的嵌入344.3.3水印的提取354.4实验结果与分析364.4.1感知透明性测试364.4.

17、2安全性测试374.4.3鲁棒性测试384.5两种算法的比较394.5.1感知透明性比较404.5.2安全性比较404.5.3鲁棒性比较414.6本章小结415总结与展望435.1全文工作总结435.2下一步工作展望44致45参考文献47在校期间发表的论文511绪论1.1研究背景近年来,计算机网络通信技术特别是互联网的蓬勃发展,使得数据的交换和传输成了相对简单快捷的过程。人们借助于电子设备将不同样式的多媒体作品以网络形式发表,一方面这些数字作品可以以低成本甚至无偿地被使用,这样就给用户带来了很大的方便;另一方面这些也会被不法分子所利用,他们可以很容易地复制这些作品,严重侵害了创作者和所有者的产

18、权。因此,数字作品的便利性和不安全性是同时存在的,采取必要的手段对数字作品实行保护已是迫在眉睫的工作1。传统的作品保护手段现在已经不能满足需要,我们应该考虑数字作品本身的特点,为它提供新的保护手段。人们通常认为通信安全的实现可以通过加密来完成2,即首先对多媒体数据进行加密处理,将其变成密文以后发布,在传播的过程中,非法的个人和团体不会得到信息,从而达到保护和信息安全的目的。以香农信息论与密码学理论为依据的密码技术,存在着一些不足,并不能彻底解决问题。首先,经过加密处理后的多媒体文件因其不可理解性而妨碍了多媒体信息的传播;其次,多媒体信息经过加密后比较容易引起攻击者的好奇和注意,并有被破解的可能

19、性,而且加密文件一旦被破解,其容就完全透明了,不会再起到任何保护作用。由于电脑技术的高速发展和破解技术的日渐成熟,传统系统的安全慢慢被人们所质疑。因此,人们不得不去寻找新的技术来补充加密技术,使多媒体数据的能得到更有效的保护。数字水印技术的研究就是基于这样的实际需要而发展起来的。 自从数字水印(Digital Watermarking)技术在1993年被Caronni提出来以后,工业界与学术界的学者们对它产生了浓厚的兴趣,此后慢慢成为全球非常热门的研究课题。数字水印技术是一门兴起时间不是很长的多门学科相交叉的技术,但发展非常迅速,主要涉与到了计算机科学、多媒体处理、数据压缩、人类心理学和密码学

20、等领域,具有非常重要的理论意义和现实意义。数字水印技术是一种信息隐藏技术,其基本思想是在不影响信息可用性的前提条件下,利用人的听觉特性和视觉特性,对数字产品嵌入秘密信息,用来保护数字产品的和证明数字产品的可靠性,以与为用户提供产品的附加信息等等。随着因特网的普与和数字化音乐制品的大量制作和发行,人们可以很方便的从互联网上下载音乐产品,但这也给非法侵权者提供了机会,致使很多侵害产权的音乐被以不同的方式发布,这样不但给音乐产业带来很大的经济损失,而且阻碍了它的发展。于是,对音频数据实施保护变得越来越重要,音频数字水印技术由此而生。音频数字水印技术是在原始音频数据中嵌入秘密信息水印,但不影响原始音频

21、的听觉质量,在音频中嵌入的秘密信息可以有很多种形式如文字、图像、作品序列号等等3。水印信息和原始音频数据紧密结合在一块,通常情况下音频中嵌入的水印,人们在听觉上根本察觉不到,并且还要能够有效地抵抗不法侵权行为的攻击。1.2音频数字水印的国外研究现状数字水印技术是信息隐藏技术的一个重要分支,最早提出的数字水印技术都是对图像实施保护的。在1993年,Tirkel等人4发表的一篇文章中首次论述了该技术。“数字水印”这一概念最早由Tirkel等人在1994年国际图像处理会议上正式提出。此后,数字水印技术在国际上引起了人们的广泛关注。从1996年的第一届国际信息隐藏技术研讨会(International

22、 Information Hiding Workshop,IHW)顺利召开以后,数字水印技术就被认定为一个重要的容在往后连续四届的信息隐藏会议上进行了探讨。从1999年开始,光学工程师协会SPIE和国际图像科学与技术协会IS&T每年都要举办“多媒体容安全和水印的专题研讨会”(Security and Watermarking of Multimedia Contents)。2009年8月国际数字水印专题讨论会(International Workshop on Digital Watermarking,IWDW)第八次会议在英国的吉尔福德顺利闭幕。自上世纪90年代起,世界上许多著名大学、科研机

23、构和比较有名的企业对数字水印技术都投入了大量的人力和财力进行研究和开发,并且取得了一定的成绩。NEC美国研究所、麻省理工学院和IBM研究中心等都已对数字水印技术进行了深入的研究,一些数字水印的软件被生产出来。数字水印技术在国外取得一定发展的同时,在我国也引起了学者们的关注和研究。我国最早的水印算法是Bender等人在1996年5提出来的,他们主要提出了四种水印算法,有最低有效位算法、回声隐藏算法、相位编码算法和扩频编码算法。通过实验证明,这些算法都有一定的使用价值。后来,Boney等学者6把Cox方案运用到音频信号中,经过仿真实验发现,这也是一个比较有效的方法。再后来,又有一些研究人员进一步改

24、进和完善了上面的几种算法,而且取得了较好的实验结果。 音频水印技术在近年来虽然有一定的发展,但在实际的应用中,能够完全对实施保护的方案却寥寥无几。音频数字水印技术的发展之所以不能达到图像数字水印的水平,一个原因是人类听觉系统模型(Human Auditory System,HAS)比人类视觉系统模型(Human Visual System,HVS)要敏感得多,如果在音频信号中嵌入微弱的水印信息,很有可能会被人耳感受到;另一个原因是在音频信号中嵌入水印的信息量远远小于在图像中嵌入的信息量7。所以,目前音频数字水印技术面临的挑战是如何在保证水印鲁棒性和感知透明性的同时,提高水印的检测效率和嵌入强度

25、。1.3本文主要工作与容安排1.3.1本文的主要工作(1)介绍了音频数字水印技术的相关概念、基本原理、音频水印算法评价标准、攻击方法以与WAV格式音频特性等,同时,分析了几种典型的音频数字水印算法。(2)结合人类听觉系统特性,提出一种基于能量比较的时域音频数字水印算法。算法以二值图像作为水印嵌入到音频信号中,为了减小水印图像像素间的相关性,增强水印图像的安全性,利用Arnold置乱变换对要嵌入的水印图像进行置乱处理。首先介绍了Arnold置乱算法,接着详细分析该算法的嵌入过程和提取过程。通过仿真实验对算法的感知透明性、安全性和鲁棒性进行验证。(3)提出一种基于小波变换的频域音频数字水印算法。该

26、算法利用混沌序列对水印信息进行加密,通过小波变换把音频信号映射到频域,将水印信息嵌入到音频信号的精细分量上。首先介绍了混沌加密的有关知识,然后详细分析该算法的嵌入过程和提取过程。通过实验对算法的感知透明性、安全性和鲁棒性进行检验。最后,比较两种算法的性能。1.3.2本文的容安排第一章首先简单介绍了音频数字水印技术的研究背景,接着讲述了该领域国外的研究现状以与面临的挑战,最后论述了本论文主要工作与结构安排。第二章首先介绍了数字音频的基本理论、音频水印系统的基本框架、要求与应用,并对音频数字水印的评价标准做了简单介绍,随后列举了几种典型的音频数字水印算法,最后分析了WAVE音频的编码格式。第三章提

27、出一种基于能量比较的时域音频数字水印算法。首先简单介绍了Arnold置乱变换,该算法采用Arnold变换对水印进行预处理,然后详细分析了该音频水印算法,最后通过仿真实验对算法的感知透明性、安全性和鲁棒性进行了验证。第四章提出一种基于小波变换的音频数字水印算法。首先对本章算法所采用的小波变换进行了简单的介绍,随后详细介绍了该音频水印算法,算法中采用混沌序列对水印信息进行加密处理,最后对算法的性能进行了验证,并与第三章的算法进行了比较。第五章总结全文工作,并对未来的数字水印研究方向进行了展望。2音频数字水印技术2.1数字音频基本理论2.1.1人类听觉特性在音频信号中嵌入秘密信息(即水印)一般都要结

28、合人类听觉系统(Human Auditory System,HAS)的某些特性89,即人的听觉生理心理特性,来满足嵌入水印的感知透明性(听觉相似性)要求。人耳的听觉过程是一个很复杂的生理过程,并不是所有的声音都能被人耳听到,这主要是由人耳对频率的感知围和人耳对声音强度的感知围决定的。一般情况下,人耳能够感受到频率在20Hz到20kHz之间的声音,但人耳对不同频率的声音的灵敏度是不同的,绝大部分人的听觉系统对2kHz5kHz之间的声音的敏感度比较高。人的听觉系统一般能感受到声压级在0dB以上的声音的存在,但对于声压级在120dB以上的声音,人耳会明显的感觉到不舒服,当声音的声压级大于130dB时

29、,人耳就会有疼痛感。 掩蔽效应(Masking Effect)是心理声学的一个重要性质,它表明人耳的听觉系统(HAS)的灵敏度对频率和时间分辨力的局限性。一个较弱的声音的听觉感受被另一个较强的声音所影响的现象称为人耳的“掩蔽效应”。较弱的声音称为被掩蔽音(Masked Tone),较强的声音称为掩蔽音(Masking Tone)。被掩蔽音单独存在时的听阈分贝值,或者说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈值。实验表明,在3000Hz5000Hz围绝对闻阈值最小,即人耳对它的微弱声音最敏感;而在低频和高频区绝对闻阈值要大得多。在800Hz1500Hz围绝对闻阈值受频率变化的影响最不明

30、显,也就是说在这个围语言可储度最高。 掩蔽效应分为时域掩蔽(Temporal Masking)和频域掩蔽(Simultaneous Masking)10。频域掩蔽11,又被称为同时掩蔽,指的是掩蔽效应发生在掩蔽音和被掩蔽音共同发生作用的情况下,是一种较强的掩蔽效应。这时,在掩蔽效应发生期间掩蔽音一直都在起作用。通常情况下,频域中的弱音会被其附近的强音掩蔽,弱音和强音之间的距离越小,就越容易被掩蔽。在距离强音较远处,绝对闻阈值比该强音所引起的掩蔽阈值要高,这时,噪声的掩蔽阈值是由绝对闻阈值决定的。时域掩蔽12,又被称为异时掩蔽,指的是掩蔽音和被掩蔽音不同时出现时发生的掩蔽效应。异时掩蔽又被划分为

31、超前掩蔽(Pre-masking)和滞后掩蔽(Post-masking),如图2-1所示,如果掩蔽音出现在被掩蔽音的前面,则称为滞后掩蔽。如果掩蔽音出现在被掩蔽音的后面,就称为超前掩蔽。滞后掩蔽发生的原因是人的神经行为具有一定的持久性,而发生超前掩蔽的原因则是掩蔽音和被掩蔽音之间的听觉处理互相干涉。异时掩蔽是一种比较弱的掩蔽效应,并且随着时间的推移而迅速衰减。一般来讲,超前掩蔽发生作用的时间很短,只有320ms,而滞后掩蔽则可以持续50100ms。人耳的这种超前掩蔽、滞后掩蔽的特性为音频中嵌入水印提供了很大的方便。同时掩蔽滞后掩蔽超前掩蔽掩蔽音出现前的时间/ms掩蔽音消失后的时间/ms掩蔽音被

32、掩蔽音可闻阈值的上升量/dB图2-1时域掩蔽效应Figure 2-1 Time-domain masking effect人类听觉系统特性特别是掩蔽特性在数字音频水印技术中发挥着举足轻重的作用。目前出现的大多数音频数字水印算法都直接或间接地利用人耳掩蔽特性来保证嵌入隐秘数据的感知透明性13,在音频中嵌入的隐秘信息必须适应并且依靠于原始音频信号,而且原始音频信号的时域和频域掩蔽特性决定水印的时域和频域的分布。根据原始音频信号的不同,嵌入音频中的水印信号的强度也不一样,这样就可以保证嵌入的水印信息在具有很好的感知透明性的同时,也具有最大能量,水印能量的最大化增强了水印抵抗攻击的能力。2.1.2音频

33、信号的数字化自然界中的音频信号是幅度随时间而变化的一维连续信号,不仅在幅度上是连续的,而且在时间上也是连续的,一般称为模拟信号。音频信号在幅值上连续指的是音频信号有无限多个幅度的数值,而音频信号在时间上的连续指的是在某一个指定的时间围信号的样本值有无限多个。随着计算机的普与和科学技术的不断发展,采用现代化的信息技术手段处理音频信号已经成为一种有效的手段,但是计算机只能处理在时间和幅度上都是有限的数字信号,它不能处理模拟信号,所以要使用计算机来处理音频信号就要先对音频信号进行数字化。对模拟信号进行采样和量化就可以把音频信号变成时间上和幅值上都离散的数字信号。音频信号的数字化有两个重要的参数:量化

34、精度和采样频率。连续时间的离散化是通过采样来实现的。采样指的是在一些特定的时间点测量模拟信号,每次采样都会相隔相等的一小段时间,把这种方式的采样称为均匀采样,两个采样点之间的间隔称为采样周期,采样频率是采样周期的倒数。目前,音频信号常用的采样频率有8kHz,10kHz,12kHz,16kHz,22.05kHz和44.1kHz。音频信号的采样频率会影响水印信息的嵌入量。在大部分已有的数字水印技术中,可用的数据空间和采样频率的增长至少满足线性关系。信号连续幅度的离散化是通过量化来实现的。所谓量化就是把采集到的数值送到量化器(A/D转换器)编码成数字,每个数字代表一次采样所获得的音频信号的瞬间值。量

35、化时,把整个幅度划分为几个量化级,将落入同一级的样本值归为一类,并给定一个量化值。目前,常用量化数据位来表示量化级。通常,音频信号的样本量化位数有8位和16位。最近,有公司还推出了24位的产品。样本量化位数的多少影响到音频信号的质量,量化位数越少,音频的质量就越差,需要的存储空间就越小;量化位数越多,音频的质量就越高,但需要的存储空间就越大。2.1.3常用音频信号的编码格式多媒体技术问世以来,在互联网和各种机器上的音频文件格式有很多种,不同的格式有各自不同的用途。下面简单介绍几种目前比较流行的编码格式:(1)PCM编码:脉冲编码调制(Pulse Code Modulation,PCM)是对信号

36、进行采样和量化时,将所得到的量化值序列进行编码,变换为数字信号的调制过程。PCM编码的音质比较好,但是占用的存储空间却非常大。我们常见的Audio CD采用的就是PCM编码,一光盘的容量只能容纳72分钟的音乐信息。(2)WAV:WAV是Microsoft 公司开发的一种声音格式,也叫波形声音文件,是最早的一种数字音频格式,被Windows平台与其应用程序广泛支持。只要有足够高的采样频率和量化精度,采用WAV格式记录的声音和原始声音几乎没什么差别,质量比较高。(3)MP3:MP3(Moving Picture Experts Group Audio Layer III)是目前最为普与的音频压缩格

37、式,是Fraunhofer-IIS研究所的研究成果。MP3所属的MPEG-1标准的部分对应于ISO/IEC 111723标准16。MP3是利用MPEG Audio Layer3的技术,将音乐以1:10甚至1:12的高压缩率压缩成容量较小的音乐文件,也就是说,能够在音质丢失很小的情况下把音乐文件压缩到更小,而且还能非常好的保持原来的音质。MP3格式音频体积小,音质高,一分钟CD音质的音乐经过MP3压缩编码后只需要大约1MB的存储空间,而没有压缩时需要10MB左右的存储空间。但MP3文件是熵编码,没有办法直接得到音频信号的原始幅值,所以也就没办法直接对其进行信号处理。(4)MIDI:(Musica

38、l Instrument Digital Interface,MIDI)是乐器数字接口,是上世纪80 年代初提出的,用来解决电声乐器之间的通信问题。它是电子乐器和电脑之间与电子乐器之间的一种统一交流协议。MIDI 传输的不是声音信号,而是音符、控制参数等指令,它指示MIDI设备要做什么,怎么做,如演奏哪个音符,多大音量等。MIDI文件数据量小,便于传输和保存,而且能够很容易地转换成音频,用途很广泛。(5)RealMedia:RealMedia是Real Networks公司为了解决网络传输带宽资源有限的问题而提出的一种支持网络流媒体的多媒体格式。RealMedia的音频格式有RA和RMA,它可

39、以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行音频数据实时传送和播放,非常适合早期的互联网应用环境。(6)WMA:WMA(Windows Media Audio)是微软公司推出的与MP3格式齐名的一种新的音频格式。WMA在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质。(7)OggVorbis:OggVorbis是一种新的音频压缩格式,类似于MP3等现有的音频格式,其扩展名是.OGG。它也是通过有损压缩算法进行音频压缩的,在压缩技术上,OggVorbis使用了可变数码率和平均数码率方式进行编码,这样可

40、以获得较好的音质,而且它是多声道、完全免费、开放和没有专利限制的。2.2音频数字水印系统基本构架音频数字水印技术就是在音频中添加某些数字信息来保护数字媒体的,证明数字产品的真实可靠性。水印信息嵌入在音频载体中,不能影响原始音频的完整性和可用性。从数字通信的角度来讲,可以把音频数字水印技术理解为用扩频等通信技术把一个窄带信号(水印)放在在一个宽带信道(载体)上传输;从信号处理的角度来讲17,可以把音频数字水印技术看作是把一个作为水印信息的弱信号叠加到原始音频载体的强背景上。一个完整的数字音频水印系统包括水印的生成、水印的嵌入和水印的提取或检测三个基本环节18,图2-2为水印嵌入过程的基本框架。原

41、始水印()水印预处理算法()原始音频数据()嵌入水印后的音频()水印嵌入算法私钥/公钥()图2-2水印嵌入的基本框架Figure 2-2 Basic framework of the watermark embedding把原始音频数据、要嵌入的水印信息和一个可选的私钥/公钥作为这个系统的输入,嵌入水印后,该系统输出的是含水印的音频信号。其中水印信息可以是图像(二值图像、灰度图像或彩色图像)、随机序列或伪随机序列、文字等。在嵌入水印前,通常都会采用水印预处理算法对水印信息进行处理,以提高水印的安全性。由图2-2可以定义水印嵌入过程的通用公式: (2.1) 图2-3为水印检测/提取的基本框架。原

42、始水印()/原始音频()含水印音频数据()私钥/公钥()估计水印()/相似度检测()水印检测算法图2-3水印检测的基本框架Figure 2-3 Basic framework of the watermark detection由图2-3定义水印检测过程的公式: 需要原始音频数据时: (2.2) 需要原始水印时: (2.3) 不需要原始音频数据时: (2.4)其中,代表要估计的水印,代表遭受到攻击后的含水印的音频数据,是所采用的水印检测算法。一般采用相似度检验的方法来证明检测信号是水印信号,但它只能检测水印信号是伪随机信号,或者是随机信号。水印相似度检验的公式为: (2.5)其中,代表水印信号

43、和检测信号的相似度,代表估计水印,代表原始水印。2.3音频数字水印系统的要求要成功地在数字音频中隐藏水印信息,水印处理系统必须满足一些特定的要求。音频数字水印系统的要求20主要包括对鲁棒性、感知透明性、安全性以与对载荷(容量)和计算复杂性的要求。 (l)感知透明性音频数字水印系统要求在音频中嵌入水印信息后,含水印音频必须在听觉感知上达到一定的要求,也就是说在音频中嵌入水印信息而引起的音频载体的变化对人的听觉系统来说应该是觉察不出来的,理想情况是嵌入水印的音频和原始音频载体在听觉上几乎没什么差异,并且对两者进行一样的信号处理操作后也不会有任何感知上的差异。(2)鲁棒性数字水印的鲁棒性是指数字作品

44、在受到各种信号处理操作或攻击后,水印系统仍然能够检测到水印的能力。目前,信号处理操作主要有:DA/AD转换、添加噪声、低通滤波和压缩等。这些操作都不是恶意的,恶意的攻击主要有未经授权的删除、未经授权的嵌入和未经授权的检测。数字水印系统要求水印必须有一定的鲁棒性,即含水印信号在受到各种有意或无意攻击后仍能从水印载体中提取出水印,以达到保护的目的。(3)安全性安全性主要指水印抵抗恶意攻击的能力。对于有目的的攻击,如在已获取水印算法或相关知识的情况下,要具有抵抗力,使非授权用户无法检测和破坏水印。(4)数据容量数据容量也称为嵌入率、加载率,是指在一个数字作品中最多可以嵌入的水印比特数。不同的应用环境

45、对数据容量的要求不同,在保护应用中,为了提高水印的抗裁剪能力,一般把水印信息重复地嵌入到音频载体中,这种应用对容量的要求不是很高。水印技术运用到隐密通信中时,对信息容量的要求就相当高了。(5)计算复杂性根据应用的环境不同,数字水印系统对计算复杂性的要求也不一样。通常情况下,要求检测器的复杂性要低于嵌入器的复杂性。到目前为止,没有哪一种算法能够完全满足上述要求,现有的音频数字水印算法都是在这些要求之间寻求一种平衡,实际应用时可以根据应用环境选择较为理想的方法。2.4音频数字水印技术的应用音频数字水印技术的应用非常广泛,总的来说主要有如下几个方面 1314:(1)保护数字音频作品的所有者为了表明其

46、对作品容的所有权,采用音频数字水印技术将具有特定意义的水印嵌入到原始音频数据中,接着公开自己的音频作品。在不法分子声称自己对所公开的嵌入水印的音频作品拥有所有权时,该作品的真正所有者利用检测或提取算法,检测或提取出音频作品中嵌入的水印信息,这时就可以很有力地证明该音频作品中含有水印,同时也用来证明所有者对作品的所有权。需要注意的是,该应用要求水印具有较好的感知透明性、安全性和鲁棒性。(2)信息标识在该应用中,把数字作品的一些信息如标题、注释等容以水印的形式嵌入到数字作品中。水印用来提供更多有关数字作品容的信息,如一首歌曲的作曲者、演唱者等。这种隐式注释不需要增加额外的带宽、不影响原始作品容,且

47、不容易丢失。(3)数字指纹数字指纹通常被用于进行盗版跟踪,它可以有效地避免合法用户对数字产品进行非法的复制和传播甚至非法牟取暴利。作品的所有者将不同的水印嵌入到每个数字作品拷贝中,以此来防止不法分子非法复制和传播数字作品,这就是所谓的数字指纹。作品所有者发现没有经过授权的拷贝时,就可以借助检索指纹来追踪该拷贝的出处。(4)广播监控利用数字水印技术可以在广告、音乐作品等媒体中嵌入水印信息,而且嵌入的水印是不可感知的。在播放含有水印的多媒体数据时,监控设备会利用水印信息来自动监控这些媒体的相关信息如播放的时间、次数等。(5)认证和完整性校验如今以难以觉察的方式对数字作品进行篡改已经变得越来越容易。

48、虽然传统的数字签名技术也可以用来进行数字作品的认证,但验证时需要将原始签名和所验证的作品一同传送,一旦签名丢失,数字作品便无法进行认证。使用数字水印技术将签名嵌入作品中是一种比较好的解决方法。数字水印技术是通过检验提取出的水印的完整性来检验数字作品容的完整性的,先用嵌入水印时所设定的唯一的密钥把水印提取出来,然后再检验数字作品容的完整性。2.5常见的音频数字水印攻击数字水印技术是一种对抗性的研究领域,要实现对数字音频的容认证、保护等功能,就要使水印系统能够有效地抵抗常规信号处理操作和恶意攻击,也就是说要有一定的鲁棒性。音频数字水印的攻击有主动攻击和被动攻击,主动攻击主要是为了篡改或破坏水印,音

49、频文件遭受主动攻击后,即使合法用户也不能正确读取水印信息;被动攻击尝试破解数字水印算法,难度要大得多。在实际的应用中,破解数字水印算法比较困难,数字水印主要面临的是主动攻击。尽管常见的信号处理操作不是一种攻击,但它也会对水印信息造成一定程度的破坏。所以,一种有效的水印算法要能够有效地抵抗常见的信号处理操作。下面列举常见的攻击手段和信号处理方法:(1)滤波:滤波器增加或滤除选定部分的频谱,主要的攻击手段是低通滤波;(2)添加噪声:在嵌入水印的音频文件中加入白噪声或者有色噪声;(3)时域重采样:改变音频信号的采样频率,对信号进行下采样和上采样; (4)剪切:剪切掉含水印音频的一小部分,并不会影响音

50、频的质量,这对于要求同步性的水印来说是一个有效的攻击;(5)时域拉伸:延长或者缩短音频信号的持续时间。(6)压缩攻击:音频压缩主要是去除音频信号中的冗余信息,而这些冗余信息正好是有些水印算法嵌入水印的位置,因此也可以把音频压缩看作一种攻击手段。针对不同的应用场合,音频水印算法需要抵抗的信号处理或者恶意攻击的要求也不尽一样。2.6典型的音频数字水印算法经典的音频数字水印算法可以分为:时域音频水印算法、变换域音频水印算法和压缩域音频水印算法。时域音频数字水印算法把水印信息直接嵌入到原始音频信号的采样点幅值上,该类算法比较容易实现,而且快速,嵌入的信息量较大,但对常规数字信号处理的鲁棒性普遍较低;变

51、换域音频水印算法先对原始音频信号实施某种变换运算(如DCT变换、DFT变换、DWT变换等),然后根据人类听觉系统特性,通过修改某些变换系数的方式来嵌入水印信息。变换域算法的优点是:抵抗干扰和抗恶意攻击的能力较强,鲁棒性好。缺点是计算量太大;压缩域音频水印算法是直接把水印信号添加在经过压缩编码的音频信号中,输出的是含水印的压缩编码的音频信号,它能够有效地避免压缩算法编解码的复杂过程。2.6.1时域音频数字水印算法当前,时域音频数字水印算法比较少,最主要的是Basia,Pitas提出的最不重要位(LSB)算法,W.Bender提出的回声隐藏算法。(1)最不重要位(LSB)算法LSB(Least S

52、ignificant Bit,最不重要位)28算法是由Bender W等人在1996年提出的,是一种最简单的水印算法。任何形式的秘密数据(水印)都可以看作是一串二进制位流,而音频文件的每一个采样值也是用二进制数来表示的。该方法是用代表秘密数据的二进制位来替换音频信号的采样值的最不重要位(一般为最低位),以达到在音频信号中嵌入秘密数据的目的,提取水印时只要把相应的最低位取出来,就能恢复出嵌入的秘密信息。该方法是一种盲水印算法,在提取水印的过程中不需要原始音频信号的参与。这种方法的优点是:秘密数据嵌入和提取算法简单,速度快;音频信号里可编码的数据量大。缺点是:对某些信号处理技术比较敏感,也就是说对

53、一些信号处理的鲁棒性较差,若在嵌入水印的过程中没有采取冗余技术,含水印音频就不能抵抗有损压缩、重采样、滤波等信号处理操作。在实际应用中,LSB方法只能用于一些鲁棒性较低的场合。(2)基于回声的音频水印算法回声隐藏(Echo Hiding)算法最早由Gruhl等人29于1996年提出,它是通过在时域中引入回声的方式把秘密数据嵌入到载体数据中,也是一种经典的音频数字水印算法。在该算法中,编码器先把载体数据延迟一定的时间,然后叠加到原始的载体数据上来产生回声。编码器一般用两个不同的延迟时间来嵌入“0”和“1”。回声隐藏算法的感知透明性较好,具有一定的鲁棒性,但第三方可以用检测回声的方法把水印检测出来

54、。2.6.2变换域音频数字水印算法(1)扩频水印一般情况下,为了有效地降低能量和保持有效的带宽,在实施通信的信道中,都需要把信息聚集在很窄的频谱围。还有,为了更方便地对信息流进行编码1,基本的频谱扩展技术一般会把编码数据分散到比较多的频谱中去。常用的扩频通信方法有直接序列扩频编码(Direct Sequence Spread Spectrum Encoding,DSSS),该方法类似于在音频中加上宽带噪声,首先把秘密数据藏在信号的相位上,然后对伪随机序列和载波作乘法运算,最后把衰减后的信号加到音频序列上。(2)相位水印算法Bender W等人在1996年提出了相位水印算法28,它利用人耳听觉系

55、统对绝对相位不敏感,而对相对相位敏感的特性,用代表水印信息的参考相位来替换原始音频段的绝对相位,然后调整其它的音频段,这样就可以使各音频段之间的相对相位保持不变。相位水印算法的一个不足是:如果水印信息的参考相位发生剧烈变化,那么就会有明显的相位差异(Phase Dispersion)出现,这不但会增加接受方译码的难度,还会影响水印信息的感知透明性。(3)离散傅里叶变换域(DFT)算法Tilki和Beex提出了一种离散傅里叶变换域音频水印算法30,该方法先对音频信号实施离散傅里叶变换,然后选择中频段变换系数(2.46.4KHz)来嵌入水印信息,用表示水印序列的频谱分量替换相应的离散傅里叶系数。采

56、用该方法嵌入水印,如果嵌入到音频信号中的水印信息不是很大,并且水印信息的幅度比当前的音频信号小,此时该方法对噪声、磁带的颤动与录音失真都具有一定的鲁棒性。在文献31中,Tilki和Beex利用短时傅里叶变换,通过修改相位来嵌入一个隐藏的附加信道。(4)离散余弦变换域(DCT)算法Wang Ye 32在1998年提出了一种基于修正离散余弦变换的音频数字水印算法,该方法先在时域对音频信号进行序列变换,根据伪随机序列重新排列音频的采样信号,然后在频域添加水印,对排列好的序列进行修正离散余弦变换(Modified Discrete Cosine Transform,MDCT),以改变MDCT的系数的方

57、式来嵌入水印,最后实施修正离散余弦变换逆变换就可以得到含水印的音频序列。文献33中,王秋生等提出了一种离散余弦变换的音频水印算法。该方法在嵌入水印前,先要把音频信号划分成段,每段的长度是相等的,然后对每段音频信号实施离散余弦变换,最后通过修改离散余弦变换的中频系数来嵌入水印信息。(5)离散小波变换域(DWT)算法小波变换具有良好的时频局部特性,利用小波变换在音频信号中嵌入水印,可以获得较好的鲁棒性,含水印音频信号能够在一定程度上抵抗攻击。钮心忻等34在2000年提出了一种基于小波变换的数字水印算法,该方法嵌入的不是一般的水印信号,而是把高斯白噪声作为水印信号嵌入到音频信号的小波变换域中。该方法

58、先利用小波变换对原始音频信号实施小波分解(级小波分解),对于前级的粗糙分量不作任何处理,然后通过处理第级的精细分量来嵌入水印。Nishimur等35提出了一种基于离散小波变换的自同步音频水印算法,该方法以序列作为同步信号,将水印信息和序列一块隐藏到离散小波变换域的低频子带中。2.6.3压缩域音频数字水印算法目前,压缩域音频水印算法嵌入水印的方式主要有三类:(1)嵌入水印前,先对音频信号进行预处理,即把音频文件解压缩,在音频信号的压缩域中嵌入水印信息,最后再把已经嵌入水印的音频容进行重新压缩,得到压缩格式的含水印的音频文件。(2)在压缩域直接对压缩格式的音频文件嵌入水印信息,该方法不需要对音频文

59、件进行解编码,所以嵌入速度比较快。任何解压缩/再压缩的处理都可以很容易地破坏或者去除水印,鲁棒性不是很好。(3)在音频文件的编码过程中实现水印的嵌入,这样也不需要再压缩就能够直接得到含有水印的压缩格式的音频文件,但提取水印时需要对音频文件进行解压缩。Siebenhaar等36提出了一种压缩域水印系统方案,该方案输入的是没有经过压缩的音频信号,输出的是已经嵌入水印的音频的比特流。这一方案可以同时实现音频压缩和水印嵌入,而且也可以实现水印参数和压缩参数的较好的匹配,计算复杂度较低。英国剑桥大学计算机实验室安全组的研究人员提出了MP3Stego37技术,该技术主要针对MP3压缩音频。该方法是在音频的

60、压缩过程中把水印信息嵌入到MP3音频文件中,鲁棒性不是很好,而且实施起来也比较耗时。2.7音频数字水印的评价标准数字音频水印的主要性能指标包括38:感知透明性、安全性、嵌入量和鲁棒性。它们通常是相互牵制,互为矛盾的。一般来说,水印嵌入量越多,鲁棒性越好,但同时水印的感知透明性就越差。如果要同时保持很好的鲁棒性和感知透明性,就要适当减少嵌入量了。所以在设计水印算法时,要对这三者综合考虑,在它们之间寻求一个恰当的平衡。2.7.1感知透明性评价方法音频数字水印的感知透明性是指嵌入水印后的音频信号与原始音频信号在听觉感知上几乎没有明显的差别,一般有主观评价和客观评价。1主观评价可以说主观评价标准是最可

61、靠也是最有效的评价标准,因为嵌入水印后的音频信号的最终接收者是人,人的主观感受对于评价算法的性能有一定的参考价值。常用的主观评价方法有ABX测试方法39和五级平均意见打分40。(1)五级平均意见打分五级平均意见打分(Mean Opinion Scores,MOS)是一种绝对等级的打分方法,一般用它来评价被编解码器处理后音频信号的质量。通常采用五级评分标准,测试者对所听到的音频从表2-1所示的五个等级中选择其中一个作为他对音频质量的评价,计算所有测试者的平均分,将平均分作为最后的评价结果。测试者人数要求足够多,所测试的音频也要求足够丰富。表2-1列出了MOS评分方法的标准。表2-1 MOS评分标

62、准Table 2-1 Grading standard of MOS得分质量级别(MOS)失真级别(DMOS)5优(excellent)无察觉4良(good)刚有察觉3中(fair)有察觉,稍微令人讨厌2差(poor)明显觉察,令人讨厌,但可忍受1劣(bad)不可忍受(2)ABX测试方法ABX测试用来测试编码器和解码器分别在编码和解码过程中引进来的噪声对于测试者来说是否是不可感知的,也就是用来测试音频编解码能不能提供“透明的”质量。ABX测试方法的测试过程具体如下:A代表原始音频信号,B代表嵌入水印后的音频信号,X代表从A、B中随意抽取的音频信号。(1)让测试者听取音频信号A和B;(2)让测试者听取音频信号X,X是音频信号A、B中的任意一个。(3)让测试者判断所听到的X是A还是B。针对不同的测试者和不同的音乐进行多次测试,并且记录ABX测试的测试结果,当最后的判断结果的正确率非常接近50%时,就说明被测试算法的感知透明性较好,人耳很难觉察到音频信号A和B的区别。2客观评价主观测试方法的测试结果受测试环境、测试者听力情况等影响,不具有可重复性。解决该问题的方法之一是采用客观评价方法。通常,用信噪比来客观评价嵌入水印后原始音频信号受影响的程度。信噪比(Signal Noise Ratio,SNR)表示原始音频信号和

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!