基于视频的目标跟踪及人群密度估计方法研究说明书
基于视频的目标跟踪及人群密度估计方法研究说明书,基于,视频,目标,跟踪,人群,密度,估计,估量,方法,法子,研究,钻研,说明书,仿单
开题报告登记表学号姓 名导 师学科学院(系、所)电学位论文题目 稳健对地目标跟踪方法研究研究课题来源国家自然科学基金、航天创新基金、中航613横向项目课题的意义以及研究的主要内容 运动目标跟踪是视觉图像处理中的一个非常热门的话题,在多个领域有着广泛的应用。运动目标跟踪的应用领域和环境主要有:对大型公共场所进行智能化视频监控、基于视频的人机交互、交通流量监测、医疗诊断等。本文从计算机视觉角度研究对地目标跟踪方法。由于视觉跟踪系统能在比较复杂的背景下,提取与分离市场内的目标、确定目标位置、估计目标运动趋势、实现对目标的实时跟踪,且具有跟踪精度高、跟踪状态平稳、抗干扰能力强、分辨率高和成本低等特点,在军事上很受重视。在民用领域,对地目标跟踪也有着广泛的应用:对大型公共场所进行智能化视频监控。例如在机场、商场、地铁站等场所进行智能化监控,其主要目的都是为了 保障公众财产和信息安全。在人群监测、交通管理上实现智能化有非比寻常的意义。以以上应用为背景,本文的对地目标跟踪技术包含以下几个主要技术模块:单目标跟踪技术、多目标跟踪技术、密集目标跟踪技术。分出这几个模块是为了应对不同的应用场景,或是在同一场景需要各模块的协同合作。例如地铁站的人群流量具有明显时段特征,早晚上下班高峰人流极大,而其他时段人流量明显减少,这就需要对不同时段采用不同的跟踪方法以达到最好的效果。在上下班高峰期,采用密集目标跟踪技术,而在其他时段,采用多目标跟踪技术,而在有特殊需要的时候,例如跟踪特定犯罪嫌疑人时,可采用单目标跟踪技术。本文研究的主要内容具体有:粒子滤波基本方法研究,这是单目标跟踪方法的框架。在图像跟踪应用中,目标状态的后验概率分布往往是非线性非高斯多模态的,粒子滤波方法对于系统模型没有特殊要求,且能够保持状态的多模态分布,在跟踪领域得到了很大的发展。但常规粒子滤波跟踪算法存在计算量大、采样效率低等问题。粒子群最优化思想研究,改进常规粒子滤波采样效率低的问题,提高采样效率。针对常规粒子滤波跟踪算法存在计算量大、采样效率低等问题,引入粒子群优化思想对目标状态后验分布进行最优搜索,找到后验分布的高似然区,并依据此高似然区来进行重采样。变结构多模型的设计,以更好的表征目标的运动模型。几乎所有的方法对目标的运动状态都假定为平滑的,或者将运动限制在恒速或恒加速运动状态。而实际情况并非如此,例如机动目标的运动状态就很难用单一模型来表征。本文引入变结构多模型方法为目标建立变结构多运动模型。变结构多模型方法能够很好的表征目标的运动模型却又不增加过多的计算量,因此相比单一运动模型能够更好的估计目标的运动。 将先验信息模型引入目标跟踪系统,以得到更精确的跟踪效果。包括在某些场景下,先验信息是可知的,这些信息可用来指导粒子先验分布以获得更精确的后验分布,而地理位置信息模型则是最常用也是最易获取的信息。地理位置模型包含了跟踪场景里道路分布、建筑分布等信息,对目标的运动起到很好的约束作用,能够提高目标跟踪的精确度。结合在线学习与粒子滤波,以稳健的跟踪目标。针对粒子滤波跟踪丢失目标后难恢复的问题,提出一种基于粒子滤波结合在线学习的稳健跟踪方法,使用粒子滤波有效的跟踪结果作为正训练样本不断更新样本库,以跟踪被遮挡和消失后再出现的目标。 JPDA方法及MHT方法研究,以解决多目标之间可能产生的“错标识”问题。多目标跟踪的主要问题在于处理多目标联合状态估计,又由于多数多目标跟踪情况均是非线性非高斯的多维的状态估计问题,在这种情况下,数据关联算法至关重要。所谓数据关联就是将未标记的目标观测与对应目标的状态进行关联。比较成熟的数据关联算法有JPDA方法及MHT方法。然而两者的计算复杂度过大,特别是在视觉跟踪本身的大数据量情况下难以实际应用。本文拟通过挖掘多目标间约束模型来简化JPDA或MHT的计算以使其能够实际应用。 密集目标的运动估计。在一幅幅复杂的密集目标图像中,如果依靠每个目标的个体信息来估计总体的运动,则必须要分离出每个个体的运动,然而这在密度大的情况下是不现实的,特别是当个体之间相互遮挡时这就变得更加困难。本文拟从总体运动趋势入手,不借助于单独个体的信息,而是通过统计视频中宏块的运动矢量来进行总体运动估计。 对本文提出的单目标跟踪算法、多目标算法、密集目标跟踪算法分别从跟踪准确性、跟踪成功率等各方面对各算法的有效性、稳健性进行评估。课题的工作方案以实际应用为背景,为解决对地目标的跟踪监控问题,本文的工作方案为:1、 研究单目标跟踪算法,以满足特殊情况下需要,例如跟踪特定嫌疑人等。本文拟在粒子滤波框架下,用粒子群优 化思想提高采样效率,用变结构多模型来对目标复杂的运动建模,结合在线学习来克服粒子滤波跟踪丢失目标后难恢复的问题。2、 研究多目标跟踪算法,在目标密度较小的情况下进行多目标跟踪。本文拟在MHT框架下研究出能够实际应用于视觉跟踪系统的简易多目标跟踪方法。3、 研究密集型目标群跟踪算法,在目标密度较大情况下进行密集型目标群跟踪。抛弃借助单独个体的运动信息来进行总体运动估计的方法,通过统计视频中宏块的运动矢量进行总体运动估计。4、 实现对地目标跟踪软件系统。注:内容填不下时可自行加页。课题 准研 备究 如有 何无 解困 决难1、 单目标的跟踪方法近年来各种跟踪方法层出不穷,主流算法主要有粒子滤波方法、mean-shift方法、tracking-by-detection等方法。但几乎所有的方法对目标的运动状态都假定为平滑的,或者将运动限制在恒速或恒加速运动状态。而实际情况并非如此,例如机动目标的运动状态就很难用单一模型来表征。本文引入变结构多模型方法,结合粒子滤波方法进行视觉目标跟踪。变结构多模型方法能够很好的表征目标的运动模型,因此相比单一运动模型能够更好的估计目标的运动。2、 多目标的跟踪方法主要在于解决目标发生重叠时的标识问题。常用并比较成熟的方法有JPDA算法和MHT算法。由于JPDA算法的复杂度与目标个数的阶乘成正比,为了降低计算量许多文献讨论了次优JPDA快速算法。而理论的MHT算法同样存在计算复杂度过高难以实际应用的问题,不少文献同样讨论了简约MHT算法。本文拟挖掘多目标之间的运动关联性约束以提高JPDA或MHT算法的效率。计划进度 2014.42014.5 单目标跟踪算法研究及软件实现 2014.62014.7 多目标跟踪算法研究及软件实现 2014.82014.10 密集目标跟踪算法研究及软件实现 2014.112015.1 整体软件整合及论文撰写导师意见签名:年 月 日学科审批意见开题报告时间:参 加 人 数 : 教 师 人, 研究生 人。审 查 结 果 : 同 意 不 同 意签名:年 月 日备注 3 基于视频的目标跟踪及人群密度估计方法研究摘 要近几十年随着人口的急剧增长,加上经济的快速增长使得都市化现象日益严重,在给人民生活带来便利的同时也带来了安全隐患。随着社会安全事件接连不断地发生,人们对安全的需求越来越大。随着图像处理技术的飞速发展,智能视频监控技术作为一种安防的有效手段,正越来越受到人们的重视。基于图像的目标跟踪、人群密度估计等技术是智能视频监控系统的基础问题,是更高层次的行为分析技术与行为识别技术的基础。本文针对基于图像的目标跟踪技术、人群密度估计技术进行了比较深入的研究,对前人的工作做了系统性总结,并针对一些不足做了相应改进。所做具体工作如下:1) 分析了粒子滤波跟踪算法在目标后验概率分布呈多模态时重要性重采样的无力以及过分依赖单一运动模型这两个不足,分别提出了自适应重采样算法和变结构多运动模型算法来改进粒子滤波算法,提高粒子滤波算法的准确性与稳定性。2) 针对日常应用背景的多目标跟踪问题,引入了经典的JPDA算法,指出了其量测缺乏图像信息的不足,提出了基于量测扩展思想的改进JPDA多目标算法,它是一种通用方法,可根据不同场景选择合适图像信息进行扩展。本文选取了颜色信息扩展到量测中,使其在计算关联概率矩阵时充分考虑了颜色信息,提高了关联概率的准确度,有效实现了多目标跟踪。3) 在人群密度估计方面,分析了像素统计特征与纹理特征两大经典算法各自的优缺点,并阐述了两大算法在各种密度场景下的互补性,提出了融合像素统计特征与纹理特征进行人群密度估计的算法。4) 针对每个议题,都收集了相关领域的权威测试视频库,并进行了详尽的仿真实验与实验结果分析。关键词:智能视频监控、目标跟踪、人群密度估计、粒子滤波算法RESEARCH ON VIDEO-BASED OBJECT TRACKING AND CROWD DENSITY ESTIMATIONAbstract请键入文字或网站地址,或者上传文档。Jn j sh nin suzhe rnku de jj zngzhng, ji shng jngj de kuis zngzhng shd dsh hu xinxing ry ynzhng, zi j rnmn shnghu di li binl de tngsh y di lile nqun ynhun.With the rapid population growth and economic growth in recent decades, while urbanization bring convenience to peoples life but also bring security problems. While social security incidents occur more and more frequently, the demand for security monitoring is growing. Benefit to the rapid development of image processing technology, intelligent video surveillance technology, as an effective approach, has attracted more and more attention. Video-based object tracking and crowd density estimation are the fundamental technology of behavior analysis, recognition and intelligent video surveillance system. This paper systematically summarized on previous related works, and made a research on video-based object tracking and crowd density estimation technology. The details are as follows:1). This paper first points out two disadvantages of particle filtering algorithm: first, the traditional importance resampling cant handle the situation when the object posterior probability density is multi-model; second, most algorithm assume that the object motion is smooth, however, the assumption is unrealistic. This paper proposed adaptive resampling scheme and introduced variable structure multiple model estimation method to solve these problems. 2). For multi-object tracking application, we point out some disadvantages of applying JPDA algorithm into multi-object tracking:the observation just contains position information and its not suitable without applying image information in video-based tracking. To solve this problem, this paper extended the observation information by introducing image features, which improved the accuracy of the association probability matrix, and also the tracking results.3). For crowd density estimation problem, this paper first analysis advantages and disadvantages of pixel-based method and texture analysis method. After elaborated their complementary in various density level situation, this paper proposed feature fusion method, which combined pixel-based and texture feature and designed corresponding fusion strategy, to estimate crowd density more robustly. 4). For every every topic mentioned above, various authoritative video library in related fields were collected. Plentiful simulations were made and follows detailed analysis and comparison.Key Words: Intelligent video surveillance, Multi-object tracking, Crowd density estimation, Particle filter algorithm目 录第一章 绪论11.1 研究背景11.2 研究现状21.2.1 视频目标跟踪技术21.2.2 人群密度估计41.3 现有研究的不足61.3 本论文主要工作71.4 本论文结构安排7第二章 粒子滤波跟踪算法102.1 引言102.2 目标跟踪算法回顾112.2.1 表观模型112.2.2 图像特征122.2.3 跟踪算法132.3 粒子滤波算法原理152.3.1 问题定义152.3.2 序列重要性采样(SIS)算法162.3.3 序列重要性重采样(SIR)192.3.4 算法框架212.4 粒子滤波目标跟踪算法222.4.1 运动模型222.4.2 表观模型222.4.3 跟踪算法232.5 小结24第三章 基于粒子滤波的单目标跟踪算法研究253.1 引言253.1.1 常用重采样机制的不足253.1.2 常用运动模型的不足263.2 自适应重采样算法263.2.1 粒子群优化算法263.2.2 粒子群优化重采样303.2.3 自适应重采样算法313.3 变结构多模型运动估计323.3.1 LMS基本原理333.3.2 LMS-PF跟踪算法353.3.3 模式集设计353.4 实验结果与分析373.4.1 实验素材373.4.2 评价指标373.4.2 自适应重采样粒子滤波跟踪算法383.4.3 变结构多运动模型粒子滤波跟踪算法403.4.4 AR-LMS-PF433.5 小结44第四章 基于量测扩展的JPDA多目标跟踪方法研究454.1 引言454.2问题定义474.3 研究现状的不足484.4 多目标跟踪算法架构484.5 JPDA算法描述494.5.1生成确认矩阵494.5.2 计算所有可行联合事件及其参数504.5.3 计算时刻所有量测的联合事件的条件概率504.5.4 计算量测与目标的关联概率504.5.5 利用卡尔曼滤波器得到目标状态估计及协方差阵514.6 基于量测扩展的JPDA多目标跟踪算法514.7 实验结果与分析524.7.1 实验素材524.7.2 评价指标534.7.3 结果分析544.8 小结59第五章 基于特征融合的人群密度估计研究605.1引言605.2 问题定义625.3 研究现状的不足625.4 基于特征融合的人群密度估计635.4.1 系统框架635.4.2 运动分割645.4.3 透视校正655.4.4 特征抽取665.4.5 手动标注685.4.6 回归模型695.5 实验结果与分析705.5.1 实验素材705.5.2 评价指标705.5.3 结果分析715.5.4 整合应用775.6 小结78第六章 总结与展望796.1 论文总结796.2 研究展望80参考文献81致 谢90攻读硕士学位期间已发表或录用的论文91109第一章 绪论1.1 研究背景近年来,随着智能化设备的快速发展,人们的生活与工作方式越发趋于智能化。计算机视觉技术作为智能化中重要的组成部分,发展也十分迅猛。计算机视觉技术的目标是让机器能够像人一样“读懂”图像,理解图像。计算机视觉技术随着其高速发展,现如今已经深入渗透到了各个领域,如制造业、检验、文档分析、医疗诊断和军事等领域中。随着当今社会人们夜生活越来越丰富,安全需求也越来越大。智能视频监控技术作为一种安防的有效手段,正越来越受到人们的重视,例如智能监控系统现在已经是各公共场所安全防范措施标准配置,对于预防恶性事件或犯罪事后调查都具有重要意义 1。相较于传统的靠人工判读视频内容的视频监控系统而言,正在迅速崛起的智能视频监控系统能够自动的对场景内运动对象进行提取、跟踪、识别和行为分析等方面的内容,既能减少人力成本,又能提高监控质量。智能视频监控是一门多交叉学科,多涉及人工智能及模式识别等新兴学科,是一个具有挑战性的综合性问题,而目标跟踪与人群密度估计就是其中极其重要的组成部分,它是更高层次的行为分析技术与行为识别技术的基础,具有重要的研究价值。视频目标跟踪技术除了应用在智能监控系统中,还广泛应用于民用和军事等许多领域中2。在军事领域,由于战场环境远比普通民用环境更加复杂与苛刻,对视频监视系统的要求比民用领域更高。在恶劣的战场环境下要对目标进行实时稳定可靠的跟踪是目标跟踪系统在军事上的一个重要应用。如成立于1997年的VSAM视频监控项目,主要研究自动视频理解技术。VSAM融合多种传感器,具有先进的视频分析处理技术及网络传输系统,用三维建模技术提供图形操作界面,可应用在战场等危险情况场合的监控。视频跟踪相关技术还有许多其他的民用应用领域,例如视觉人机接口的设计,涉及到对人的行为的识别,例如手势与表情等3。在运动分析领域,可应用于对运动员或运动团体的跟踪与分析,如田径中各运动员的运动姿势与速度分析,羽毛球及网球比赛中对球运动轨迹及落点的判断,足球篮球比赛中根据团队中队员的跟踪结果进行战术分析与预测等。多目标跟踪技术作为视频目标跟踪的一个重要分支具有非常广泛的应用,包括交通流量控制、车辆异常行为检测等。交通监控对于预防交通事故及事后处理具有很大价值,著名的基于VIPS的交通监控系统4能够对道路的流量及车型等具体信息进行监控和统计,除此之外还能发现简单的异常行为,比如闯红绿灯、转向错误、超速行驶等。另一方面,随着全球经济的持续复苏,人们生活水平明显提升,城市化进程不断加速,特别是在像中国、印度、巴西等发展中国家尤为明显。城市化的加速,不仅仅只是城市人口在总人口中的比例加大,同时也伴随着一系列由于人口密集而产生的矛盾。尤其是我国近年来经济高速发展加速了城市化的进程,城市人口的密集,城市的交通、生活、娱乐等公共设施经常会迎来短期的人流高峰,人群高度拥挤如果不能及时有效的得到合理的疏散容易造成重大的安全隐患。因此,在智能监控系统中如何有效的对突发人群的密度进行监控和预警,是一个很有研究价值的课题5。近年来因人群密度过高而造成的群体性伤亡事件屡见不鲜,得到了国内外研究学者的广泛关注。此外,人群密度估计和目标跟踪技术的结合可使得在跟踪人群获得运动信息的同时能获得人数信息,这对于防范密集人群聚集、规划人群流向具有重要的指导意义。1.2 研究现状1.2.1 视频目标跟踪技术视频目标跟踪作为智能视频监控系统中的基础核心技术,是为上层其他高级处理如行为分析、行为识别等技术服务的,是智能监控系统能够实时应用的关键。由于从三维世界到二维图像的投影本身存在大量信息的丢失,加上目标外观复杂的形变及繁复的运动模式,以及受到复杂背景及如天气变化等环境变化的强烈影响,图像摄取本身的图像噪声等因素印象,视频目标跟踪技术一直是一个极具挑战性问题。完整的视频目标跟踪系统包含了从目标检测、表观模型、运动模型、图像特征到定位算法等几个主要部分,各国学者从以上所述各个方面展开研究,近十年得出丰富成果。Comaniciu将Mean Shift算法应用到目标跟踪领域具有里程碑式意义6,成为了目标跟踪领域内经典算法之一。紧接着,许多研究学者提出了许多改进,例如Collins通过引入归一化因子来感知目标尺度变化7,但是由于需要费时的搜索导致计算量过大;Xianwu提出用非匀质mean shift算法来同时跟踪位置、尺度以及运动方向8;另一方面,Parameswaran从特征角度,通过结合空间信息扩展了目标直方图9。粒子滤波方法是另一经典算法,它不仅能够有效地解决视觉目标跟踪中普遍存在目标状态非线性、噪声分布非高斯性的问题,而且能够同时跟踪视觉目标多种状态变化,还对视觉平台运动状态不作要求,既适用于静止视觉平台,又适用于移动视觉平台,使其成为视觉目标跟踪算法的一个较优选择,在视觉目标跟踪研究与应用领域均受到广泛关注。围绕粒子滤波算法的研究主要集中在建议分布的选取以及重采样机制的设计两方面。例如辅助粒子滤波APF以序列重要性采样算法为基础10,但结合了当前的观测数据选择了不同的重要性密度函数,使得重要性函数更加接近真实的状态。正则粒子滤波11在重采样过程中,使用核函数代替SIR中离散粒子的加权和,使得重采样过程可以对连续函数进行采样而避免了重要性重采样中从离散粒子集中采样所带来的粒子贫化问题。近几年来,通过在线学习算法来进行跟踪的算法取得了极大进展,随着机器学习算法的深入研究,将学习算法与图像处理相结合来进行目标识别,对于某些特定目标(如人脸)已经有了很高的识别率。在许多传统经典算法中,对目标表观模型的在线学习是作为跟踪框架的重要组成部分,是用来处理目标表观变化的。传统的基于模板匹配的跟踪算法由于其固定模板而不能自适应目标模型变化,导致跟踪精度受限。基于在线学习的动态模板可以更好的处理目标的姿势及光照方面的变化。Zhou将基于EM算法的自适应表观模型嵌入粒子滤波器12,达到了更好的跟踪鲁棒性。其中一种在线学习算法是所谓的“tracking by detection”,即基于检测的跟踪。与经典跟踪算法不同的是,基于目标检测的跟踪算法充分利用了目标与背景的信息,训练出一个二分分类器将目标与背景区分开,并实时在线的更新目标表观与背景环境变化。Babenko提出多示例学习算法13,数据以含有多个示例的标记包形式呈现。多示例学习开辟了一种新的机器学习框架,和以往的学习框架不同的是,一个样本包不止一个示例,样本包和示例是一对多的对应关系。其中示例可以理解为每个训练样本的特征向量,而样本包表示其包含的这些示例所属的级别。多示例学习能处理类别样本含有大量噪声而又难以去除的分类问题,具有广泛的应用前景。对于长时间跟踪而言,Kalal提出了tracking-learning-detection 跟踪框架14。长时间跟踪的难点在于,目标消失后又再次出现时如何捕获,并继续跟踪。另一难点在于,长时跟踪意味着目标会出现不同程度的形变、尺度变化、还有环境的变化、与周围目标进行交互时引起的遮挡等不确定性情形。鉴于长时跟踪的复杂性,单纯跟踪算法或者单纯检测算法均难以达到可靠稳定的跟踪效果,TLD方法基于在线学习机制,将跟踪与检测两者能够有效结合,形成闭环体系,有效提高了长时跟踪的精准度。除MIL和TLD外还有许多优秀的在线学习算法应用于目标跟踪领域,如在线随机森林算法15等。从上述目标跟踪算法的发展可以看出,鲁棒的图像特征、完善的在线学习体系是当前研究热点,这也意味着视频目标跟踪急需解决的问题依然是应对复杂环境变化、目标形变及运动突变等情况3。1.2.2 人群密度估计1990 年之前,人群密度估计主要依靠人工估计,安保人员围在模拟监控显示设备前观察特定区域的监控画面,并及时判断人群密度情况。这种方法一直沿用了很多年,具有设备简单的优点,但存在精度差、主观性强、实时性差等缺点。要实现全天二十四小时实时监控,就必须有人一直守在显示设备前,并确保不间断的全神贯注盯着监控画面,其必将耗费巨大的人力资源,易出现纰漏,容易漏报。近二十年来,计算机视觉和数字图像处理技术的快速发展,使得这一问题得到了逐步的解决,模拟监控设备已被数字设备取代,应用最新的智能视频图像处理理论将实现人群密度的估计,以实现二十四小时全天候自动预警。由于计算机视觉技术越来越介入人们的日常生活,给人们带来了便利,基于视频图像的人群密度估计作为计算机视觉的一个重要方向,正处于快速发展阶段。人群密度估计目前主要有两种方向:密度估计与人数统计。密度估计主要针对视频中人群整体,从一个宏观角度提取相关特征参数进行研究,也称为宏观分析;而人数统计的目的是从个体角度得到精确的人数统计,也称微观分析。人群行为研究得到的有力结论是人群密度估计研究的起点。1985 年,人群密度与人群行为的关系第一次被提出16:人群密度与引发群体事件的风险呈正相关关系,论文中表示当人群密度超过1.25m2/人时,人群将会有引发群体事件的风险。这个理论给出了人群事故和人群密度间的关系,也为这之后人群密度估计研究提供了方向。1990 年在基于图像的人群密度估计研究领域出了很多优秀成果,其中具有代表性的有Davies提出的基于像素统计的人群特征提取方法17,而Marana提出了基于纹理特征提取的分析方法18。这两种方法后来成为人群密度估计研究中两大经典方法。不过上述两种方法还停留在特征水平上,也就是分析何种特征适用于人群密度估计。现在还缺少一个在特征获取环节与最终估计结果之间的数学模型,该数学模型代表着输入的特征与输出的结果之间的关系。最简单的模型是线性模型,例如认为前景图像像素数与人数呈线性关系,即可通过简单的计算前景图像在整个图像中所占的像素比来估计人群的密度。在人数较少的场景下,此方法简单易行,不过很明显的是,前景像素个数与人数呈线性关系在人群密度较高遮挡较为严重的情况下是不成立的。一个大的飞跃是使用神经网络模型分析人群密度的提出19,结果显示此方法对人群密度估计的准确率有很大的提高,并且该方法已于 2000 年在香港地铁系统中得到了应用。近年来随着机器学习算法的风靡,各种学习算法被应用到人群密度估计领域中,其中的佼佼者如训练支持向量机(SVM)回归模型或者高斯过程回归模型、或者ELM学习算法20来进行人群密度估计,均以其优良的性能得到了广泛的认可。2001年,Lin提出利用个人特征来检测行人21,进而实现人群人数的统计。此方法属于对象级分析方法,试图在复杂场景下定位个体,相对于上述回归分析方法可以提供更精确的结果(能定位到具体目标)。虽然在低密度情境下识别个体不是很难的事,在高密度情境下,严重的遮挡使得基于个体的识别统计并不理想。2008年,Shobit等提出了一种可以对特定人群情景中的事件进行建模的算法22,其为基于 KLT 跟踪的多特征点检测与跟踪的算法。为了实现快速建模,他们又进一步提出了扩展场景识别引擎(SRE)的方法,同时也增加了人群事件检测的可靠性。Chan 等人23把视频看成是不同纹理抽样的结果,并借鉴高斯模型思想,用混合高斯模型的动态纹理系统取代传统纹理分析方法。此方法可以实现对场景的粗略分类,比较适合于室外条件下大场景的粗略估计。苏航等24系统全面的分析了近年来国内外文献中有关复杂场景下视频监控中的密度估计算法,并剖析了各算法的实现及优缺点,以及未来的研究发展方向。2012年,Srivastava通过大量的实验进一步验证了特定区域内的前景像素数与通过该区域的人群人数有关25,提出了利用图像纹理特征来描述特定场景拥挤程度的比例因子,通过比例因子的大小来判断场景是否存在危险。此方法要求场景环境稳定(如光照不变)。相比国外学者,我国对于基于视频图像的人群密度估计的研究相对滞后。但是随着公共场所监控、交通场景监控等对人群密度估计需求的加大,国内高校不断在加大基于视频的人群密度估计研究的力度。北京航天航空大学很早就建立了模式识别与人工智能研究室;上海交大的图像处理与模式识别研究所近年来申请了许多有关智能视频监控研究方面的国家自然科学基金项目;电子科技大学先知视听觉实验室开发的智能视频监控系统具备遗物提醒、行人流量统计、人群密度估计、单人和多人异常行为检测等功能;上述国内高校的研究小组和实验室的视频监控研究中均涉及到了基于视频图像的人群密度估计研究,人群密度估计研究是其它人群行为研究的基础。1.3 现有研究的不足当前视觉目标跟踪算法中,粒子滤波算法能够有效处理目标状态非线性、噪声分布非高斯的问题,相比较传统确定性跟踪方法具有一定优势;且粒子滤波本身的开放性决定了它可以吸收最新的在线学习算法,来获得更加鲁棒的跟踪效果。因此粒子滤波跟踪算法一直以来都是目标跟踪领域的研究热点。粒子滤波算法的研究重点主要有两个:一是重要性采样函数的选取,二是重采样机制的设计。一种机制很难适应所有情况,一般都需要根据具体情境来选取合适的重要性采样函数及设计重采样机制。目标遮挡与分离是目标跟踪中的常见问题,也是难点问题。传统的重要性重采样机制并不适合目标出现遮挡的情形,在目标出现遮挡或干扰时会出现跟踪漂移;另一方面,良好的目标运动模型是实现目标持续跟踪的前提,然而目标的运动模型设计在粒子滤波跟踪算法中一直不受重视,是粒子滤波跟踪算法现有研究的另一大不足。在多目标跟踪方面,经典数据关联算法JPDA在雷达目标跟踪中获得极大成功,它能有效处理杂波环境下的数据关联问题。然而在视频目标跟踪领域,由于将量测限制在位置信息上,基于视频的JPDA多目标跟踪算法“有名无实”,它并没有充分利用图像中的信息。针对这个问题,本文提出将颜色信息融入量测中,使得量测同时包含位置与图像信息,使得在计算关联概率矩阵时充分考虑了颜色信息,因此提高了关联概率的准确度,从而提高了跟踪效果。人群密度估计算法在国内起步较晚,研究力度也不如视频目标跟踪。人群密度估计当前主要的研究重点在于图像特征的选取。正如同对于不同类型的目标,需要选用不同的图像特征来表征,针对不同密度级别下的人群估计,也需要选择相适宜的图像特征。现今研究的不足在于过于割裂不同特征的关系,没有看到特征之间的相关性与互补性,就如同过于看重全局估计方法与局部估计方法的差异却忽略了它们之间的共性。单一性特征对于复杂多变的场景很难做到长期稳定,特征融合研究对于人群密度估计具有重大意义。1.3 本论文主要工作本文针对粒子滤波算法中存在的上述问题展开研究,一是针对重要性重采样机制对于后验概率分布呈多模态时的处理无力,提出了结合粒子群优化思想的自适应重采样机制来处理后验概率分布多模态问题;二是将变结构多运动模型代替常用的单一化运动模型,来提高先验模型的精确度与适用范围,从而改善跟踪性能。针对JPDA多目标跟踪算法中量测信息匮乏问题,本文将目标的颜色信息融入到目标量测中,从而丰富了目标的量测信息,使得图像信息在计算量测和目标的关联概率时作出了贡献,从而提高了关联概率的准确度,能有效缓解因目标遮挡引起的量测准确性下降问题。改进后的JPDA算法能大幅度提高跟踪效果。在人群密度估计方面,现今的主流主要是基于像素统计与纹理分析等特征的回归分析方法。像素统计通过计算人群的总像素数来估计人群人数,简单直接易于实现,在低密度人群中可以获得较好的效果。而纹理分析有较好的通用性与容忍性,然而当背景复杂并且人群密度不高而呈现粗糙的纹理时,估计的误差会较大。因此,本文基于特征融合思想,结合像素统计与纹理分析特征以实现优势互补进行人群密度估计,相较于单一特征,在密度估计的精度和稳定性上都有较大提高。1.4 本论文结构安排本论文研究的是基于视频图像的目标跟踪技术与人群密度估计技术,各个研究部分之间相互联系形成统一整体,本文的研究部分及其之间的架构关系如图1-1所示。论文主要分为三个研究部分:单目标跟踪算法、多目标跟踪算法、人群密度估计算法。它们都是智能监控系统中的关键基础技术,各算法可单独使用,亦可配合使用。例如日常生活中,人们通常结伴而行,在人群密度较大的场合下,目标检测的精度下降会导致目标跟踪失误率高,然而恰恰在这种情况下更加需要知道移动人群的密度大小,以预防高密度人群的聚集导致的安全事故。本文将人群密度估计和目标跟踪互相结合互为补充,两者的结合可以在人群跟踪过程中获得人群运动信息的同时获得人数信息,这对预防人群聚集、规划人群流向等安全防范措施具有重要意义。图1-1 全文组织结构全文分为六章,每一章的主要内容如下:第1章 绪论。重点描述了本课题的研究背景及意义,调研了国内外的研究现状,同时对本论文的研究内容与实现方案也做了全面的阐述。第2章 粒子滤波跟踪算法介绍。本章回顾了近年来主流的目标跟踪算法,分析了各算法的长处与不足,确立了以粒子滤波跟踪方法作为本文的研究重点,并详细介绍了粒子滤波算法的基本原理以及其在视频跟踪中的应用。第3章 基于粒子滤波单目标跟踪算法。本章重点针对了传统粒子滤波跟踪算法对于目标概率密度呈相近多峰情况下的重采样导致跟踪失败的问题,以及依赖先验运动模型的特点,提出了相应的改进方案,并给出了相应的仿真结果与结果分析。第4章 改进JPDA的多目标跟踪算法。本章回顾了主流的多目标跟踪算法,分析了JPDA多目标跟踪算法的不足,提出了融合颜色信息的量测扩展方式,提高了关联概率准确性,改善了跟踪结果。其中详细阐述了该跟踪算法的框架与执行流程,最后给出了相应的仿真结果与结果分析。第5章 人群密度估计。本章回顾了主流的人群密度估计算法,并分析了像素统计特征与纹理相关特征各自的不足,重点提出了特征结合互补的思想,将像素统计特征与纹理相关特征进行有机结合用于人群密度估计,并详细阐述了人群密度估计算法的原理与框架,最后给出了相应的仿真结果与结果分析。第6章 总结与展望。本章对本论文的研究内容进行了总结, 提出了论文的创新点,并指出了论文研究的不足点,最后对此课题研究未来的方向进行了展望。第二章 粒子滤波跟踪算法2.1 引言视频目标跟踪是计算机视觉中经久不衰的研究方向,也是许多视觉应用中必须用到的关键技术。视频目标跟踪的根本目的是要从视频中提取出运动目标的轨迹、形状、位置、速度等参数,以满足其他高级分析的需求。一般来说,视频目标跟踪技术包含了目标检测、分类、跟踪等模块,一个良好的视频跟踪系统需要各模块的密切配合。由于从三维世界到二维图像的投影本身存在大量信息的丢失,加上目标外观复杂的形变及繁复的运动模式,以及受到复杂背景及如天气变化等环境变化的强烈影响,图像摄取本身的图像噪声等因素影响,使得视频目标跟踪依然是一个极具挑战性问题。本文研究场景均为静止单摄像机,该情境也是当前最为广泛使用的标准配置。在该场景下,背景是静止的或者只有微小的扰动。视频目标跟踪常见的应用领域有2:基于运动的识别:基于步态的身份识别、运动目标检测等、智能监控、视频检索、人机交互:手势识别、眼动跟踪等、交通监控、汽车导航等。虽然现今已经有许多成功的应用,视频目标跟踪到现今依然是个挑战性难题,主要是因为以下几个原因:a) 从3D世界向2D平面图像投影所造成的信息损失;b) 图像噪声:图像成像受许多因素影响,且图像成像与这些因素之间关系往往非常复杂,呈强非线性。这些因素有与周围环境相关的,如光源的角度及距离;有与摄像系统相关的,如摄像机角度及距离等;c) 复杂运动模型:现实生活中的运动目标一般不会呈单一模型特征,也就说具有一定程度的机动性。然而常用的跟踪算法一般是在目标可能出现的区域内进行搜索,所以当目标机动过强,会造成跟踪目标丢失;d) 遮挡:遮挡是目标跟踪面临的大难点之一,主要是遮挡会引起目标图像信息的丢失,且这种信息丢失呈非线性,所以容易引起跟踪失效;e) 尺度伸缩及形变:目标运动引起的尺度伸缩、目标形变会使目标在图像中的表达产生非线性变化,合理处理尺度变化和形状变化一直是视频目标跟踪研究的重点;f) 场景光照变化:目标的图像成像受目标与光源的相对位置、光源本身的强弱等因素影响,然而室外天气变幻莫测,因此在很多实际系统中对光照变化必须具有一定鲁棒性;g) 实时处理要求;下一小节将要对目标跟踪领域有代表性的算法进行回顾与分析,并分析经典算法是如何处理上述难点的,为后面的研究内容打下基础。2.2 目标跟踪算法回顾目标跟踪问题可以简单的定位为:对一个目标在一个场景内的运动轨迹的估计。放在视频目标跟踪领域,一个目标跟踪器需要在不同视频帧中对目标给出一致的标记,且另外需提供目标信息,如运动方向、所在区域、目标形状等。在目标跟踪算法中,目标建模策略和目标定位策略是不可能回避的问题,也是主要研究的问题。目标建模策略是指该使用哪种目标表观模型以及该使用哪种图像特征的问题,而目标定位策略是指如何推理目标位置等信息的过程。下面根据目标建模所用的视觉特征和目标定位所用的方法对跟踪算法的研究现状进行简要介绍。2.2.1 表观模型目标跟踪的难点之一就是,要跟踪的目标种类繁多不一而足,如大海上的船、水族馆的鱼、道路上的车、天空中的飞机、路上的行人等等,都是在某一特定情境下的跟踪目标。对于不同的目标与应用场景,该如何进行外观表示是个很关键的问题。下面介绍几种常见用于目标跟踪的形状模型:a) 点:即用目标中心点或者点集来表示目标26。通常点表观模型用来表示在图像中区域较小的目标。b) 原始几何形状:可以用矩形、椭圆6、来表示目标。针对该表观模型的运动模型,通常被建模为仿射变换或者投影变换等。尽管原始几何模型更适合表示简单的刚体目标,它们也经常用来表示非刚体目标。c) 剪影与轮廓:轮廓表观模型定义了目标的边缘。轮廓内区域即称为目标的剪影。剪影与轮廓模型适合用来跟踪复杂非刚体目标2。d) 关节模型:关节型目标由多个部分经关节点衔接组成。例如,人体就是一个关节型目标,各部分为躯干、手、脚、头等。e) 骨架模型:目标骨架可通过对目标剪影进行中轴变换得到,该模型经常被用来识别物体,且骨架模型可以对关节目标及刚体目标建模。形状表示可以结合外观表示来更好地跟踪目标,一些常用的外观表示有:a) 目标外观的概率密度:目标外观的概率密度估计可以是高斯或者是混合高斯形式,或者是非参数模型,或者是直方图形式6。目标外观特征(颜色,纹理)的概率密度可通过目标区域内(椭圆或者轮廓)内的信息计算得到。b) 模板:模板由简单的集合形状或剪影推导得出。模板的优点就是结合了空间信息与表观信息。然而模板只能反映目标在某一角度的外观,因此目标模板只适合跟踪那些姿势变化不大的目标。c) 主动外观模型:主动外观模型同时对目标形状和外观建模。d) 多视角外观模型:这些模型从不同视角对目标建模。要用这么多不同视角来表示目标,需要从给定的视角空间中中选取一个子空间以减少干扰。常见子空间方法有主成分分析(PCA)、独立成分分析(ICA)等都已经成功应用到目标的外观表示中。实际上,目标表观模型与跟踪算法的联系非常紧密,目标表观模型的选择通常与应用领域密切相关。跟踪小面积目标,点表观模型比较合适,而对于目标形状近似于矩形或者椭圆形状时,原始几何模型则更适合。对于有复杂形状的目标,例如人类,则轮廓或者剪影表观模型更合适。2.2.2 图像特征同样,在视频跟踪中选择正确的图像特征也是重中之重。具有良好分辨性的图像特征是分辨和分割真实目标与环境背景的关键,是实现长期稳定跟踪的前提。针对不同场景,选择合适的图像特征异常重要。另一方面,特征选取与目标表观的关系是非常密切的,对于视频跟踪也是缺一不可的,如颜色作为常用特征结合直方图表示形式就是目标跟踪算法最常使用的颜色直方图表观模型。在实际应用中,现在许多跟踪算法更倾向于多种特征的结合来弥补单一特征的不足。下面列举几个常用的图像特征:a) 颜色:颜色特征作为一种全局特征,对于目标的旋转、部分遮挡以及形变等具有一定的鲁棒性,在非刚体目标跟踪中表现优异,且因颜色特征提取简单,易于理解和实现,被广泛应用于视频目标跟踪中。目标的颜色受两个物理因素影响:一是光源的光谱功率分布,二是目标表面反射特性。在图像处理领域,RGB模型是颜色的常用模型,然而RGB有两个不足:一是RGB模型并不十分符合人类的感知,二是RGB的三个维度之间有很高的相关性。相比之下,L*u*v和L*a*b模型都是感知上的均匀颜色空间,而HSV颜色空间是近似均匀颜色空间。然而它们的缺点也很明显:对噪声很敏感。总之,各个颜色空间各有所长,因此在视频跟踪领域,各种颜色空间都有所使用。b) 边缘:在图像像素水平上,在目标边界处像素强度值通常会发生巨变,而边缘检测则是用来检测像素巨变区域的。相比颜色特征,边缘特征的一个重要特性就是对光照改变不那么敏感。利用目标边界进行跟踪的算法通常会采用边缘特征。最常用的边缘检测算法是Canny算子27。J.Deutscher选取边缘作为目标的图像特征28,实现了可靠跟踪。由于光照不敏感性,边缘和光照敏感型的颜色特征天生互补,因此边缘与颜色的融合策略研究曾是红极一时。c) 光流:光流是一种简单实用的图像运动的表达方式。它能够提取图像序列中图像亮度的变化模式,将这个模式反推回到目标成像之前,就表现为实物空间中目标的运动模式。光流研究的是图像中的像素强度随时间的变化及相关性,并依据像素强度变化模式和实物空间物体运动之间的关系来研究实物空间中物体的运动。光流法需要对每个像素进行多次计算,计算量较大是其主要缺点,另外对光照及噪声较为敏感等因素都限制了光流法的广泛推广。Denman改进了光流法并实现目标跟踪实例29,使得运算时间及准确性都得到较大提高。d) 纹理:纹理是人类视觉系统对自然界物体表面现象的一种感知,是人类描述和区分不同物体的重要特征之一。在图像处理领域,纹理是作为一种物体表面强度变化的量化属性,如平滑性和规律性的衡量指标,对光照变化并不敏感。常用的纹理描述子有灰度共生矩阵(GLCM)和小波等。e) 局部特征描述子:相比全局特征来说局部特征有其独特优点,即对光照、尺度、旋转的不变性。HOG和SIFT特征是局部特征的代表。局部特征着眼于局部区域进行特征抽取,经过组合形成相应描述子,用于图像匹配或跟踪等。C.Wen-Yan利用SIFT特征点实现区域匹配进行目标跟踪30,Huiyu Zhou结合SIFT特征和mean shift直方图特征实现了稳健目标跟踪31。大多数特征选择都是根据应用情景具体分析得出的。近些年来,特征的融合策略及自动选择在模式识别领域越来越受重视。特征融合与自动选择有简单易实现的特点,能切切实实的提高跟踪性能,是视频跟踪领域特征选取的趋势32。2.2.3 跟踪算法目标定位策略是根据目标的历史信息,结合当前观测推断出目标在当前图像中的位置、形状等参数。一方面,目标表观模型的选取与跟踪算法的关系是极其密切的,表观模型会影响到算法对目标运动和形变的处理;另一方面,从目标定位策略角度来说,最简单的思路莫过于在场景中根据特征匹配算法进行全局搜索,寻找最优位置点,然而其计算量之大难以满足实时处理要求,且需要处理大量不相关信息。因此,如何合理缩小目标的搜索范围是极其关键的一步,这里大体来说有两个研究方向:一是预测目标下一帧可能出现的位置,然后在可能区域搜索最优点,即为概率跟踪方法; 另一类是通过优化搜索方向来减小搜索范围,如通过梯度优化算法找到最优搜索方向以实现快速目标定位。1) 概率跟踪方法中常用的有有卡尔曼滤波(KF)跟踪方法及粒子滤波(PF)跟踪方法,因其各自优缺点可适用于不同的应用场景。在系统模型呈线性,系统噪声和观测噪声服从高斯分布时,KF是最优的Bayesian滤波器,能给出最优解33;而在视频监控领域,目标的运动模型往往呈非线性,标准KF并不适合使用。将标准KF做适当修正得到的EKF34和UKF35可以给出非线性状态滤波的次优解,因此在视频监控领域EKF和UKF有一定的应用;对于系统模型为非线性且噪声模型为非高斯,目标状态呈多模态的复杂情形,对目标状态的后验概率分布采用基于蒙特卡罗思想的采样方法来进行状态估计,取得了很好的结果36。粒子滤波算法是其中的典型代表,它是基于贝叶斯滤波理论框架,并采用蒙特卡罗采样思想的滤波算法,它用递推的方式对量测数据进行处理,省去了对历史量测的再处理,节省了大量的计算量和存储空间。粒子滤波算法在视频目标跟踪领域的鲁棒性已经得到广泛的认可37。2) 确定性跟踪方法的跟踪过程是模板匹配的过程,它根据事先设定的相似性函数来度量目标模板和当前帧候选目标之间的相似度,通过最优化思想计算相似度的最大值,并认为使相似度取最大值的候选目标位置即为目标在当前帧的真实位置38。确定性跟踪方法思路清晰,简单明了,然而其不足之处正在于目标模板与候选目标之间的匹配过程。如果目标在跟踪过程中发生形变而模板并未更新,长此以往必然跟踪失败。目标表观模型的在线更新策略是近些年来的研究热点,主要目标是研究如何实时的将目标表观变化合理反映到目标模板中,使之能处理因目标的形变与遮挡等因素造成的信息缺失与畸变。以TLD为代表的基于在线学习的跟踪方法在目标表观模型上也都融合了表观在线更新的思想。综上所述,相比确定性跟踪方法,概率跟踪方法将不确定性和不同的可能状态相联系,这与现实世界对未来事件只能进行概率预测有异曲同工之妙。也正因此,概率跟踪方法更适用于贴近现实生活的视频监控系统应用。粒子滤波方法是概率跟踪方法中的主流算法,对非线性系统具有很强的鲁棒性,在视频跟踪领域获得了巨大的成功。本文后续章节均以研究粒子滤波算法为主,下一节将讲述粒子滤波算法基本原理,为后续章节打下基础。2.3 粒子滤波算法原理2.3.1 问题定义为了对目标跟踪这个问题进行定义39,考虑目标的状态序列 x,k:xk=fk(xk-1,vk-1) (2-1)其中,fk:RnxRnvRnz是关于状态xk-1以及过程噪声vk-1的线性或非线性函数,vk-1,k是过程噪声序列,nx,nv分别是状态向量和过程噪声向量的维数,是自然数集。“跟踪”就是要根据观测值来递归估计状态量xk,其中观测值zk:zk=hk(xk,k) (2-2)其中hk:RnxRnRnz是关于状态xk以及观测噪声k的线性或非线性函数,k,k是观测噪声序列,nx,n分别是观测向量和观测噪声向量的维数。我们基于过去所有观测量z1:k=zi,i=1,2,3,k来寻求k时刻的状态估计值xk。从贝叶斯推理角度来看,跟踪问题需要根据给出的历史观测值z1:k=zi,i=1,2,3,k,来递归计算状态量xk取不同值时的可信度。因此就需要构建后验概率函数p(xk|z1:k)。假定状态量的初始后验概率函数p(x0|z0)等于p(x0),也就是所谓的“先验”信息是可得的。然后,原则上后验概率函数p(xk|z1:k)可通过两个步骤递归得到:预测与更新。假设k-1时刻的后验概率函数p(xk-1|z1:k-1)是已知的。预测阶段需要应用公式(2-1)描述的系统模型,通过Chapman-Kolmogorov方程来获得k时刻状态量的先验分布:pxk-1z1:k-1=pxkxk-1pxk-1z1:k-1dxk-1 (2-3)公式(2-3)中,假设系统状态符合一阶马尔科夫过程,则pxkxk-1,z1:k-1=p(xk|xk-1)得以成立。状态传播概率模型p(xk|xk-1)定义在系统模型中。在k时刻,可获得观测值zk,并可以用来更新先验概率分布,这就是更新阶段:pxkz1:k=pzkxkp(xk|z1:k-1)p(zk|z1:k-1) (2-4)pzkz1:k-1=pzkxkp(xk|z1:k-1)dxk (2-5)其中归一化参数p(zk|z1:k-1)依赖相似度函数p(zk|xk),而相似度函数定义于公式(2-2)描述的观测模型中。在(2-4)描述的更新过程中,观测值zk用来修正先验概率密度来获得当前状态量的后验概率密度分布。(2-3)和(2-4)的循环迭代形成了最优贝叶斯推理的基本形式。这种后验概率密度的递归传播是理论上的最优,但实际上很多情况下得不到解析解28。在许多限制情况下可以得到最优解,如卡尔曼滤波器和网格滤波器。卡尔曼滤波器的基础假定是每一时刻的后验概率密度都是高斯形式的。然而在许多情况下,上述假定并不成立,卡尔曼及基于网格的方法并不能用来估计该情况下的状态量。2.3.2 序列重要性采样(SIS)算法序列重要性采样(SIS)算法是一种蒙特卡罗(MC)方法,也是大多数MC滤波器的基础。序列蒙特卡罗(SMC)方法有多种形式,如bootstrap滤波器,condensation滤波器,粒子滤波器等等。它利用MC方法用来实现递推贝叶斯滤波器,其基本思想是利用带权重的后验概率分布随机采样得到的粒子集来表示后验概率密度分布。当采样的粒子数很大时,粒子集表示的后验概率分布就能逼近真实的后验概率分布,而序列重要性采样方法(SIS)能达到最优贝叶斯估计。下面对该算法的具体细节进行推导。令x0:ki,wkii=1Ns表示后验概率分布p(x0:k|z1:k)的随机采样集,其中x0:ki,i=0,1,2,Ns是采样点集而wki,i=0,1,2,Ns是相应粒子的权重集,x0:k=xj,j=0,1,2,k表示到k时刻的历史状态集。权重经过归一化得以满足wki=1,然后k时刻后验概率分布可估计为:p(x0:k|z1:k)j=1Nswki(x0:k-x0:kj)(2-6)于是我们有了对于真实后验概率分布的一个离散加权估计p(x0:k|z1:k)。(2-6)中权重的计算则需要根据重要性采样来定。假设p(x)是一个难以取样的概率密度分布,但是(x)可以更容易取样,且p(x)(x),另外,令xiqx,i=1,2,3,Ns,作为从一个被称作为“重要性函数”的建议分布qx中采样得到的样本。则对概率密度p()的加权估计为:p(x)i=1Nswi(x-xi)(2-7)wi(xi)q(xi)(2-8)其中wi是第i个粒子经过归一化后的权重。因此,如果样本x0:ki是从一个重要性密度函数qx0:k|z1:k中采样得到的,那么(2-8)中权重成为:wip(x0:ki|z1:k)q(x0:ki|z1:k)(2-9)上述的重要性采样方法由于估计 px0:k|z1:k需要用到所有历史观测z1:k,每来一个新的观测又需要重新计算整个状态序列的重要性权重,计算量随着时间推移不断增加,很难随着时间进行递推估计。为解决这个问题,学者们提出了序列重要性采样方法(SIS)。如果说重要性密度分布可因式分解为:qx0:k|z1:k=qxkx0:k-1,z1:kq(x0:k-1|z1:k-1) (2-10)那么就可以从已有粒子集 x0:k-1iqx0:k-1|z1:k-1,结合新的状态x0:kiqxk|x0:k-1,z1:k,就可以得到新的粒子集x0:kiqx0:k|z1:k。首先,后验概率分布 px0:k|z1:k可根据px0:k-1|z1:k-1、pzk|xk以及 pxk|xk-1表示为:px0:k|z1:kpzk|xk pxk|xk-1px0:k-1|z1:k-1 (2-11)将(2-10)、(2-11)代入(2-9)中,权重更新方程成为:(2-12)进一步,如果qxk|x0:k-1,z1:k=qxkxk-1,zk,那么重要性密度函数就只依赖于xk-1和zk。
收藏