GB7401-87
《GB7401-87》由会员分享,可在线阅读,更多相关《GB7401-87(15页珍藏版)》请在装配图网上搜索。
1中华人民共和国国家标准GB 740187彩色电视图象质量主观评价方法Mehod of subjective assessment of quality of colour TV pictures本标准作为对现行的彩色电视图象质量进行主观评价方法的依据,也可作为对其他新电视制式彩色图象质量进行主观评价时评价方法的参考。1 测试图片1.1 图片张数使用五张到七张静止图片,并可使用有活动内容的一些连续片段。一般使用静止图片,因图片内容活动而引起图象上产生附加损伤时,可使用有活动内容的连续片段。1.2 图片内容图片景物内容,所含彩色画面结构,应选择得对不同的客观失真具有一定的敏感程度。具体要包括以下一些方面:a.常见色,例如肤色、无蓝色,草绿色和红旗色等。b.不同的平均亮度、反差,不同的细节丰富程度,以及不同的画面构图。例如室内、室外、远景、中景、近景、人物、景色、多细节、中等细节、少细节,以及背景复杂、背景简单等。c.多种色调和较多的饱和度层次。1.3 图片类型测试图片应是较高质量的彩色幻灯片或彩色照片。2 观看条件2.1 合适的观看条件与电视系统的场频有关,50Hz 场频系统的观看室条件如下表:注: H 是荧光屏图象高度。对电视接收机评价彩色图象质量时采用 6H。如果比值大于 0.1,衬托光色温必须接近 D6500白。如果不与条件“c”相抵触,其精确值不严格。不很严格,A 白和 D6500白之间的任何白都可以。2.2 观看员观看员可以是专业人员,也可以是非专业人员。通常,应由非专业人员作观看员。观看员应有正常的视力和彩色视觉。序 号 项 目 要 求abcdefg观看距离荧光屏最高亮度(坎德拉每平方米,cd/m 2,尼特,nit)荧光屏不发光(电子束截止)亮度与峰值亮度之比监视器背后衬托光亮度与图象峰值亮度之比观看室内其他照明光照度衬托光色温和其他照明光色温初托光发亮面积对观看者所张立体角与图象面积对观看者所张立体角之比4 H 6 H 60100.2约 0.1低 白 92观看员至少 7 人,最好 20 人,甚至更多。在观看员性别与年龄结构等方面,要全面考虑。在数据处理结果中,应说明观看员类型、人数和观看距离等。3 测试程序3.1 测试装置调整和图片选用测试过程中要采用一套固定设备,包括摄象装置和显象装置等。要依照正确的方法调整测试设备,并在全部测试过程中保持设备特性始终一致。每一测试阶段中选用对特定失真较敏感的几张测试图片,给以若干种受评条件(一定量的单项失真或多项失真,例如杂波、回波、微分增益、微分相位、亮度色度增益差、亮度色度延时差和单频干扰等失真)。不加有任何失真的图象称为参考图象,它也应作为一种受评条件。3.2 对观看员的安排每个测试阶段开始时,先向入座的观看员介绍测试方法、评价制和评分等级,语气应无偏向性,避免作出会影响分数评定的暗示。然后,给出几幅受损程度不同的受评图象示例,但不得与具体的主观评分等级相联系。也不必包罗受评失真量的高、低限范围。正 式 开 始 评 价 时 , 观 看 员 应 按 评 分 等 级 的 说 明 对 正 式 显 示 的 各 受 评 图 象 在 印 制 的 记 分 卡 上 独 立 地进 行 评 分 。测试过程中,应避免观看员的视觉和听觉受环境干扰,分散注意力。为了免使观看员疲劳而影响评价结果的准确性,一个测试阶段(包括事先介绍、图象示例和正式评价)的总时间不应超过 30 分钟。在两个测试阶段之间,同一批观看员至少要有半天的休息时间。3.3 图象显示程序受评条件不同的图象,显示次序的安排是随机的;同一图片内容不能以不同的失真量连续显示。每个测试阶段中,同一图片的同一受评条件需给出两次显示,以便对观看员评分结果的一致性进行检查。附 录 A 中 列 出 了 在 随 机 杂 波 单 项 干 扰 造 成 图 象 损 伤 的 一 个 主 观 测 试 阶 段 中 , 受 评 图 象 显 示 次 序的 一 种 安 排 例 子 。一个测试阶段包括若干次显示,每次显示包含四段时期。设 四 段 时 期 的 持 续 时 间 为T1、 T2、 T3、 T4,它们分别是:T158s 显示参考图象;T235s 中灰画面间隔期;T3812s 某一受评条件的图象(包括参考图象);T410s 中灰画面,观看员评分期。每 次 显 示 的 小 计 时 间 为 26 35 秒 , 每 个 测 试 阶 段 中 正 式 评 价 的 实 际 时 间 约 为 20 分 钟 , 可 显示 次 数 为 34 46 次 。在许多场合下,例如对实际已存在各种失真的彩色电视系统、传输环节或特定设备给出的图象质量进行主观评价测试时,可以只采用 T3 和 T4 两段时期。观看员不获得参考图象的先期印象,直接按评分等级的说明对受评图象进行评分。对 4H 6 H 范围内不同观看距离上的观看员的评分,可分别地或综合地进行数据统计处理。数据处理方法可参考附录 B。3.4 评价分数的取舍一个测试阶段中,某观看员对同一受评条件的同一图片给出相差两级或两级以上的评分时,删去此种评分。某观看员给出的有效评分次数低于其总评分次数的 85%时,取消其全部部分。一个测试阶段中,全体观看员给出的累加有效评分次数总和低于应有总评分次数的 85%时,取消该测试阶段的全部评分。34 评分等级评分等级采用五级质量制或五级损伤制。特定情况下,根据需要也可采用七级比较制。4.1 五级质量制质量制是从图象质量主观感觉的综合优劣程度出发,对受评图象进行评分。质量制五级评分的分级如下:5 分(优):图象质量极佳,十分满意。4 分(良):图象质量好,比较满意。3 分(中):图象质量一般,尚可接受。2 分(差):图象质量差,勉强能看。1 分(劣):图象质量低劣,无法观看。4.2 五级损伤制损伤制是根据图象质量受损程度的主观感觉,对受评图象进行评分。损伤制五级评分的分级如下:5 分:图象上不觉察有损伤或干扰存在。4 分:图象上有稍可觉察的损伤或干扰,但并不令人讨厌。3 分:图象上有明显觉察的损伤或干扰,令人感到讨厌。2 分:图象上损伤或干扰较严重,令人相当讨厌。1 分:图象上损伤或干扰极严重,不能观看。4.3 七级比较制比较制是将受评图象与一个基准图象同时显示,由观看员的主观判断作出比较性评分。比较制七级评分的分级如下:+3 分:比基准图象质量好得多。+2 分:比基准图象质量显得较好。+1 分:比基准图象质量稍好点。0 分:与基准图象质量相同。-1 分:比基准图象质量稍差点。-2 分:比基准图象质量显得较差。-3 分:比基准图象质量差得多。附录 A 一个测试阶段中受评图象显示安排示例(参考件)A.1 一个测试阶段中的显示次数每个测试阶段中,受评图象的总显示次数可如下地计算。假设以节 Np 表示选定的测试图片张数,以 Nt 表示每张图片的受评条件数,则 30 分种的一个测试阶段中,可显示的受评图象总次数 N 应符合下式:N(35)+2 Np(1+Nt)3446式中:后项括号内的“1”表示参考图象要作为受评条件之一,前项括号内的 35 表示正式评价中的前几次显示,它们作为观看员适应于评分的过渡次数,不列为可用评分。4如果某评价过程中实际所需的 Np和 Nt值确定后,由此计算出的受评图象应显示次数 N0值大于一个测试阶段中可给出的显示次数 N,则应将某些图片及其若干受评条件的显示分散到其他的测试阶段中。A.2 一个测试阶段中的显示安排示例此处举一个例子,说明一种显示安排。假设已选定测试图片张数, Np3。于是,根据 A.1 的公式可知, Nt45。现取 Nt4,并选定适应次数为 5,这时 N35。若进行的主观测试是评价随机杂波对图象质量的影响,采用的三张图片标记为 I1、 I2、 I3 四个受评条件为信杂比等于 40、30、25、20dB,参考图象的信杂比优于 50dB。这时,受评图象的一种显示次序可安排如下表。显示序号 显示图片 受评条件(S/N,dB) 显示序号 显示图片 受评条件(S/N,dB)1 I1 30 11 I3 202 I3 参考 12 I1 403 I2 20 13 I2 204 I3 40 14 I3 405 I2 25 15 I2 参考6 I1 30 16 I1 207 I2 25 17 I3 258 I3 参考 18 I2 309 I2 40 19 I1 参考10 I1 25 20 I3 30续表 1显示序号 显示图片 受评条件(S/N,dB) 显示序号 显示图片 受评条件(S/N,dB)21 I2 25 29 I1 4022 I3 参考 30 I3 2523 I1 30 31 I2 参考24 I3 20 32 I1 2025 I2 40 33 I2 3026 I1 25 34 I3 4027 I2 20 35 I1 参考28 I3 30 36附录 B 电视图象质量主观评价试验的数据处理(参考件)B.1 一般原则数 据 处 理 的 目 的 , 在 于 找 到 测 试 图 片 电 视 信 号 客 观 失 真 量 与 观 看 员 对 图 象 质 量 主 观 评 分 平 均 值 之间 的 函 数 关 系 。 对 于 给 定 的 图 片 和 一 定 的 失 真 量 , 不 同 观 看 员 会 给 出 不 同 的 评 分 值 , 但 在 多 次 重 复 的试 验 下 总 的 评 分 分 布 基 本 上 为 某 种 形 态 , 即 大 量 人 次 的 评 分 结 果 具 有 一 定 的 概 率 分 布 规 律 , 可 求 得 给5定 图 片 在 一 定 失 真 量 条 件 下 观 看 员 对 图 象 的 平 均 评 分 值 , 从 而 可 以 找 到 测 试 图 片 电 视 信 号 客 观 失 真 量与 观 看 员 对 图 象 主 观 评 分 平 均 值 之 间 的 函 数 关 系 。在进行数据处理时,要运用数理统计的一系列方法,包括理论概率分布类型的选择、置信度的确定、逻辑函数类型的选取,以及正交设计、方差分析、回归分析等,借以建立能反映客观失真量与主观评分平均值之间关系的最佳拟合逻辑函数,并应通过标准离差和相关系等的计算检验逻辑函数的精度。B.2 数据处理的几种方法B.2.1 二项分布模型数据处理方法采用五级评分制进行数据处理时,为了计算方便,选取如下所示的归一化分等分数值:等 级 5 4 3 2 1归一化分数 1 0.75 0.5 0.25 0评分百分比 P5 P4 P3 P2 P1这样,对某图片在给定失真量 的受评条件下,所得的评分平均值 P 平 为:P 平 P5 +0.75P4+0.5P3+0.25P2按数理统计规律,观看员大量实际评分结果的直方图形状一般近似于二项分布或正态分布模型。当选取二项分布模型时,其一般形式为:( P+q)mn-1式 中 , P 是 评 分 出 现 的 概 率 , q 1-P, n 是 所 取 分 级 系 统 的 级 数 。 在 五 级 评 分 制 条 件 下 , 取n 5; 因 此 , 这 时 的 二 项 分 布 模 型 为 :( P+q)5m-1式中,m 是阶数。一般地说,参加评分的观看员的类型不同,适用的二项分布模型的阶数也就不同;评分越集中,取的阶数应越高。实践中,m 可取为 1,2,4,6,。将 (P+q)5m-1 展 开 式 中 的 各 项 按 P 的 幂 次 高 低 排 列 , 就 项 数 等 分 成 五 个 相 继 的 组 , 依 次 取 作P5、 P4、 P3、 P2、 P1 。根据实验数据计算得到的大量数据点(, P 平 ),在 - P 平 直角坐标系中可近似地描绘成一条斜对称S 型曲线。按照逻辑函数类型的选取,可找到其最佳拟合逻辑函数的形式为:P 平 sxMe1式中,参数 M 是评分的中间值所对应的失真量,参数 S 是 P 平 0.731 时失真量 与 M 之间的差,它反映了人们对一定值失真量发生微量改变时主观评分变化的敏感程度。由大量的数据点(, P 平 ),可利用最小二乘法确定出参数 M 和 S 。为了说明经上述数据处理后所得结果的置信度,还需要进行拟合精度的估计。对分布模型按 95%的置信度,分别求出 P5、 P4、 P3、 P2、 P1 的置信限。对于逻辑函数,经过标准离差的计算给出在 95%置信度下- P 平 关系曲线的置信限,同时还要通过相关系数的计算来说明逻辑函数的拟合精度。B.2.2 正态分布模型数据处理方法当采用正态分布曲线来拟合观看员实际评分结果的直方图时,对于五级评分制,可设 P (1,2,3,4,5)为某一图片在给定失真量的受评条件下观看员评其为 i 级的百分比。观看员对某图片在一定失真量条件下的评分结果是一个离散随机变量,其评分平均值和均方差分别为:6评分平均值 ,51iP均方差: - 12i512)(i1可以用一条平均值为 、均方差为 的正态分布曲线来拟合观看员实际评分结果的直方图。这时,要使所确定的正态曲线满足下面的条件:由正态曲线量化后的评分直方图(即对每一个评分为 i 级的比例以正态曲线下的面积来表示)计算出的评分平均值和均方差,应与由原始评分数据得到的直方图计算出的评分平均值和均方差一样。由此,可确定出 和 。按上述方法从每次试验计算出的平均值中,选出一组 3(五级评分的中间值)时的方差 p值,再重新计算出平均值 R 即为所得到的评分平均值。然后,利用数理统计方法可确定反映失真量 与评分平均值之间关系的最佳拟合逻辑函数。B.2.3 数据处理的其他方法在数据处理过程中,也可以根据多种失真同时作用于测试图片所得到的评分结果,利用多元线性回归方式直接逼近法,找到同时存在的多种客观失真量与测试图片主观评价分数之间的关系式。此外,还可以采用其他的处理方法。B.2.4 特定条件下的数据处理方法在图象显示端,对实际的彩色电视传输环节和系统给出的彩色电视图象质量进行主观评价时,可根据对各幅图象的评分结果分别计算出评分平均值。因为各图象的总评分近似于正态分布,所以可用数理统计中由小样本估计总体平均值的方法确定在 95%置信度下评分平均值的变化区间。如果得到几个评分值,分别为 1, 2, 3, n(即样本单位数为 n),则样本的评分平均值为:x nix1令样本标准差 S 为:S= nix12)(设 为估计的总体评分平均值,并取新变量 t,t 的表示式为:t 1/nSx它服从 t 分布,于是有总体评分平均值的区间估计 txP(1ntx1nS式中,t 为 t 分布的临界值, 为显著性水平,1- 为置信度。在给定置信度下,可根据 n-1 值和 值从 t 分布表中查得临界值 t ,从而求得此时的总体评分平均值区间为:7 txtxnS,11nS反之,预先规定区间容差t 的值时,可由已知的 n 值、 值计算出对标准差 S 的要求。/据此,可判断实际评分的样本标准差 S 是否符合要求,从而认定该主观评价过程中评分结果的可靠程度。例 1. 设 n 20, 置 信 度 规 定 为 95%, 要 求 总 体 评 分 平 均 值 处 在 范 围 内 ,1.0,.x则 根 据 n 20, 0.05, 查 t 分 布 表 得 到 t 2.093, 由 此 可 计 算 出 样 本 标 准 差 S 应 满 足 :S 0.20例 2. 设 n 20, 置 信 度 规 定 为 95%, 要 求 总 体 评 分 平 均 值 处 在 范 围 内 ,2.0,.x则 样 本 标 准 差 S 应 满 足 :S 0.41例 3.设 n 30, 置 信 度 规 定 为 95%, 根 据 评 分 结 果 计 算 出 的 样 本 标 准 差 为 S 0.4, 则 由 n-1 值 、 值 查 t 分 布 表 得 到 t 2.045, 从 而 计 算 出 :xt .1nS15.034.即总体评分平均值落在 15.0,.x区间内的概率为 95%。8中华人民共和国国家标准GB 740187彩色电视图象质量主观评价方法Mehod of subjective assessment of quality of colour TV pictures本标准作为对现行的彩色电视图象质量进行主观评价方法的依据,也可作为对其他新电视制式彩色图象质量进行主观评价时评价方法的参考。1 测试图片1.1 图片张数使用五张到七张静止图片,并可使用有活动内容的一些连续片段。一般使用静止图片,因图片内容活动而引起图象上产生附加损伤时,可使用有活动内容的连续片段。1.2 图片内容图片景物内容,所含彩色画面结构,应选择得对不同的客观失真具有一定的敏感程度。具体要包括以下一些方面:a.常见色,例如肤色、无蓝色,草绿色和红旗色等。b.不同的平均亮度、反差,不同的细节丰富程度,以及不同的画面构图。例如室内、室外、远景、中景、近景、人物、景色、多细节、中等细节、少细节,以及背景复杂、背景简单等。c.多种色调和较多的饱和度层次。1.3 图片类型测试图片应是较高质量的彩色幻灯片或彩色照片。2 观看条件2.1 合适的观看条件与电视系统的场频有关,50Hz 场频系统的观看室条件如下表:注: H 是荧光屏图象高度。对电视接收机评价彩色图象质量时采用 6H。如果比值大于 0.1,衬托光色温必须接近 D6500白。如果不与条件“c”相抵触,其精确值不严格。序 号 项 目 要 求abcdefg观看距离荧光屏最高亮度(坎德拉每平方米,cd/m 2,尼特,nit)荧光屏不发光(电子束截止)亮度与峰值亮度之比监视器背后衬托光亮度与图象峰值亮度之比观看室内其他照明光照度衬托光色温和其他照明光色温初托光发亮面积对观看者所张立体角与图象面积对观看者所张立体角之比4 H 6 H 60100.2约 0.1低 白 99不很严格,A 白和 D6500白之间的任何白都可以。2.2 观看员观看员可以是专业人员,也可以是非专业人员。通常,应由非专业人员作观看员。观看员应有正常的视力和彩色视觉。观看员至少 7 人,最好 20 人,甚至更多。在观看员性别与年龄结构等方面,要全面考虑。在数据处理结果中,应说明观看员类型、人数和观看距离等。3 测试程序3.1 测试装置调整和图片选用测试过程中要采用一套固定设备,包括摄象装置和显象装置等。要依照正确的方法调整测试设备,并在全部测试过程中保持设备特性始终一致。每一测试阶段中选用对特定失真较敏感的几张测试图片,给以若干种受评条件(一定量的单项失真或多项失真,例如杂波、回波、微分增益、微分相位、亮度色度增益差、亮度色度延时差和单频干扰等失真)。不加有任何失真的图象称为参考图象,它也应作为一种受评条件。3.2 对观看员的安排每个测试阶段开始时,先向入座的观看员介绍测试方法、评价制和评分等级,语气应无偏向性,避免作出会影响分数评定的暗示。然后,给出几幅受损程度不同的受评图象示例,但不得与具体的主观评分等级相联系。也不必包罗受评失真量的高、低限范围。正 式 开 始 评 价 时 , 观 看 员 应 按 评 分 等 级 的 说 明 对 正 式 显 示 的 各 受 评 图 象 在 印 制 的 记 分 卡 上 独 立 地进 行 评 分 。测试过程中,应避免观看员的视觉和听觉受环境干扰,分散注意力。为了免使观看员疲劳而影响评价结果的准确性,一个测试阶段(包括事先介绍、图象示例和正式评价)的总时间不应超过 30 分钟。在两个测试阶段之间,同一批观看员至少要有半天的休息时间。3.3 图象显示程序受评条件不同的图象,显示次序的安排是随机的;同一图片内容不能以不同的失真量连续显示。每个测试阶段中,同一图片的同一受评条件需给出两次显示,以便对观看员评分结果的一致性进行检查。附 录 A 中 列 出 了 在 随 机 杂 波 单 项 干 扰 造 成 图 象 损 伤 的 一 个 主 观 测 试 阶 段 中 , 受 评 图 象 显 示 次 序的 一 种 安 排 例 子 。一个测试阶段包括若干次显示,每次显示包含四段时期。设 四 段 时 期 的 持 续 时 间 为T1、 T2、 T3、 T4,它们分别是:T158s 显示参考图象;T235s 中灰画面间隔期;T3812s 某一受评条件的图象(包括参考图象);T410s 中灰画面,观看员评分期。每 次 显 示 的 小 计 时 间 为 26 35 秒 , 每 个 测 试 阶 段 中 正 式 评 价 的 实 际 时 间 约 为 20 分 钟 , 可 显示 次 数 为 34 46 次 。在许多场合下,例如对实际已存在各种失真的彩色电视系统、传输环节或特定设备给出的图象质量进行主观评价测试时,可以只采用 T3 和 T4 两段时期。观看员不获得参考图象的先期印象,直接按评分等级的说明对受评图象进行评分。对 4H 6 H 范围内不同观看距离上的观看员的评分,可分别地或综合地进行数据统计处理。数据处理方法可参考附录 B。3.4 评价分数的取舍10一个测试阶段中,某观看员对同一受评条件的同一图片给出相差两级或两级以上的评分时,删去此种评分。某观看员给出的有效评分次数低于其总评分次数的 85%时,取消其全部部分。一个测试阶段中,全体观看员给出的累加有效评分次数总和低于应有总评分次数的 85%时,取消该测试阶段的全部评分。4 评分等级评分等级采用五级质量制或五级损伤制。特定情况下,根据需要也可采用七级比较制。4.1 五级质量制质量制是从图象质量主观感觉的综合优劣程度出发,对受评图象进行评分。质量制五级评分的分级如下:5 分(优):图象质量极佳,十分满意。4 分(良):图象质量好,比较满意。3 分(中):图象质量一般,尚可接受。2 分(差):图象质量差,勉强能看。1 分(劣):图象质量低劣,无法观看。4.2 五级损伤制损伤制是根据图象质量受损程度的主观感觉,对受评图象进行评分。损伤制五级评分的分级如下:5 分:图象上不觉察有损伤或干扰存在。4 分:图象上有稍可觉察的损伤或干扰,但并不令人讨厌。3 分:图象上有明显觉察的损伤或干扰,令人感到讨厌。2 分:图象上损伤或干扰较严重,令人相当讨厌。1 分:图象上损伤或干扰极严重,不能观看。4.3 七级比较制比较制是将受评图象与一个基准图象同时显示,由观看员的主观判断作出比较性评分。比较制七级评分的分级如下:+3 分:比基准图象质量好得多。+2 分:比基准图象质量显得较好。+1 分:比基准图象质量稍好点。0 分:与基准图象质量相同。-1 分:比基准图象质量稍差点。-2 分:比基准图象质量显得较差。-3 分:比基准图象质量差得多。附录 A 一个测试阶段中受评图象显示安排示例(参考件)A.1 一个测试阶段中的显示次数每个测试阶段中,受评图象的总显示次数可如下地计算。假设以节 Np 表示选定的测试图片张数,以 Nt 表示每张图片的受评条件数,则 30 分种的一个测试阶段中,可显示的受评图象总次数 N 应符合下式:11N(35)+2 Np(1+Nt)3446式中:后项括号内的“1”表示参考图象要作为受评条件之一,前项括号内的 35 表示正式评价中的前几次显示,它们作为观看员适应于评分的过渡次数,不列为可用评分。如果某评价过程中实际所需的 Np和 Nt值确定后,由此计算出的受评图象应显示次数 N0值大于一个测试阶段中可给出的显示次数 N,则应将某些图片及其若干受评条件的显示分散到其他的测试阶段中。A.2 一个测试阶段中的显示安排示例此处举一个例子,说明一种显示安排。假设已选定测试图片张数, Np3。于是,根据 A.1 的公式可知, Nt45。现取 Nt4,并选定适应次数为 5,这时 N35。若进行的主观测试是评价随机杂波对图象质量的影响,采用的三张图片标记为 I1、 I2、 I3 四个受评条件为信杂比等于 40、30、25、20dB,参考图象的信杂比优于 50dB。这时,受评图象的一种显示次序可安排如下表。显示序号 显示图片 受评条件(S/N,dB) 显示序号 显示图片 受评条件(S/N,dB)1 I1 30 11 I3 202 I3 参考 12 I1 403 I2 20 13 I2 204 I3 40 14 I3 405 I2 25 15 I2 参考6 I1 30 16 I1 207 I2 25 17 I3 258 I3 参考 18 I2 309 I2 40 19 I1 参考10 I1 25 20 I3 30续表 1显示序号 显示图片 受评条件(S/N,dB) 显示序号 显示图片 受评条件(S/N,dB)21 I2 25 29 I1 4022 I3 参考 30 I3 2523 I1 30 31 I2 参考24 I3 20 32 I1 2025 I2 40 33 I2 3026 I1 25 34 I3 4027 I2 20 35 I1 参考28 I3 30 36附录 B 电视图象质量主观评价试验的数据处理(参考件)B.1 一般原则12数 据 处 理 的 目 的 , 在 于 找 到 测 试 图 片 电 视 信 号 客 观 失 真 量 与 观 看 员 对 图 象 质 量 主 观 评 分 平 均 值 之间 的 函 数 关 系 。 对 于 给 定 的 图 片 和 一 定 的 失 真 量 , 不 同 观 看 员 会 给 出 不 同 的 评 分 值 , 但 在 多 次 重 复 的试 验 下 总 的 评 分 分 布 基 本 上 为 某 种 形 态 , 即 大 量 人 次 的 评 分 结 果 具 有 一 定 的 概 率 分 布 规 律 , 可 求 得 给定 图 片 在 一 定 失 真 量 条 件 下 观 看 员 对 图 象 的 平 均 评 分 值 , 从 而 可 以 找 到 测 试 图 片 电 视 信 号 客 观 失 真 量与 观 看 员 对 图 象 主 观 评 分 平 均 值 之 间 的 函 数 关 系 。在进行数据处理时,要运用数理统计的一系列方法,包括理论概率分布类型的选择、置信度的确定、逻辑函数类型的选取,以及正交设计、方差分析、回归分析等,借以建立能反映客观失真量与主观评分平均值之间关系的最佳拟合逻辑函数,并应通过标准离差和相关系等的计算检验逻辑函数的精度。B.2 数据处理的几种方法B.2.1 二项分布模型数据处理方法采用五级评分制进行数据处理时,为了计算方便,选取如下所示的归一化分等分数值:等 级 5 4 3 2 1归一化分数 1 0.75 0.5 0.25 0评分百分比 P5 P4 P3 P2 P1这样,对某图片在给定失真量 的受评条件下,所得的评分平均值 P 平 为:P 平 P5 +0.75P4+0.5P3+0.25P2按数理统计规律,观看员大量实际评分结果的直方图形状一般近似于二项分布或正态分布模型。当选取二项分布模型时,其一般形式为:( P+q)mn-1式 中 , P 是 评 分 出 现 的 概 率 , q 1-P, n 是 所 取 分 级 系 统 的 级 数 。 在 五 级 评 分 制 条 件 下 , 取n 5; 因 此 , 这 时 的 二 项 分 布 模 型 为 :( P+q)5m-1式中,m 是阶数。一般地说,参加评分的观看员的类型不同,适用的二项分布模型的阶数也就不同;评分越集中,取的阶数应越高。实践中,m 可取为 1,2,4,6,。将 (P+q)5m-1 展 开 式 中 的 各 项 按 P 的 幂 次 高 低 排 列 , 就 项 数 等 分 成 五 个 相 继 的 组 , 依 次 取 作P5、 P4、 P3、 P2、 P1 。根据实验数据计算得到的大量数据点(, P 平 ),在 - P 平 直角坐标系中可近似地描绘成一条斜对称S 型曲线。按照逻辑函数类型的选取,可找到其最佳拟合逻辑函数的形式为:P 平 sxMe1式中,参数 M 是评分的中间值所对应的失真量,参数 S 是 P 平 0.731 时失真量 与 M 之间的差,它反映了人们对一定值失真量发生微量改变时主观评分变化的敏感程度。由大量的数据点(, P 平 ),可利用最小二乘法确定出参数 M 和 S 。为了说明经上述数据处理后所得结果的置信度,还需要进行拟合精度的估计。对分布模型按 95%的置信度,分别求出 P5、 P4、 P3、 P2、 P1 的置信限。对于逻辑函数,经过标准离差的计算给出在 95%置信度下- P 平 关系曲线的置信限,同时还要通过相关系数的计算来说明逻辑函数的拟合精度。B.2.2 正态分布模型数据处理方法13当采用正态分布曲线来拟合观看员实际评分结果的直方图时,对于五级评分制,可设 P (1,2,3,4,5)为某一图片在给定失真量的受评条件下观看员评其为 i 级的百分比。观看员对某图片在一定失真量条件下的评分结果是一个离散随机变量,其评分平均值和均方差分别为:评分平均值 ,51iP均方差: - 12i512)(i1可以用一条平均值为 、均方差为 的正态分布曲线来拟合观看员实际评分结果的直方图。这时,要使所确定的正态曲线满足下面的条件:由正态曲线量化后的评分直方图(即对每一个评分为 i 级的比例以正态曲线下的面积来表示)计算出的评分平均值和均方差,应与由原始评分数据得到的直方图计算出的评分平均值和均方差一样。由此,可确定出 和 。按上述方法从每次试验计算出的平均值中,选出一组 3(五级评分的中间值)时的方差 p值,再重新计算出平均值 R 即为所得到的评分平均值。然后,利用数理统计方法可确定反映失真量 与评分平均值之间关系的最佳拟合逻辑函数。B.2.3 数据处理的其他方法在数据处理过程中,也可以根据多种失真同时作用于测试图片所得到的评分结果,利用多元线性回归方式直接逼近法,找到同时存在的多种客观失真量与测试图片主观评价分数之间的关系式。此外,还可以采用其他的处理方法。B.2.4 特定条件下的数据处理方法在图象显示端,对实际的彩色电视传输环节和系统给出的彩色电视图象质量进行主观评价时,可根据对各幅图象的评分结果分别计算出评分平均值。因为各图象的总评分近似于正态分布,所以可用数理统计中由小样本估计总体平均值的方法确定在 95%置信度下评分平均值的变化区间。如果得到几个评分值,分别为 1, 2, 3, n(即样本单位数为 n),则样本的评分平均值为:x nix1令样本标准差 S 为:S= nix12)(设 为估计的总体评分平均值,并取新变量 t,t 的表示式为:t 1/nSx它服从 t 分布,于是有总体评分平均值的区间估计 txP(1ntx1nS14式中,t 为 t 分布的临界值, 为显著性水平,1- 为置信度。在给定置信度下,可根据 n-1 值和 值从 t 分布表中查得临界值 t ,从而求得此时的总体评分平均值区间为: xtxnS,11nS反之,预先规定区间容差t 的值时,可由已知的 n 值、 值计算出对标准差 S 的要求。/据此,可判断实际评分的样本标准差 S 是否符合要求,从而认定该主观评价过程中评分结果的可靠程度。例 1. 设 n 20, 置 信 度 规 定 为 95%, 要 求 总 体 评 分 平 均 值 处 在 范 围 内 ,1.0,.x则 根 据 n 20, 0.05, 查 t 分 布 表 得 到 t 2.093, 由 此 可 计 算 出 样 本 标 准 差 S 应 满 足 :S 0.20例 2. 设 n 20, 置 信 度 规 定 为 95%, 要 求 总 体 评 分 平 均 值 处 在 范 围 内 ,2.0,.x则 样 本 标 准 差 S 应 满 足 :S 0.41例 3.设 n 30, 置 信 度 规 定 为 95%, 根 据 评 分 结 果 计 算 出 的 样 本 标 准 差 为 S 0.4, 则 由 n-1 值 、 值 查 t 分 布 表 得 到 t 2.045, 从 而 计 算 出 :xt .1nS15.034.即总体评分平均值落在 15.0,.x区间内的概率为 95%。15- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB7401 87
装配图网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文