第二章 误差与数据处理

上传人:daj****de2 文档编号:195436407 上传时间:2023-03-16 格式:DOCX 页数:37 大小:250.77KB
收藏 版权申诉 举报 下载
第二章 误差与数据处理_第1页
第1页 / 共37页
第二章 误差与数据处理_第2页
第2页 / 共37页
第二章 误差与数据处理_第3页
第3页 / 共37页
资源描述:

《第二章 误差与数据处理》由会员分享,可在线阅读,更多相关《第二章 误差与数据处理(37页珍藏版)》请在装配图网上搜索。

1、第二章误差与数据处理基本术语分析化学中的误差是客观存在的。例如,设有一铁的标准样品,其含铁的标准值为T。对这一铁标准样品进行分析,即使 采用最可靠的方法,使用最精密的仪器,由最有经验的分析工作者进行测定,所得的结果也 不可能与T完全一致;由同一有经验的分析人员对同一样品进行多次分析,所得的结果也不 可能完全一致。1、准确度准确度表征测定结果与真实值的符合程度。准确度的高低用误差来衡量。测 量值与真实值之间差别越小,则分析结果的准确度越高。2、精密度精密度表征几次平行测量值相互符合程度。精密度的高低用偏差来衡量。平 行测定所得数据间差别越小,则分析结果的精密度越高。3、精密度与准确度的关系例:A

2、、B、C、D四个分析人员对同一铁标样(wF=37.40%)中的铁含量进行测量, 结果如图示,比较其准确度和精密度?厕量值;标谁值I 平均值精密度与准确度的关系可表示为:1. 精密度是保证准确度的前提;2. 精密度高,不一定准确度高。4、系统误差系统误差是由某种固定的原因造成的误差。具有重现性,系统误差的正负、大小都有一 定的规律性。在理论上讲是可以测定的,又称可测误差。系统误差存在与否决定分析结果的 准确度。1. 方法误差,由分析方法自身不足所造成的误差。如,重量分析法中,沉淀的溶解度大,沉 淀不完全引起的分析结果偏低;滴定分析中,指示剂选择不适合,滴定终点与化学计量点不 符合引起的误差。2.

3、 仪器误差,由测量仪器自身的不足所引起的误差。如,容量仪器体积不准确;分光光度计 的波长不准确。3. 试剂误差,由于试剂不纯引起的误差。如,试剂和蒸馏水含有待测组分,使测定结果系统 偏高。4、操作误差由分析人员的主观原因造成的误差。如分析人员掌握的分析操作与正确的分析 操作有差别;分析人员对颜色敏感度的不同等。5、随机误差(亦称偶然误差)随机误差是由某些不确定的偶然的因素引起的误差。例如,测量时环境温度、湿度和气压的微小波动;仪器电源的微小波动;分析人员对各 份试样处理的微小差别等。随机误差的正负、大小都不可预见,也称不可测误差。随机误差的出现符合统计规律。 随机误差的大小决定分析结果的精密度

4、。6、总体与样本在统计学中,对于所考察的对象的全体,称为总体(或母体)。从总体中随机抽出的一 组测量值,称为样本(或子样)。样本所含测量值的数目,称为样本容量(或大小)。例如,对某批矿石中的镍含量进行分析,经取样、破碎、过筛、混匀、缩分后,得到一 定数量(例如500 g)的试样供分析用。这就是分析试样,是供分析用的总体。如果分析人 员甲和乙分别从中称取3份和4份进行平行分析,分别得到3个和4个测量值,则这两组分 析结果就是矿石分析试样总体的两个随机样本,样本容量分别为3和4。7、直值某一物理量本身具有的客观存在的真实值。其值是未知的、客观存在的量,在特定情况 下认为是已知的:(1) 理论真值(

5、如化合物的理论组成);(2) 计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等等);(3) 相对真值(如高一级精度的测量值相对于低一级精度的测量值)。8、平均值样本容量为n的一组测量数据的算数平均值.为:3口 i=l9、中位数一组测量数据按大小顺序排列,中间一个数据即为中位数七。当测量值的个数为偶数 时,中位数为中间相邻两个测量值的平均值。10、误差对真值为T的分析对象总体随机抽取一个样本进行n次测量。(1)个别测量值的误差为E =x.-T ;i i(2)实际上,通常用各次测量结果的平均值“表示测定结果,测定结果的绝对误差为E=X -T a5, = -xlOO%(3)测量结果的相

6、对误差为T11、极差(R)式中,xmax和xmin分别为测量数据中的最大值和最小值。12、相对极差(RR)RR = xlOO%13、公差公差是生产部门对于分析结果允许误差的一种表示方法。如果分析结果超出允许的公差范围,称为超差,该项分析工作必须重做。如,对钢中硫含量分析的允许公差范围规定如下:硫的质量分数 0.200公差(绝对误差)土 0.002土 0.004土 0.006土 0.010土 0.01514、偏差与标准偏差样品容量为n的一组测量数据;各次测量值的偏差为d气一;3=-Z(2) 个别测量值的平均偏差为;RMD = xlOO%(3) 个别测量值的相对平均偏差为x样本的标准偏差为 I 丫

7、 I式中(n - 1)称为自由度,以f表示。自由度f是指计算一组测量数据分散程度的独立偏差数;CV=XxlOO%(5)样本的相对标准偏差,亦称变异系数(CV)x 。16、总体标准偏差当测量次数为无限多次时,各测量值对总体平均值M的偏离,用总体标准偏差o表示,17、总体平均值p= lim上无当测量次数为无限多次时,所得的平均值为总体平均值p,ii=i若没有系统误差,则总体平均值p就是真值T。18、总体平均偏差当测量次数为无限多次时,单次测量的平均偏差为El-pl目=19、平均值的标准偏差当测量次数无限增多(或实际上n 30)时,单次测量值%的偏差为o i二 一 p求各次测量值的偏差和,得iln2

8、i= 一叫i=li=l或 上幺=上无一户=无一声ni=i ni=ix尹是平均值对总体平均值的偏离,即为平均值的总体平均偏差。故幻=i上式表明,测定的平均值的偏差等于各测量值偏差求平均值。当测定次数趋于无穷大时, 正、负误差互相抵消,lim V= 0I-&MTCO)= 口计算平均值的偏差的平方,有3 =-4(CF1 + O-2+-+O-n)2=+- + 0) + (2明母+?%?+ + 2%_%)根据误差分布规律,上式二倍乘积的各项有不同的符号以及相对称的两项其绝对值相 等,因而其代数和趋于零,上式变为:即平均值的总体标准偏差为单次测定的总体标准误差除以测定次数的平方根。对有限次测量,则为平均值

9、的标准偏差与测定次数的关系增加测定次数,可以提高测量的精密度,但增加测定次数的代价不一定能从减小误差得 到补偿。在分析化学实际工作中,一般平行测定4书次就已足够。20、有效数字有效数字就是实际上能测到的数字,其最后一位是可疑数字。例如,读取滴定管上的刻度,三个学生可能得不同的读数。甲22.42ml乙22.43ml丙22.41ml这三个测量数据中,前三个数字都是准确的,第四位是估计出来的,所以稍有差别,称 为可疑数字。这三个测量数据的有效数字都是4。1.数字的修约规则各测量值的有效数字位数确定后,就要将它后面多余的数字舍弃。舍弃多余数字的过程 称为“数字修约”,目前一般采用“四舍六入五成双”规则

10、。“四舍六入五成双”规则规定,当测量值中被修约的那个数字等于或小于4时,该数字 舍弃;等于或大于6时,进位;等于5时,如进位后末位数为偶数则进位,进位后末位数为奇数则舍弃。根据这一规则,将下列测量值修约为两位有效数字时,结果应为:3.1483.17.3977.40.7360.7475.5762.数据的计算规则数据的计算规则,是根据误差的传递规律而确定的。加减法 是各个测量值绝对误差的传递,绝对误差最大的测量值的绝对误差决定了分析 结果的不确定性。因此,求几个测量值的代数和时,有效数字位数的保留,应以小数点后位数最少的数为依据。例如:乘除法是各个测量值相对误差的传递,结果的相对误差应与各测量值中

11、相对误差最大 的那个数相适应。因此,在乘除法运算中通常根据有效数字位数最少的数来进行修约。例如: 随机误差是由一些偶然的因素造成的,其大小、正负具有随机性,服从一定的统计规律。2.2.1频率分布某校的学生对海水中的卤素含量进行测定,得到x=16.01 gLs = 0.046 g L-1fy0.05 g-L;1=198由于测定过程中存在随机误差,测量值有高有低,具有分散性。将测量值按大小顺序排 列,由最大值和最小值可知测量值落在1土19昌1 1-15.84范围。如果按组距0 03 g L1将198个测量值分组,每组中数据出现的个数称为频数(.),频数除以测量值总 i数(n)称为频率(n/n),频

12、率除以组距($)称为频率密度(气/$),以频率密度对相 应组值范围作图,就得到频率密度直方图。No分组频数(n.)i频率(n/n)i频率密度(n. /in3)115.831.00.010.17215.862.00.010.34315.893.00.020.51415.929.00.051.52515.9518.00.093.03615.9833.00.175.56716.0153.00.278.92816.0438.00.196.4020.00.102.371016.07直接连接相邻组中值对应的频率密度点,得到频率密度分布图。16.1012.00.062.0211频率密度分布图直观地反映出测量

13、数据的集中趋势。19.135.00.030.8412趋0.02无穷冰51组距 趋近于无穷小,频率密度曲线趋近于一条正态分13-布的平滑曲线。该曲线称为概率密度曲线。16.191.00.010.17频率密度直方图14、偏差与标准偏差样品容量为n的一组测量数据;各次测量值的偏差为d尸气艺如0为个别测量值的平均偏差为i=1RMD = xlOO%个别测量值的相对平均偏差为(4)样本的标准偏差为式中( -1)称为自由度,以f表示。自由度f是指计算一组测量数据分散程度的独立偏差数;CV=-xlOO%(5)样本的相对标准偏差,亦称变异系数(CV)二 。10、误差对真值为T的分析对象总体随机抽取一个样本进行n

14、次测量。个别测量值的误差为E =x.T ; i i(2) 实际上,通常用各次测量结果的平均值应表示测定结果,测定结果的绝对误差为E 顶T;a5, = -xlOO%(3) 测量结果的相对误差为T。11、极差(R)式中,xmax和xmin分别为测量数据中的最大值和最小值。12、相对极差(RR)RR = xlOO%13、公差公差是生产部门对于分析结果允许误差的一种表示方法。如果分析结果超出允许的公差 范围,称为超差,该项分析工作必须重做。如,对钢中硫含量分析的允许公差范围规定如下:硫的质量分数 0.200公差(绝对误差)土 0.002土 0.004土 0.006土 0.010土 0.0154、系统误

15、差系统误差是由某种固定的原因造成的误差。具有重现性,系统误差的正负、 大小都有一定的规律性。在理论上讲是可以测定的,又称可测误差。系统误差存 在与否决定分析结果的准确度。1. 方法误差,由分析方法自身不足所造成的误差。如,重量分析法中,沉淀的溶 解度大,沉淀不完全引起的分析结果偏低;滴定分析中,指示剂选择不适合,滴 定终点与化学计量点不符合引起的误差。2. 仪器误差,由测量仪器自身的不足所引起的误差。如,容量仪器体积不准确;分光光度计的波长不准确。3. 试剂误差,由于试剂不纯引起的误差。如,试剂和蒸馏水含有待测组分,使测 定结果系统偏高。4. 操作误差由分析人员的主观原因造成的误差。如分析人员

16、掌握的分析操作与 正确的分析操作有差别;分析人员对颜色敏感度的不同等。5、随机误差(亦称偶然误差)随机误差是由某些不确定的偶然的因素引起的误差。例如,测量时环境温度、湿度和气压的微小波动;仪器电源的微小波动;分 析人员对各份试样处理的微小差别等。随机误差的正负、大小都不可预见,也称不可测误差。随机误差的出现符合 统计规律。随机误差的大小决定分析结果的精密度。随机误差是由一些偶然的因素 造成的,其大小、正负具有随机性,服从一定的统计规律。2.2.1频率分布某校的学生对海水中的卤素含量进行测定,得到x=16.01 gL;1s = 0.046 g L_10.05 义 顼茂=1弱由于测定过程中存在随机

17、误差,测量值有高有低,具有分散性。将测量值按大小顺序排 列,由最大值和最小值可知测量值落在1619gL 1-1584gL1范围。如果按组距 03g L1将198个测量值分组,每组中数据出现的个数称为频数(妒,频数除以测量值总数(n)称为频率(n/n),频率除以组距0S)称为频率密度(气/nAS),以频率密度对相 应组值范围作图,就得到频率密度直方图。No分组频数(n.)1频率(n/n)i频率密度(n. /inAS)115.831.00.010.17215.862.00.010.34315.893.00.020.51415.929.00.051.52515.9518.00.093.03615.9

18、833.00.175.56716.0153.00.278.92816.0438.00.196.40916.0720.00.102.371016.1012.00.062.021119.135.00.030.841216.163.00.020.511316.191.00.010.17直接连接相邻组中值对应的频率密度点,得到频率密度分布图。频率密度分布图直观地反映出测量数据的集中趋势。条正当测量值个数n趋近于无穷大,组距 趋近于无穷小,频率密度曲线趋近于 态分布的平滑曲线。该曲线称为概率密度曲线。频率密度直方图2.2.2正态分布条正当测量值个数n趋近于无穷大,组距 趋近于无穷小,频率分布曲线趋近于

19、态分布的平滑曲线,称为概率密度曲线。正态分布的概率密度函数式是这样的正态分布记作N(p ,。2)其中,J表示概率分布;X表示测量值;g表示总体平均值,即无限次测定所得数据的 平均值,表示无限个数据的集中趋势。没有系统误差时,g = T。 a表示总体标准偏差,表征无限次测定数据的分散程度。(X - g)表示随机误差,若以(X - g)为横坐标则曲线最高点横坐标为0。这时表示的是随机误差的正态分布。测量值和随机误差的正态分布体现了随机误差的概率统计规律: 小误差出现的概率大,大误差出现的概率小,特别大的误差出现的概率极小; 正误差出现的概率与负误差出现的概率相等; X = g时,J值最大,表明测量

20、值向M集中的趋势;表明数据的分散程度与O有关,O越大,测量值的分散程度越大,正态分布曲线也就 越平坦。思考:出现图示二条正态分布曲线的可能情况是什么? (请移上鼠标)2.2.3标准正态分布正态分布曲线的形状随o而异。将正态分布的概率密度函数转换为这样的分布称为标准正态分布,记作N(0,1)。标准正态分布与a无关标态分布曲线2.2.4区间概率随机误差在某一区间出现的概率(P),可以取不同的u值对标准正态分布的概率密度函数进行定积分,P =面积=尘(对.血=/召2血正态分布概率积分表(点击)正态分布概率积分表中列出的面积与图中阴影部分相对应,表示随机误差在此区间的概 率。若是求土u值区间的概率,必

21、须乘以2。例如:随机误差出现的区间(以o为单位)测量值出现的区间概率(%)u =1x=g1a68.3u =1.96x=p1.96o95.0u =2x=g2a95.5u =2.58x=p2.58o99.0u =3x=g3o99.72.3.1.1 t 分布正态分布概率积分图正态分布是无限次测量数据的分布规律。当测量数据不多时,其分布服从t分布规律。定义: 阪 t分布函数是t分布曲线随自由度f而改变。当f趋近于无穷大时,t分布趋近于正态分布。-4-2024 fr分布曲线2.3.1.2区间概率t分布曲线下面一定区间内的积分面积,就是该区间内随机误差出现的概率。不同f值及概率所相应的t值已有表可查。(附

22、录表21列出了部分最常用的t值。)表中置信度用P表示,它表示在土区间内出现的概率;a称为显著性水准,表示在 土区间以外所出现的概率。P=1-a;由于t值与置信度及自由度有关,一般表示为taf。例如:too5io表示置信度为95%,自由度为10时的t值。2.3.2置信区间对少量测量数据,以样品平均值估计总体平均值可能存在的区间为刈11。它表示在一定置信度下,以平均值f为中心,包括总体平均值口的范围,称为总体平均值 的置信区间在测量次数增多(实际上巧 如时),总体标准偏差已知的情况下,总体平均值在一定置产=元=信度下的置信区间为血。例如,口 = 36.86%0.10%(置信度为95%),可理解为有

23、95%的把握说以平均值36.86% 为中心,包含了总体平均值的区间为36.86%0.10%。显著性检验是指对存在着差异的两个样本平均值之间、或样本平均值与总体真值之间是 否存在“显著性差异”的检验。在实际工作中,往往会遇到对标准样品进行测定时,所得到的平均值与标准值(相对真 值)不完全一致;或者采用两种不同的分析法或不同的分析仪器或不同的分析人员对同一试 剂进行分析时,所得的样本平均值有一定的差异。显著性检验就是检验这种差异是由随机误 差引起或是由系统误差引起。如果存在“显著性差异”,就认为这种差异是由系统误差引起; 否则这种误差就是由随机误差引起,认为是正常的。2.3.3.1 t检验法1.

24、平均值与标准值的比较根据下式计算出t值,计算旦由从附录表21中查出指定置信度下的3值,并进行比较。如果计笆冲,则认为存 在着显著性差异,否则不存在显著性差异。在分析化学中,通常以95%的置信度为检验标准, 即显著性水准为5%。2. 两组平均值的比较设两组分析数据为如证明S1和s2之间没有显著性差异(F检验),则可以为字队,用下式求得合并标准偏差s。计算t值,并比较。查 附录表21 (总自由度f =1+2-2),得nJ两组平均值存在显著性差异;两组平均值不存在显著性差异。2.3.3.2 F 检验F检验是通过比较两组数据的方差,以确定它们的精密度是否有显著性差异的方法。按下式计算F值,中式中,*和

25、*分别代表两组数据中大的方差和小的方差。杳附录表22,为)的值,并比较,如果算 用械则认为两组数据的精密度之间存在显著性差异(置信度为95%),否则不存在显著性 差异。附录表22所列F值用于单边检验时,即检验某组数据的精密度是否大于或等于另一 组数据的精密度,此时置信度为95%(显著性水平为0.05)。而用于判断两组数据的精密 度是否有显著性差异时,即一组数据的精密度可能大于,等于,也可能小于另一组数据的精 密度时,显著性水平为单边检验时的两倍,即=0.10,因而此时的置信度=1010 = -90(90%)一组分析测量数据中的异常值的取舍,可按统计学方法进行处理。2.3.4.1格鲁布斯(Gru

26、bbs )法有一组数据,从小到大排列为:%,X2,Xn其中X1或xn可能是异常值。统计量T定义为计算一 5(七为可疑值)或T AT竺十算=-(xn为可疑值)从 附录表23中查出指定显著性水平的Tan值,并进行比较。如果T计算 则异 常值应舍去,否则应保留。2.3.4.2 Q检验法有一组数据,从小到大排列为:X,X2 ,气,Xn统计量Q定义为纹博=:一:(为异常值)或R计算=予三(&为异常值)Q称为“舍弃商”。从附录表24中查出指定置信度下的Qpn值,并进行比较,如果Q计算 Qp n,该异常值 应舍弃,否则应予保留。分析结果通常是经过一系列测量步骤之后获得的,其中每一步骤的测量误差都会反映到 分

27、析结果中去。误差的传递方式取决于:I、误差的性质(随机误差或系统误差);II、分 析结果与测量值之间的关系(线性组合、乘除、指数、对数等)。2.4.1系统误差设A、B、C、D为相互独立的测量值;岫、油、区、AD分别是测量值A、B、C、D的系 统误差(包含系统误差的正负号);K、KA、KB、为常数;j为由测量值根据化学计量关 系计算所得的分析结果;Aj为分析结果的系统误差。系统误差的传递公式:1. 当 y=K+KA+KB+时有 Ay=K AA+KBAB+T鲍2. 当 CD时您 _ AA AB AC AD有3. 当 y=f (x)A安衣有双2.4.2随机误差设A、B、C、D为相互独立的测量值;s、

28、s、s、s分别为测量值A、B、C、D的标准A B C D偏差;K、KA、Kb、为常数;y为由测量值根据化学计量关系计算所得的分析结果;sy为分 析结果y的标准偏差。随机误差的传递公式为: 当 y=K+KA+KB+时有当有嘿时y=.f(x)当在仪器分析中,常用标准工作曲线法确定待测组份的含量。由于随机误差的存在,测量 值不可能完全落在同一曲线上。回归分析就是用数理统计方法确定一条对各测量值误差较小 的直线。这条直线所表达的两个变量之间的某种线性关系是否有意义,则用相关系数进行判 断。2.5.1 一元线性回归方程设以X表示自变量,y为因变量,则一元线性回归方程表示为:y=a+bx其中a和b称为回归

29、系数。设对y作n次独立的测量,得到一系列测量值:(%,y,),i=1,2,3,n通常假设x,具有足够的精密度,所有的随机误差都来源于测量值y。根据最小二乘法的原理,最佳的回归线应是各测量值y,与相对应的落在回归线上的值之 差的平方和(Q)为最小。欲使Q达到最小,对Q分别求和b的偏微分,并令其为零:孚=-也(山-知=口字=也於一由蚯=口上两式求解得 nn/一应无 _ _队= =y-hx立(无 -工)(乂 -对队一=一如无fi=l式中U=L立工=【亡妇 n i=in fi2.5.2相关系数1、相关系数定义为2、相关系数的物理意义(1) 当所有的为值都落在回归线上,R = 土 1;(2) 当j与x之

30、间完全不存在线性关系时,R = 0; 当R的值在0与1之间时,如果其值与指定置信度下相关系数临界值耳丁比较,满足梅,就可以认为这一回归线是有意义的。2.6.1减小测量误差1、减少称量误差一般分析天平一次读数的绝对误差E. = 0.0001 g一次称量读两次Ea = 2E. = 0.0002 g常量分析要求Er 0.1%即试样的质量必须在0.2 g以上。2、减少容量误差一般滴定管读数常有土 0.01 ml的误差一次滴定中,读数两次Ea = 土 0.02 ml常量分析要求Er 测量精度,不合理。2.7.7综合题例10某分析工作者根据客户的要求对果汁中的铅含量进行测定。客户指明样品中的铅含量 处在1叩咫蝗1数量级,并要求分析结果的准确度优于5昭*写1,可接受的置信度为95%。 已知分析方法对给定浓度范围铅含量进行分析的精密度为8昭把日1,问需要平行测定几次才能满足客户的需求。解:根据题意知道客户要求在95%置信度下总体平均值口(要求没有系统误差存在,|i=T)包含在区间内,并要求要平行测定10次才能满足客户的需要。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!