化学误差及分析数据的统计处理
三水锰矿 / 2021-09-27
误差及分析数据的统计处理
当对物质组分含量测定时“准确”两个字是相当重要的,但是绝对准确的测定结果是不存在的,所谓“准确”是指测定的误差小,因此测定结果的误差愈小就愈“准确”,所以这一章的重点与难点就表现在与“准确”二字相关的误差和分析数据的统计处理上。
2.1要点与难点
要点
误差、偏差;误差与准确度、偏差与精悟度,误差与偏差的联系、准确度与精密度的关系,分析中误为产生的原因、出现的规律和减少的措施,重点理解和掌握系统误差和随机误差,要深人掌握这两种误差产生的原因、误差的性质和校正的办法;随机误差分布服从正态分布,有限次测定中随机误差服从1分石;置信变与置信区间:分析结果的数据处理方面,可疑数据的取舍,平均值与标准值的比较和两个平均值的比较;其中可疑数据的取合包括Grubbs检验法和Q检验法(Q-test)两个方法;有效数字及其运算规则;标准曲线的回归分析。
难点
绝对误差与绝对偏差的概念;精密度与准确度的关系;系统误差和随机误差产生的原因、误差的性质和校正的办法;有效数字及其运算。
2.2绝对误差与相对误差
绝对误差表示测定值与真实值之差,误差的概念与绝对误差的概念是一致的,绝对误差并不意味着误差的绝对值,而是既有正值,又有负值,也就是说当测定结果大于真实值时,绝对误差为正值,表示测定结果偏高:反之绝对误差为负值,表示测定结果偏低。这一点学生经常出错,主要原因是简单地把绝对误差中的“绝对”二字误认为是绝对值.
相对误差是指误差在真实值中所占的比例(%),因此相对误差也有正负。因为相对误差能反映误差在真实结果中所占的比例,因此用相对误差来表示各种情况下测定结果的准确度更为确切些。
2.3绝对偏差与相对偏差
误差反映的是测定结果与真值接近的程度,而偏差反映的是与多次平行测定分析结果的算术平均值接近的程度,也就是偏差表示测定结果与平均结果之间的差值.
绝对偏差与绝对误差的区别是,前者反映的是测定结果与多次平行测定分析结果的算术平均值接近的程度,后者反映的是测定结果与真实值接近的程度,绝对偏差和绝对误差其中的“绝对”二字都没有绝对值的意思,所以其结果既有正值、又有负值,还有一些可能为零,也就是说绝对偏差表示测定结果与多次平行测定分析结果的算术平均值之差,而不是测定结果与多次平行测定分析结果的算术平均值之差的绝对值,以上这一概念学生经常出错,应倍加注意。
相对偏差是指偏差在多次平行测定分析结果的算术平均值中所占的比例(%)
2.4 准确度与精密度的关系
一般对于准确度与精密度的关系理解起来有些困难,但是实际上这个问题很简单,要想把它们之间的关系分析清楚,需要从两个方面透彻理解,其一是准确度与精密度的基本概念,其二是反映准确度与精密度之向的关系的两句话。
准确度是指多次平行测定分析结果的平均值与真值接近的程度,准确度的高低用误差表示,即误差小,则准确度高,精密度是指各次分析结果相互接近的程度,也就是在确定条件下,将测试方法实施多次,求出所得结果之间的一致程度。精密度的好坏用偏差表示,即偏差小,则精密度好。
精密度的高低还常用重复性和再现性表示。
重复性:同一操作者,在相同条件下,获得一系列结果之间的一致程度。
再现性:不同的操作者,在不同条件下,用相同方法获得的单个结果之间的一致程度。
反映准确度与精密度之间的关系,有两句话必须记住,一是精密度高不一定准确度高,二是准确度高一定需要精密度高,把这两句话理解透彻了,就会认识清楚准确度与精密度之间的关系。为什么精密度离不一定准确度高呢?原因是存在系统误差,当系统误差消除以后精密度高的测定结果准确度才能高。
对实验结果的数据处理偏差的表示中,用标准偏差更合理,原因是将单次测定值的偏差平方后,能将软大的偏差显著地表现出来。
2.5 系统误差与随机误差
关于系统误差与随机误差的问题,首先应该理解它们产生的原因、性质和校正方法。在这一节中,学生认识不清和理解不够深入的地方往往是其产生的原因和随机误差的分布规律,随机误差的分布规律将在下一节中介绍,本节主要分析系统误差和随机误差产生的原因。
2.5.1 系统误差及其产生的原因
系统误差是由某种固定的原因所造成的,具有重复性和单向性,系统误差的大小、正负,在理论上是可以测定的,所以又称可测误差。
根据系统误差的性质和产生的原因,可从以下几方面加以鉴别。
(1)方法误差 这种误差是由方法本身造成的。例如,在重量分析中沉淀的溶解、共沉淀、沉淀的洗涤,灼烧时沉淀的分解或挥发等;在滴定分析中,反应不完全、干扰成分的影响、指示剂选择不当、化学计量点和滴定终点不符合以及发生副反应等,使分析结果系统地偏高或偏低。
(2)仪器误差 由于仪器本身的缺陷或者仪器本身不够精确引起的,如砝码的质量、容量器皿刻度和仪表刻度不准确等,电子仪器“噪声”过大等
(3)试剂误差 试剂误差来源于试剂不纯或蒸馏水纯度不够,例如试剂或蒸馏水中含有被测物质或干扰物质,使分析结果系统偏高或偏低。
(4)操作误差操作误差是由于分析人员所掌握的分析操作与正确的分析操作有差异所引起的或是操作者存在操作偏见造成的人为误差。例如在读测定数据时,有的人第二次读数总是想与第一次重复造成的误差。
总之,系统误差是可测的,原因是固定的,至少从理论上是可以找出其原因加以克服的。
校正系统误差的办法包括选择标准方法、进行试剂提纯、进行仪器校正,通过对照试验、空白试验以及回收试验加以检验和校正,为此需要学会以上几项方法和技术,同时搞清其概念和原理。
2.5.2随机误差及其产生的原因
随机误差又称偶然误差,它是由一些随机的偶然的原因造成的,这些因素是无法控制和不确定的,例如环境温度、湿度和气压的微小波动,仪器不可控的微小变化,分析人员在实验过程中不确定操作上的或是式样处理上的微小差别,以及其他一些不确定的因素,不可避免的偶然原因,都将使分析结果在一定范围内波动,引起随机误差,这类误差值有时大、有时小,有时正、有时负,所以随机误差又称不定误差,这种误差难以找到具体原因,更无法测量它的值,随机误差在测量中是无法避免的。一个很有经验的分析工作者完全规范的操作,对同一试验进行数次分析,其分析结果却不能完全一致,但是继续进行很多次就会发现,仍然符合一定规律,这种规律是“概率统计学”中研究的重要的统计规律。
2.6随机误差的正态分布
在分析化学中,随机误差是由一些偶然因索造成的误差,它的大小和正负有随机性,但如果用统计学方法处理,就会发现,如果测定次数较多,在系统误差已经排除的情况下随机误鉴也有一定的规律性,即随机误差分布服从正态分布。正态分布就是通常所说的高斯外布,其数学表达式为:
式中,σ为标准偏差, υ为总体平均值,χ为测量值.
若将横坐标用υ为单位表示,则可将分布曲线标准化,标准正态分布以N(O,1)表示,υ定义为,代人式(2-1)得
由表2-1可得以下几个典型随机误差出现的区间(以σ为单位)与出现的概率的关系。
随机误差出现的区间(以σ为单位) 测量值出现的区间 概率
u=±1 χ=μ±1σ 68.3%
u=±1.96 χ=μ±1.96σ 95.0%
u=±2 χ=μ±2σ 95.5%
u=±2.58 χ=μ±2.58σ 99.0%
u=±3 χ=μ±3σ 99.7%
随机误差分布具有以下性质。
(1)对称性 大小相近的正误差和负误差出现的概率相等,误差分布曲线是对称的。
(2)单峰性 小误差出现的概率大,大误差出现的概率小,很大误差出现的概率非常小。误差分布曲线只有一个峰值。误差有明显的集中趋势。
(3)有界性 仅仅由于偶然误差造成的误差不可能很大,即大误差出现的概率很小。误差很大的测定值,往往是过失误差造成的。对这种数据应作适当的处理.
(4)抵偿性 随机误差的算术平均值的极限为零。
2.7 t分布与平均值的置信区间
测定值或随机误差出现的概率称为置信度或置信水平, 68.3%、 95.0%, 95.5%、 99.0%、99.7%即为置信度,其意义可以理解为某一定范围的测定值或随机误差值出现的概率。μ±1σ、μ±1.96σ、μ±2σ、μ±2.58σ、μ±3σ等称为置信区间,其意义为真实值在指定概率下,包括在某一区间。显然置信度选得高,置信区间就宽。
有限次测定的随机误差并不完全服从正态分布,而是服从英国统计学家和化学家W.S.Gosset 提出的分布,其纵坐标仍为概率密度,但横坐标则为统计量t。t的定义为:
χ-μ
t=-------
S-
x
t分布曲线与正态分布曲线相似, t分布曲线随自由度∫(∫=n-1)而改变,当∫→/∞时, t分布趋于正态分布,当∫≥20时, t值与u值很接近.
已知置信度和测定值的次数,可从,值表中查到相应的t值.
由t的定义式(2-6)可得
- - ts
μ=х±ts- =х±-----
х √n
式(2-7)示在一定置信度下,以平均值х为中心,包括总体平均值μ的范围。称为平均值的置信区间。对于置信区间的概念必须正确理解。
置信区间的宽窄与置信度,测定值的精密度和测定次数有关,当测定值精密度愈高(s值愈小),测定次数愈多(n值愈大)时,置信区间愈窄,即平均值愈接近真值,平均值愈可靠。当测定值精密度愈低,测定次数愈少时会怎样?请读者思考。
2.8 有效数字及其运算规则
对有效数字的理解、辨认和计算经常出现错误,这些错误主要有两点,一是对有效数字的基本概念理解不清楚,二是经常把小数点的位数和有效数字的位数混淆。
什么是有效数字呢?有效数字是最高数字不为零的而且通常保留的最后一位数字是不确定的,也就是说其他各位都是确定的,而最后一位不确定的数字称为可疑数字。一个有效数字只有最后一位数字是可疑的,因而有效数字位数的多少,反映的是测量的精确度。
例如称量某物质为0.0875g, 0.0875为三位有效数字,保留到小数点后面第四位,并不是四位有效数字,这一点不能混淆。由此也可以将有效数字理解为最高数字不为零的实际能测量的数字。
2.8.1有效数字的运算规则
(1)加减法 运算结果的有效数字位数取决于这些数据中绝对误差最大者
(2)乘除法 运算结果的有效数字位数取决于这些数据中相对误差最大者。
在学习有效数字及其运算规则时还应特别注意以下几点:
1.一般有效数字的最后一位数字有士1个单位的误差。
2.运算中,首位数字≥8时,有效数字可多记一位。
3.改换单位不能改变有效数字的位数。例如2.0g是两位有效数字,不能改写为2000mg,应写成2.0х103mg,仍然为两位有效数字。
4.pH, pM. lgK等有效数字位数,按照“对数的位数与真数的有效数字位数相等,对数的首数相当于真数的指数”的原则来定,例如[H+]=6.3×10-11,两位有效数字,所以pH=10.20,不能写成pH=10.2或者写成pH=10,所以pH的小数部分才为有效数字。pM.lgK也是如此。
5.在表示分析结果时,组分含量≥10%时,用四位有效数字,含量为1%~10%时用三位有效数字,表示误差大小时有效数字常取一位,最多取两位。
2.8.2 数字修约规则
按照“四舍六入五留双”规则,当测量值中被修约的那个数<4时舍去尼数, ≥6时进位;当测量值中被修约的那个数=5时,若5后数字不为0,一律进位, 5后无数或为0, 5前是奇数则将5进位, 5前是侧数则将5含去,简称“奇进偶舍”。例如将下列有效数字修约为三位有效数字时,结果为:
13.148→13.1
17.3976→ 17.4
0.2736→0.274
175.5 → 176
176.5 →176
22.451→ 22. 5
183. 5→184