第四节 实验数据的处理
实验数据处理与结果分析是实验的重要环节,实验数据处理是指从获得数据开始到得出最后结论的整个加工过程,包括数据记录、整理、计算、分析和绘制图表等。数据处理是实验工作的重要内容,涉及的内容很多,这里仅介绍有效数字的概念以及如何用有效数字表达测量的结果。另外,需要特别指出的,如今的计算均是计算器或计算机完成,似乎有效数字及其运算规则不存在或不重要了,其实不完全是,最基本的概念和规则仍然存在。
一、有效数字及其运算规则
(一)有效数字的意义
在检验工作中,为保证结果的准确性,除要准确测量外,还要正确记录和处理数据。
实际能测量到的数字称为有效数字。它由所有准确数字和最后一位欠准数字组成,最后一位数字的欠准程度通常只能上下相差1单位。
例5-7 使用25ml移液管量取25ml溶液,应记为25.00ml,四位有效数字,小数点后第二位上的0是欠准数字,即有±0.01ml的误差;在分析天平上称量0.1521g的物质,最后一位1是欠准数字,即:(0.1521±0.0001)g。一支25ml的滴定管,其最小刻度为0.1ml,溶液的体积在20.9~21.0ml刻度之间,再进行估读,若管内溶液的体积为20.97ml,前三位是准确数字,最后一位“7”是欠准数字。
由此可见,有效数字不仅可反映数量的大小,还可反映测量的精确程度。
(二)有效数字的位数
因为有效数字需反映测量准确到什么程度,所以记录一个测定值时,一般只保留一位欠准数字。记录的位数超过恰当的有效数字的位数再多,也不会提高测量值的实际可靠性,反而会给运算带来麻烦。当然,现在计算均是有计算器或计算机轻松完成,使得我们对运算的麻烦不太在意了。
常量分析中一般要求保留四位有效数字以表明分析结果有千分之一的准确度。例如,滴定管、移液管、容量瓶等取4位有效数字;分析天平(万分之一)取小数点后4位数字;标准溶液的浓度,用4位有效数字表示。
数据中数字1~9都可作为有效数字,数字0在数据中具有双重作用。
1.数据中的“0”
(1)数字中间和数字后边的“0”都是有效数字。如5.108和1.510均为4位有效数字。
(2)数字前边的“0”不是有效数字。如:0.0518和5.18×10-2均为3位有效数字。
需注意的是,对于较大和较小的数据,常用10的方次表示。例:1000ml,若保留3位有效数字,可写成1.00×103ml。
2.改变单位,不改变有效数字的位数。例:4.01ml和4.01×10-3 L的有效数字都是三位。
3.结果首位为8或9时,有效数字可以多计一位。例:90.0%,可视为四位有效数字。
4.pH、p K等对数值,其小数点后的数字位数为有效数字位数,整数部分只代表该数的方次。
例5-8 pH=2.299→[H+]=5.02×10-3mol/L,为三位有效数字。
5.测定次数、倍数、系数、分数等非测量数字不记位数。
(三)有效数字的修约规则
有效数字的修约应遵从修约后的数值与修约前相比,差值最小的原则,也就是通常所说的四舍六入五成双的原则,即:
1.拟取舍数字的最左一位数字小于等于4时,舍弃有效数字后的数字。
例5-9 将下列测量值修约到小数点后二位数:
2.0149→2.01
2.拟取舍数字的最左一位数字大于等于6,或者是5且其后有并非全部为0的数字时,有效数字最后一位数加1,并舍弃有效数字后的数字。
例5-10 将下列测量值修约到小数点后二位数:
3.2364→3.24
3.125001→3.13
3.拟取舍数字的最左一位数字为5时,而后面无数字或全部为0且5前面为奇数则进1,5前面为偶数则舍弃有效数字后的数字。
例5-11 将下列测量值修约到小数点后二位数:
3.155→3.16
4.125→4.12
8.75500→8.76
8.76500→8.76
需注意的是,只允许对原测量值进行一次修约至所需位数,不能分次修约。
例5-12 将3.15452修约到小数点后二位数,不能先修约为3.155,再修约为3.16,只能为3.15。
4.在相对标准差(RSD)的数字修约中,采用“只进不舍”的原则。
例5-13 1.23%→1.3%,0.81%→0.9%。
需要强调的是,这一修约规则常常被忽视。
(四)有效数字的运算
加减运算结果的位数以小数点后位数最少的数据的位数为准,即取决于绝对误差最大的数据位数。
例5-14 0.0121+25.64+1.057=26.71
乘除运算以有效数字位数最少者为准,即取决于相对误差最大的数据位数。
例5-15 0.0121×25.64×1.057823=0.328
需要注意的是:
1.对数 对数的有效数字只计小数点后的数字位数,即有效数字位数与真数位数一致;
2.常数 常数的有效数字可取无限多位;
3.第一位有效数字等于或大于8时,其有效数字位数可多算一位;
4.在计算过程中,为减少取舍误差,可暂时多保留一位有效数字(不修约);算出结果后,再修约至应有的有效数字位数。
5.相对平均偏差或相对标准差取1~2位有效数字即可。
例5-16 阿司匹林的含量测定(《中国药典》2015年版二部):称取阿司匹林0.4015g,用已经标定好的0.1mol/L氢氧化钠滴定液(F=1.025)滴定,终点时用去氢氧化钠滴定液21.78ml,空白实验用去氢氧化钠滴定液0.06ml,已知每1毫升的氢氧化钠滴定液(0.1mol/L)相当于18.02mg的C9H8O4,计算阿司匹林的含量。
阿司匹林百分含量=V×F×T/W×100%=(21.78-0.06)×1.025×0.01802/0.4015×100%=99.92%,修约为99.9%。
(五)药品检验操作中的有效数字应用
1.精密称定
指称取重量应准确至所取重量的千分之一。
2.称定
指称取重量应准确至所取重量的百分之一。
若精密称定样品的质量为2g,用千分之一天平即可。若精密称定样品的质量为0.2g,用万分之一天平。若精密称定样品的质量为20mg,则需用十万分之一天平。
3.精密量取
指量取体积的准确度应符合国家标准中对该体积移液管的精度要求。如精密量取5.00ml,应选用5ml移液管;量取5.0ml,应选用5ml刻度吸管。
4.量取
指可用量筒或按照量取体积的有效数位选用量具。如量取5ml,应选用5~10ml量筒。
需要特别指出的是,先修约后计算的实质,是因为不修约掉的数据参与计算对最终结果的有效数字是没有贡献的,反而平添很大麻烦,而这种麻烦在没有计算器或计算机以前是很被在意的,如今,计算常常用计算器或者由计算机按公式直接计算,这种麻烦就“看不见”了。因此,完全可以不经“先修约后计算”的过程,直接得到最终结果,只是最终结果的有效位数,仍然取决于:①加减运算结果的有效数字位数由小数点后位数最少的数据决定,即取决于绝对误差最大的数据位数;②乘除运算结果的有效数字位数由最少者决定,即取决于相对误差最大的数据位数;③混合运算同时遵循上述二个规律。
二、可疑数据(离群值)的取舍
在测量中有时会出现偏离平均值很多的测量值,称作可疑数据或逸出值。例如,测量时得到4个数据:20.40、20.25、20.23和20.26ml,其中20.40与其他数值相差较大,为可疑数据。但是舍弃可疑数据也要有根据,而不应该随意取舍。
在舍弃可疑数据之前,应首先检查实验记录是否正确,计算过程有无错误,实验过程中是否曾有不正常现象发生等。如能找到确实的原因,则可疑数据可以舍弃。若无确实的原因,则应采取统计检验的方法,以决定可疑数据的取舍。
对于可疑数据的取舍没有一个确定的、广泛适用的规定,现介绍三种常用的方法:Q检验法、G检验法及4法。
(一)Q检验法(3~10次测定适用,且只有一个可疑数据)
1.将各数据从小到大排列,x1,x2,x3……xn,其中x1或xn为可疑数据;
2.计算序列中最大值和最小值之差(极差),即(xn-x1);
3.计算可疑数据与其邻近值之差,即(x可疑-x邻);
4.计算舍弃商
5.根据测量次数n和置信度P查Q临界值表(见表5-1)得Q表;
6.比较Q表与Q计
若:Q计≥Q表,则可疑数据应舍弃;
Q计<Q表,则可疑数据应保留。
例5-17 某标准溶液六次标定的浓度校正值因子(F)为:1.015、1.018、1.016、1.015、1.019、1.026,其中1.026是否应该舍弃(置信度90%)?
将数据按由小到大的顺序排列:1.015、1.015、1.016、1.018、1.019、1.026
查Q临界值表,当测量次数n=6时,Q0.90=0.56
由于Q计>Q0.90,所以1.026应该舍弃。
(二)G检验法(Grubbs法)
Grubbs法适用范围较Q检验法广,效果也更好,G检验法的检验步骤如下:
1.将各数据从小到大排列,x1,x2,x3……xn,其中x1或xn为可疑数据;
2.计算 -x(包括可疑值x1、xn在内);
4.计算包括可疑值在内的标准差S;
5.计算舍弃商T
6.查T值表得Tα,n(见表5-2),α为显著性水准,n为测量次数。
7.比较T计与Tα,n:
若:T计≥Tα,n,则舍去可疑值;
T计<Tα,n,则保留可疑值。
例5-17中,-x=1.018,S=0.0042,T计==1.90
查表T0.05,6 =1.82,T计>T0.05,6,故1.026这个数据应舍弃。
(三)4法
4d—法又称四倍法或Chauvenet法,这种方法虽然存在较大的误差,但由于处理比较简单,不必查表,所以仍为人们所采用。其处理方法为:
2.将可疑值与平均值进行比较,若两者的绝对差值大于4,则可疑值舍去,否则保留。
现将例5-17中的数据按4法处理如表5-3:
4=4×0.002=0.008
故可疑值1.026应舍去。
需要再次强调的是,测量数据不能像体育比赛打分时那样,去掉最大值或最小值。测量的次数也不能随意增加,然后剔除不想要的数。必须是给可疑数据找到引起的原因,或通过统计的方法,看是否可以舍去,否则仍应视作有价值数据。