误差和分析数据的处理.docx
- 文档编号:1832942
- 上传时间:2022-10-24
- 格式:DOCX
- 页数:11
- 大小:66.32KB
误差和分析数据的处理.docx
《误差和分析数据的处理.docx》由会员分享,可在线阅读,更多相关《误差和分析数据的处理.docx(11页珍藏版)》请在冰豆网上搜索。
误差和分析数据的处理
第三章误差和分析数据的处理
教学要求:
1、了解误差的意义和误差的表示方法
2、了解定量分析处理的一般规则
3、掌握有效数字表示法和运算规则
重点、难点:
误差的表示方法
随机误差的正态分布
有效数字及运算规则
教学内容:
第一节误差及其产生的原因
第一节第二节第三节第四节第五节
一、误差:
测定结果与待测组分的真实含量之间的差值。
二、分类:
㈠、系统误差:
由某些确定的、经常性的原因造成的。
在重复测定中,总是重复出现,使测定结果总是偏高或偏低
1、特点:
重现性:
在相同的条件下,重复测定时会重复出现
单向性:
测定结果系统偏高或偏低
可测性:
数值大小有一定规律
2、原因:
1方法误差
2仪器和试剂误差
3操作误差
㈡、随机误差(偶然误差):
有不固定的因素引起的,是可变的,有时大,有时小,有时正,有时负。
1、特点:
符合正态分布
2、规律:
见第三节
第二节测定值的准确度与精密度
第一节第二节第三节第四节第五节
准确度与精密度来评价测定结果的优劣
一、准确度与误差:
1、准确度:
真值是试样中某组分客观存在的真实含量。
测定值X与真值T相接近的程度称为准确度。
测定值与真值愈接近,其误差(绝对值)愈小,测定结果的准确度愈高。
因此误差的大小是衡量准确度高低的标志。
2、表示方法:
绝对误差:
Ea===x-T(如果进行了数次平行测定,X为平均值)
相对误差:
Er===%
3、误差有正、负之分。
当测定值大于真值时误差为正值,表示测定结果偏高;
当测定值小于真值时误差为负值,表示测定结果偏低;
二、精密度与偏差
1、精密度:
一组平行测定结果相互接近的程度称为精密度
2、表示方法:
用偏差表示
如果测定数据彼此接近,则偏差小,测定的精密度高;
如果测定数据分散,则偏差小,测定的精密度低;
⑴、绝对偏差、平均偏差和相对平均偏差:
绝对偏差:
di=xi-(i=1,2,…,n)
平均偏差:
==
相对平均偏差:
dr=%
⑵、标准偏差和相对标准偏差
总体:
一定条件下无限多次测定数据的全体
样本:
随机从总体中抽出的一组测定值称为样本
样本容量:
样本中所含测定值的数目称为样本的大小或样本容量。
若样本容量为n,平行测定数据为x1、x2、…、xn,则此样本平均值为x=
当测定次数无限多时,所得的平均值即总体平均值μ
=μ
当测定次数趋于无限时,总体标准偏差σ表示了各测定值x对总体平均值μ的偏离程度:
σ=σ2称为方差
但一般情况下μ是不知道的,故只有采用样本标准偏差来衡量该组数据的精密度,从而表示各测定值对样本平均值的偏离程度。
样本的标准偏差:
S=
n-1称为自由度,用f表示。
标准偏差比平均偏差能更灵敏地反映数据的精密度。
P47例
两组数据:
9.6,9.7,9.7,9.8,10.0,10.1,10.2,10.2,10.3,10.4;
9.3,9.8,9.8,9.9,9.9,10.0,10.1,10.2,10.3,10.5。
样本的相对标准偏差(变异系数):
Sr=
⑶、平均值的标准偏差:
多个样本测定,平均值的精密度比单次测定值的更高。
用平均值的标准偏差来衡量
平均值的标准偏差:
()
对于有限次数的测定则:
Sx=样本平均值的标准偏差
由上式可知:
增加测定次数可以减小随机误差的影响,提高测定的精密度。
⑷、极差:
又称全距,是测定数据中的最大值与最小值之差。
R=xmax-xmin
其值愈大表明测定值愈分散。
三、准确度与精密度的关系:
系统误差影响测定的准确度,而随机误差对精密度和准确度均有影响;评价测定结果的优劣,要同时衡量其准确度和精密度。
精密度高,准确度不一定高;
准确度高,精密度必然高。
第三节、随机误差的正态分布
第一节第二节第三节第四节第五节
一、频率分布:
1、频数:
测定值落在每组内的个数。
2、频率(相对频数):
数据出现在各组内的频率。
即频数与样本容量之比。
3、测定值出现在平均值附近的频率相当高,具有明显的集中趋势。
4、频率分布图显示了测定数据既有分散性而又具有集中趋势的分布特性。
二、正态分布:
㈠、正态分布的特点:
又称高斯分布,它的数学表达式即正态分布概率密度函数式为
y=f(x)=
y表明测定次数趋于无限时,测定值xi出现的概率密度
若以x值表示横坐标,y值表示纵坐标,就得到测定值的正态分布曲线。
曲线分析:
1、曲线有最高点,它对应的横坐标值即为总体平均值。
2、的数值决定了正态分布曲线在横坐标上的位置,反映了来自某一总体的测定值向某具体数值集中的趋势。
3、为总体标准偏差,是曲线两侧的拐点之一到直线x=的距离,它表征了测定值的分散程度。
4、值越小,表明测定值位于附近的概率越大,测定的精密度越高;
值越大,表明测定值位于附近的概率越小,测定的精密度越低;
综上所述:
一旦和确定后,正态分布曲线的位置和形状也就确定了,因此和是正态分布的两个基本参数,这种正态分布用N()表示。
㈡、定量分析中,来自同一总体的随机误差一般也是服从正态分布的。
正态分布曲线关于直线x=呈钟形对称,形象地反映了随机误差具有以下的特点和规律:
(随机误差的分布规律)
1、对称性:
绝对值相同的正、负误差出现的几率相等
2、单峰性:
小误差出现的几率大,大误差出现的几率小。
很大的误差出现的几率近于零
3、有界性:
随机误差的分布具有有限的范围,其值大小是有界的,并具有向μ集中的趋势。
三、标准正态分布:
将正态分布曲线的横坐标改用u来表示(以σ为单位表示随机误差)
u=(u的定义式)
将上式代入高斯方程并微分得
f(x)dx=
u称为标准正态变量,那麽高斯方程即转化为
y=
结论:
总体平均值为、总体标准偏差为得任一正态分布均可化为=0,2=1的标准正态分布,以N(0,1)表示。
曲线的形状与和的大小无关。
四、随机误差的区间概率
1、概率积分表:
正态分布曲线与横坐标之间所夹的总面积,就等于概率密度函数从-∞至+∞的积分值。
它表示来自同一总体的全部测定值或随机误差在上述区间出现概率的总和为100%,即为1。
=1
欲求测定值或随机误差在某区间出现的概率P,可取不同的u值对上式积分求面积而得到,从而可得到概率积分表供直接查用。
若区间为值,则应将所查得的值乘以2。
2、用途:
1求概率:
P53
2由概率确定误差界限:
第四节有限测定数据的统计处理
第一节第二节第三节第四节第五节
一、置信度与μ的置信区间
1、置信区间:
根据有限的测定结果来估计μ可能存在的范围
测量值所在u的范围称为置信区间。
该范围愈小,说明测定值与μ愈接近,即测定的准确度愈高。
2、置信度:
置信区间不可能以百分之百的把握将μ包含在内,有一定的概率。
测量值落在u范围内的概率称为置信度。
㈠、已知总体标准偏差时
x=u由u值则确定不同的区间概率。
1、如果用单次测定值来估计μ可能存在的范围,则可以认为区间x±1.96能以0.95的概率将真值包含在内。
即
μ=x±u
2、以样本平均值表示(因平均值较单次测定值的精密度更高),则μ=x
3、上述两式分别表示了在一定的置信度时,以单次测定值x或以平均值x为中心的包含真值的取值范围,即μ的置信区间。
在置信区间内包含μ的概率称为置信度,它表明了人们对所作的判断有把握的程度,由P表示。
4、在对真值进行区间估计时,置信度的高低要定得恰当。
在定量分析中,一般将置信度定为0.95或0.90。
5、置信区间的大小取决于测定的精密度和对置信度的选择,对于平均值来说还与测定的次数有关。
当一定时,置信度定的愈大,值愈大,即置信区间也愈大,过大的置信区间将使其失去实际意义。
若将置信度固定,当测定的精密度越高和测定次数越多时,置信区间越小,表明x或x越接近真值,即测定的准确度越高。
㈡、已知样本标准偏差s时:
1、t分布:
由英国统计学家兼化学家戈塞特(GossetWS)在1908年提出。
当时他采用的笔名为student,故称为t分布法。
tp,f=
(其中tp,f是随置信度P和自由度f而变化的统计量)
t分布是有限测定数据及其随机误差的分布规律。
随着测定次数增加,t分布曲线愈来愈陡峭,测定值的集中趋势亦更加明显。
当f→∞时,t分布曲线就与正态分布曲线合为一体,因此可以认为标准正态分布就是t分布的极限。
3、t值的计算值:
t值与标准正态分布中的u值不同,它不仅与概率还与测定次数有关。
不同的置信度和自由度所对应的t值见表3-2
随着自由度的增加,t值逐渐减小并与u值接近。
当f=20时,t与u已经比较接近。
当f→∞时,t→u,s→。
3、计算公式:
①μ=x±tp,fs
②μ=x±tp,fsx=μ=x±tp,f
由上式可知,P一定时,置信区间的大小与tp,f、s、n均有关,而且tp,f与s实际也都受n的影响,即n值越大,置信区间越小。
二、可疑测定值的取舍
1、可疑值:
在平行测定的数据中,有时会出现一二个与其它结果相差较大的测定值,称为可疑值或异常值(离群值、极端值)
2、方法
㈠、Q检验法:
由迪安(Dean)和狄克逊(Dixon)在1951年提出。
步骤:
1、将测定值由小至大按顺序排列:
x1,x2,x3,…xn-1,xn,其中可疑值为x1或xn。
2、求出可疑值与其最邻近值之差x2-x1或xn-xn-1。
3、用上述数值除以极差,计算出Q
Q=或Q=
4、根据测定次数n和所要求的置信度P查Qp,n值。
(分析化学中通常取0.90的置信度)
5、比较Q和Qp,n的大小:
若Q>Qp,n,则舍弃可疑值;
若Q<Qp,n,则保留可疑值。
中位数:
将全部测定值按大小顺序排列,当n为奇数时,位于正中间的数值即为中位值;当n为偶数时,中位数为正中间两数的平均值。
㈡、格鲁布斯法:
步骤:
1、将测定值由小至大按顺序排列:
x1,x2,x3,…xn-1,xn,其中可疑值为x1或xn。
2、计算出该组数据的平均值x和标准偏差s。
3、计算统计量G:
若x1为可疑值,则G==
若xn为可疑值,则G==
4、根据置信度P和测定次数n查表得Gp,n,比较二者大小
若G>Gp,n,说明可疑值相对平均值偏离较大,则舍去;
若G<Gp,n,则保留。
注意:
置信度通常取0.90或0.95。
三、显著性检验
用统计的方法检验测定值之间是否存在显著性差异,以此推测它们之间是否存在系统误差,从而判断测定结果或分析方法的可靠性,这一过程称为显著性检验。
㈠、样本平均值与真值的比较(t检验法)
1、原理:
t检验法用来检验样本平均值与标准值或两组数据的平均值之间是否存在显著性差异,从而对分析方法的准确度作出评价,其根据是样本随机误差的t分布规律。
2、步骤:
①、计算平均值和平均值的标准偏差。
②、由P57式μ=x±tp,fs=μ=x±tp,f
得:
==tp,fsx
得t==
根据上式计算t值。
③、查表得tp,f,比较t值
若t>tp,f,则二者之间存在显著性差异。
若t<tp,f,则二者之间无显著性差异,说明测定方法正确可靠。
(定量分析中,常采用0.95或0.90的置信度)
第五节有效数字及其运算规则
第一节第二节第三节第四节第五节
一、有效数字的意义和位数
1、举例说明:
天平称量要求保留小数点后4位数字
台秤称量要求保留小数点后1位数字
滴定管读数要求保留小数点后2位
在分析测定之中,记录实验数据和计算测定结果究竟应该保留几位数字,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 误差 分析 数据 处理