立刻注册计量论坛 交流工作中的点滴
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
本帖最后由 史锦顺 于 2017-11-10 08:18 编辑
–
为什么说方差之路走不通?
–
史锦顺
–
测量仪器的误差,分为系统误差与随机误差。
系统误差中包含恒值的部分,也包括长稳及温度等的环境影响。长稳中包括有规的部分,如线性漂移(老化),也包括无规慢波动(日以上的慢波动)。
随机误差是快速变化的随机量。通过实验观察,可知随机误差有四个性质:单峰性、对称性、抵消性、有界性。
随机误差的概率密度函数是正态分布。此时有:
EX= μ
DX= σ2
贝塞尔公式为
σ = √[1/(N-1)∑(Xi-X平)2] (1)
σ = √[1/(N-1)∑(ξi – ξ平)2] (2)
公式(2)与公式(1)等效。公式(2)说明,贝塞尔公式是随机误差ξ的公式,它不包含系统误差β的因素,对系统误差无效。贝塞尔公式不能用来表征系统误差。
–
不确定度体系处理测量计量问题的基本着眼点是“方差”。
不确定度体系包含有A类标准不确定度uA、B类标准不确定度uB,合成标准uC,扩展不确定度U,这三层架构设置的目的是方差合成。
不确定度体系的“取方差”、“方差合成”、“方差扩展”的三步曲,体现它的“方差路线”。
–
史锦顺认为:方差之路走不通。这个判断的根据如下。
–
1 系统误差是恒值,方差为零
由方差的定义可知,常量的方差为零。
用塞尔公式求测得值的方差,是把测得值分成两部分:大的常量与小是变量。贝塞尔公式的基本单元是M-M平,已消除大的常量,被统计的量是差值,即小变量。这个小变量是随机误差。
在时域统计的时段内,就是在重复测量N次(例如20次)的时段内,系统误差为恒值,系统误差的方差为零。
–
2 取方差不能处理系统误差
测量仪器的绝大多数,以系统误差为主。贝塞尔公式仅能表征随机误差,而不能表征系统误差,因此,用取方差的办法处理测量计量问题,必然抹煞系统误差的存在与作用。
–
3 两类统计方式的混淆
测量计量的统计方式有两种:时域统计和台域统计。
在仪器生产厂,为评价一批产品的性能,可能进行“台域统计”,就是用N台(例如20台,都成文中实例取200台和400台)测量同一计量标准,统计的对象是在各台中系统误差的情况,分布是指各台的系统误差大小不同。说均匀分布、正态分布都是可能的。都成用大量仪器的实际测量,得到是“正态分布”的结论,是值得称赞的,它否定了GUM及许多人的“均匀分布”的设想。但这里所谓系统误差的“均匀分布”、“正态分布”都是针对“台域统计”而言的。并不是测量计量要处理的通常的情况。
请注意:生产厂的出厂检验、用户的验收,此后的主导业务:计量、应用测量,所面临的情况都是“一台仪器重复测量一个量”,不是“台域统计”,而是“时域统计”。在时域统计中,仪器的误差是“有偏正态分布”,不是无偏正态分布。系统误差是恒值,不能取方差。取方差,仅能表征随机误差,而抹煞系统误差的作用。方差之路行不通。
–
通常认为的“均匀分布”或都成实验得到的“无偏正态分布”都是不能用的,统计方式不对。试验的统计方式,必须与实践的统计方式一致。测量计量实践的统计方式是时域统计,试验的统计方式也必须是时域统计,统计结果才有用处。
GUM给出的uB=MPEV/√3,都成给出的uB=MPEV/3,都是台域统计的结果,对测量计量的时域统计,没有用处。系统误差不能取方差,对系统误差,除以任何数或乘以任何数都是没有道理的。
–
4 系统误差没有方差,无法参与“方差合成”。
–
5 相关性判别公式的误导
方差合成,取“方和根”的条件是参与合成的量“不相关”。
误差量相关性的判别公式,皮尔逊公式,仅仅对随机误差有效。对系统误差,皮尔逊公式的灵敏度是零,因此它不能判别系统误差的相关性。
–
国家计量规范《JJF1059.1》关于有系统误差则协方差为零的条款如下:
4.4.4.1 协方差的估计方法
a)两个输入量的估计值xi与xj的协方差在以下情况时可取零或忽略不计:
1)xi和xj中任意一个量可作为常数处理;
2)在不同实验室用不同测量设备、不同时间测得的量值;
3)独立测量的不同量的测量结果。
–
这个4.4.4.1 a)条款,就是把皮尔逊公式错用于系统误差的结果,错了。这个错误,源于GUM(JCGM-100-2008:F.1.2.1)。GUM说按皮尔逊公式(5.8)计算。由于皮尔逊公式对系统误差的灵敏度为零,从而对系统误差的相关性判别,也就全错了。
不确定度体系下的误差合成,老生常谈:“假设不相关”。假设而不求证,是空的、伪的、错的。恰恰相反,崔伟群先生证明:系统误差相关系数的绝对值是1。史锦顺证明:系统误差合成的交叉系数的绝对值是1。“假设不相关”不成立,于是,一律“方和根”的合成方法就不成立。这是“方差之路”走不通的一个重要关卡。
–
6 包含系数k乘错地方
一台仪器的误差,在时域统计中,呈“有偏正态分布”,这是高斯误差曲线(参见德国马克10元纸币)的全貌,一切能完成独立测量任务的仪器,必然如此。就是有特征值:
EX= μ
DX= σ2
量值的期望值μ,用X平近似表达,代表真值与系统误差。在有计量标准的计量场合,可以测定系统误差。真值已知,μ-Z就是系统误差β。因此,“有偏正态分布”的偏倚值的作用,正是系统误差的作用。
以往的大量研究,包括国际规范与中国国家规范,焦点都集中在σ上,而忽略了更为重要的偏倚值,即系统误差值,是不妥的。是没有深入理解高斯曲线的精髓。前几天,本人刊出那张德国马克,目的不是证明正态分布曲线的存在,而是提醒人们全面、正确认识“有偏正态分布”的重要性。
–
不确定度体系,把包含因子乘在uC上,就是错把“有偏正态分布”错当成“无偏正态分布”的结果。包含因子,只对“无偏正态分布”有效,只能乘在σ上。uC中包含有系统误差,在uC上乘k,错了。
–
如下示意图,表明包含因子k应乘在σ上,而不确定度体系把包含因子乘在R上,是严重的错误。不确定度体系之作法,扩大误差范围,却声称降低包含概率。正是:方差之路走不通,赔了夫人又折兵。
–
–