1、概述。
涉及以下几种手段:
1.14d检查法
1.2Q检查法
1.3Grubbs检查法
1.4偏置-峰值数据分布正态试验方法
1.5相对极差
1.6STD、RSD
说明:这个文件里的公式都是excel公式,那种大的计算公式懒得敲。
在上述6种手段中,1-3是消除偏离值,4是消除偏离值。详细信息请参见GB/T 4883-2008偏转-峰度检查法,5-6是对总体方差图的判断。
2、分散。
照片来自百度,侵删。
离散度,英文名称Measures of Dispersion是通过随机观察变量的每个值之间的差异来衡量风险大小的指标。
正义来自百度百科。
2.1相对极差:
示意图2.1
极差:
对比上图,极差是离散的判断,最基本的计算,所以也叫全距离。
相对极差:
通过比较上图,可以发现,引入平均值后,对相同的极度数据可以表示不同的方差。
但是相对的极差并不比极差显著。
2.2STD、RSD:
示意图2.2
STD:
比较示意图2.2,两组数据集的离散是一致的,但两组数据集实际上不在一个类别中。一个属于1以下,一个属于10以上。标准差是每个值与平均值的比较。因为乘法关系扩大了这个差异。对于1、2、3、4、5、1、2、2、5、5等数据,极差无法处理。标准差可以清楚地提供方差图的差异。
可以看到以下示例。
示例图2.2
RSD:
比较示意图2.2表明,相对标准差根据两组的类别表示不同数据的差异。同样,这一平均值使10.112和0.112两组数据集的精度明显。
差别了,一个是五位有效数字一个是三位有效数字,同样波动下,显然五位有效数字这组精密度更好。3、离群值
上面的方法做了离散度的判断,那么具体有哪些值离群了呢?是否可以非主观的去判断离群值从而方便查找原因和数据处理呢?
有。
3.14d检验法:很简单的小方法,问题也不少,先说计算。
示意图3.1
4d检验法
适用于10个数据以上的处理,如果数据量在5~10,可以酌情使用2.5d,问题是数据量不够的时候(<10),容易无法正确判断是否离群值。
3.2Q检验法:适用于10个数据以内的处理。
示意图3.2
Q检验法:
3.2.1选取可疑值:
3.2.2计算测定次数
3.2.3与可疑值最接近的值的绝对差值
3.2.4Q值
3.2.5查表
这里解释一下,数据是5个没错,但是因为查询表返回的数值是以0.01那行开始计算的,index的作用是返回对应行、列的数值,那么查出来0.01那一列的数据,如果用5,就会查到7和0.01交叉的数值,但是数据实际是n=3开始的,所以要-2。
3.2.6判断
3.3Grubbs检验法:
示意图3.3
Grubbs检验法:
3.3.1上侧
3.3.2下侧
3.3.3判断
IF(上侧>临界值,"上侧检出:"&MAX(范围),"上侧未检出")&","&IF(下侧>临界值,"下侧检出:"&MIN(范围),"下侧未检出")
稍做一下改变:
示例图3.3.3-1
再做一下改变:
示例图3.3.3-2
还做一下改变:
示例图3.3.3-3
对于检测来说,如果整组数据RSD符合就没必要再去剔除离群值。
3.4偏态-峰态数据分布正态性检验法:
数据是正态分布以上手段才是有效的。那么就验证正态分布吧。
示意图3.4
偏态-峰态数据分布正态性检验法:
3.4.1母体方差
解释一下power函数中的2改3、改4就可以。
3.4.2A偏态
解释一下,0.5即开方。
3.4.3B峰态
3.4.4判断
偏态判定:IF(偏态<INDEX(XLOOKUP(置信概率&"偏态A1"查询范围,返回范围),MATCH(COUNT(范围),范围,0)),"通过","不通过")
解释一下,match中的0为精确查找,就是=。
峰态判定:IF(AND(INDEX(XLOOKUP(置信概率"峰态B1",查询范围,返回范围),MATCH(COUNT(数据量,范围,0))<峰态,峰态<INDEX(XLOOKUP(置信概率&"峰态B2",查询范围,返回范围),MATCH(COUNT(范围),范围,0))),"通过","不通过")
最终判定:
这东西没有一定数据量没啥意义,一般会结合Grubbs剔除异常值后去做,先上100个数据。
1.《【excel怎么算rsd】错误处理的部分应用——离群》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《【excel怎么算rsd】错误处理的部分应用——离群》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/2543520.html