中华人民共和国国家标准
GB/T8056-2008代替GB/T80561987
数据的统计处理和解释 指数分布样本离群值的判断和处理
Statistical interpretation of data-Detection and treatment of outliersin the sample from exponential distribution
中国国家标准化管理委员会 中华人民共和国国家质量监督检验检疫总局 发布
目次
前言 引言1范围2规范性引用文件3术语、定义和符号3.2符号和缩略语 3.1术语和定义.4离群值判断4.1离群值的来源与判定4.2离群值的三种情形 4.3检出离群值个数的上限4.4单个离群值情形4.5多个离群值情形5离群值处理5.1处理方式5.3备案 5.2处理规则6单个离群值的判断规则6.1检验统计量的选择6.2上侧情形的检验规则 6.3 下侧情形的检验规则6.4双侧情形的检验规则7多个离群值的判断规则7.1检验步骤8定数截尾样本离群值的判断规则 7.2多个离群值检验示例8.1定数截尾样本8.2离群值的检验规则8.3定数截尾样本离群值检验示例附录A(规范性附录)临界值表 参考文献. 15
前言
本标准代替GB/T8056-1987《数据的统计处理和解释指数样本异常值的判断和处理》.本标准与GB/T8056-1987相比较,技术内容的变化主要包括:
一增加了术语、定义和符号;一将术语“检出异常值”和”高度异常值”分别改为“歧离值”和“统计离群值”,并进一步明确了二-一增加了检出水平和剔除水平的定义; 者的含义及相互差异;一检出水平由原标准中“检出水平一般取为1%,5%或10%"改为"除非根据本标准达成协议的各方另有约定,检出水平应为0.05”:一明确规定剔除水平的值除非根据本标准达成协议的各方另有约定,剔除水平应为0.01;增加了各种情形“统计离群值”的检验步骤; “一将”没有异常值”和"没有高度异常的异常值”分别改为”未发现离群值”和”未发现统计离群值”:一增加了双侧离群值检验、多个离群值检验、定数截尾样本离群值检验的示例.
本标准的附录A是规范性附录.
本标准由全国统计方法应用标准化技术委员会提出并归口.
本标准起草单位:宁波工程学院、中国标准化研究院、北京大学、上海师范大学、福州春伦茶业有限公司.
本标准主要起草人:荆广珠、丁文兴、于振凡、梁方楚、孙山泽、费鹅良、傅天龙.
本标准所代替标准的历次版本发布情况为:
GB/T
引言
从事科学研究、工农业制造以及管理工作都离不开数据,而对这些数据的整理、分析和解释都离不开统计方法.统计学是研究数字资料的整理、分析和正确解释的一门学科.人们各自从不同的来源取 得各种数字资料,这些数字资料通常都是杂乱无章的,必须经过整理和简缩才能利用,使用完善的统计方法就可使数据整理、排列的有条有理,用图形或少量的几个重要参数,就可将大量数据的特征表达出来,这样既可避免不正确的解释,又可将获得满意数据的成本降到最低限度,提高了经济效益.
《数据的统计处理和解释》含有多项国家标准,它们是:
统计容忍区间的确定(GB/T3359)均值的估计和置信区间(GB/T3360)-在成对观测值情形下两个均值的比较(GB/T3361)二项分布参数的估计与检验(GB/T4088)正态性检验(GB/T4882) 泊松分布参数的估计与检验(GB/T4089)正态样本离群值的判断和处理(GB/T4883)正态分布均值和方差的估计与检验(GB/T4889)一正态分布均值和方差检验的功效(GB/T4890)伽玛分布(皮尔逊Ⅲ型分布)的参数估计(GB/T8055) I型极值分布样本离群值的判断和处理(GB/T6380)指数分布样本离群值的判断和处理(GB/T8056)
本标准尚无相应的国际标准.
指数分布样本离群值的判断和处理 数据的统计处理和解释
1范围
本标准规定了判断和处理来自指数分布的样本中离群值的一般原则和实施步骤.本标准适用于来自指数总体的样本.
2规范性引用文件
下列文件中的条款通过本标准引用成为本标准的条款.凡是注日期的引用文件,其随后的修改单(不包括勘误的内容)或修订版本均不适于本标准.然面,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本,凡是不注日期的引用文件,其最新版本适用于本标准.
GB/T4086.4统计分布数值表F分布分位数表 ISO3534-1统计学词汇及符号第1部分:一般统计术语与用于概率的术语ISO3534-2统计学词汇及符号第2部分:应用统计
3术语、定义和符号
于参考,某些术语直接引自上述标准. ISO3534-1、ISO3534-2确立的术语、定义和符号以及下列术语、定义和符号适用于本标准,为便
3.1术语和定义
3. 1. 1
指数分布exponential distribution
具有下述分布函数的连续型分布,
其中β>0.
3. 1. 2
离群值outlier
注:离群值按显著性的程度分为歧离值和统计高群值. 样本中的一个或几个观测值,它们离开其他观测值较远,暗示它们可能来自不同的总体.
3.1.3
统计离群值statisticaloutlier
在别除水平(3.1.6)下统计检验为显著的离群值.
3.1. 4
歧离值straggler
在检出水平(3.1.5)下统计检验为显著,但在剔除水平(3.1.6)下不显著的离群值.
3. 1. 5
检出水平detection level
为检出离群值面指定的统计检验的显著性水平.
注:除非根据本标准达成协议的各方另有约定,检出水平应为0.05.