标准偏差和范围是一个数据集的蔓延这两项措施。每个数字都以自己的方式告诉我们怎么间隔出的数据,因为他们都变化衡量。依赖于一个非常简单的公式,从最大值减去最小值的数据值的范围内。标准偏差是变异的一个更可靠的措施,然而,不容易受到异常值,标准偏差的计算比取值范围为更多地参与。虽然有一个没有被明确规定的范围和标准偏差之间的关系,有一个经验法则,可以是有用的。
范围规则的范围内规则告诉我们的样品的标准偏差是约等于四分之一的范围内的数据。换言之= (最大-最小)/ 4。这是一个非常简单的公式来使用,而只应作为一个非常粗略的估计的标准偏差。
要看到的范围规则是如何工作的一个例子,我们看看下面的例子。假设我们开始的数据值12,12,14,15,16,18,18,20,20,25。这些值均值为17,标准差约4.1。相反,如果我们先计算我们的数据范围为25 - 12 = 13,然后将这个数字除以4,我们有我们的标准偏差估计为13/4 = 3.25。此数字是比较接近真正的标准偏差,以及良好的粗略估计。
为什么它的工作呢?它可能看起来像范围规则是有点怪。为什么它的工作呢?似乎不完全是任意的,只是划分范围由四个?为什么不,我们把不同的数字?实际上是幕后的一些数学的理由。
回想一下钟形曲线的属性和从标准正态分布的概率。一个特征,与一定数量的标准偏差范围内的数据量:约68%的数据是平均一个标准差内(高于或低于)。约95%的数据是两年内平均标准偏差(高或低)。三个标准偏差以内(高或低)平均约99%。的数量,我们将使用95%。我们可以说,95%来自两个标准偏差低于平均值平均值的两个标准差以上,我们的数据,我们有95%。因此,我们的几乎所有的正态分布会伸出过线段,这是一个总的四个标准偏差长。
不是所有的数据是正态分布的钟形曲线的形状。但最重要的数据表现良好,以至于去远离平均值的两个标准差捕获几乎所有的数据。我们估计说四个标准偏差是约的范围大小,这样被一分为四的范围是一个粗略的近似的标准偏差。
用途范围规则在一些设置的范围内的规则是有帮助的。首先,它是一个非常快的估计的标准偏差。标准偏差要求我们先找到的平均值,再减去这意味着从每个数据点,方形的差异,添加这些,然后除以一个小于数据点的数量,(最终)的平方根。另一方面,的范围内规则只需要一次减法和一次除法。
其他地方的范围规则是有帮助的是,当我们有不完整的信息, 如确定样本大小的公式,需要三个方面的信息:错误,所需的保证金水平的信心和我们正在调查人口的标准偏差。很多时候,它是不可能知道的总体标准偏差。随着一系列规则,我们可以估计统计,然后知道如何大,我们应该使我们的样本。
|