平均值的标准偏差 平均值的标准偏差例题


汽车引擎盖表面缺陷分析

以下表格详细记录了通过观察在汽车引擎盖新喷漆工序底漆表面所发现的缺陷数量。

汽车引擎盖喷漆表面缺陷统计

为了更直观地了解这些数据,我们构建了相应的直方图:

请注意,缺陷数量是一个离散变量。通过直方图或表格数据,我们可以得知:

至少存在3处缺陷的样本占比为39/50,即0.78倍的比例。而缺陷数量在0至2之间的样本占比为11/50,即0.22倍。这些比例均表示相对频率。

数据可视化与汇总

茎叶图与直方图为我们提供了样本数据的可视化展示,具体包括数据分布的形态、数据的中心趋势以及数据的离散程度或变异性。采用数据化方法分析数据的中心趋势和离散度对我们理解数据非常有帮助。

若X1, X2, ..., Xn为样本中的观测值,那么衡量样本中心趋势的关键指标是样本平均数

需注意,样本平均数x-bar是n个观测值的算术平均。以晶圆金属层厚度为例,其平均数表达了样本数据的集中趋势。

衡量数据变差:样本方差与标准偏差

我们用样本方差来衡量样本数据的变差程度。

样本方差表示每个观测值与平均数之间的偏差的平方和,再除以样本数量减1。若样本没有波动,即每个观测值都等于平均数Xbar,那么样本的方差S平方为0。

值得注意的是,样本方差的单位是数据原始单位的平方,这有时会造成理解上的不便。我们更倾向于使用方差的平方根作为变异的度量指标,它被称为样本标准偏差(S)

标准偏差的优点在于,它以数据原始单位表示测量结果,使得变异度量更为直观。针对金属层厚度数据,我们进一步分析如下:

通过比较两个样本的变异情况,可以明显看出样本2的变异程度较大。在标准偏差的表述下,样本1和样本2的差异得以清晰体现。

对于第三个样本,其标准偏差S为2,与样本1的标准偏差相同。比较这两个样本,我们可以得出它们相对于平均值的变异或离散程度是相同的,这便是标准偏差的实质含义。

标准偏差主要反映的是数据相对于其平均值的离散程度,而不能直接反映数据的大小或范围。

手持计算器常被用于计算样本的平均值和标准偏差。从计算效率的角度考虑,使用上述公式可以在计算器上减少数据输入的次数。许多价格适中的手持计算备自动计算平均值和标准偏差的功能。