Please enable JavaScript to view this site.

Navigation: 使用 PRISM 进行统计分析 11 > 描述性统计

调和均数、二次均数、修剪均数与温莎化均数

Scroll Prev Top Next More

调和平均数

Prism 通过先将所有数值转换为倒数,再计算这些倒数的平均值及其置信区间,从而计算调和平均数及其置信区间。调和平均数即该平均值的倒数。如果数值均为正数,则数值越大,其权重实际上越小。调和平均数最常用于计算一组速率或速度的平均值。

当数据集的倒数形成近似高斯分布的对称分布时,使用调和平均数是合理的。

平方平均值

Prism 通过以下步骤计算平方均值及其置信区间:首先将所有数值平方(即数值自乘),然后计算这些平方值的均值及其置信区间。平方均值即该均值的平方根。平方均值也称为均方根。  

当数据集的平方集合形成近似高斯分布时,使用平方均值是合理的。

截尾均值与温莎化均数

截尾均值或温莎化均数的原理在于抑制最大值和最小值对计算结果的显著影响。在计算截尾均值或温莎化均数之前,必须先确定要忽略或降低权重的最大值和最小值的数量。若将 K 设为 1,则仅对最大值和最小值进行特殊处理;若将 K 设为 2,则对两个最大值和两个最小值进行特殊处理。K 必须预先设定。 有时 K 设为 1,有时设为数据总数的一个较小比例,因此当数据量较大时,K 的值也会相应增大。

要计算截尾均值,只需删除 K 个最小值和 K 个最大值,然后计算剩余数据的均值。

要计算温莎化均数,需将 K 个最小值替换为第 K+1 位的数值,并将 K 个最大值替换为第 N-K-1 位的数值,然后计算数据的均值。

截尾均值和温莎化均数的优势在于,它们不受单个(或少数几个)极高或极低值的影响。Prism 不会计算这些值。

 

众数

众数是指出现频率最高的数值。对于精度至少达到几位数的测量值,众数没有实际意义,因为大多数数值都是唯一的。但对于只能取整数值的变量,众数可能很有用。虽然众数通常被列入此类列表中,但它并不总是能准确反映分布的中心。 设想一项医疗调查,其中一个问题是“您做过几次手术?”在许多人群中,最常见的回答将是零,因此零就是众数。在这种情况下,有些数值会高于众数,但没有数值低于众数,所以众数并不是量化分布中心的一种方法。