Please enable JavaScript to view this site.

1.输入数据

选择“列”表格和列散点图。如果您尚未准备好输入自己的数据,请选择样本数据集:频率分布数据和直方图。

2.选择分析

点击“分析”,然后从“列”数据分析列表中选择“频率”分布。

3.选择分析选项

累积?

频率分布中,每个箱子包含的数值数量位于定义该箱子的数值范围之内。在 累积 分布中,,每个箱子包含的数值数量位于范围之内 或者 箱子下方。根据定义,最后一个箱子包含数值总数。下图左侧示出了频率分布,右侧示出了相同数据的累积分布,两者均绘制每个箱子中的数值数量。

累积分布的主要优点是您无需决定箱宽。取而代之的是,您可以将精确累积分布制成表格,如下所示。数据集有250个数值,因此该精确累积分布有250个点,这使得它有点参差不齐。当您选择使用百分比而非分数制成累积频率分布的表格时,这些百分比实际上是百分位数,结果图有时称为 “百分比图”

相对频率或绝对频率?

选择 相对 频率用于确定每个箱子中数值的分数(或百分比),而非每个箱子中数值的实际数量。例如,如果45个数值中有15个数值落入一个箱子中,则相对频率为0.33或33%。

如果选择累积频率和相对频率,可以使用概率轴绘制分布图。以此方式绘图时,高斯分布呈线性。

箱宽

如果您选择累积频率分布,我们建议您选择创建精确的分布。在此情况下,您无需选择箱宽,因为每个数值均会单独绘出。

如需创建一个普通的频率分布,您必须决定一个箱宽。如果箱宽过大,只有几个箱子,则您无法很好地理解数值的分布方式。如果箱宽过小,则许多箱子可能只有几个值(或者没有值),因此相邻箱子中的数值数量可能随机波动,以至于您无法解数据的分布方式。

您需要几个箱子?部分取决于您的目标。部分取决于样本量。如果您有一个大样本量,您可以有更多箱子,且频率分布依然平滑。其中一条经验法则是箱子数量等于样本量以2为底的对数。在自动生成箱宽时,Prism将此作为其两个目标之一(另一目标是使箱宽为一个整数)。

下图示出了具有三种不同箱宽的相同数据。中间图表示出了数据分布。左侧图表中的细节过少,而右侧图表中的细节则过多。

箱子范围

除决定控制箱子数量的箱宽外,您还可以选择第一个箱子的中心。这可能很重要。假设您的数据是百分比,从0到100。数值不可能小于0(负值)或大于100。假设您想将箱宽设为10,这样就可以做成10个箱子。如果第一个箱子以0为中心,其将包含 - 5至5之间的数值;下一个箱子将包含5至15之间的数值,下一个箱子将包含15至25之间的数值,以此类推。由于不可能出现负值,因此,第一个箱子实际上只包含0 - 5之间的值,因此,其有效箱宽是其他箱宽的一半。此外,还需注意的是,有11个箱子包含数据,而非10个。

如果您改为第一个箱子以5为中心,它将包含0 - 10之间的值,下一个箱子包含10 - 20之间的值,等等。现在,所有箱子均包含相同数值范围,且所有数据均包含在十个箱子中。

边界上的一个点与保持较大数值的箱子对应。因此,如果一个箱子由3.5变为4.5,下一个箱子由4.5变为5.5,则4.5将落在第二个箱子中(由4.5变为5.5)。

重复数据

如果您输入重复值,则Prism可以将每个重复数据放入其相应的箱子中,或者计算重复数据的平均值,且只将平均值放入箱子中。

在分析过程中,会忽略所有过小而无法放入第一个箱子的数值。此外,您还可以输入上限,以便从分析中忽略较大的数值。

如何绘制

参见 这些示例

Prism只能根据数值数据进行频率分布。它可以处理分类数据,但仅当分类作为数值输入时。

© 1995-2019 GraphPad Software, LLC. All rights reserved.