本示例摘自题为《如何避免和发现统计学不当行为》的优秀在线统计学教材。该研究旨在评估两种病媒控制方法与不采取控制措施相比,对牛的红细胞压积(PCV)的影响。三群奶牛被随机分配到三种处理组中。从每群奶牛中抽取四头牛的血液样本,并记录其红细胞压积值。
我们关注的因素是处理组。嵌套因素是牛群。由于每群牛只接受一种处理,因此牛群因素嵌套在处理组因素之下。

该设计被称为嵌套设计,是因为每群牛要么属于对照组,要么接受某一种处理。由于每群牛仅接受其中一种替代处理,因此无法比较不同牛群对处理的反应差异。因此,牛群被视为嵌套在处理因素之下。
这也称为分层设计。分层和嵌套是描述此类设计时的同义词。
虽然将这三组处理数据均视为样本量为12的样本很诱人,但这种做法并不恰当。

若对这些数据进行单因素方差分析,结果将毫无意义。方差分析假设每个数据值提供独立信息。每个处理组由三个牛群提供数据,每个牛群包含四头奶牛。因此,每个处理组并不具备十二个独立测量值。来自同一牛群的每头奶牛的重复测量值之间,比与其他牛群奶牛的测量值之间更为接近。
若按此方式分析数据,P值几乎肯定会过小,且均值差异的置信区间会过窄。
若无缺失值,可采用单因素方差分析进行数据分析。第一步是计算每群牛的技术重复值的平均值。随后将这些均值填入新表格,再通过单因素方差分析比较这三组均值。

请注意,在单因素方差分析中,每个处理组内的三个牛群被堆叠在同一列中,而在嵌套t检验中,它们则并列在子列中。
在无缺失数据的情况下,对这些均值数据进行单因素方差分析的结果将与对整个数据集进行嵌套单因素方差分析的结果完全一致。