置信区间解释：示例、公式与解读

什么是95%置信区间？

95%置信区间是一组值，你可以有95%的信心认为它包含了总体的真实均值。由于自然抽样变异性，样本均值（置信区间的中心）会因样本而异。

置信度在于方法，而不在于某个特定的置信区间。如果我们多次重复抽样方法，大约95%的构建区间将捕捉到总体的真实均值。

因此，随着样本量的增加，区间值的范围将变窄，这意味着你比小样本时更准确地知道均值。

我们可以使用正态分布来可视化这一点（见下图）。

例如，总体均值在样本均值的-1.96和+1.96标准差（z分数）之间的概率为95%。

相应地，总体均值有5%的概率位于上下置信区间之外（如图所示，1.96 z分数两侧各有2.5%的异常值）。

为什么使用置信区间？

研究整个总体中的每个人几乎是不可能的，因此研究人员选择一个样本或总体的一个子群体。

这意味着研究人员只能估计总体的参数（即特征），估计范围是从一组给定的样本数据计算得出的。

因此，置信区间仅仅是一种衡量你的样本代表所研究总体程度的方法。

置信区间包含总体真实均值的概率称为置信水平。

你可以计算任何置信水平的置信区间，但最常用的值是95%。95%置信区间是一组值（上限和下限），你有95%的把握认为它包含了总体的真实均值。

如何计算

要计算置信区间，首先计算样本的均值和标准误差。

记住，你必须根据所选置信水平的z分数（见下表）计算置信区间的上界和下界。

置信水平	Z分数
0.90	1.645
0.95	1.96
0.99	2.58

置信区间公式

其中：

X 是均值
Z 是选定的Z值（95%时为1.96）
s 是标准误差
n 是样本量

对于下限值，将标准误差除以n的平方根，然后将此计算结果乘以z分数（95%时为1.96）。最后，从样本均值中减去此计算结果的值。

示例：

X（均值）= 86
Z = 1.960（上表95%时的值）
s（标准误差）= 6.2
n（样本量）= 46

下限值：86 – 1.960 × 6.2 √46 = 86 – 1.79 = 84.21

上限值：86 + 1.960 × 6.2 √46 = 86 + 1.79 = 87.79

因此，总体均值很可能在84.21和87.79之间。

总体均值与样本均值

我们如何确保总体均值与样本均值相似？

区间（上限和下限）越窄，我们的估计就越精确。

一般而言，随着样本量的增加，置信区间应该变得更窄。

因此，使用大样本可以比小样本更精确地估计总体均值。因此，从大样本计算出的置信区间相当窄。

如何报告

APA 6风格手册指出（第117页）：

“报告置信区间时，使用格式95% CI [LL, UL]，其中LL是置信区间的下限，UL是置信区间的上限。”

例如，可以报告95% CI [5.62, 8.31]。

置信区间也可以在表格中报告

进一步信息

常见问题

置信区间揭示了什么？

置信区间给出了我们认为某个数字（如平均数）可能位于的范围，基于我们的样本数据。置信水平（如95%）是我们对这个范围包含真实值的信心程度。

所以，如果我们有一个16岁青少年平均身高在5'4"到5'8"之间的95%置信区间，我们就是在说我们有95%的信心认为所有16岁青少年的真实平均身高在5'4"到5'8"之间。

这并不意味着所有身高都同样可能，只是说真实平均值可能落在这个范围内。这是一种展示我们估计不确定性的方法。

置信区间与标准差相同吗？

不，它们不同。标准差显示了一个组内各个测量值与平均值的差异程度。可以将其理解为学生分数与班级平均分的差异程度。

而置信区间则是我们非常确定（如95%确定）包含所有班级真实平均分数的范围，基于我们的班级。它是关于我们对估计真实平均值的信心程度，而不是关于个体差异。

盒形图显示置信区间吗？

标准盒形图显示中位数和四分位数范围，而不是置信区间。然而，一些增强的盒形图可以包括围绕中位数或均值的置信区间，通常用凹槽或误差线表示。

虽然这不是传统功能，但添加置信区间可以提供更多关于中心趋势估计可靠性的见解。

置信区间练习题

一名研究人员抽取了30名学生的测试成绩样本，平均分为85分，标准差为5分。测试成绩的95%置信区间是多少？
一项研究测量了50人的身高，发现平均身高为170厘米，标准差为10厘米。该人群身高的99%置信区间是多少？
在40个灯泡的样本中，平均寿命为5000小时，标准差为400小时。计算灯泡平均寿命的90%置信区间。

答案：

对于95%置信区间和样本量>30，我们通常使用z分数1.96。置信区间的公式为（均值 - （z (std_dev / sqrt(n))），均值 + （z (std_dev / sqrt(n))）。因此，置信区间为（85 - (1.96 (5 / sqrt(30)))，85 + (1.96 (5 / sqrt(30))) = (83.21, 86.79)。
对于99%置信区间和样本量>30，我们通常使用z分数2.58。因此，置信区间为（170 - (2.58 (10 / sqrt(50)))，170 + (2.58 (10 / sqrt(50))) = (167.35, 172.65)。
对于90%置信区间和样本量>30，我们通常使用z分数1.645。因此，置信区间为（5000 - (1.645 (400 / sqrt(40)))，5000 + (1.645 (400 / sqrt(40))) = (4870.92, 5129.08)。

引用来源

本文翻译自以下网站：

simplypsychology.org

使用声明

本文仅供教育和参考用途。如需转载或引用，请注明出处和作者。

如果你有任何问题或建议，请随时联系微信公众号。

聚观点

聚观点