置信区间解释:示例、公式与解读

置信区间解释

什么是95%置信区间?

95%置信区间是一组值,你可以有95%的信心认为它包含了总体的真实均值。由于自然抽样变异性,样本均值(置信区间的中心)会因样本而异。

置信度在于方法,而不在于某个特定的置信区间。如果我们多次重复抽样方法,大约95%的构建区间将捕捉到总体的真实均值。

因此,随着样本量的增加,区间值的范围将变窄,这意味着你比小样本时更准确地知道均值。

我们可以使用正态分布来可视化这一点(见下图)。

为什么在95%置信度下Z值为1.96?

例如,总体均值在样本均值的-1.96和+1.96标准差(z分数)之间的概率为95%。

相应地,总体均值有5%的概率位于上下置信区间之外(如图所示,1.96 z分数两侧各有2.5%的异常值)。

为什么使用置信区间?

研究整个总体中的每个人几乎是不可能的,因此研究人员选择一个样本或总体的一个子群体。

这意味着研究人员只能估计总体的参数(即特征),估计范围是从一组给定的样本数据计算得出的。

因此,置信区间仅仅是一种衡量你的样本代表所研究总体程度的方法。

置信区间包含总体真实均值的概率称为置信水平。

你可以计算任何置信水平的置信区间,但最常用的值是95%。95%置信区间是一组值(上限和下限),你有95%的把握认为它包含了总体的真实均值。

如何计算

要计算置信区间,首先计算样本的均值和标准误差

记住,你必须根据所选置信水平的z分数(见下表)计算置信区间的上界和下界。

置信水平 Z分数
0.90 1.645
0.95 1.96
0.99 2.58

置信区间公式

置信区间公式

其中:

  • X 是均值
  • Z 是选定的Z值(95%时为1.96)
  • s 是标准误差
  • n 是样本量

对于下限值,将标准误差除以n的平方根,然后将此计算结果乘以z分数(95%时为1.96)。最后,从样本均值中减去此计算结果的值。

示例:

  • X(均值)= 86
  • Z = 1.960(上表95%时的值)
  • s(标准误差)= 6.2
  • n(样本量)= 46

下限值:86 – 1.960 × 6.2 √46 = 86 – 1.79 = 84.21

上限值:86 + 1.960 × 6.2 √46 = 86 + 1.79 = 87.79

因此,总体均值很可能在84.21和87.79之间。

总体均值与样本均值

我们如何确保总体均值与样本均值相似?

区间(上限和下限)越窄,我们的估计就越精确。

一般而言,随着样本量的增加,置信区间应该变得更窄。

置信区间以高低收盘图形式呈现

因此,使用大样本可以比小样本更精确地估计总体均值。因此,从大样本计算出的置信区间相当窄。

如何报告

APA 6风格手册指出(第117页):

“报告置信区间时,使用格式95% CI [LL, UL],其中LL是置信区间的下限,UL是置信区间的上限。”

例如,可以报告95% CI [5.62, 8.31]。

置信区间也可以在表格中报告

APA风格表格

进一步信息

常见问题

置信区间揭示了什么?

置信区间给出了我们认为某个数字(如平均数)可能位于的范围,基于我们的样本数据。置信水平(如95%)是我们对这个范围包含真实值的信心程度。

所以,如果我们有一个16岁青少年平均身高在5'4"到5'8"之间的95%置信区间,我们就是在说我们有95%的信心认为所有16岁青少年的真实平均身高在5'4"到5'8"之间。

这并不意味着所有身高都同样可能,只是说真实平均值可能落在这个范围内。这是一种展示我们估计不确定性的方法。

置信区间与标准差相同吗?

不,它们不同。标准差显示了一个组内各个测量值与平均值的差异程度。可以将其理解为学生分数与班级平均分的差异程度。

而置信区间则是我们非常确定(如95%确定)包含所有班级真实平均分数的范围,基于我们的班级。它是关于我们对估计真实平均值的信心程度,而不是关于个体差异。

盒形图显示置信区间吗?

标准盒形图显示中位数和四分位数范围,而不是置信区间。然而,一些增强的盒形图可以包括围绕中位数或均值的置信区间,通常用凹槽或误差线表示。

虽然这不是传统功能,但添加置信区间可以提供更多关于中心趋势估计可靠性的见解。

置信区间练习题

  1. 一名研究人员抽取了30名学生的测试成绩样本,平均分为85分,标准差为5分。测试成绩的95%置信区间是多少?
  2. 一项研究测量了50人的身高,发现平均身高为170厘米,标准差为10厘米。该人群身高的99%置信区间是多少?
  3. 在40个灯泡的样本中,平均寿命为5000小时,标准差为400小时。计算灯泡平均寿命的90%置信区间。

答案:

  1. 对于95%置信区间和样本量>30,我们通常使用z分数1.96。置信区间的公式为(均值 - (z (std_dev / sqrt(n))),均值 + (z (std_dev / sqrt(n)))。因此,置信区间为(85 - (1.96 (5 / sqrt(30))),85 + (1.96 (5 / sqrt(30))) = (83.21, 86.79)。
  2. 对于99%置信区间和样本量>30,我们通常使用z分数2.58。因此,置信区间为(170 - (2.58 (10 / sqrt(50))),170 + (2.58 (10 / sqrt(50))) = (167.35, 172.65)。
  3. 对于90%置信区间和样本量>30,我们通常使用z分数1.645。因此,置信区间为(5000 - (1.645 (400 / sqrt(40))),5000 + (1.645 (400 / sqrt(40))) = (4870.92, 5129.08)。

AB测试中的统计显著性。当置信区间为95%时,p值为0.05


引用来源

本文翻译自以下网站:

simplypsychology.org

使用声明

本文仅供教育和参考用途。如需转载或引用,请注明出处和作者。

如果你有任何问题或建议,请随时联系微信公众号。

回到首页