置信区间(Confidence Interval)是统计学中用来估计一个总体参数(例如均值、比例等)的范围。它提供了一个区间估计,表示在一定的置信水平下,该区间包含总体参数的可能性。
统计学教材中是这样定义置信区间:
在区间估计中,由样本量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。置信区间是怎么来的?由样本均值的抽样分布可知,在重复抽样或无限总体抽样的情况下,样本均值的数学期望等于总体均值,即E(x)=μ,样本均值的标准差为σx=σ/√n。
正常情况下,可以根据此公式求出样本均值落在总体均值μ的两个任何一个抽样标准差范围内的概率,但是由于大多数情况下我们是不知道总体均值μ,只知道样本均值x,总体均值μ通常需要根据样本均值x估计。因为样本均值x与总体均值μ的距离是对称的,所以可以推断如果样本均值x落在总体均值的两个标准差之内,那么就可以说总体均值μ就被包含在样本均值x的两个标准差之内,也就有了95%的样本均值所构造的2个标准的区间内会包含μ。