T检验主要分为单样本T检验和双样本T检验。
1. 单样本t检验:检验总体均值的值
scipy.stats.ttest_1samp()
测试数据的总体平均值是否可能等于给定值。它返回T统计量和p值:
>>> stats.ttest_1samp(data['VIQ'], 0)
(...30.088099970..., 1.32891964...e-28)
如果p值为10 ^ -28,我们可以说明IQ(VIQ测量)的总体均值不为0。
2. 双样本t检验:测试群体间的差异
我们在上面已经看到,男性和女性人群的平均VIQ是不同的。为了测试这是否重要,我们进行了双样本t检验scipy.stats.ttest_ind()
:
>>> female_viq = data[data['Gender'] == 'Female']['VIQ']
>>> male_viq = data[data['Gender'] == 'Male']['VIQ']
>>> stats.ttest_ind(female_viq, male_viq)
(...-0.77261617232..., 0.4445287677858...)