统计学中最重要的概念之一就是P值的定义。无论是使用哪种数据分析软件(Excel,R,SAS等)对数据进行统计分析时,P值都是关键的输出之一。之前的文章(正态分布)(此处增加文章链接)简单介绍了P值。但由于其在统计学中的重要性,加上大家对P值的询问量,所以本期的统计专栏将带大家进一步的认识什么是P值。(温馨提示:熬过三段文字就可以看漫画啦!!)
首先,来复习一下假设检验,因为有假设检验的地方就有P值。假设检验是先对总体数据提出一个假设值,然后利用样本信息判断这一假设是否成立。例如,为了控制成本,国民女神某干妈,使用新辣椒替代原来的旧辣椒(老款辣椒),我们想要知道这样生产出来的辣酱口感是否有差异。此时我们无法对总体数据(全部人对新辣椒与旧辣椒的评价)进行评估,我们只能从总体中随机抽样得到样本数据进行分析。我们会设置两个假设:
1. 原假设/零假设(H0):由新辣椒为原材料制作的辣椒酱口感 = 由旧辣椒为原材料制作的辣椒酱口感(新辣椒与旧辣椒无差异)
2. 备择假设(H1):由新辣椒为原材料制作的辣椒酱口感 ≠ 由旧辣椒为原材料制作的辣椒酱口感(新辣椒与旧辣椒有差异)
在进行假设检验时,我们一般希望拒绝H0,从而接受H1。假设检验又分为双边假设(上述例子)和单边假设。例如:我们心里的预期是原来的旧辣椒口感更好时:
1. 原假设/零假设(H0):由旧辣椒为原材料制作的辣椒酱口感 ≤ 由新辣椒为原材料制作的辣椒酱口感
2. 备择假设(H1):由旧辣椒为原材料制作的辣椒酱口感 > 由新辣椒为原材料制作的辣椒酱口感 (单边假设)
所以可以总结为,当备择假设没有特定的方向性,形式为“≠”时,这种检验假设称为双侧检验。当备择假设带有特定的方向性, 形式为">","<"的假设检验,称为单侧检验 "<"称为左侧检验, ">"称为右侧检验。
回到主题,P 值是Probability density Value的缩写,所以它的取值在0和1 之间。用正式的术语来说,P值是当原假设为真时,随机抽样将产生一个比我们的样本数据估计值更偏离假设值时的概率。用不太正式的术语来说,P 值告诉我们如果原假设为真,得到这样的结果的可能性有多大。定义对非统计专业人士太抽象,所以请看本期的漫画小剧场:
2022年开始,伊之助沉迷水果布丁。但是近日,他觉得水果布丁中的水果含量没有达到标准值(包装上写明每200克含有70克及以上的水果)。
看完漫画你也许会有以下疑问:
1. 显著水平可以是除了0.05 以外的值吗?
2. 为什么P值小于0.05就可以拒绝原假设?
首先第一个问题的答案是肯定的,显著水平通常有0.05,0.01,0.005等等,但是0.05是最常用的选择。
Figure 1 各个数值的P值解释
关于第二个问题,回到P值的定义,假如我们得到的P值是0.04,即如果原假设(布丁中的水果含量大于等于70g)为真时,抽样计算得到68.7g或者更小值的概率是4%。这相当于是一个小概率事件,也就是说在原假设成立的情况下,小概率事件发生了,因此要拒绝原假设。
总结:
根据假设检验得到的P值,通常将它与0.05的显著水平相比较,如果P值大于等于0.05,则不能拒绝原假设。如果P值小于0.05,则可以拒绝原假设,接受备择假设。需要注意的是,P值因为直观易懂,非统计学专业研究者也可以使用P值,因此也被广泛应用于医学研究中。但这也伴随着P值被滥用的问题。特别是在医学实验中,不仅需要关注统计学意义的显著性还需要结合医学意义。P值不能代表实验的全部,仍然需要其他统计分析来支持实验结果。
Reference:
P-value in statistics: Understanding the p-value and what it tells us - Statistics Help - YouTube
1478: P 值 - 解释 xkcd (explainxkcd.com)(Figure 1)
注:漫画人物来自动漫鬼灭之刃,侵权删。