如何用spss算p值(p值怎么算出来的)?如果你对这个不了解,来看看!
SPSS23:率的两两比较(手工Bonferroni校正),下面是一起学统计工具给大家的分享,一起来看看。
如何用spss算p值
《【SPSS】率的两两比较(Bonferroni校正)》一文介绍了率的两两比较的Bonferroni校正,但遗憾的是该方法没有给出统计量和P值大小,而且默认是对各组进行两两间的比较,不能满足各组分别与对照组比较的情形。而某些统计功能或某些软件的统计功能未能提供Bonferroni校正功能,这时我们就需要使用人工校正的方法了。
《Bonferroni:Step by Step 攻克两两比较》提到Bonferroni法的两种情况:
⑴多组间的两两比较:k个样本间,任两组均进行比较时,比较次数m为k(k-1)/2。
⑵实验组与同一个对照组的比较:在k个样本中,指定对照组与其余各组比较时,比较次数m为k-1。
在正式统计之前,我们先用上述两个公式计算出各种方法的校正检验水准。这个过程我们可以用Excel计算,读者可保存此表,方便使用时查阅。
需注意,Bonferroni法是两两比较方法中最为保守的。当比较次数m不多时,该法效果较好;当比较次数m较多时(如m>10),由于α' 值较低,结论偏于保守,可用Sidak法调整每次比较的检验水准:
根据上述公式,整理出检验水准校正表(获取校正表Excel文件,请回复“pair”):
表1 Bonferroni法检验水准校正表
(m≤10时检验查此表)
表2 Sidak法检验水准校正表
(m>10时,建议查此表)
今天我们继续用上海闵行区不同人群的吸烟情况调查的例子,介绍用手工Bonferroni校正的方法。
〖例〗下表为生活在上海闵行地区15岁及以上的男性的吸烟情况,试不同文化水平人群的吸烟率进行两两比较,并用Bonferroni法校正检验水准。
参见:【SPSS入门】数据可视化:谈数据文件的建立
【Step01】选择“edu = 1 | edu = 2”的数据(“ | ”表示“or”)
参见:SPSS常用统计分析教程:3.2.4选择个案
【Step02】根据n进行加权。
参见:SPSS常用统计分析教程:3.2.5 加权个案
【Step03】进行卡方检验
参考【SPSS】率的两两比较(Bonferroni校正)的方法进行统计
【结果】小学组和中学组吸烟率的比较
同理得到,各组两两比较的结果:
表3 不同文化水平吸烟率的两两间比较
【结果解释】
1.如果进行两两比较:不调整检验水准时,按α=0.05的水准,三组的吸烟率两两间比较,差别均有统计学意义。如果进行Bonferroni校正,查询表1,检验次数m=3,按校正检验水准α'=0.0167,则中学组与小学组的吸烟率间的差别无统计学意义,其他两两比较均有统计意义。
2.如果以小学组作为对照组,查询表1,检验次数m=2,校正检验水准α'=0.0250,读者不放解读一下结果。
【作者介绍】李志辉,长期从事各类统计软件应用研究,主编或参编SPSS、MINITAB、STATISTICA多个统计软件教材共8本。代表作:电子工业出版社《SPSS常用统计分析教程(SPSS 22.0中英文版)(第4版)》(2015年)。
关注微信订阅号“一起学统计工具"(原名:一起学SPSS)后,回复关键词“免费”二字,可获取一起学统计工具学习资源包。
p值怎么算出来的
大家好,我们在之前阐述过,对于体外诊断产品来说,实际上是由检测系统和临床治疗方案选择两部分内容组成,而将它们联系再一起的,就是统计学,我们在之前阐述过一些其他的统计学方案,今天我们给大家介绍的是卡方检验。
什么是卡方检验?
卡方检验,通常写成χ2检验,是一种统计假设检验,用于分类变量的分析,以确定观察到的数据是否与预期不同。卡方检验是一种常用的非参数检验,这意味着它们不假设所涉及的数据的分布(例如,正态分布)。相反,该测试依赖于奇偶分布,这是一个总体的理论值分布。
卡方检验的类型
有两种主要的卡方检验类型:
拟合卡方检验,用于检验一个变量的观察频率(每个类别中的观察数)是否与预期的不同。换句话说,该检验决定了样本分布是否与群体分布相匹配。独立卡方检验,也被称为关联卡方检验,它对两个变量进行比较,看它们是否彼此不同。这些类型的测试使用卡方检验统计量和分布,以及你观察到的值与预期值之间的比较,用于不同的目的。它们被称为皮尔逊卡方检验。还有其他各种使用卡方检验统计量的检验,包括趋势卡方检验、麦克尼玛检验(用于分析配对数据)、单方差检验和似然比检验,单我们这次并不会讨论这些检验。
在本文中,我们将重点讨论独立卡方检验,因为它在社会科学、医学统计和计量经济学中得到了广泛的应用,它被用来比较一个样本中分类变量的分布和另一个样本中分类变量的分布。
何时使用卡方检验
关联卡方检验适用于你想比较的两个变量的频率的交叉表。这被称为或然率表,其中行和列的每个组合(例如,一个小家庭中有症状的COVID-19的人数)在表中用一个单元格表示(见表1)。关键是这两个变量都是分类的,也就是说,它们可以在不同的类别中采取有限的可能值。分类变量的例子包括种族、疾病的存在(是/否)和年龄分组(例如,0-5岁,6-10岁,11岁以上)。
表1 | 在一项研究中,在218名对COVID-19检测呈阳性的参与者中,按家庭规模显示COVID-19的症状状态的概率表。
有症状
无症状
总数
家庭规模
小型(1-3人)
30(41.1%)
43(58.9%)
73
大型(4个以上成员)
96(66.2%)
49(33.8%)
145
共计
126(57.8%)
92(42.2%)
218
你可以用卡方检验来研究像这样的两个变量之间的关联,其假设如下:
无效假设(H0)是这两个变量之间没有关联。备选假设(H1)是存在任何形式的关联。卡方检验的局限性在于它需要有足够大的样本量才有效。作为一般规则,当预期值小于5时,我们应该转向精确的概率分布,并使用费雪精确检验。
如何进行卡方检验
一位卫生研究人员可能正在进行一项关于COVID-19传播动态的研究,并希望调查家庭规模是否与那些病毒检测呈阳性的人中是否出现症状性疾病有关。为了帮助回答这个研究问题,他们可以使用以下四个步骤进行独立的卡方检验。
第1步:提出无效假设和备选假设
进行卡方检验的第一步是明确提出假设。在这个例子中,具体的假设如下。
无效假设(H0)是:在人群中,家庭规模和有症状的COVID-19感染之间没有关联。换句话说,两个家庭规模组中有症状的比例之间的真实差异为零(π1 - π2 = 0)。备选假设(H1)是,家庭规模和有症状的感染之间存在关联,并且两个家庭规模组中有症状的比例之间的真实差异不为零(π1 - π2 ≠ 0)。第2步:计算无效假设下的预期值
在这一步,我们使用我们的或然率表(表1),为每个单元格找出如果无效假设为真时的预期频率。为了做到这一点,我们使用行和列的总数,称为边际总数,并推导出预期值:
因此,如果家庭规模与症状状态没有关系,我们将预期两个家庭组中有症状的感染比例相同。
在小家庭组中预计有症状COVID-19的预期值为(73 × 126)/218 = 42.1,在大家庭组中预计有症状COVID-19的预期值为(145 × 126) / 218 = 83.8。表2显示了或然率表中所有四个单元的预期值。值得注意的是,卡方计算是根据频率值本身进行的,而不是根据比例进行的。
表2 | 在一项对COVID-19检测呈阳性的研究中,218名参与者的COVID-19症状状况按家庭规模显示的应急表。预期值显示粗体。
有症状
无症状
总数
家庭规模
小型
30(42.1)
43(30.8)
73
大型
96(83.8)
49(61.2)
145
共计
126
92
218
在我们的例子中,鉴于我们感兴趣的变量都有两个类别,我们使用了一个2×2的或然率表,但是如果我们想比较有两个以上类别的分类变量的分布,可以使用这四个相同的步骤轻松扩展卡方检验。
第3步:计算卡方检验统计量
现在我们比较两个变量的观察频率和预期频率。我们需要计算一个检验统计量,以总结它们的差异程度,以及任何差异在多大程度上是由随机变化造成的。卡方(χ2)检验统计量用以下公式计算:
在这个公式中,∑符号表示取或然率表中所有四个单元格的后续数量之和(加在一起)。对于本文中的示例:
这样,我们的检验统计量为χ2 = 12.51。
第四步:计算P值,评估反对无效假设的证据强度
χ2检验统计量越大,观察值和预期值之间的差异越大。为了检验关联的强度,我们可以将χ2检验统计量与其在无效假设下的已知分布进行比较,并计算出P值。空白的χ2值和P值在实践中可以通过统计软件很容易地计算出来,如果用手计算的话,可以用参考表来计算。这些值取决于自由度,对于2×2表来说,自由度等于1,对于有更多类别的或然表来说,自由度会更大。它们还取决于显著性水平(通常是α=0.05)。
在我们的例子中,χ2产生了一个小的P值(P<0.001),这意味着我们从卡方检验中得到的解释是,有非常强的证据反对无效假设。我们可以得出结论,有证据表明,较大的家庭规模和有症状的COVID-19感染之间可能存在关联。
诊断科学编辑团队收集、整理和编撰,如需更多资讯,请关注公众号诊断科学(DiagnosticsScience)。
***