信度检验如何用spss(怎么用spss进行相关分析)?如果你对这个不了解,来看看!
签约服务情境下全科医生岗位胜任力自评量表的开发与信效度检验,下面是中国全科医学给大家的分享,一起来看看。
信度检验如何用spss
随着我国分级诊疗制度在近几年的落实发展,基层医疗卫生机构不断建立起以全科医生为核心的服务团队。启动落实全科医生签约服务,引导分级诊疗体系形成常见慢性病基层首诊、急病重症转诊分治、各级医院上下联动的科学分工,逐渐成为我国医疗体系未来的发展方向[1]。尽管现在有很多基层医生在进行全科医生培训,但仍存在人才数量和质量问题,且当下看来,质量问题尤为严重。居民不信任社区卫生服务中心和基层医院、直接前往大型综合医疗机构就医的现状尤为突出。因此全科医生质量,即其岗位胜任力成为落实基层首诊与转诊的瓶颈[2]。为有效推进分级诊疗和满足居民的健康需求,必须对全科医生的岗位胜任力做出测评,从而对全科医生的教育、培养、考核等全流程环节给予更准确的建议。目前在全科医生岗位胜任力测量方面,相对于国外全科医生组织和协会成熟的岗位胜任力测量、评估方法和模型运用情况,我国尚未形成正式且统一的岗位胜任力测量评价体系。基于此,本研究聚焦中国基层医疗卫生机构中为社区居民提供签约服务情境下的全科医生,结合相关研究中以扎根分析结果为基础的全科医生岗位胜任力模型,编制、设计全科医生岗位胜任力量表,以期能够对全科医生工作产生正向激励,促进签约服务不断提质增效,从而增加居民对全科医生的信赖。
1 全科医生与全科医生岗位胜任力界定
全科医生是随着欧美等国家社会老龄化的发展,医疗体系日渐完善而产生临床医生类别,西方国家也将全科医生称为家庭医生,世界家庭医师组织(WONCA)将全科医生定义为负责为任何有需要的人提供综合性医疗保健服务的医生[3]。而我国的全科医生主要包括在各级综合医院、社区卫生服务中心注册的全科医生及具备全科资质的乡村医生等。因此,本文将全科医生定义为基层一线的医疗卫生服务提供者[4],主要以团队合作的形式承担基层社区常见病、多发病、慢性病的首诊与转诊、预防保健、康复管理等服务工作,并为居民提供以预防为导向、持续、综合的全方位照顾,担任着居民健康的"守门人"角色[5]。
胜任力研究起源于美国,著名心理学家、哈佛大学教授MCCLELLAND[6]1973年在人员选拔程序中界定了胜任力概念,认为其是工作绩效优异者所具备的一些个人特征,具体包括工作中所需的特定知识和技能、适应能力或性格特质等,被统称为个体对于某工作和任务角色的胜任力,这些胜任特征可以突显工作绩优者与表现平庸者的巨大区别。国内学者仲理峰等[7](2003年)则认为应该将人们履行岗位工作职责时表现出的具体、可观察的行为特征定义为胜任力,认为其应该是人们能够顺利从事工作等外显特征的集中体现,通过辨认持久的潜在胜任特征,才能找出某岗位中的绩优者。具体在医疗服务领域,胜任力的内涵还需考虑与医疗护理工作特征相关的内容。CHERAGHI-SOHI等[8](2008年)发现全科医生胜任初级卫生保健工作职责过程中,除了应具备临床知识和技术能力外,还应当具备对患者的护理与关怀能力;杜改燕等[9](2011年)基于培训实践提出了医疗、预防、照顾、康复、学习5项全科医生必须具备的核心能力;苏芳等[10](2015年)认为,与其他临床医务工作者相比,全科医生独有的胜任力是首诊服务能力和意识、全科医学思维和工作理念的集合;林朝芬[11](2020年)提出扎实且全面的医学专业知识、高尚的职业人文道德及良好的人际沟通能力等是全科医生需具备的胜任素质。可以看出学者对全科医生岗位胜任力的解释着重强调全科医生的专业知识与技能等外显性胜任力,对全科医生价值观、个人动机与特质等隐性胜任力的关注不足。这不仅与全科医生"健康守门人"的工作职责不相匹配,也忽视了全科医生处于签约服务工作情境下的胜任力要求。
因此,本文基于国内外学者对全科医生岗位胜任力研究不足的现状,在团队运用扎根理论方法探索全科医生岗位胜任力模型研究成果的基础上,从全科服务能力、人文执业能力、团队协作能力和学习发展能力4个维度来衡量全科医生岗位胜任力。其中,全科服务能力和学习发展能力分别是全科医生岗位胜任力的外在表现和外在驱动,属于胜任力的外显层面,决定了全科医生提供签约服务的能力水平;人文执业能力和团队协作能力则是全科医生的内在特质与能力,属于胜任力的内隐层面,决定了全科医生提供签约服务的能力潜质。
2 对象与方法
2.1 量表生成与问卷设计
2.1.1 初始题项拟定
(1)确定初始题项池:基于胜任力模型构建过程中的范畴提炼,结合文献回顾并参考相关胜任力量表[11,12,13,14],本研究初步拟定了涵盖4个维度的20个测量题项作为初始题项池。
(2)初次校正量表:由3名具有量表开发经验的博士研究生通读评判题项,消除题项中的语病与歧义,并从67个全科医生胜任初始概念中寻找可以补充相关维度的测量题项,补充相关测量题项至24个。
(3)二次校正量表:邀请2名本专业的教授及3名本地社区卫生服务中心的全科医生,以小组讨论的形式阅读已拟定的24个题项,从相关术语的易读性和语言表达的准确性方面对题项进行修改和合并,最终得到全科医生岗位胜任力测量题项21个(表1)。全科医生岗位胜任力初始量表每个维度有≥4个测量题项,这符合管理学相关研究建议(量表中不同维度应至少有3个题项),可以初步保证量表的内容效度良好。
2.1.2 问卷设计
考虑全科医生岗位胜任力的外部评价涉及主体较多、误差较大,因此本研究基于全科医生自我评价角度进行调查问卷设计,问卷内容包括问卷填写提示和问卷主体两部分。(1)问卷填写提示设计。问卷填写提示需要通过简洁、明确、无疏漏的表达,给予答卷者有关问卷的重要提醒信息。开头提示部分主要阐述本次问卷调查的目的,对调研对象郑重承诺(强调数据仅用作学术研究并严格保密等),明确提出需要完整填答问卷中每一题等基本要求,以及表示对调研对象的感谢等;问卷中间部分需要告知答卷者具体操作和目前的答卷进度,强化其继续答卷的信心;结尾提示部分主要表达对答卷者的感谢与祝福。(2)问卷主体结构设计。问卷主体内容包括调研医生的基本信息与全科医生岗位胜任力量表两部分。第一部分对答卷全科医生的性别、年龄、工作年限、从业资格培训、单位规模、职称信息进行调查,通过基础信息体现出的调研医生背景,在一定程度上可以作为问卷真实性的保证和后期清洗的依据。第二部分为全科医生自评岗位胜任力水平,共有21个题项,涵盖全科医生岗位胜任力的4个维度。问卷采用Likert 5点计分方式,由调研的全科医生根据自身感受的实际情况与题项语句描述的符合程度在对应区域打对勾,量表中"1分"表示与题项表述非常不符合,"5分"表示与题项表述非常符合。
2.2 调研开展
2.2.1 调研对象选取
2021年4—8月,课题组调研团队对各级公立综合医院中的全科医学科及社区卫生服务中心的全科医生进行调研。研究所用数据主要通过以下两种渠道获得:一是在获得地区卫生健康委员会或基层医疗卫生机构相关科室的同意下,直接进入医院全科医学科和社区卫生服务中心对全科医生进行现场调研。这种数据收集渠道的优势在于,在问卷填写过程中可以与医生沟通交流,了解其日常工作信息和签约服务现状,由调研团队现场分发、答疑解惑、回收能够较好地保证数据的真实性。二是借助"问卷星"平台,以发放电子问卷的方式进行调查。由于调研后期不同地区新型冠状病毒感染疫情的防控措施限制,数据收集进度无法达成原定计划,因此只能通过部分全科医生在其工作群和朋友圈进行问卷发放的方式扩大调研样本的分布范围,保证数据在全国主要省级行政区域的基本覆盖,对提高研究结果普适性具有一定帮助。调研对象排除标准:(1)未完整作答问卷者,即存在题项漏答,尤其是问卷第6题(所在省份地区)未填写者;(2)重复作答问卷只保留一份(主要指同一IP地址多次填写者);(3)明显不认真填写问卷者,例如累计作答时间<2 min者等;(4)问卷作答存在明显逻辑错误者,包括IP地址与工作单位不在相同省份者,年龄、工作年限与职称等级三者明显不匹配者。共回收调查问卷450份,其中有效问卷402份,问卷有效回收率为89.3%。有效问卷数量测量题项数与有效问卷数量达到1∶10的比例,符合进行实证分析的基本要求。
2.2.2 初始量表的题项净化
由于本次问卷调查未进行预调研,为探究量表题目是否符合问卷内涵,本研究参照齐丽云等[13](2017年)的做法在对数据因子分析前对量表题项进行了净化。运用SPSS 26.0软件计算出各题项的Cronbach's α系数和项目-总体相关系数(CITC)来判断量表的内部一致性和项目总分相关性,若项目Cronbach's α系数>0.6且CITC值≥0.5,则予以保留,否则进行删减。
2.2.3 探索性因子分析
(1)本研究从样本数据中随机抽取201份问卷,标记为数据A并用于探索性因子分析。在进行探索性因子分析前,需要确定量表中涵盖的各维度变量间是否具有相关性,因此首先通过SPSS 26.0软件进行KMO检验和Bartlett's球形检验,根据经验标准值判断数据A是否适用于开展探索性因子分析。(2)运用主成分分析法抽取特征值>1的因子,并结合碎石图提取量表维度。(3)为了获取具有较高理论意义和价值的因子结构,本研究采取最大方差法旋转展开分析,通过对比探索性因子分析结果和模型构建的相关结论,初步验证量表合理性。
2.2.4 验证性因子分析
(1)本研究将样本数据中剩余的201份问卷标记为数据B,运用AMOS 21.0软件进行一阶验证性因子分析,进一步检验全科医生岗位胜任力量表维度设置的合理性,并通过不断地尝试、检验以判断是否还有其他因子结构存在的可能性,引入不同因子结构的一阶竞争模型进行对比。(2)根据以往研究经验,在量表维度的一阶验证过程中若一阶因子之间存在较高的相关性,说明可能存在多重共线性的问题或者具有更高层次的因子结构[13]。因此本研究还对量表进行了二阶验证性因子分析,以期能较好地反映更高一层的潜在因素,其收敛效度可以通过一、二阶因子链接中形成的标准化路径指数来检验并判断[14]。
2.2.5 最终量表的信效度检验
(1)信度检验结果反映数据的稳定性,即验证全科医生岗位胜任力量表的可靠性,一般根据Cronbach's α系数判定。(2)效度检验是指测量结果与试图达到的目标之间的接近程度,包括内容效度和结构效度,反映的是最终全科医生岗位胜任力量表的有效程度,其中结构效度可经收敛效度和区分效度细分后综合体现。
2.3 统计学方法
采用SPSS 25.0、AMOS 17.0软件进行统计分析,计数资料以相对数表示,检验水准α=0.05。
3 结果
3.1 参与调研全科医生基本情况
402例参与调研全科医生中,男231例(57.5%),女171例(42.5%);年龄31~35岁179例(44.5%);工作年限11~15年182例(45.3%);其他基本情况见表2。
3.2 题项净化结果
鉴于量表中题项QK6和RW6的CITC值低于经验标准值0.5,将其删除后量表的Cronbach's α系数有明显改善,且大于所在维度的Cronbach's α系数,因此删除这两个题项(表3)。
3.3 探索性因子分析结果
3.3.1 KMO和Bartlett's球形检验结果
基于数据A的计算结果显示,KMO值为0.923,高于经验标准值0.7,说明存在着较多的共同因子。Bartlett's球形检验中χ2值为2 319.759,自由度为171,P<0.001,表明数据相关矩阵间有共同因素存在,提示数据A适合进行因子分析。
3.3.2 主成分提取与旋转成分矩阵
(1)基于数据A进行主成分提取,软件分析报告结果显示初始特征值>1.000的因子有4个,其中因子1的特征值为9.105,解释方差百分比为47.922%,因子2的特征值为1.515,解释方差百分比为7.976%,因子3的特征值为1.224,解释方差百分比为6.444%,因子4的特征值为1.014,解释方差百分比为5.338%,主要因子总方差累计贡献率为67.680%(表4),符合>50%的经验标准值,说明4个因子结构对于原始数据的解释度较为理想。碎石图结果显示,折线在成分5之前急剧下降,并在之后基本趋向平缓(图1),说明净化后的19个题项提取4个公因子较为合适,基本保留了模型中的4个维度。(2)旋转成分矩阵结果显示,由于每个条目在对应维度上的因子载荷均>0.50,在其他维度上的交叉载荷均较小,因此全科医生岗位胜任力量表剩余19个题项得以保留(表5)。
3.4 验证性因子分析结果
3.4.1 一阶验证性因子分析
基于数据B,运用最大似然法分别对量表所有题项的一阶单因子、二因子、三因子和四因子模型进行拟合,部分竞争模型示意见图2,图3,图4,图5,并通过相关指标系数值与经验标准值的差异评判一阶竞争模型的优劣。
量表题项的不同一阶竞争模型拟合指标系数见表6,可以看出量表的四因子模型拟合程度最好。具体而言,绝对拟合指数χ2/df为1.327,小于经验标准值3,说明拟合良好;近似误差均方根(RMSEA)为0.040,小于经验标准值0.05;拟合优度指数(GFI)为0.913,达到0.9以上的理想水平,表明模型可以接受;简约拟合优度指数(PGFI)为0.702,大于经验标准值0.5,表明模型较为简约。因此,全科医生岗位胜任力量表的一阶四因子竞争模型拟合指标均达到较为理想的水平,说明量表具有较好的区分效度。同时量表各维度因子载荷见图5,所有题项在对应维度上的标准化载荷系数均高于0.5,且均在P<0.001的水平上显著,通过了t检验,说明量表具有较好的聚合效度。
3.4.2 二阶验证性因子分析
全科服务、人文执业、团队协作和学习发展这4个维度之间的相关系数为0.68~0.72,说明该结构模型的一阶因子间可能存在多重共线性的问题,也可能具有更高层次的因子结构。因此本研究对量表进行了二阶验证性因子分析,二阶验证性因子分析结果为:χ2/df为1.312,RMSEA为0.039,GFI为0.913,PGFI为0.711,规范拟合指数(NFI)为0.907,Tucker-Lewis指数(TLI)为0.972,比较拟合指数(CFI)为0.976。拟合程度略微优于四因子结构模型,因此认为全科医生岗位胜任力量表的二阶结构方程模型的拟合度可以接受。
二阶路径检验结果见图6,全科服务能力维度的路径系数为0.83、人文执业能力维度的路径系数为0.86、团队协作能力维度的路径系数为0.83、学习发展能力维度的路径系数为0.82,均高于临界值0.7。综上可以认为,量表的4个维度可以较好地收敛于全科医生岗位胜任力这一更高层面的概念,能较好地体现其岗位胜任力水平。
3.5 最终量表的信效度检验结果
3.5.1 信度检验结果
通过信度检验,全科医生岗位胜任力量表全科服务能力、人文执业能力、团队协作能力、学习发展能力4个维度的Cronbach's α系数分别为0.877、0.850、0.810、0.811,总Cronbach's α系数达到0.929,由此可以认为量表具有良好的信度。
3.5.2 效度检验结果
就收敛效度而言,全科医生岗位胜任力量表中4个维度19个题项的标准化荷载系数均>0.5,并达到显著水平,全科服务能力、人文执业能力、团队协作能力和学习发展能力4个因子的平均萃取方差(AVE)均>0.5,依次分别为0.545、0.535、0.523、0.520,组合信度(CR)均>0.7,依次为0.878、0.851、0.814、0.813。
区分效度见表7,本研究中全科医生岗位胜任力量表的4个维度间相关系数最大值为0.689,远小于经验标准阈值0.85,由此可以确定量表的各维度间不存在高相关系数,从而也不会导致量表内部产生多重共线性的问题。同时表格对角线上的各因子AVE算术平方根值均大于表格下半区因子间的相关系数值。
4 讨论
本文基于全科医生岗位胜任力模型从全科服务能力、人文执业能力、团队协作能力、学习发展能力4个维度出发构建全科医生岗位胜任力自评量表,并用定量研究方法实证检验了此量表的信效度。首先是内容效度,内容效度反映的是量表在多大程度上完整反映构念的测量指标。本研究是在参考相关量表构建文献及基于深度访谈的扎根理论分析基础上形成的全科医生岗位胜任力量表题项;为使测量题项具备较好的针对性,在形成问卷前,请相关专家就题项的内涵和表述进行了两轮修改完善,最终形成初始问卷;分别对初始量表进行探索性因子分析、验证性因子分析,且用于分析的样本覆盖了全国主要省级行政区域的全科医生,收集调研数据后又进一步通过定量分析的方法删除了部分不合内涵的题项。综合以上判断,本研究构建的全科医生岗位胜任力量表内容效度是合理的。结构效度方面,根FORNELL等[15](1981年)的观点,本研究中因子荷载、AVE和CR指标都达到了经验标准阈值,可以认为全科医生岗位胜任力量表具有良好的收敛效度;区分效度方面,各因子的AVE算术平方根值均大于因子间的相关系数,可以认为相应维度间具有较好的区分效度。综合以上分析可以认为,本研究所构建的全科医生岗位胜任力量表具有较好的信度和效度,能够被后续影响因素研究中用于胜任力测量。
本研究仍存在一定的局限性:一方面,本研究开发的全科医生岗位胜任力测量量表采取的是自评形式收集数据,评价较为主观,未来可以考虑通过发放基层医疗卫生机构管理者与全科医生的配对问卷、全科医生与社区居民的配对问卷等形式收集非自评数据,从而提高全科医生岗位胜任力测量的信效度;另一方面,受限于数据可及性,本次全科医生岗位胜任力量表开发回收过程中的调查问卷抽样存在一定偏差,未来可以通过强化区域抽样的科学性和增加样本数量来进一步提升全科医生岗位胜任力量表的可靠性和适用性。
本文无利益冲突。
参考文献略
引用本文: 马志强, 张宝丽, 郭乐. 签约服务情境下全科医生岗位胜任力自评量表的开发与信效度检验 [J] . 中国全科医学, 2023, 26(4) : 477-485. DOI: 10.12114/j.issn.1007-9572.2022.0645.
怎么用spss进行相关分析
序曲微雨
【唐】李商隐
初随林霭动,稍共夜凉分。
窗迥侵灯冷,庭虚近水闻。
【译文】
微雨初起时,只觉它像林中雾气一样浮动;逐渐地,伴随着夜幕降临,它分得了夜的丝丝凉意。
那寒气仿佛透窗入户让灯火闪烁不定,离窗很远也能感觉到它的凉意;仔细听还能感觉到从空旷的院子里传来的轻微淅沥声。
【赏析】
李商隐写了不少咏物诗,不仅体物工切,摹写入微,还能够通过多方面的刻画,传达出物象的内在神韵。这首《微雨》就是这样的一首作品。此诗前两句写傍晚前后微雨刚落不久的情景,后两句写夜深后微雨落久的情景。全诗摹写入微,绘形绘声,通过多方面的刻画,传达出微雨的内在神韵,其妙处在于从虚处着笔,避免从正面铺写雨的形态,只是借人的感受作侧面烘托,显得非常灵活而新鲜。
四句诗写出了从黄昏到夜晚间微雨由初起到落久的过程,先是全然不易察觉,而后渐能察觉,写得十分细腻而熨贴,但又没有一个字直接刻画到微雨本身,仅是从林霭、夜凉、灯光、水声诸物象来反映微雨带给人的各种感觉,显示了作者写景状物出神入化的艺术功底。用字也极有分寸,“初随”“稍共”“侵”“冷”“虚”“近”,处处扣住微雨的特点,一丝不苟。
这首诗体物传神,刻画入微,虚处着笔,雨中有人。朦胧,迷离,似愁绪,可意会不可言传。全诗不着一个雨字,只是借助周遭相关的事物以及人的主观感受来表现微雨的形态,却是很成功的。
注:来源于 古诗文网
判别分析简介判别分析最初由统计学家、遗传学家,现代统计学的奠基人之一R.A.Fisher于1936年应用于生物学的植物分类,那是的Fisher判别分析只是一种分类方法而没有数学上的理论依据。约在20世纪50年的出现了Bayes判别,它证明了Fisher判别的合理性,所以一般情况下,把两种判别分析合称为线性判别分析或Fisher判别分析。
判别分析的因变量是无序或有序分类变量,以此把样本划分为不同的组类,而自变量可以是任何尺度的变量,只是定性变量需要以哑变量(虚拟变量)的方式进入模型。其目的在于建立一种线性组合使得用最优化的模型来概括分类之间的差异,从而可以根据已知样本的分类情况来判断未知分类样本的归属问题,如信用风险的判别、市场细分中的客户分类、地质层的判断、模式识别的问题等。
同聚类分析一样,判别分析也是对样本个体进行分类的一种统计分析方法。但是判别分析与聚类分析最大的区别在于:
聚类分析可以对样本分类,也可以对变量分类;但判别分析只能对样本分类;在聚类分析中,样本的类别事先是未知的,甚至样本可以分几类读不知道,只要知道样本各变量的观察值,就可以对样本进行分类;但判别分析必须事先明确样本可以分为几类,以及每个样本的类别,根据训练样本建立一个判别函数和判别准则,再对未知分类的新样本进行分类。(1)判别分析类别
在SPSS中判别分析可提供两种常用的判别分析方法:
费舍尔 Fisher:以距离作为判别准则,即样本与哪个类的距离最短就归为哪一类。当对多分类总体进行判别时,仅用一个判别函数往往不能很好地区分各个总体,这时可取次大的特征根对应的特征向量构成第二判别函数,以此类推,还可以建立第三判别函数、第四判别函数。各判别函数的判别能力可以用对应的特征值占各特征值综合的百分比来表示。贝叶斯 Bayes:以概率作为判别准则,即样本属于哪类的后验概率最大,就归为哪一类。贝叶斯判别分析的判别准则是将样本判入事后概率最大的类中。(2)逐步判别分析
一个判别函数的判别能力很大程度上取决于指标的选择。和多重回归分析类似,用于判别的指标并非越多越好,如果判别函数中特异性强的指标越多,判别函数的判别能力越强。相反,如果一些对分类不重要的指标越多,只能有害无益。和逐步回归方法一样,逐步判别分析就是对用于判别的指标进行筛选,将对判别作用不大的指标排除在判别函数外,将对判别效果有重要影响的指标保留在判别函数内。指标对判别能力有无贡献可以用F检验。
(3)样本量要求
一般而言,样本量应为使用建模自变量个数的10-20倍,至少应在5倍以上
(4)判别效果评价
判别分析的核心评价指标是结果用于判别时准确度如何。在评价时,一般使用 错判率或 正判率 表示,低的错判率和高的正判率说明判别效果较好。但是判别结果还要依赖于总体本身的分离程度,不同总体的差异越大越能得到好地判别结果。判别分析正确率达到多少才可以?可以借鉴20/25%法则,即正确分类的比率应该超过随机分组正确率的20%或25%
总体中各组样本等概率:模型正确率 > (100% ÷ G)×1.2 或 1.25; G—组数总体中各组样本不等概率:模型正确率 > (P1 + P2 + …. + Pg)×1.2 或 1.25以上公式汇总G为组数,乘以1.2对应超过20%的标准,如果超过了上述界值,则可以认为判别函数有价值的。
错判/正判率的计算方式:
自身验证:将训练样本依次代入判别函数,判断模型效果;但这种方法往往会高估判别效果,自身验证效果好,并不能说明判别外部数据的效果也好外部验证:重新收集新的样本数据,查看模型效果。但缺点是很难保证两次收集的样本是同质的样本二分法:采用随机函数将样本进行拆分,如此可保证验证样本与训练样本的同质性,但样本量要求较大。交叉验证:将样本等分为 n 份,然后依次使用其中 n-1 份样本建立判别函数,并用判别函数对另外一份样本进行判别,进行判别效果评价,最终判别函数则通过某种方法从这 n 各函数中综合而来。Bootstrap法:在原始数据的范围内做有放回的抽样,样本含量为 n,原始数据中每个样本每次被抽到的概率相等,为 1/n,所得样本成为 Bootstrap样本。从该样本可以得到一个判别分析结果;重复抽取这样的样本若干次,建立一系列的判别函数,相应的每个系数都有一系列取值。采用Bootstrap方法可求出最稳健的判别函数。(5)判别分析适用条件
在做统计分析前,一般要先了解其适用条件,判别分析也不例外。判别分析的前提和假设如下:
自变量和因变量间的关系符合线性嘉定因变量的取值是独立的,且必须是事先就已经确定自变量服从多元正态分布所有自变量在各组间方差齐,协方差矩阵也想到自变量间不存在多重共线性SPSS实现判别分析示例:眼科研究视网膜病变严重程度和视网膜电图的关系,以便用各种指标判断糖尿病病人的时往往病变严重程度,测量了131例糖尿病病人的10个指标:年龄 age、患糖尿病期限 Time、血糖水平 Glucose、视力 Vision、视网膜电图A波峰时 AT、A波振幅 AV、B 波峰时 BT、B波振幅 BV、QP波峰时 QPT、QP波振幅 QPV。同时详细检查了这些病人的视网膜病变情况。根据统一标准判断为 轻、中、重度,变量为Group,通过逐步判别法选出作用较大的指标建立判别函数。具体数据如下:
1.打开 分析—分类—判别式
2. 参数选择与说明
(1)主页面
----一起输入自变量:建立包含所有自变量的全模型
----使用步进法:指定使用逐步判别法,根据各自变量对判别贡献的大小进行选择;选择步进法后,
(2)统计 页面
--- 平均值:输出各组的均数和标准差
---单变量ANOVA:各变量在各组间的单变量方差分析表,有助于判断各变量是否对判别有作用
---博克斯M:组间协方差齐性检验
函数系数:--- 费舍尔:给出贝叶斯判别系数
---未标准化:给出未标准化的判别系数
矩阵:输出矩阵选项,依次为组内相关阵、组内协方差阵、分组协方差阵和总协方差阵。(3)方法 页面
(4)分类 页面
a.所有组相等:默认各类先验概率相等
b.根据组大小计算:用样本估计值估计先验概率
显示:输出判别考核结果a.个案结果:输出每个样本的预测组、实际组、后验概率和判别得分
b 摘要表:输出正确分类与错误分类的样本数及错判率,也可指定输出前n个样本的判别结果
c.留一分类:输出交叉验证的结果
图:输出判别图a.合并图:输出所有类别的图形在同一图上;若只有一个判别函数,输出直方图
b.分组:每一类别生成一个散点图
c.领域图:用于直接分类,根据判别函数得分所做;把平面划分成与分类个数相同的几个区域。
使用协方差矩阵:选择计算所用的协方差矩阵a.组内:组内协方差矩阵
b.分组:各组的协方差矩阵
(5)保存 页面:创建新变量,保存聚类结果
3.结果输出与解释
(1)个案处理摘要
显示样本数、缺失值数,及所占百分比。(2)各组统计量:给出各组的平均值和标准差
(3)选择变量
最终选入四个变量:vision、at、age、bv,,建立判别式函数。(4)判别函数特征值
特征值:显示第1个判别函数解释了所有变异的77.8%;第2个判别函数解释了22.2%。威尔克检验各判别函数有无统计学意义,显著性p <0.05,说明判别函数显著成立(4)判别函数
标准化判别函数:Y1=0.524*age+0.908*vision-0.525*at+0.316*bv
Y2=-0.795*age+0.313*vision+0.726*at+0.479*bv
标准化典型判别函数应用时需要将原始变量进行标准化,使用起来不太方便,因此常用未标准化典型判别函数。
非标准化判别函数:Y1=0.078+0.051*age+4.238*vision-0.554*at+0.003*bv
Y2=-0.077*age+1.463*vision+0.765*at+0.005*bv-9.704
未标准化典型判别函数的应用是将患者4项x 指标分别代入方程,得到Y1和Y2得分,然后根据得分,在区域图中,确定该患者的分类。即未标准化典型判别函数需要结合区域图进行结果解释。
(5)模型结构矩阵
即判别得分和自变量之间的相关系数,在表格中,用 * 标识出的每个自变量与每组判别得分中相关系数最大的一个,这类似于之后讲到的主成分分析中的成分矩阵。可看出,vision主要与第一判别函数相关,可解释第一判别函数较多的新型。(6)质心与图形展示
组质心处的函数:各类别中心在平面上坐标,如类别1:(1.288,0.354);根据判别函数计算出每个样本的平面坐标后,计算与各类别重心的距离,可判别归属(7)Fisher判别函数:
在使用上面的判别函数时(标准化或未标准化),对每个样本先要计算其平面指标,然后比较它与各类别重心的距离,再做分类。相比而言,费舍尔判别函数要简单许多,直接用它计算每个样本属于各类的得分,并把此样本归入得分最高的类别即可。依据下表中系数,得到相应函数Y1=0.374*age+60.36*vision+17.178*at+0.057*bv-171.044
Y2=0.383*age+49.774*vision+17.184*at+0.043*bv-157.187
Y3=0.105*age+43.967*vision+20.060*at+0.047*bv-182.680
(8)分类结果:
总的错判率为11/131=8.4%;交叉验证的结果,错判率为14/131=10.69%(9)数据结果
总的错判率为11/131=8.4%;4.语法
******************* 判别分析 ******************.DISCRIMINANT/GROUPS=group(1 3)/VARIABLES=age time glucose vision at av bt bv qpt qpv/ANALYSIS ALL/SAVE=CLASS SCORES PROBS/METHOD=WILKS/FIN=3.84/FOUT=2.71/PRIORS EQUAL/HISTORY/STATISTICS=COEFF RAW TABLE CROSSVALID/PLOT=COMBINED/CLASSIFY=NONMISSING POOLED.