可见主成分分析法再次说明了污灌区土壤剖面PAHs的主要来源为石油源和燃烧源的输入,因此本研究将通过对PAHs数据的因子分析和多元回归分析,再生水灌区土壤PAHs污染中两个主因子的贡献率分别为F1(煤的燃烧、汽车尾气、石油源)83.2%,表4.14 再生水灌区土壤的方差极大旋转后的主因子载荷第二个主成分F2在菲、芴上有较高的正负荷,表4.13 污灌区土壤的方差极大旋转后的主因子载荷注:提取方法为主成分分析法,因此第二个主成分F2可表征的污染源为焦炭源和石油源,第一主成分F1可表征的污染源为煤的燃烧、汽车尾气的排放和石油源,表4.15 清灌区土壤的主因子载荷注:用主成分分析法提取出两个因子。
什么是主成分分析方法
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。 在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征.这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面.但是,这也不是一定的,要视具体应用而定.
spss主成分分析步骤是什么
spss主成分分析法详细步骤:
1、打开SPSS软件,导入数据后,依次点击分析,降维,因子分析。如图1所示:
2、打开因子分析界面之后,把需要进行分析的变量全部选进变量对话框,然后点击右上角的描述。如图2所示:
3、勾选原始分析结果、KMO检验对话框,然后点击继续。如图3所示:
4、点击抽取,方法里选择主成分再点击碎石图。如图4所示:
5、点击旋转,再点击最大方差旋转。如图5所示:
6、点击得分,再点击,保存为变量及显示因子得分系数矩阵。如图6所示:
7、最后点确定就可以在输出截面看到主成分分析的结果了。如图7所示:
扩展资料:
SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。
用户只要掌握一定的Windows操作技能,精通统计分析原理,就可以使用该软件为特定的科研工作服务。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。
其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储时则是专用的SPO格式,可以转存为HTML格式和文本格式。对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口。
主成分分析法源解析
比值法可以定性地解释研究区PAHs的污染来源,但是不能进行定量的描述,且还有一定的局限性。因此本研究将通过对PAHs数据的因子分析和多元回归分析,可以半定量地了解各种污染源对研究区PAHs总量的贡献率。
主成分分析(PrincipalComponentsAnalysis,PCA)和因子分析是进行数据降维的常用方法,是把多个变量(指标)化为少数几个可以反映原来多个变量的大部分信息的综合变量(综合指标)的一种方法。主成分分析可直接将数据映射到唯一正交坐标系,因子分析可以进一步通过旋转坐标系,使被提取出来的因子具有最小的协方差,使每个因子代表的变量更明显,从而支持污染源识别。Wangetal.(2009)运用空间和多元分析对北京表土(0~10cm)PAHs的分布特征和污染来源进行了研究,结果表明,煤的燃烧和汽车尾气的排放、石油源及焦炭源分别是商业区、市内和郊区的主要污染源,这与北京的能源消耗及功能区划的空间分布特征密切相关。
对污灌区表土的14种PAHs进行主成分分析,结果表明,前两个因子说明了100%的方差,其中第一个主成分F1占方差的68.36%,第二个主成分F2占方差的31.64%,因此这两个主因子可以说明PAHs的污染来源。
由表4.13可以看出,第一个主成分F1在变量苯并[a]芘、苯并[b]荧蒽、苯并[g,h,i]苝、苯并[k]荧蒽、二苯并[a,h]蒽、二氢苊、芘、屈、茚并[1,2,3-cd]芘上有高的正负荷,同时也可以看出大部分是高环的PAHs。根据文献报道(Harrisonetal.,1996;Mastraletal.,1996),荧蒽、芘、屈、苯并[k]荧蒽是煤燃烧产物的典型标志。屈、苯并[b]荧蒽、苯并[g,h,i]苝、苯并[k]荧蒽、二苯并[a,h]蒽、苯并[a]芘、茚并[1,2,3-cd]芘表征汽车尾气的排放(Simciketal.,1999;Motelay-Masseietal.,2007)。因此,第一主成分F1可表征的污染源为煤的燃烧和汽车尾气的排放。
表4.13 污灌区土壤的方差极大旋转后的主因子载荷
注:提取方法为主成分分析法。施转方法为Varimax与Kaiser规范化。3次迭代汇成的旋转。
第二个主成分F2在萘、菲、芴、荧蒽、苊上有较高的正负荷,反映的是低环的PAHs。据Simciketal.(1999)的研究发现,二氢苊、菲、芴是焦炭源的主要产物。蒽和苊是石油源的主要产物,其中包括在生产和运输过程中石油及其相关产品的泄漏和溢洒。因此第二个主成分F2可表征的污染源为焦炭源和石油源。
运用SPSS对主因子分析所得的结果进行多元回归分析,进一步估算每种PAHs源的贡献率,因变量为PAHs总量的标准化分数,自变量为各因子的得分,得出的回归方程为
∑PAHs=0.393F1+0.919F2
各因子的贡献率根据公式 计算,其中Ai为每个因子的回归系数。
根据上述公式可以计算出,污灌区土壤PAHs污染中两个主因子的贡献率分别为F1(煤的燃烧和汽车尾气)30%,F2(焦炭源和石油源)70%。可见主成分分析法再次说明了污灌区土壤剖面PAHs的主要来源为石油源和燃烧源的输入,其中石油源的输入比重较大,这一结果与比值法所得结果相吻合。
对再生水灌区表土的PAHs进行主成分分析,结果表明,前两个因子说明了100%的方差,其中第一个主成分F1占方差的79.39%,第二个主成分F2占方差的20.61%,因此这两个主因子可以说明PAHs的污染来源。
由表4.14可以看出,第一个主成分F1在变量苯并[a]芘、苯并[b]荧蒽、苯并[g,h,i]苝、苯并[k]荧蒽、蒽、二苯并[a,h]蒽、苊、芘、屈、茚并[1,2,3-cd]芘、荧蒽上有高的正负荷,同时也可以看出大部分是高环的PAHs。根据上面的文献报道可得出,第一主成分F1可表征的污染源为煤的燃烧、汽车尾气的排放和石油源。
表4.14 再生水灌区土壤的方差极大旋转后的主因子载荷
第二个主成分F2在菲、芴上有较高的正负荷,反映的是低环的PAHs。第二个主成分F2可表征的污染源为焦炭源。
运用SPSS对主因子分析所得的结果进行多元回归分析,进一步估算每种PAHs源的贡献率,得出的回归方程为
∑PAHs=0.980F1+0.198F2
根据因子贡献率公式可以计算出,再生水灌区土壤PAHs污染中两个主因子的贡献率分别为F1(煤的燃烧、汽车尾气、石油源)83.2%,F2(焦炭源)16.8%。可见再生水灌区土壤剖面PAHs的主要来源为煤的燃烧、汽车尾气的排放和部分石油源的输入。
对清灌区表土的PAHs进行主成分分析,结果表明,前两个因子说明了100%的方差,其中第一个主成分F1占方差的69.72%,第二个主成分F2占方差的30.28%,因此这两个主因子可以说明PAHs的污染来源。
由表4.15可以看出,第一个主成分F1在变量苯并[a]芘、苯并[b]荧蒽、苯并[g,h,i]苝、苯并[a]蒽、荧蒽、芘、屈、茚并[1,2,3-cd]芘上有高的正负荷,同时也可以看出主要是高环的PAHs。根据上面的文献报道可得出,第一主成分F1可表征的污染源为煤的燃烧、汽车尾气的排放。
表4.15 清灌区土壤的主因子载荷
注:用主成分分析法提取出两个因子。
第二个主成分F2在菲、芴上有较高的正负荷,反映的是低环的PAHs。第二个主成分F2可表征的污染源为焦炭源。
运用SPSS对主因子分析所得的结果进行多元回归分析,进一步估算每种PAHs源的贡献率,得出的回归方程为
∑PAHs=0.981F1+0.193F2
根据因子贡献率公式可以计算出,再生水灌区土壤PAHs污染中两个主因子的贡献率分别为F1(煤的燃烧、汽车尾气)83.6%,F2(焦炭源)16.4%。可见清灌区土壤剖面PAHs的主要来源为煤的燃烧和汽车尾气的排放。
从以上分析可以看出,3个灌区土壤的PAHs污染来源主要是煤的燃烧、汽车尾气的排放、焦炭源和石油源,只是各个污染源所占的比重不同而已。因此控制北京地区汽车的保有量,加强清洁能源的推广,继续缩减煤炭在能源结构中的比重,并加强石油储藏、运输过程中的管理,可以有效地减少PAHs的污染。
这里需要说明的是,由于PAHs在环境中可能会因挥发、淋滤、降解、光解等过程而产生损失或丢失,造成“源”信息的失真,在一定程度上影响了其有效地示踪环境中该类污染物的来源。如本研究中由于污水的长期灌溉,使低环的PAHs会向下层土壤中迁移,因此表土中低环PAHs的含量会不断地发生变化,从而导致表土的PAHs的组成发生相应的变化,进而影响PAHs的来源分析。此外灌溉用水沿渠道流动水质的改变也会影响到PAH来源的判别。
什么是主成分分析方法
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。 在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征.这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面.但是,这也不是一定的,要视具体应用而定.