主成分分析法应用广泛,一直是热门话题。关于PCA的文章很多,不考虑它的原理,图形解释,绘制方法。它还广泛应用于转录组、种群进化、微生物生态学,甚至金融和教育。
今天我们简单介绍一下PCA分析与微生物物种多样性的关系。在微生物群落的研究中,正常的PCA图如图1所示,一般以二维坐标显示,其中样本为点,物种为箭头。
很多常见的PCA图像因为不显示所以没有箭头,但最原始的PCA图像其实是有箭头的。这种图也叫双标图,就是一个图同时显示物种和样本。
图1。典型主成分分析图
主坐标
主成分分析的特点是“主坐标”,这在大多数解释中都应该提到。主要坐标是什么?这里有一个简单的例子,比如表1中物种X样本的丰度表,包括S1-S6的6个样本点和A、B、C三个物种,其中S1、S2、S3为一组,另外三个样本为另一组。
因为在一般的实验设计中,样本是根据某些性质分组的,所以同一组中的物种在理论上会有相似的丰度模式,所以实际上,样本之间的关系可以通过一些物种来判断。从表1中我们可以发现,不同样品中A和B物种的丰度是不同的,但是C是相同的,所以我们不能用C来区分样品,所以只有A和B适合区分样品。
但是A和B的歧视程度是有区别的。a在所有样本中跨度较大,表现出前三个样本和后三个样本分别聚集的趋势;B在所有样本中均匀分布,所以A比B更能区分样本分组,这里A更能说明样本的分布规律,即“第一主坐标”,B是“第二主坐标”,C是“第三主坐标”,因为区分度最差。
表1物种多度表
S1
S2
S3
第四心音
表面抗原-5
S6
A
100
90
80
40
30
20
B
45
四十二岁
39
36
33
30
C
80
80
80
80
80
80
群集
PCA的作用其实是通过物种多度模型找到样本的距离关系,使同一分组的点在图中更加接近。怎么做?我们再举一个简单的例子。我们使用omicshare工具绘制了上标数据的三维散点图,结果如图2所示。为了便于解释,我顺便标注了三个物种轴A、B、C和所有样本点。
从图中可以简单看出,物种丰富度模式相似的点(如S1、S2、S3)在图中靠得更近,形成“聚集”效应。那么,最极端的是,如果S1,S2,S3都是A: 100,B: 45,C: 80,那么这三点就完全重合了!
图2。三维效果图
降维
降维是PCA中最常提到的词。社区里检测到了成千上万的微生物。前面说过,一个物种是一维的,那么1000个物种就是1000维空。我们正常人是无法识别和理解空这样的高维的,所以需要把空这样的高维简化成三维甚至二维,这样大家才能明白降维就是这样。
要理解和实现降维,需要依靠前面的“主坐标”概念。我将图2的三维图形投影在坐标a、b和c上,这是图3的效果。图3的本质是三维化简为一维,是一个相对简单的降维例子。降维后,我们可以将A、B、C三个投影与图2中的原始三维图形进行对比,发现A轴上的点聚类模式最能还原原始三维图形,C轴上的投影还原效果最差(简直是误解!)。
原来降维可能失真了!怎么办?结合主坐标的重要性,我们可以发现从数据表上看A轴的数据最有代表性,从降维图上看A轴的效果也最好。所以我们在降维的时候一定要保证选定的轴是最有代表性的,那么图形失真的比例自然会降低。
图3。降维效果图
坐标变换
这部分应该是最难理解和解释的,不打算在这里花太多篇幅。上面说的降维,尽量找最有代表性的物种来显示图形作为坐标轴,以减少失真效果。但实际上,由于数据的复杂性,很难有一个可以直接作为坐标的“已知物种”。这时,我们必须“创造”一个虚假的物种。
在表1的A、B、C三个物种中,A物种很有代表性。但实际数据往往如表2所示,A、B、C作为代表物种不是很合适。非得降维,怎么办?当物种足够多的时候,空之间的维数会很高。通过空(这个我们无法理解)之间不断的投影和变换,总会找到一个新的物种坐标A ',B '。
算法上,A '和B '是通过分解其他物种合成的。不存在,但在映射中最有代表性。这类似于图4中的投影。我们不断的移动灯泡位置,总能找到白纸上一个点最合理的投影。这时候白纸的坐标就是我们说的新合成的坐标。
表2 .物种多度表
S1
S2
S3
第四心音
表面抗原-5
S6
A
100
56
60
43
20
0
B
20
22
64
54
40
12
C
80
35
55
97
九
43
图4。灯泡投影效应
实际应用
不可忽视的一点是,PCA在社区研究中的应用越来越少,这主要与其线性模型有关。它会默认所有物种都沿着环境梯度线性变化,但实际上是不可能的(如果你对线性解释感兴趣,可以自行搜索)。要解决这个问题,需要CA,PCoA等方法。
另外,由于PCA的线性特征,会过分强调优势种在群落中的作用。在稀有物种较多的样品(如环境土壤样品)中,PCA的分析效果可能很差,值得注意。
1.《pca 你是否真的了解PCA?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《pca 你是否真的了解PCA?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/junshi/1586693.html