当前位置:首页 > 旅游指南

pca 你是否真的了解PCA?

主成分分析法应用广泛,一直是热门话题。关于PCA的文章很多,不考虑它的原理,图形解释,绘制方法。它还广泛应用于转录组、种群进化、微生物生态学,甚至金融和教育。

今天我们简单介绍一下PCA分析与微生物物种多样性的关系。在微生物群落的研究中,正常的PCA图如图1所示,一般以二维坐标显示,其中样本为点,物种为箭头。

很多常见的PCA图像因为不显示所以没有箭头,但最原始的PCA图像其实是有箭头的。这种图也叫双标图,就是一个图同时显示物种和样本。

图1。典型主成分分析图

主坐标

主成分分析的特点是“主坐标”,这在大多数解释中都应该提到。主要坐标是什么?这里有一个简单的例子,比如表1中物种X样本的丰度表,包括S1-S6的6个样本点和A、B、C三个物种,其中S1、S2、S3为一组,另外三个样本为另一组。

因为在一般的实验设计中,样本是根据某些性质分组的,所以同一组中的物种在理论上会有相似的丰度模式,所以实际上,样本之间的关系可以通过一些物种来判断。从表1中我们可以发现,不同样品中A和B物种的丰度是不同的,但是C是相同的,所以我们不能用C来区分样品,所以只有A和B适合区分样品。

但是A和B的歧视程度是有区别的。a在所有样本中跨度较大,表现出前三个样本和后三个样本分别聚集的趋势;B在所有样本中均匀分布,所以A比B更能区分样本分组,这里A更能说明样本的分布规律,即“第一主坐标”,B是“第二主坐标”,C是“第三主坐标”,因为区分度最差。

表1物种多度表

S1

S2

S3

第四心音

表面抗原-5

S6

A

100

90

80

40

30

20

B

45

四十二岁

39

36

33

30

C

80

80

80

80

80

80

群集

PCA的作用其实是通过物种多度模型找到样本的距离关系,使同一分组的点在图中更加接近。怎么做?我们再举一个简单的例子。我们使用omicshare工具绘制了上标数据的三维散点图,结果如图2所示。为了便于解释,我顺便标注了三个物种轴A、B、C和所有样本点。

从图中可以简单看出,物种丰富度模式相似的点(如S1、S2、S3)在图中靠得更近,形成“聚集”效应。那么,最极端的是,如果S1,S2,S3都是A: 100,B: 45,C: 80,那么这三点就完全重合了!

图2。三维效果图

降维

降维是PCA中最常提到的词。社区里检测到了成千上万的微生物。前面说过,一个物种是一维的,那么1000个物种就是1000维空。我们正常人是无法识别和理解空这样的高维的,所以需要把空这样的高维简化成三维甚至二维,这样大家才能明白降维就是这样。

要理解和实现降维,需要依靠前面的“主坐标”概念。我将图2的三维图形投影在坐标a、b和c上,这是图3的效果。图3的本质是三维化简为一维,是一个相对简单的降维例子。降维后,我们可以将A、B、C三个投影与图2中的原始三维图形进行对比,发现A轴上的点聚类模式最能还原原始三维图形,C轴上的投影还原效果最差(简直是误解!)。

原来降维可能失真了!怎么办?结合主坐标的重要性,我们可以发现从数据表上看A轴的数据最有代表性,从降维图上看A轴的效果也最好。所以我们在降维的时候一定要保证选定的轴是最有代表性的,那么图形失真的比例自然会降低。

图3。降维效果图

坐标变换

这部分应该是最难理解和解释的,不打算在这里花太多篇幅。上面说的降维,尽量找最有代表性的物种来显示图形作为坐标轴,以减少失真效果。但实际上,由于数据的复杂性,很难有一个可以直接作为坐标的“已知物种”。这时,我们必须“创造”一个虚假的物种。

在表1的A、B、C三个物种中,A物种很有代表性。但实际数据往往如表2所示,A、B、C作为代表物种不是很合适。非得降维,怎么办?当物种足够多的时候,空之间的维数会很高。通过空(这个我们无法理解)之间不断的投影和变换,总会找到一个新的物种坐标A ',B '。

算法上,A '和B '是通过分解其他物种合成的。不存在,但在映射中最有代表性。这类似于图4中的投影。我们不断的移动灯泡位置,总能找到白纸上一个点最合理的投影。这时候白纸的坐标就是我们说的新合成的坐标。

表2 .物种多度表

S1

S2

S3

第四心音

表面抗原-5

S6

A

100

56

60

43

20

0

B

20

22

64

54

40

12

C

80

35

55

97

43

图4。灯泡投影效应

实际应用

不可忽视的一点是,PCA在社区研究中的应用越来越少,这主要与其线性模型有关。它会默认所有物种都沿着环境梯度线性变化,但实际上是不可能的(如果你对线性解释感兴趣,可以自行搜索)。要解决这个问题,需要CA,PCoA等方法。

另外,由于PCA的线性特征,会过分强调优势种在群落中的作用。在稀有物种较多的样品(如环境土壤样品)中,PCA的分析效果可能很差,值得注意。

1.《pca 你是否真的了解PCA?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《pca 你是否真的了解PCA?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/junshi/1586693.html

上一篇

我的前半生结局是什么 我的前半生2小说结局是什么

下一篇

卧蚕眉 说到丹凤眼卧蚕眉过五关,你会想起谁?黄飞虎名气为何不如关羽?

宁珂 2020[PCA专业咖啡冲煮大师竞技赛]奖品赞助商—宁珂斯特

  • 宁珂 2020[PCA专业咖啡冲煮大师竞技赛]奖品赞助商—宁珂斯特
  • 宁珂 2020[PCA专业咖啡冲煮大师竞技赛]奖品赞助商—宁珂斯特
  • 宁珂 2020[PCA专业咖啡冲煮大师竞技赛]奖品赞助商—宁珂斯特

飞天鸡 为了一口鲜美的鸡汤,他用8年把一只濒临灭绝的“飞天鸡”,变成了70w+的新物种

上海大众总经理 PCauto专访众道上汽大众总经理刘宏卫

上海大众总经理 PCauto专访众道上汽大众总经理刘宏卫

2019广州车展隆重开幕。各大汽车厂商都展出了他们最新的产品和技术,很多新车都让人眼花缭乱。太平洋汽车网在车展上采访了中岛上汽大众总经理刘宏伟。以下是采访记录:   太平洋汽车网:你好,刘先生。欢迎来到太平洋展位接受独家采访。能否介绍一下本次上汽大众品牌展的亮点? 刘宏伟:从今年10月31日起,大...

上海大众老总 PCauto专访众道上汽大众总经理刘宏卫

上海大众老总 PCauto专访众道上汽大众总经理刘宏卫

2019广州车展隆重开幕。各大汽车厂商都展出了他们最新的产品和技术,很多新车都让人眼花缭乱。太平洋汽车网在车展上采访了中岛上汽大众总经理刘宏伟。以下是采访记录:   太平洋汽车网:你好,刘先生。欢迎来到太平洋展位接受独家采访。能否介绍一下本次上汽大众品牌展的亮点? 刘宏伟:从今年10月31日起,大...

smc气动元件 SMC气动元件系列产品选型样本库

smc气动元件 SMC气动元件系列产品选型样本库

SMC(中国)有限公司是SMC集团于1994年9月在北京经济技术开发区投资设立的全资子公司,是北京首批高新技术企业之一。公司采用世界同行业最精英的自动化生产设备,引进了完整、现代化的气动元件制造工艺。经过18年的快速发展,SMC(中国)有限公司已成为世界上最大的气动元件生产和出口基地之一,...

smc气动 SMC气动元件系列产品选型样本库

SMC(中国)有限公司是SMC集团于1994年9月在北京经济技术开发区投资设立的全资子公司,是北京首批高新技术企业之一。公司采用世界同行业最精英的自动化生产设备,引进了完整、现代化的气动元件制造工艺。经过18年的快速发展,SMC(中国)有限公司已成为世界上最大的气动元件生产和出口基地之一,...

北极熊坐标 我在北极七年,告诉你“北极熊灭绝、32℃高温”的真相

  • 北极熊坐标 我在北极七年,告诉你“北极熊灭绝、32℃高温”的真相
  • 北极熊坐标 我在北极七年,告诉你“北极熊灭绝、32℃高温”的真相
  • 北极熊坐标 我在北极七年,告诉你“北极熊灭绝、32℃高温”的真相
南港展览馆 【展会公告】TPCA Show 2020将于10/21-23日在台北南港展览馆扩大举办!届时,与您相约!

南港展览馆 【展会公告】TPCA Show 2020将于10/21-23日在台北南港展览馆扩大举办!届时,与您相约!

2020年TPCA展 10月21 ~ 23日,台北南港展览馆,遇见你! TPCA 2020展决心扩大规模 10月21 ~ 23日台北南港展览馆 新电子制造产业链的跨境平台共同展示了电子行业资源整合的有效性  致TPCA成员: 虽然今年疫情干扰了经济增长,但对5G部署和生态链的需求持续扩大。...