日期:2016-04-28资料来源:生物质
相关主题:
摘要: 2016年4月18日,国际著名学术杂志《美国国家科学院院刊》杂志在线发表了中国科学院上海生命科学研究院生物化学细胞生物学研究所系统生物学重点实验室陈洛南研究小组的最新研究成果。
2016年4月18日,国际著名学术期刊《美国国家科学院院刊》杂志在线发表中国科学院上海生命科学研究院生物化学与细胞生物学研究所系统生物学重点实验室陈洛南研究组题为“Part mutual information for quantifying direct associations in networks”的最新研究成果。该成果首次提出“部分互信息”的新概念和理论,通过“部分互信息”量化网络中节点之间的直接相关性,可实现由观测数据直接构建网络。
在数据分析中,定量的标识变量的直接依赖性是一件非常重要的事情,特别是对于科学和工程中各种类型的网络重构和因果推断问题,都需要高精度的理论和方法。应用的最广泛的方法之一是偏相关性系数(partial correlation),但是偏相关性系数只能量化线性之间相关性和关联性,从而忽略非线性的关联性。然而,基于“条件独立性”(conditional independency)的“条件互信息”(CMI: conditional mutual information)可以从观察数据中量化变量之间非线性的直接关联性,优于线性的方法。但是,条件互信息存在着过低估计的问题,因而严重限制它的应用,特别是在网络节点有强相关的网络中,这个问题就更加严重。
基于这个问题,陈洛南研究组提出了全新的概念,即“偏独立性”(partial independency)以及新的度量方法,又称作“部分互信息”(PMI: part mutual information),不仅能够克服条件互信息的缺点,同时还能保持互信息和条件互信息的性质。特别是,陈洛南研究组首先定义了部分互信息用于量化变量之间直接关联性,然后从理论上给出部分互信息和互信息以及条件互信息之间的内在联系。通过数值实验,陈洛南研究组证明了部分互信息的性质和优点,接着通过用Escherichia coli和Yeast的基因表达数据重构其基因调控网络,进一步验证了部分互信息在量化网络中非线性的直接关联性的优越性。该工作对于大数据网络研究提供了全新的概念和理论,不仅可用于生物分子网络的高精度构建,而且可以应用于其他网络(领域)中各种复杂因素的因果关系推断。
图示: 比较PMI(X;Y|Z)和CMI(X;Y|Z)的统计功效。研究了十种不同类型的关系,在变量X和Z关系由弱变强的过程中,PMI(X;Y|Z)和CMI(X;Y|Z)的统计功效的变化情况。根据上图可以看出PMI(X;Y|Z)的统计功效变化并不明显,而CMI(X;Y|Z)的统计功效则随着X和Z关系的变强而逐渐减小至接近零。
原文链接:
Part mutual information for quantifying direct associations in networks
原文摘要:
Quantitatively identifying direct dependencies between variables is an important task in data analysis, in particular for reconstructing various types of networks and causal relations in science and engineering. One of the most widely used criteria is partial correlation, but it can only measure linearly direct association and miss nonlinear associations. However, based on conditional independence, conditional mutual information (CMI) is able to quantify nonlinearly direct relationships among variables from the observed data, superior to linear measures, but suffers from a serious problem of underestimation, in particular for those variables with tight associations in a network, which severely limits its applications. In this work, we propose a new concept, “partial independence,” with a new measure, “part mutual information” (PMI), which not only can overcome the problem of CMI but also retains the quantification properties of both mutual information (MI) and CMI. Specifically, we first defined PMI to measure nonlinearly direct dependencies between variables and then derived its relations with MI and CMI. Finally, we used a number of simulated data as benchmark examples to numerically demonstrate PMI features and further real gene expressiondata from Escherichia coli and yeast to reconstruct gene regulatory networks, which all validated the advantages of PMI for accurately quantifying nonlinearly direct associations in networks.
作者:陈洛南 点击:次
1.《【生物帮】PNAS:中科院生化细胞所陈洛南研究组建立量化网络中直接关联性的部分互信息新方法》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《【生物帮】PNAS:中科院生化细胞所陈洛南研究组建立量化网络中直接关联性的部分互信息新方法》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/yule/3209026.html