2018年10月25日,在华大集团主办的第十三届国际基因组学大会(ICG-13)上,深圳国家基因银行正式发布了“中国国家基因银行数据库”(以下简称“中国基因银行数据库”),成为本次ICG大会的亮点。
国家基因银行CNGBdb平台负责人、华大集团大数据中心大数据应用团队负责人魏晓峰介绍了CNGBdb。这个平台是为了促进生物大数据的共享和利用而诞生的。与其他数据平台不同,在大数据和云计算技术的支持下,CNGBdb基于国家基因库、NCBI(国家生物技术信息中心)、EBI(欧洲生物信息学研究所)、OMIM(在线人类孟德尔遗传数据库)等平台。海量数据的整合贯穿了“搜索”、“存储”、“计算”和“使用”的多重需求,打破了该领域零散的数据库
中国国开行平台总监魏晓峰
CNGBdb到底能做什么?该平台负责人魏晓峰表示,该平台为全球科研人员提供数据归档、知识搜索、计算分析、管理授权、可视化等数据服务,覆盖妇幼保健、肿瘤、动植物多样性、病原微生物等十多个研究领域,形成了集多个研究领域、多种数据类型、多种分析维度于一体的超大型科研数据系统。
CNGBdb数据结构
CNGBdb首先解决了国内科研人员的“保存”问题——国内本地化数据存档空。其核酸序列归档系统(CNSA)提供英汉双语界面、1Gb带宽和批量归档功能,确保用户可以轻松上手、快速上传和下载,加强我国遗传数据资源的安全性。同时,CNGBdb给每个科学数据一个唯一的“身份证”——DOI(数字对象标识符),方便检索、跟踪和参考,提高了数据的暴露率和参考率。截至目前,该平台已支持近3000个项目,归档数据近600TB。
国家航天局
据悉,CNGBdb的另一大优势是AI驱动的分布式搜索引擎。同时也是生命科学垂直领域最大的搜索引擎,实现了30亿+索引和10+TB元信息的互联。文献、变异、基因、蛋白质、序列等12个结构的数据是相互联系的。搜索时将相关信息收集在同一页面,一目了然,信息收集和筛选效率翻倍。此外,CNGBdb搜索引擎不仅实现了二阶响应速度,还支持中文关键词和全文检索。
在“计算”方面,CNGBdb提供了一系列的数据计算和分析服务,其中BLAST是最值得推荐的应用之一。它是一个高性能的混合计算池,集成了NCBI最新的nt和nr库,拥有CNGB独有的数千个植物转录组数据集、1万个鸟类基因组计划数据集、全球最大的免疫序列数据集等。,方便用户搜索和比较核酸或蛋白质序列。
CNGBdb BLAST
CNGBdb的发布可谓是生命科学领域的一大成就,引起了国内外嘉宾的强烈反响。该平台已经正式上线,用户可以访问db.cngb.org体验其功能和服务。平台负责人魏晓峰表示,相信GNGBdb将为国内外生命科学领域的科研提供极大的便利。国家基因库将进一步拓展平台的数据存储,结合前沿技术不断强化平台的功能和服务,更好地推动生命多组学大数据的互联互通、开放共享和有效利用,促进生命科学和生物产业的快速发展。
登录CNGBdb或国家基因库官网
1.《bdb 国家基因库生命大数据平台上线》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《bdb 国家基因库生命大数据平台上线》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/caijing/1041096.html