解码“基因宝藏”:最全海洋微生物基因数据库出炉
9月4日晚,华大生命科学研究院(简称“华大”)联合山东大学、英国东安格利亚大学、中国海洋大学、厦门大学、丹麦哥本哈根大学等机构,在《自然》上发表研究成果。
他们通过对目前已公开的海洋微生物宏基因组数据进行分析和深度挖掘,构建了迄今为止最完整的海洋微生物基因数据库,并从中发现了大量具有应用潜力的基因资源,有望为开发新型基因编辑工具、抗菌肽、PET塑料降解酶等提供了全新思路,助力相关产业的应用发展。
审稿人在评价中指出,“该研究很好地证明了海洋微生物的无限可能,为在海量基因组数据中挖掘生物技术与生物医学相关的宝贵资源指引了方向”,“将对研究和利用海洋微生物相关的多个研究领域产生持续、长久的积极影响”。
超2万个海洋微生物新物种被发现
海洋是地球上最广阔且最为复杂的生态系统之一,占全球表面的70%以上,有着丰富的生物多样性和生物资源。海洋微生物作为海洋生态系统的基础组成部分,在全球生物地球化学循环中起核心作用,拥有巨大数量和多样性。然而,目前科学家们对海洋微生物的了解仍是“冰山一角”。
在这项研究中,研究团队历时五年,通过对目前已公开的接近240Tb的海洋微生物宏基因组数据进行重分析,构建了拥有超4.31万个海洋微生物基因组和24.58亿个基因序列的海洋微生物组数据库The Global Ocean Microbiome Catalogue(GOMC),覆盖范围包括从南极到北极、从近海到深远海、从表层海洋到万米超深渊等多样化的海洋生态系统。
“研究团队建立的数据库是已公开报道的海洋基因组数据库Tara Ocean 的3倍、蛋白序列库的60倍。在该数据库中,我们发现有2万多个微生物是潜在的新发现物种,首次发现近1万个在深海等独特生境中的微生物。” 文章共同第一作者、华大生命科学研究院专项科学家陈建威博士介绍。
据了解,研究团队使用了宏基因组分箱技术对海量数据进行重分析,获取了海洋环境中大量不可培养微生物的全基因组序列,包括新物种的基因组及其功能信息等。“在未来基因资源利用上,基于已挖掘出有应用潜力的微生物基因组数据,结合合成生物学技术有望实现微生物活性功能的大规模开发利用。” 文章共同通讯作者、英国东安格利亚大学教授Thomas Mock表示。
该研究不仅极大拓宽了对海洋微生物多样性的理解,刷新了过去认知中海洋原核微生物基因组大小的上限,揭示了缺氧海洋环境对大基因组细菌的适应性演化提供了选择压力,解析了全球海洋微生物群落的生物地理分布规律,为理解微生物在不同海洋环境中的遗传连通性提供了新的视角。
解码“基因宝藏”,助力产业发展
除了构建GOMC数据库,研究团队还利用深度学习算法工具对数据库中的“基因宝藏”进行挖掘,发现了多项具有应用潜力的基因资源。
例如,研究团队鉴定了117个新型抗菌肽,并通过生物合成和实验验证发现,其中10个抗菌肽具有显著抗菌活性及广谱抗菌效果。基于该成果,华大目前已联合香港理工大学开展相关合作,研究抗生素耐药性难题并探索其产业化潜力。
此外,研究团队还在数据库中发现了能够助力塑料污染难题的新型塑料降解酶。他们发掘了3个深海来源的高活性新型嗜盐PET塑料降解酶,3天内对PET薄膜降解率达到83%,是已报道的IsPETase塑料降解酶活性的44倍。
“塑料污染是全球性难题,以PET生物酶法来降解、再生和升级PET塑料可以解决塑料污染,提升环境生态效益,是该领域的研究热点。新型PET塑料降解酶有望推动PET塑料的绿色低碳可持续利用,减少塑料制造工业对石油的依赖和碳排放。”文章共同通讯作者、山东大学微生物技术国家重点实验室常务副主任李盛英表示。
据了解,目前GOMC数据库已存储于国家基因库生命大数据平台,研究团队基于GOMC数据库和自有的极端生境基因数据,进一步开发了贯穿序列鉴定、结构预测与聚类、酶蛋白活性位点精准预测和高通量基因合成等全链条AI技术辅助的功能基因挖掘技术体系,并面向全球学者提供海洋及极端环境来源的新型酶高效挖掘技术服务平台。
“这一研究标志着海洋宏基因组学领域的一个新高度,凸显了海洋微生物组在改善人类福祉和促进环境可持续性发展上的关键作用。这些发现不仅为全球科学家对海洋的可持续探索和利用开辟了广阔前景,也为未来的生物技术和生物医学研究奠定了基础。”文章共同通讯作者、华大生命科学研究院主任科学家范广益表示。
相关论文信息:https://doi.org/10.1038/s41586-024-07891-2
分享1 |