鞠峰1,2,3*,王慧1,2
1浙江省海岸带环境与资源研究重点实验室,工学院,西湖大学,杭州,浙江
2前沿技术研究所,浙江西湖高等研究院,杭州,浙江
3西湖实验室(生命科学与生物医学浙江省实验室),西湖大学,杭州,浙江
*通讯作者邮箱:jufeng
westlake.edu.cn宏基因组学是直接研究环境样品中的遗传学材料,主体研究对象是微生物群落的基因组,即所有微生物个体基因组的总和。随着近20年以来DNA测序成本的大幅降低(倍)和第二代高通量测序技术(NGS)大规模应用,宏基因组学(Metagenomics)正在快速发展成生物学与环境科学的一个重要的新兴交叉学科分支,其方法学正史无前例地转变着传统环境生物学与生态学的研究方式1,2。伴随着现代分子生物学方法与技术流程的不断自动化与大规模商业化,当前微生物群落研究的时间与经济成本投入已从检测通量低、劳动力密集型的分子生物学“湿实验”转变为检测通量高、数据处理密集型的计算生物学“干实验”(例如生物信息和生物统计计算)2,3。
宏基因组学是打开通往未知微生物界大门的钥匙,广义上包括环境基因组、生态基因组学和群体基因组学的研究目标与内容。自然环境中超过99%以上的微生物在已知实验室条件下尚未被分离培养。相比于传统方法(如分离与培养)与现代分子生物学技术,宏基因组学的方法与技术的最大优势体现在不依赖实验室分离培养来解码微生物组赋存的物种与基因多样性4。通过环境样品中遗传学材料的直接分离提取与测序、生物信息学、生物统计学等多方法与技术手段可全面研究微生物群落结构与功能,本文统称为“泛宏基因组”(Bulkmetagenome)。不同于基于功能表型或活性筛选(简称“功能宏基因组学”)或者是仅靶向部分微生物组信息(如16S核糖体RNA基因扩增子测序、可培养微生物群落测序)的宏基因组学研究技术路线,获取环境样品的泛宏基因组信息无需对微生物进行富集或其核酸进行PCR扩增,避免了微生物可培养性、引物设计与扩增偏好性等问题的干扰,能更真实反映微生物群落在原位环境中生物多样性及组成丰度信息。
简言之,宏基因组学突破了环境微生物难培养的研究瓶颈,打开了微生物界物种和基因多样性的知识与资源宝库,促进了包括新物种、新酶基因(如CRISPR-Cas核酸酶)、新功能代谢过程(如完全氨氧化)与新活性物质(如抗生素)的发现。此外,针对自然或工程生态系统的大规模时间与空间尺度宏基因组学研究有助于探明微生物之间及微生物与环境之间的复杂相互作用,进而阐释群落构建机制,完善群落生态学理论4-8。过去10余年基于高通量测序的宏基因组学方法与工具已被广泛应用于生物学、环境科学等领域的前沿交叉学科研究,衍生了一系列新发现与重大成果;其中,代表性的研究成果可大致归纳为以下五类:(1)新微生物物种的发现;(2)新酶基因(簇)及功能的发现;(3)新物质代谢途径的发现;(4)微生物组-环境-效能新关联的发现;(5)新生命进化树与物种分类新规则。
(1)新微生物物种的发现通过不同类型环境样品采集、核酸提取、宏基因组测序、基因组重构等多技术手段联用有助于不断发现新的微生物物种。美国加州大学伯克利分校JillBanfield教授是环境宏基因组学领域的先驱者与引领者9,10。她的团队通过利用宏基因组组装基因组(Metagenome-AssembledGenome,简称MAG)分析与转录组分析研究了科罗拉多河附近蓄水层的微生物组,发现了一类“不寻常微生物”,命名为“候选门辐射群”(CandidatePhylaRadiation,简称CPR)11。这类CPR微生物不同于传统观念中的原核生物:它们的基因组编码了外显子与内含子,还具有自我剪接的内含子及在其核糖体(rRNA)蛋白质编码基因。该发现更新了领域对原核生物组成的理解,相关成果于年在《自然》上发表后引发了国际同行对包括CPR在内的未培养微生物暗物质的进一步