点评 |郭安源华中科技大学张勇中国科学院动物研究所高歌北京大学|王秀杰中科院遗传发育所

编者按:“假基因”是一块亟待探索的神秘宝地,华中农大的陈振夏教授以独特的视角绘制了一个全面的假基因功能及进化蓝图。正文很精彩,几位专家的点评更为鞭辟入里,先一睹专家的精彩点评吧!


 专 家 点 评:

– 专家一 –

中科院遗传发育所

王秀杰

研究员

      假基因作为一类与蛋白编码基因具有相似序列、但却丧失了原有功能的元件,在人类基因组中数目众多。传统的遗传学观点一直认为,假基因是基因家族在进化过程中形成的无功能残留物,然而,近年来越来越多的发现表明,部分假基因可以表达,并具有较重要的调控功能。根据最新的注释(GRCh38.p14),人类基因组中的假基因数目已达16876个,其数量超过了人类基因组中蛋白编码基因数目(20203个)的80%。但对于这些假基因在物种间的序列保守性及其在人不同组织与发育阶段的表达特征与功能,还缺少系统的研究。
      华中农业大学陈振夏教授团队发表在Genome Biology上的这篇论文,系统地分析了人和小鼠基因组中假基因序列在斑马鱼、爪蟾、鸡、狗、大鼠、恒河猴、黑猩猩等物种中的进化保守性,并综合利用多种公共数据库中的表达数据,对人和小鼠假基因表达的组织特异性与发育时期特异性进行了系统研究,取得了很多有价值的科学发现。假基因在器官分化与器官特异性功能形成时期的表达变化最为活跃,随着年龄的增长,更多的假基因获得转录活性,并且这部分表达变化活跃的假基因也倾向于在肿瘤和正常组织之间差异表达,提示假基因可能在器官分化调控和功能获得与维持过程中发挥重要功能。非常有趣地,她们发现活跃表达并具有较强组织与发育时期表达动态性的假基因相比于其它假基因更长,暗示动态表达的假基因具备响应转录因子和组蛋白修饰等精准调控的能力。陈振夏教授团队还发现,与lncRNA相比,更高比例的假基因拥有编码潜能,指出部分假基因可能通过编码蛋白或短肽而发挥功能。这项工作为深入了解人类基因组中假基因的进化起源、表达动态、生理功能与调控机制提供了全面系统的线索,有望推动假基因功能研究相关的重要发现的产出,也是生物信息学研究成果为实验生物学家提供创新性研究切入点的一个绝佳范例。


– 专家二 –

北京大学生命科学学院

高歌

研究员

      基因组演化是物种演化与表型创新的核心动力与主要机制。近20年的研究发现,哺乳动物基因组中存在大量假基因(pseudogene)。前期分析显示,这些假基因在序列上虽然与基因组中存在的蛋白编码基因(protein-coding genes)高度类似,但却无法编码蛋白,因此其功能及其在演化中的作用长期以来受到学界的广泛关注。在本研究中,陈振夏教授团队基于新一代测序技术,系统探索了发育过程中人和小鼠基因组中假基因的表达与调控模式,鉴定到一批在发育过程中动态表达的假基因,并发现其呈现与蛋白编码基因相似的表达模式与功能/选择信号,提示了其潜在的演化意义。作为一篇“组学”论文,作者针对演化发育生物学中关键科学问题,综合运用计算与实验手法对假基因表达与调控进行了系统分析,是“数据导向(Data-Oriented)”与“假说驱动(Hypothesis-Driven)”范式结合的很好范例。值得指出的是,本文相关数据与代码均已在线公开,相信本文的正式发表将为从整体角度理解与解析假基因的功能与演化提供重要的数据与方法学基础。


– 专家三 –

中国科学院动物研究所

张勇

研究员

     功能基因在漫长的演化长河中可能丧失其功能,蜕变为缺乏功能的假基因。人或小鼠等哺乳类动物基因组一般被认为编码1万到2万个丧失了蛋白编码能力的假基因;这些假基因通常被认为是没有功能的进化残骸。近十几年的进展显示,部分假基因可通过结合microRNA等方式发挥功能,但这些研究往往是在癌症或其它病理条件下开展的。相比之下,除XIST、HBBP1等少数例子外,发育过程中的功能性假基因所知甚少。

      陈振夏教授团队通过对自产及公开功能基因组及进化基因组数据的深入挖掘,系统分析了假基因的功能及进化特点。尤其值得注意的是该团队探索了人和小鼠的发育转录组数据,鉴定并刻画了那些在发育过程中重现动态表达模式(上调、下调模式)的假基因(developmentally dynamic pseudogenes,DPP)。该团队鉴定了超过2000个DPP,进而通过整合表观组、调控组、进化基因组等多组学数据分析了DPP与其他假基因相比更有可能扮演重要的角色。一方面,DPP富集各类功能关联信息。例如,其启动子区被更多不同的转录因子所结合;暗示着这些假基因与剩余的假基因相比,具备更复杂的转录调控。另一方面,DPP进化上更加保守,富集那些演化上年龄比较古老的假基因。
      整体来看,该工作在哺乳动物中绘制了一个全面的假基因的功能及进化蓝图,首次系统探索了假基因在发育中的角色,为假基因的功能研究特别是其在发育中的功能研究打下了基础。


– 专家四 –

华中科技大学生命科学与技术学院

郭安源

教授

      基因在高等生物基因组中普遍存在,是基因组进化的痕迹。虽然有少数假基因被发现可以转录成非编码RNA有一定的调控功能,但大多数假基因被认为是没有功能的。

      陈振夏教授的这项工作通过结合配对样本的二代和三代测序数据以及发育时序表达数据,系统鉴定人和小鼠基因组中的假基因,分析假基因的在不同组织器官和发育阶段的表达和调控。发现了部分假基因有器官特异的表达,对器官身份的确定有一定贡献。该工作还系统分析不同发育阶段假基因的表达,鉴定了一系列的发育动态相关的假基因(DDP),并发现它们可能受到转录因子、组蛋白修饰、m6A和RBP等调控,代表一个新的调控层次。部分DDP可能可以翻译并且在癌症中有异常表达。
      这项工作巧妙地从器官特性和发育动态层次系统研究假基因的表达和功能特征,有多个新的发现,对理解基因组组成、进化和假基因功能有重要意义和贡献,也为深入系统研究某一类分子提供了一个典范。

文章正文简要报道



假基因是指基因组中与蛋白编码基因序列相似,但不能转录翻译和缺乏功能的DNA片段。因而假基因长期以来被认为是基因组中演化的遗迹和无功能的化石。随着近些年来分子生物学技术和高通量测序技术的发展,某些假基因被发现能够转录甚至翻译产生完整的蛋白质。尽管个别的有功能的假基因被报道,对于假基因整体的表达和演化调控仍然是未知的。对于人类基因组中占基因数量1/4的1.4万个假基因,其演化起源时间、表达活性以及在发育和癌症中的功能等问题仍然有待探究。

2022年10月,华中农业大学生命科学与技术学院的陈振夏教授团队在基因组学国际著名期刊《Genome Biology》发表题为“Evolution and function of developmentally dynamic pseudogenes in mammals”的研究论文,利用发育的转录组数据和表观调控组学数据对上述问题进行了系统地分析。华中农业大学的博士生钱胜为论文的第一作者,陈振夏教授为通讯作者。

假基因的起源和保守性评估

首先,研究者对人和小鼠基因组中的假基因的起源时间进行了分析。结果表明,假基因在灵长类和啮齿类中爆发式产生,并显示了较强的演化保守性。产生时间更早的假基因比最近产生的假基因的序列保守也更强,但都强与随机选择的基因间区序列,暗示这些假基因受到自然选择的约束。


假基因的演化保守性

假基因的表达和调控复杂性

随后,研究者利用三代测序和时间序列的二代测序数据,并发现大量的假基因都是可以表达的,显著高于之前的预期。且基于假基因表达量的主成分分析,聚类结果显示样本按照组织聚类,这与蛋白编码基因的聚类模式相似,表明假基因可能参与组织特异性的功能建立。研究人员根据假基因在发育过程中的表达波动情况,进一步鉴定了在发育过程中动态表达的假基因,结果表明这些动态表达的假基因活性程度更高,启动子区有更多转录因子结合,参与更广泛的RNA-RNA交互,也更容易具有翻译活性,表明这些动态的假基因很有可能是有功能的。此外,本研究还揭示了假基因在17种癌症组织中的表达水平,筛选到一批作为癌症标志物或靶标的假基因候选物。

发育动态假基因的调控模式

结语

假基因长期以来被认为是基因组中无功能的序列,其与亲本蛋白编码基因的序列相似性高,表达量低且特异性较高,这些特征使对假基因研究较为困难。本文结合三代全长转录组和发育的转录组数据进行了综合地分析,鉴定到的有功能的候选假基因为后续功能和表型的探究奠定了基础。
该项工作得到了国家自然科学基金、湖北省科技重大专项、湖北洪山实验室基金、中央高校基本科研专项资金、华中农业大学-中国农业科学院深圳农业基因组研究所合作基金和华中农业大学科技自主创新基金等项目的资助。

参考文献

Qian, S.H., Chen, L., Xiong, YL. et al. Evolution and function of developmentally dynamic pseudogenes in mammals. Genome Biol 23, 235 (2022). https://doi.org/10.1186/s13059-022-02802-y


– 通讯作者简介 –

华中农业大学

陈振夏

教授

       陈振夏/教授、博士生导师。华中农业大学生命科学技术学院、生物医学与健康学院教授、博士生导师,Briefings in Bioinformatics 副主编(Deputy Editor)。2011年在北京大学获得生物信息学博士学位;2011-2016在美国国立卫生研究院从事博士后研究。现主要开展营养基因组学研究,采用“果蝇-小鼠-人”比较基因组学研究策略,通过动物和人类营养健康的多组学数据整合分析,评估“基因-膳食-表型”的关联及其分子机制。迄今以通讯或第一作者发表Advanced Science, Genome Biology, Genome Research、Nucleic Acids Research,Molecular Biology and Evolution,Briefings in Bioinformatics等SCI论文16篇。

——— End ———

关于湖北省生物信息学会

湖北省生物信息学会,是由湖北省内从事生物信息学科技工作者自愿组成的全省性、学术性、非营利性的社会团体。学会致力于制定生物信息学专业规范,加强学术交流与合作,推动人才培养,促进理事单位及省内外生物信息学产业的健康可持续发展。