点评 |赵方庆中科院北京生科院刘翟中科院武汉病毒所刘琦同济大学|蒋兴鹏华中师范大学|  周宏伟南方医科大学

编者按:基于人体内微生物特征的疾病诊断,已经慢慢走进到临床。但是不同区域的人群,在微生物群体特征方面存在异质性,这为基于微生物特征的诊断标准化带来了挑战,宁康教授的这项研究无疑推动了这项挑战的解决。先一睹五位专家的重磅精彩点评吧!

– 专家一 –

中科院北京生科院

赵方庆

研究员、杰青

      许多疾病都与肠道菌群密切相关,但是由于种族、饮食等多种因素的影响,包括二型糖尿病、炎症性肠病在内的多种疾病往往呈现出高度的区域异质性。尤其是我国幅员辽阔,在不同地域散居着不同的民族,他们在遗传背景和生活习惯上不尽相同,这也导致了人群间肠道菌群的差异,如何统一不同地域间基于微生物的疾病诊断标准,探索出一套适合于不同区域人群的普适诊疗策略是一项亟待解决的问题。基于微生物特征的机器学习方法已经在多种疾病诊断中得到了应用,但是由于无法克服区域效应,这些方法在跨区域的疾病诊断中往往效力不足。

      宁康教授团队的这项工作为我们提供了很好的范例,通过迁移学习与神经网络的融合,这个模型非常巧妙地利用了不同区域人群的微生物组特征,消除了由于区域异质性带来的系统偏差,实现了基于微生物的跨区域疾病诊断。迁移学习模型在跨地级市和跨洲际队列的疾病诊断中都具有很高的准确性和鲁棒性,通过迁移学习发现的区域特异性菌种也将对跨区域疾病诊断做出重要的贡献。这项工作有助于我们更深入地理解菌群标志物在疾病发生发展中的作用,促进多种疾病的跨区域诊断,对于大人群普适性诊疗策略的应用和推广具有重大意义。人工智能方法和生物大数据挖掘是21世纪最前沿的领域,该研究充分发挥人工智能迁移学习的优势,为我们深入挖掘菌群数据提供了绝佳范例。

– 专家二 –

中科院武汉病毒所

刘翟

研究员

    种族、区域、饮食习惯等因素造就了人群微生物组的异质性,从而限制了机器学习模型在跨区域等人群疾病诊断中的应用。宁康教授团队应用迁移学习的方法,分别在广东肠道微生物组项目的数据集和跨洲际队列中,通过提取出A地区与疾病潜在关联的特征知识,进而应用于B地区相关疾病预测模型的构建,实现了高准确性、高鲁棒性的基于微生物的跨地级市和跨洲疾病诊断,同时也发现地区特异性微生物可能对迁移学习模型的跨区域诊断产生影响。该研究工作为克服我国幅员辽阔、各地诊疗水平不一所带来的诊疗质量差异问题,实现跨地域的疾病诊断有重要的借鉴和指导意义。宁康教授团队常年在生物信息学交叉学科领域探索,应用生物信息学和人工智能挖掘方法研究人体微生物组学大数据中的“暗物质”和发现新的知识,在肠道疾病、癌症等多种人体疾病的前期诊断和复发监控方面取得了一系列成果,为应用生物信息学方法探索人体未知知识和临床疾病诊断、预测等方向做出了重要贡献。

– 专家三 –

同济大学

刘琦

教授

      构建普适有效的宏基因组疾病诊断模型面临跨数据源,跨病种,跨地域等特点和痛点,迁移学习是解决目标域标记样本稀缺的有效手段。本工作中,宁康教授团队采用迁移学习的思想,探索解决不同城市宏基因组数据整合所存在的数据异质性问题。该工作表明,通过使用数据迁移的思想,可以构建在不同地域之间可迁移的疾病预测模型,有助于实现跨域的微生物疾病诊断模型,是迁移学习在微生物领域应用的有益尝试。

– 专家四 –

华中师范大学

蒋兴鹏

教授

      

      宁康教授团队这篇论文的研究兼具学术价值和应用价值,在微生物的跨区域疾病诊断问题上作出了严谨的研究和突破,在方法上,他们使用融合迁移学习的方式,将从一个区域学习到的特征“迁移”到另一个区域,最终获得具有两区域普适特征的模型,并验证了此方法的有效性。可以试想,若能够收集到中国各地的肠道微生物组样本,经过精准标注和合理训练,我们也许可以找到应对不同疾病的模版方法,由此克服不同地域的诊疗质量问题。

– 专家五 –

南方医科大学

周宏伟

教授、杰青


     多项研究表明肠道菌群在多种疾病状态下发生显著的紊乱,且利用这些紊乱特征建立判别模型可进行疾病的诊断和风险评估,是该领域的重要研究和转化方向。但其中一个关键瓶颈是肠道菌群存在显著的地域性,庞杂的疾病菌谱在一个地区富集出部分,而在另一个地区可能富集出其他部分,导致基于一个地区的菌群数据所建立的诊断模型难以外推至另外一个地区,阻碍了菌群应用于疾病诊断。

      202210月,华中科技大学生命学院系统生物学与生物信息学系宁康教授团队在胃肠病学、肝病学国际顶尖期刊《GUT》发表题为“Overcoming regional limitations:
Transfer learning for cross-regional microbial-based diagnosis of diseases”
的研究论文,创新提出利用迁移学习来克服菌群的区域效应,具有重要的启发价值。

      该研究发现,一个地区所建立的菌群模型,虽然不能直接外推到其他地区,但采用迁移学习的思路,仅需要在其他地区采集小部分病例/对照数据来训练已有的模型,即可完成模型的地域迁移。迁移模型显著优于单个地区模型的直接外推,甚至优于本地数据建模预测,说明模型在学习了多地的特征后显著提高了普适性。该方法具有可操作性,值得进一步在更广的区域范围进行验证,也为基于肠道菌群的跨区域疾病诊断和风险预测提供了重要路径。期待研究者们在更大范围验证、拓展该方法,从而实现菌群标志物挖掘以及菌群风险诊断的突破。


文章正文简要报道


一方水土养育一方人,由于地域、饮食习惯、种族、疾病等因素的影响,不同地区人群的肠道微生物有非常明显的异质性。虽然基于微生物特征的机器学习方法已经被用于一些疾病的诊断中,但是由于肠道菌群异质性的存在,现有的方法无法满足基于微生物的跨区域疾病诊断的需求。

2022年10月,华中科技大学生命科学与技术学院的宁康教授团队在胃肠病学、肝病学国际顶尖期刊《GUT》发表题为“Overcoming regional limitations: Transfer learning for cross-regional microbial-based diagnosis of diseases”的研究论文,提出利用迁移学习来克服区域效应,实现基于微生物特征的跨区域疾病诊断。华中科技大学的王南博士为论文的第一作者,宁康教授为通讯作者。

迁移学习模型的建立

针对以上问题,科研人员提出一种融合迁移学习以及神经网络的框架,此框架可以“借用”一个地区成熟的疾病诊断的知识,来用于另一个地区的疾病诊断,从而克服区域效应,实现基于微生物的跨区域疾病诊断。

融合迁移学习以及神经网络的微生物组大数据分析框架

模型的验证和优势

在本工作中,科研人员将此框架应用于来自广东肠道微生物组项目(GGMP)的6,998个粪便微生物组样本,根据其来源将其划分为14个不同的地级市(区)。据结果显示,与从头训练模型相比,迁移学习模型进行跨地级市疾病诊断的准确性最具优势,并且将其应用到跨洲际队列的疾病诊断当中时,迁移学习模型仍具有更优越的准确性。此外,科研人员通过迁移学习发现了受地域因素影响作用较大的菌种,例如Clostridium,这些菌种可能对迁移学习模型在跨区域疾病诊断当中的有效性具有潜在的贡献。

该方法在多个不同疾病上显示了出众的优势

结语

中国幅员辽阔,各地医生队伍水平参差不齐。本项目所提出来的基于迁移学习的人工智能方法,本质上是一种基于大数据的普适性的诊疗策略。这种策略的应用和推广,可以非常有效的克服地域差异所带来的诊疗质量问题,大幅度提高诊疗准确性和速度,帮助“新时代的赤脚医生”为人民群众提供更高质量的诊疗服务。

该研究得到科技部国家重点研发计划(No. 2018YFC0910502),国家自然科学基金(Nos. 32071465, 31871334, 31671374)等的资助。该工作也得到了GGMP项目主要负责人,南方医科大学周宏伟教授等的大力支持。


近年来,华中科技大学生命科学与技术学院宁康教授团队在生物信息学交叉学科领域进行不断探索,针对人体微生物组学大数据,发展了一系列人工智能挖掘方法,并成功应用于肠道疾病、类风湿性关节炎、非传染性慢性疾病、人体癌症等多种疾病的前期诊断和复发监控,相关论文发表于PNAS、Gut(3篇)、Annals of the Rheumatic Diseases、Genome Biology、Genome Medicine、Gut Microbes等医学、生物学和生物信息学领域国际顶尖期刊。相关方法和模型,已经在合作医疗机构进行临床测试。

参考文献

Nan Wang, Mingyue Cheng, Kang Ning. Overcoming regional limitations: transfer learning for cross-regional microbial-based diagnosis of diseases. Gut, DOI: 10.1136/gutjnl-2022-328216.


– 通讯作者简介 –

华中科技大学

宁康

教授

宁康教授毕业于新加坡国立大学计算机专业,博士后工作于美国密歇根大学,现为华中科技大学大学生命科学与技术学院教授、博士生导师。宁康教授长期从事生物信息学与大数据研究,在《PNAS》、《Genome Biology》、《Genome Medicine》、《Gut》等领域内顶级学术期刊上发表了超过100篇论文;文章总引用超过4000次,H指数30(Google Scholar)。获得软件著作权6项,申请国家发明专利20余项。担任国际期刊iMeta、Genomics Proteomics Bioinformatics、Microbiology Spectrum、Scientific Reports等编委。担任中国生物信息学学会-基因组信息学分会副主任,中国生物工程学会-计算生物学与生物信息学专业委员会委员,中国计算机协会-生物信息学专业委员会委员等。


——— End ———

关于湖北省生物信息学会

湖北省生物信息学会,是由湖北省内从事生物信息学科技工作者自愿组成的全省性、学术性、非营利性的社会团体。学会致力于制定生物信息学专业规范,加强学术交流与合作,推动人才培养,促进理事单位及省内外生物信息学产业的健康可持续发展。