即使对于经验丰富的遗传学家来说,诊断罕见的孟德尔疾病也是一项劳动密集型任务。贝勒医学院的研究人员正在尝试利用人工智能提高这一过程的效率。该团队开发了一种名为 AI-MARRVEL (AIM) 的机器学习系统,以帮助优先考虑孟德尔疾病的潜在致病变异。该研究发表在NEJM AI上。
贝勒遗传学临床诊断实验室的研究人员指出,AIM 的模块可以独立于感兴趣基因的临床知识进行预测,有助于推进新疾病机制的发现。
“罕见遗传性疾病的诊断率只有30%左右,从症状出现到诊断平均需要六年时间。迫切需要新的方法来提高诊断的速度和准确性。”共同通讯作者刘鹏飞博士,贝勒遗传学分子和人类遗传学副教授兼临床副主任。
AIM 使用已知变异和遗传分析的公共数据库进行训练,该数据库称为模型生物聚合资源稀有变异探索 (MARRVEL),该数据库先前由贝勒团队开发。 MARRVEL 数据库包含来自数千个确诊病例的超过 350 万个变异。研究人员向 AIM 提供患者的外显子组序列数据和症状,AIM 提供最有可能导致这种罕见疾病的候选基因的排名。
研究人员将 AIM 的结果与最近基准论文中使用的其他算法进行了比较。他们使用贝勒遗传学、未确诊疾病网络 (UDN) 和解密发育障碍 (DDD) 项目的三个数据队列来测试模型。 AIM 始终将诊断基因列为第一候选基因,其案例数量是使用这些真实世界数据集的所有其他基准方法的两倍。