世界上有1万多种罕见疾病,其中的75%会影响儿童,而受影响的孩子中有大约三分之一活不到5岁生日。罕见疾病不会引起太多的关注,而且它们的检测非常具有挑战性。
在安德鲁的病例中,多亏了人工智能计算机视觉应用程序,他获得了快速诊断,从而在治疗上取得了突破。那么,面部图片是这些致命疾病的可靠指标吗?在可供算法进行训练的信息如此之少的情况下,人工智能能够检测罕见疾病吗?本文将对这些问题展开讨论,并分享当今医生在采用这些解决方案时的做法。
两个因素使得罕见的遗传性疾病更加致命——缺乏认识,以及缺乏有针对性的治疗。
每12个婴儿中就有1个在生下来时患有罕见疾病。尽管全世界有3亿多罕见疾病患者,但人们对这些疾病的认知水平很低。由于影响儿童的罕见疾病超过1万种,相关病例的长尾分布非常分散。与安德鲁不同的是,大多数孩子的病情多年来一直没有被发现,直到症状变得严重。而让情况更复杂的是,找到遗传学家并不容易,光是预约就可能需要几个月的时间。
由于制药公司优先为影响大量人口的疾病研发药物,大多数罕见疾病都缺乏治疗方法。由于每种罕见疾病的患者只有几千人,商业化研究手段无法实行。尽管对罕见病的治疗有激励措施,但罕见病药物的研发却被边缘化了。
不过,面对作出正确诊断和提供高质量护理的双重挑战,技术正催生出新的解决方案。
“你能确定某人患有唐氏综合症吗?”专注于计算机视觉领域的连续创业家Moti Shniberg问道。唐氏综合症是一种导致儿童智力残疾和发育迟缓的遗传性疾病,而该疾病会表现出明显的面部状况,很容易识别。
由于每700个儿童中有1个受到该疾病影响,“我们很有可能遇到过患有这种疾病的人,”Moti Shniberg表示。“在最初看了几个患有该疾病的孩子之后,作为人类的我们往往会立即发现这些病例。我们的大脑在没有任何专业医学知识的情况下,就被训练成能直观地发现这种病症。”
然而,即便是专家,要想将这一视觉技能扩展到其他罕见疾病也是一项挑战。成千上万的罕见疾病有着截然不同的症状,而每一种疾病只影响全球数千名儿童,我们的大脑没有足够的例子来进行学习。
这就是计算机视觉可以提供帮助的地方。为此,Moti Shniberg创建了Face.com,这是一个面部识别平台,在互联网上发现了超过180亿张脸。2012年,他把公司卖给了Facebook。当他和搭档Lior Wolf试图用计算机视觉和深度学习来解决其他有影响力的问题时,他们偶然发现了在罕见遗传性疾病中的应用机会。
于是,他们成立了FDNA公司,并开始开发由人工智能驱动的应用程序,如Face2Gene,以便用视觉方式来检测罕见的遗传性疾病。其算法被设计成只从每一种罕见疾病的少数患者的历史照片中进行学习。
在过去的十年里,FDNA通过与遗传学家的合作建立了一个包含5,000种罕见疾病的数据库。“我们的面部识别算法可以检测到1,500种这类疾病,”Moti Shniberg解释说。“其他3,500种疾病则利用了包括自然语言处理在内的技术来进行临床特征分析。”该数据库是Face2Gene背后的支撑,其只需要通过智能手机拍摄的一张面部照片就能帮助诊断病情。
2003年,科学家对整个人类基因组进行了测序。这一里程碑引发了社会对于基因分型(genotyping)如何检测和治疗遗传性疾病的强烈关注。大约20年后的今天,许多公司可以花费小几百美元对个人的完整DNA进行测序。然而,这些进步还没有给遗传性疾病的检测带来改变。
利用基因分型来发现疾病就像在海洋中寻找一艘失踪的船只。“我们谈论的是大量的数据,因为我们的遗传物质非常复杂,”Karen Gripp说道。这种方法本身并不是很有效,至少现在还不是。
与此同时,表型分型技术(phenotyping)出现了显著进步,该技术利用可观察到的特征来了解生物,而其中便包括通过面部特征研究来发现潜在疾病。由于人工智能和计算机视觉能力有了新发展,由人工智能驱动的算法可以立即检测出疾病。它们可以通过对医学影像展开的视觉检查,以及诸如人声、打字模式和其他数字化生物标记等输入信息来实现检测。
在实践中,基因分型和表型分型这两种方法不是竞争的,而是互补的。面部表型可以作为一种初步的诊断工具,帮助我们快速、高效地确定候选名单。
“如果我们已经对病人进行了评估,并知道了需要检查的基因,那我们就有了一个非常好的鉴别诊断,”Karen Gripp解释道。“接下来,对我们从基因测试中得到的数据进行分析就会简单得多。”
面部检测的算法很好,但并不完美。当病人有潜在的严重疾病时,错误清除病人信息的代价会很高昂,而且对健康人士发出错误的警报也会引发负面影响。
FDNA在Nature Medicine上发表的文章中表示,他们的解决方案对前十名的预测有91%的准确性:也就是说,在91%的情况下,实际发生的疾病会出现在算法所推荐的前十种情况中。在这一点上,人工智能需要来自人类的帮助。
“这是一个提供建议的工具,我们不应该指望它做出诊断,”Karen Gripp指出。“我们只把它作为评估病人的一种额外工具。”而当这样的工具与医生配对时,它可以变成一个强有力的临床辅助。
这种方法在哪些领域可能会失败?“这种解决方案不能解决单纯的神经退行性疾病,”Karen Gripp称。在不涉及身体结构变化的情况下,计算机视觉的用途是有限的,而这些领域是其他的生物标志物和临床特征分析方法可以派上用场的地方。这种组合疗法对于完整覆盖1万种罕见疾病至关重要。
算法偏见是另一个需要处理的风险。宾夕法尼亚州立大学医学院的医学教授Jennifer Kraschnewski说:“在获得更好的医疗保健服务的人群中,罕见疾病的确诊率可能会更高。这可能会让人工智能训练数据集在无意中存在偏差,从而更加难以识别在代表性不足人群中的罕见疾病,并对此产生下游效应。”
Moti Shniberg分享道,FDNA在去年与150个国家的5,000多家机构进行了合作。“如今,全世界大约70%的遗传学家都在使用我们的工具。”另外,新冠期间远程医疗的普及加速了FDNA的成功。其应用程序可以很容易地集成到远程医疗会议中,并根据患者的面部特征向医生分享实时建议。
FDNA团队正致力于将该工具推广给儿科医生,与远程医疗公司合作,并直接向父母提供该应用程序,以提高其认同度。该公司有一个雄心勃勃的目标,即在未来两年内将患者覆盖范围从2021年的8万名扩大到100万名以上。
实现人工智能工具的采用需要多管齐下。“医学院和医学继续教育课程必须将这些工具整合到实践中,以确保我们在照顾患者时能适当地运用这些应用,”Jennifer Kraschnewski补充道。
尽管美国食品药品监督管理局(FDA)在治疗罕见遗传性疾病方面提供了财政激励,但这1万种疾病中只有5%有相应的治疗方法。Moti Shniberg认为,他们的目标是帮助100万罕见疾病患者,而这将引发连锁反应。
首先,通过简单的点击和上传应用程序,罕见病疾病将更容易被发现,再加上强大的分发策略,罕见疾病的检测会更简单、更有效。
其次,更多罕见疾病患者的发现有助于达到吸引制药公司关注所需的患者门槛,并推动针对新罕见疾病的药物研发工作。
希望在未来,像安德鲁这样的孩子不需要等待数年才能得到正确的诊断和治疗,能够尽快过上高质量的生活。