但是,医学领域和上述场景不同,后者已经拥有大量的经过标记的数据,而前者则没有。医学博士亚伯拉罕·韦尔盖斯(Abraham Verghese)表示,要想突破这一难关,人类必须开发出更多人工智能的潜力。开发的关键,在于如何让机器脱离对标注数据的依赖,拥有人类大脑的学习能力,将一个领域的知识应用于另一个领域。
此外,人工智能虽然颇具争议,但其能够带来的优势也十分喜人。医学博士埃里克·J.托波尔(Eric J. Topol)认为,这些优势很快会给医院带来许多改变。
人工智能未来将面临的挑战
获得人类的学习方式
未来,人工智能将面临许多挑战,其中最主要、最关键的是如何获得人类的学习方式。
人工智能目前的学习方式是“监督式学习”,也就是研究者需要将经过标记的数据输入其程序之中进行学习训练。显然,“监督式学习”并不是人类学习的方式,人类的学习方式为“迁移学习”(transfer learning),也就是将一个领域的知识应用到另一个从未接触过的领域。
这也是“学习”真正的意义。如果一个人在有限的领域所学到的知识,无法应用到其他领域,那就说明其并没有学到那个领域的基本、抽象的概念。
目前,人工智能过度依赖计算机模型,而不是真实的环境。以糖尿病性视网膜病变为例,在计算机模拟的实验室环境下,研究人员做了4组实验,其诊断数据准确率高达98%至99%。但回到临床实验时,准确率下降至约90%。
从计算机到真实的环境,原始数据集的准确率呈现下降的趋势。如果人工智能的发展停留在监督式学习阶段,那么未来计算机模拟数据和临床数据的差异会进一步扩大。
因此,如何摆脱监督式学习,或者说如何实现知识迁移学习,是人工智能技术在未来10年取得突破性进展的关键。
自然语言处理
2020年,大多数临床医生每和患者相处1小时,就意味着在电子病历上花费2小时,且每天晚上,他们还要在电子邮件上消耗1小时。
在韦尔盖斯看来,既然人工智能和视网膜病变的诊断都取得了突破性进展,现在是时候处理医生工作不断被电子文字打断的问题了。他认为,人工智能中的自然语言处理技术(Natural Language Processing, NLP)或许会有所帮助。
所谓自然语言,其实就是人类所用的语言。文字转录就是自然语言处理的进展之一。
梅兰妮·米切尔(Melanie Mitchell)是一位人工智能领域的专家,著有《人工智能:人类思维学习指南》(Artificial Intelligence: A Guide for Thinking Humans),现任职于美国圣塔菲研究所(Santa Fe Institute,SFI)和波特兰州立大学(Portland State University)。她的哥哥曾经是一名医疗记录员,每天的工作就是按照医生的口述,记录病历。但现在,这份工作已经被自然语言处理系统取代了。
米切尔表示,这是医学上一个巨大的进步,因为它证明了蛮力统计(brute-force statistics)是一个有效的方式。之所以称其为“蛮力”,是因为自然语言处理系统并不懂得人类的语言,但仍然可以进行转录。事实上,不同语言间的翻译也是如此——有很多翻译效果良好的软件,使用的也是“蛮力统计”方法。
但是,“蛮力统计”不是自然语言处理技术的终点。米切尔认为,真正的自然语言处理技术可以满足更多需求,包括真正理解人类语言,如,IBM Watson技术平台。
如果没有时间阅读所有发表的医学文献,IBM Watson能够在阅读指定文献后,回答你的问题。要做到这一点,IBM Watson需要做到理解文献内容,而“理解”文字比翻译,或单纯的文字转录要困难许多。
米切尔表示,这种“理解”目前还不确定到底是什么,但有一点非常明确,那就是“理解”也不是人工智能技术真正的终点,甚至可以说还相距甚远。
复制危机
2020年早些时候,中国的研究人员发布了一个可预测新冠肺炎确诊患者死亡率的模型,准确率超过90%。该模型选取了3个标志物,分别是C-反应蛋白、淋巴细胞计数和乳酸脱氢酶。
2020年12月中旬,《自然》子刊《机器智能》(Nature Machine Intelligence)上发表了三篇来自美国、荷兰和法国的研究报告,否定了此前中国的研究。研究人员分别检测了本国新冠肺炎确诊患者后发现,如果依靠中国研究中的三种标记物来预测死亡率,其准确率不足50%。
这就是“复制危机”(replication crisis)。复制危机是医学界普遍存在的问题。有人可能会认为,电脑处理比人工处理更客观,因此解决复制危机可以依靠电脑,但事实并非如此。
电脑系统、数据本身、数据的处理过程中存在各种各样的影响因素,研究人员或许认为电脑已经把影响因素排除了,但有些影响因素,研究人员根本预想不到。因此,复制他人的研究成果极为困难。
如今,为了尽量避免复制危机,一些权威期刊在发表文章之前,要求研究人员给出研究数据的全部细节,包括如何展开研究等。
但是,在人工智能领域,人工智能专家没有接受过这本属于其他领域的训练,没有系统学习统计学和避免科研成果不可复制的方法。因此,“复制危机”已成为人工智能应用于医学实践的新的阻碍。
人工智能和医学的融合趋势
很多人可能会问,“人工智能带来了如此多的问题和威胁!为什么还要研究人工智能?”
米切尔表示,这些质疑都是合理的,但不可否认的是,人工智能可能带来的优势也十分惊人,特别是其在医学上的应用。而且,这些优势很快会给医院带来许多改变。
托波尔表示,随着自然语言处理技术的不断发展,敲击键盘录入文字的形式首先会从医学领域消失。随着键盘的消失,医生和患者能够做到真正的对话,相处时间也将得以延长。
从长远来看,人工智能的数据和算法会不断扩大其可验证的空间,最终变得可复制,当然还是脱离不开人类的监督。
除给医院带来好处以外,人工智能还有其他惊人的潜力。例如,偏远地区的居民可以获得跟城市居民一样的医疗服务;老年人可以获得跟年轻人一样的疗效;行动不便的人可以获得跟健康人一样的定期护理体验;远程医疗等。
此外,未来,人工智能的算法会给予患者更多的尊重。到时,患者的数据不会只掌握在医生和护士手中。作为数据的生产者,患者也可以通过传感器、电子病历等各种方式查看并了解自己的诊疗数据。
米切尔表示,科技的落脚点始终在“人”身上,人工智能技术更多是作为辅助工具,拓宽医生的诊疗照护能力,从而为患者提供更好的医疗服务。人工智能技术能够给医生带来许多帮助,并不会对医生这个职业造成威胁。