《AI未来进行式》
李开复 陈楸帆 著
浙江人民出版社出版
人工智能专家李开复与科幻作家陈楸帆创造性合作,畅想了20年后在人工智能等科技影响下的人类世界。
书中10个短篇故事,展示了一系列令人大开眼界的未来场景——身临其境的沉浸式娱乐方式、自如使用人类语言的虚拟伴侣、 没有“司机”的完全自动驾驶汽车、能够以假乱真的照片和视频,以及基于量子计算、计算机视觉和其他 AI 技术的展开应用……
在这些故事给读者带来惊奇体验的同时,每一个故事之后的科技评论则让我们进行突破性的深度思考——人工智能能否帮助人类从根源上预防疫情?人们该如何应对未来的职场挑战?在人工智能主导的世界中,该如何确保文化多样性?人们如何教导下一代适应人类与人工智能共存的新社会?如何面对人工智能带来的社会问题,及其所隐含的人性拉锯战?
>>书摘
在故事《无接触之恋》发生的时代,人类社会已经被疫情彻底改变——直到最后,新冠病毒(COVID-19)也没有被彻底消灭,相反,它进化成了一种长期存在的、不断变异的季节性病毒。
这当然只是一种虚构的情境。然而,在经历了一次新冠肺炎疫情之后,不论这种病毒今后会如何变异,可以确定的是,AI将重塑整个医疗行业,例如加快疫苗和相关药物的研发,加速AI诊断与现有医疗手段进行技术集成的进程,等等。在本章,我将对新冠病毒如何推动这些技术的发展进行讨论。我们现在对人工智能医疗的关注尤其及时,因为医疗行业正在数字化,而这将产生人工智能颠覆医疗所需的大量数据。2042年当我们回顾,我们可能会看到过去20年医疗领域是AI颠覆最大的行业。
●传统药物及疫苗研发
长期以来,药物及疫苗的研发都是一件极其耗时、成本高昂的工作。想象一下,人类用了100多年时间,才完成了脑膜炎疫苗的研制和改进。而在这次新冠肺炎疫情中,正是因为各国政府把史无前例的巨额资金投入多条研发赛道,支撑了大量的临床试验和量产尝试,医药企业的疫苗研发才推进得如此迅速。
在等待了一年之后,我们终于用上了安全有效的新冠疫苗。好在新冠病毒的致死率没有那么高,这样的等待才显得可以接受。然而,如果新冠病毒进化成一种像埃博拉一样致命的传染病,情况就会变得完全不同。因此,考虑到未来可能出现新的传染病,疫苗和药物的研发速度仍然需要继续提高。
研发药物时,第一步先要理解病毒蛋白质(氨基酸序列)是如何折叠成独特的3D结构的。理解这种3D结构,对解读病毒的工作原理并找到对抗它的方法至关重要。例如,就像钥匙插入锁孔中一样,新冠病毒表面的刺突蛋白可以附着在人体细胞表面的受体上。当新冠病毒侵入人体细胞后,新冠病毒基因组(新冠病毒的RNA)将被传递、整合到宿主细胞上,然后在许多器官中不断复制,从而导致感染者表现出一系列的症状。
针对某种病原体的小分子药物发明,是通过将治疗分子附着在病原体上来抑制其功能而起作用。这种治疗分子的发现过程可以分为以下四个步骤:
第一步,利用mRNA序列推导病原体的蛋白质序列(现在这一步不难实现);
第二步,探索该蛋白质序列的三维结构(蛋白质折叠方式);
第三步,确定三维结构上的靶点;
第四步,生成可能有效的靶向分子,然后从中选择最佳临床前候选药物。
如果回到之前用过的类比,那么第一、二、三步相当于摸清锁的结构,第四步相当于打造一把适配的钥匙。这四个步骤需要依次完成,后三个步骤的工作不仅非常耗时,而且成本高昂。
例如第二步,为了确定病毒蛋白质序列的三维结构,科学家会使用冷冻电子显微镜成像等技术,直接观察病毒蛋白,然后一步一步艰苦地摸索、推敲出3D蛋白质结构。
第三、第四步是找到靶点并设计出对应的靶向药物,这是一个漫长的试错之旅,而且需要科学家具备强烈的直觉、丰富的经验和好运气。不过,就算科学家耗费数年时间锁定了一种临床前候选药物,它也有90%的概率无法通过二期、三期临床试验。这个探索过程会耗费相当长的时间。当然,也可以并行探索几种不同的方法,不过这样虽然可以缩短时间,但需要大量的资金投入。
●AI在蛋白质折叠、药物筛选及研发方面的潜力
目前,要研发一种有效的药物或疫苗,需要投入10亿―20亿美元的资金和数年的研发时间。我相信,AI将大幅提升药物的研发速度,降低研发成本,为患者提供更多价格在可承受范围内的特效药,帮助患者活得更健康、更长寿。
2020年,DeepMind公司针对蛋白质折叠研究(药物研发的第二步),推出了蛋白质折叠预测软件AlphaFold,可以说,这是迄今为止AI在科学领域最伟大的成就。
蛋白质是生命的基石,但对于人类来说,蛋白质的氨基酸序列如何折叠成3D结构,从而成为生命活动功能执行者的整个过程,仍是一个谜。解开这个谜,不仅具有重大的科学意义,对医学领域也有极高的价值。恰巧,深度学习技术似乎非常适合在这个问题上“大展拳脚”。
AlphaFold背后的训练数据集非常庞大,包含了过去发现的所有蛋白质三维结构信息。目前,AlphaFold已经证明了它模拟未知蛋白质三维结构的能力,其准确性与传统方法(如上面提到的冷冻电子显微镜成像技术)不相上下。区别在于,传统方法成本高、耗时长,而且只能解析所有蛋白质结构中不到0.1%的部分;AlphaFold的出现,提供了一种快速扩大人类已知蛋白质数量的方法,被视为“解决了困扰生物学界50年之久的巨大挑战”,是一项划时代的突破。
一旦掌握了蛋白质的三维结构,“药物再利用”就成了一种能够帮科学家快速找到有效治疗手段的方法,即尝试每一种已经证明对一些小病安全、有效的现有药物,看看其中哪些药物可能成功嵌入当前病毒的蛋白质三维结构。
“药物再利用”方法有可能成为一条捷径,从而使人类能够在一场严重的流行病发生之初就阻止病毒的传播。因为这些能被“再利用”的药物均已通过不良反应测试,可以直接使用,无须再经过大范围临床试验。《无接触之恋》中的男主角加西亚在被检测出携带COVID-Ar-41的变体病毒后,临床中心就立即启动了AI程序,以“再利用”一种能够减轻他的症状的药物。
科学家还可以充分利用AI的优势,发明新的化合物。AI可以锁定一些靶向分子可能附着的靶点(药物研发的第三步)。如果给定一个靶点,AI模型就可以通过识别数据的内部模式,来缩小对药物的搜索及筛选范围,锁定候选药物(药物研发的第四步)。2021年,AI药物研发公司英矽智能宣布其利用AI完成了治疗特发性肺纤维化的新药研发,先在三维结构上找到靶点(第三步),然后提取相关信息并找到最佳的靶点分子(第四步)。英矽智能的AI技术不仅为药物研发的后两个步骤节省了90%的成本,还创造了一项不可思议的奇迹:用18个月的时间完成了新药研发。要知道,传统新药研发往往要耗时10年以上,耗资超过20亿美元。
此外,AI还可以整合多方面知识来优化第三、四步研发过程。例如,自然语言处理(NLP)技术可对海量学术论文、专利成果和公开数据进行深入挖掘,从中提取出能够帮助锁定靶点或有效分子排序的信息。AI还可以根据过去的临床试验结果,预测所有潜在候选新药的有效性,为进一步排序提供参考。这些,都可以在计算机系统上模拟完成。科学家可以站在AI的肩膀上,参考系统给出的推断,排除“错误选项”,然后再进行下一步研究。
当然,除利用计算机模拟进行研究的“干实验”外,还有一种“湿实验”,即在实验室培养皿中对人体细胞展开药物测试。对于这一类实验,AI同样有很大的施展空间。在今天,由机器人来主导这类实验,会比由实验室技术员来操作更加高效,而且可以采集到更多的数据。镁伽机器人就是这样的先进公司,镁伽的实验室机器人,无须人工干预,就能进行24小时全天候的重复实验,这将大大加快药物的研发速度。
>>作者简介
李开复,卡内基梅隆大学计算机科学博士。曾担任谷歌全球副总裁兼大中华区总裁。2009年创立创新工场,致力帮助创业者成长与发展。
陈楸帆,科幻作家、编剧、翻译、策展人。中国科普作家协会副理事长,世界华人科幻协会名誉会长。
作者:李开复 陈楸帆
1