2020 年,谷歌旗下 “深度思维” 公司推出人工智能模型阿尔法折叠 2。如今,该模型已实现对全球已知两亿多种蛋白质结构的精准预测,将原本需要数年的人工测定周期压缩至短短几分钟,直观展现了人工智能驱动科学突破的巨大能量。
英国《自然》网站近期报道指出,阿尔法折叠 2 问世五年来,不仅彻底改变了结构生物学的研究路径,更推动计算生物学迈入发展新阶段。不过,要将其解锁的生物学洞见转化为药物开发等实际应用成果,仍需时间沉淀与持续探索。
阿尔法折叠 2 已在多个前沿科研场景中落地生根,成为科学家的得力助手。
奥地利维也纳分子病理研究所的安德烈亚・泡利团队,长期致力于精子与卵子结合机制的研究。2018 年,该团队发现斑马鱼卵表面的 Bouncer 蛋白是受精过程的关键,但始终无法破解其识别精子的核心机制。
阿尔法折叠 2 的出现为研究带来了转机。模型预测显示,一种名为 Tmem81 的蛋白会与两种精子蛋白形成复合物,进而与 Bouncer 蛋白结合。这一预测很快通过实验得到验证。
泡利表示,阿尔法折叠 2 大幅加快了研究进程,“现在我们每个项目都会用到它”。2024 年,该团队相关研究论文正式发表,而这只是引用《自然》杂志阿尔法折叠 2 原始论文的近 4 万篇文献之一。2021 年 7 月,“深度思维” 开源了这一模型,并在《自然》上详细阐述其技术原理。
与多数高被引论文的热度衰减不同,科学界对阿尔法折叠 2 的关注至今热度未减。研究人员认为,开放共享是其迅速普及的核心原因。“深度思维” 不仅公开了算法代码,还与欧洲分子生物学实验室合作搭建了 “阿尔法折叠数据库”。目前该数据库已收录超过 2.4 亿个结构预测结果,覆盖绝大多数已知蛋白质,为全球 100 多个国家的 330 万名研究者提供了有力支持。
阿尔法折叠 2 带来最深远变革的领域,当属结构生物学。欧洲生物信息学研究所的珍妮特・桑顿直言,它 “重塑了结构生物学的面貌”。
数据显示,使用阿尔法折叠 2 模型的研究人员,向蛋白质数据库提交结构的数量比未使用者高出约 50%,提交效率也优于采用其他 AI 方法或传统技术的团队。
更值得关注的是,这个基于蛋白质数据库训练而成的 AI 模型,正在反哺实验科学。阿尔法折叠 2 的开发者约翰・江珀强调,模型预测的结构能帮助研究人员解析 X 射线晶体学和冷冻电镜获取的实验数据,这对原本为其提供训练数据的实验研究者而言尤为珍贵。
计算生物学也借势迎来发展新机遇。桑顿观察到,如今学术会议上几乎每一个报告都会提及阿尔法折叠 2。在直接引用该模型的文献中,AI 辅助药物研发、蛋白质设计等方向的研究尤为突出。
美国哥伦比亚大学计算生物学家穆罕默德・阿尔库赖希坦言,阿尔法折叠 2 问世之初,不少同行曾陷入 “生存危机”,担忧蛋白质结构预测这一核心难题已被彻底攻克。但事实证明,它不仅没有终结相关研究,反而开辟了更多创新赛道 ——AI 蛋白质设计就是典型代表,既激发了科研人员的新热情,也吸引了更多资金投入该领域。
目前,科学家已借助阿尔法折叠 2 设计出应对抗生素耐药性的解决方案,探寻疟疾等疾病的新疗法,同时在深入解析疾病机制、加速靶向药物开发等方面取得重要进展。
直接引用相关论文或使用数据库,仅仅是阿尔法折叠 2 影响力的冰山一角。
英国伦敦创新增长实验室科学家乔治・理查森与大卫・安普迪亚・文森特的综合分析显示,超过 20 万项研究、近 80 万名科学家直接或间接受益于阿尔法折叠 2。
不过,当两人尝试量化其具体影响时,却发现情况远比预期复杂:实验室论文产出增幅约为 5%,个人研究者的产出增幅仅为 2%。理查森指出,阿尔法折叠 2 并未催生 “论文工厂”,其核心价值体现在更深层次的科研范式革新上。
在临床应用与商业转化层面,阿尔法折叠 2 的影响同样呈现多元化特征。或许是因为问世仅五年,时间尚短,其成果尚未充分体现在专利等商业化指标中。江珀也认为,将生物学见解转化为切实可行的应用方案,需要足够的时间积累。
2024 年,阿尔法折叠 3 正式发布,该模型在药物发现领域的潜力更为突出,能够精准预测潜在药物与蛋白质的相互作用,这一能力也使其成为 2024 年诺贝尔化学奖相关成果的核心应用方向。
江珀强调,基于阿尔法折叠 2 的研究发现,已经在帮助科学家揭示疾病背后的深层机制。未来,随着技术的持续迭代与应用的不断深化,必将有更多患者从中受益,重获健康。