在深入任何模型或工具之前,先要有一张「全流程地图」。AI 药物发现(AI Drug Discovery,AIDD)不是某一个算法,而是把机器学习接进传统药物研发链条的各个环节。理解这条链条,才知道每个工具、每篇论文落在哪个位置。
传统药物研发的五个阶段
- 靶点发现与验证:找到与疾病有因果关系、且「可成药」的蛋白或通路。
- 苗头化合物(Hit)发现:从化合物库筛选或从头设计,找到能结合靶点、有初步活性的分子。
- 先导化合物(Lead)优化:在保持活性的同时反复改造分子,平衡选择性、ADMET 与成药性。
- 临床前研究:药代动力学(PK)、毒理与安全性评估,决定能否申报 IND。
- 临床试验:I/II/III 期验证人体安全性与疗效。
一款新药从立项到上市,传统上往往需要十年以上、耗资数十亿美元,且绝大多数项目在中途失败。
AI 在每一步能做什么
- 靶点发现:用多组学数据、知识图谱与因果推断挖掘「疾病—基因—靶点」关系。
- Hit 发现:虚拟筛选、分子生成模型、深度学习对接,快速缩小搜索空间。
- 结构信息:AlphaFold 等结构预测,让没有晶体结构的靶点也能开展基于结构的设计。
- 先导优化:ADMET / 活性预测模型与自由能计算(FEP)辅助挑选改造方向。
- 决策:多参数优化(MPO)与主动学习,减少实验次数。
贯穿其中的是 DMTA 闭环(Design–Make–Test–Analyze,设计—合成—测试—分析):AI 主要加速「Design」和「Analyze」,而「Make」「Test」仍依赖真实的化学合成与生物实验。
关键要点
- AIDD 是「把机器学习接进药物研发链条」,不是单个算法;
- 价值在于压缩 DMTA 闭环、提高每一轮决策质量;
- AI 不替代湿实验:合成与生物测试仍是地基;
- 至今尚无完全由 AI「端到端」做出的上市药,但已有多款 AI 参与设计的分子进入临床。
延伸资源
- 本知识库「实战流程」模块:一条从 ChEMBL 拉数据到生成分子的 DMTA 端到端工作流。
- 综述阅读建议见后续文章《AI 药物发现综述怎么读》。