很多新手以为 AI 药物发现(AIDD)会「取代」传统的计算机辅助药物设计(CADD)。实际上两者是不同的方法论,各有擅长,且在现代流程里高度互补。
传统 CADD:物理与规则驱动
CADD 已有数十年历史,核心是用物理化学原理和经验规则来建模分子与靶点的相互作用,主要两条路线:
- 基于结构(SBDD):分子对接(Docking)、分子动力学(MD)、自由能微扰(FEP)、药效团。
- 基于配体(LBDD):QSAR、相似性搜索、药效团匹配。
优点是机制清晰、可解释、有物理基础;缺点是计算昂贵、打分函数近似、对柔性与水分子等处理有限。
AIDD:数据驱动的学习
AIDD 用机器学习/深度学习从大量数据中「学」出规律,而不是显式编码物理:
- 表征学习:让模型自动学到分子的有用特征(如图神经网络、分子语言模型)。
- 生成模型:直接生成满足约束的新分子。
- 端到端预测:活性、ADMET、相互作用等任务的快速预测。
优点是快、能处理物理难以建模的任务;缺点是依赖数据质量与数量,存在分布外失效、数据泄漏制造虚假高分等陷阱。
边界与互补
- AI 不替代物理:很多「AI 管线」内部仍在用对接、MD、FEP 做打分或验证。
- 物理增强 AI:机器学习力场(MLFF)、AlphaFold + 对接等混合方案正在兴起。
- 按问题选择:有可靠结构和算力时,FEP 等物理方法在先导优化中仍是金标准;数据充足、需要海量筛选时,AI 更高效。
关键要点
- CADD = 机制 / 物理 / 可解释;AIDD = 数据 / 模式 / 高吞吐;
- 现代项目几乎都是「AI + CADD」混合,而非二选一;
- 警惕:测试集高分 ≠ 真实可用,先理解数据划分与泄漏。
延伸资源
- 「结构与模拟」模块:Docking、MD 与自由能的系统介绍。
- 「AI 模型」模块:模型范式、方法论与常见陷阱(含 Benchmark 数据泄漏)。