AIDD·Atlas AI 制药学习地图
002

AI DD 与传统 CADD 的区别:新手必须先理解的边界

CADD 靠物理与规则,AIDD 靠数据与学习。理清两者的能力边界与互补关系,才不会误把 AI 当万能、也不会低估经典方法。

很多新手以为 AI 药物发现(AIDD)会「取代」传统的计算机辅助药物设计(CADD)。实际上两者是不同的方法论,各有擅长,且在现代流程里高度互补。

传统 CADD:物理与规则驱动

CADD 已有数十年历史,核心是用物理化学原理和经验规则来建模分子与靶点的相互作用,主要两条路线:

  • 基于结构(SBDD):分子对接(Docking)、分子动力学(MD)、自由能微扰(FEP)、药效团。
  • 基于配体(LBDD):QSAR、相似性搜索、药效团匹配。

优点是机制清晰、可解释、有物理基础;缺点是计算昂贵、打分函数近似、对柔性与水分子等处理有限。

AIDD:数据驱动的学习

AIDD 用机器学习/深度学习从大量数据中「学」出规律,而不是显式编码物理:

  • 表征学习:让模型自动学到分子的有用特征(如图神经网络、分子语言模型)。
  • 生成模型:直接生成满足约束的新分子。
  • 端到端预测:活性、ADMET、相互作用等任务的快速预测。

优点是快、能处理物理难以建模的任务;缺点是依赖数据质量与数量,存在分布外失效、数据泄漏制造虚假高分等陷阱。

边界与互补

  • AI 不替代物理:很多「AI 管线」内部仍在用对接、MD、FEP 做打分或验证。
  • 物理增强 AI:机器学习力场(MLFF)、AlphaFold + 对接等混合方案正在兴起。
  • 按问题选择:有可靠结构和算力时,FEP 等物理方法在先导优化中仍是金标准;数据充足、需要海量筛选时,AI 更高效。

关键要点

  • CADD = 机制 / 物理 / 可解释;AIDD = 数据 / 模式 / 高吞吐;
  • 现代项目几乎都是「AI + CADD」混合,而非二选一;
  • 警惕:测试集高分 ≠ 真实可用,先理解数据划分与泄漏。

延伸资源

  • 「结构与模拟」模块:Docking、MD 与自由能的系统介绍。
  • 「AI 模型」模块:模型范式、方法论与常见陷阱(含 Benchmark 数据泄漏)。