AIDD·Atlas AI 制药学习地图

002

AI DD 与传统 CADD 的区别：新手必须先理解的边界

CADD 靠物理与规则，AIDD 靠数据与学习。理清两者的能力边界与互补关系，才不会误把 AI 当万能、也不会低估经典方法。

很多新手以为 AI 药物发现（AIDD）会「取代」传统的计算机辅助药物设计（CADD）。实际上两者是不同的方法论，各有擅长，且在现代流程里高度互补。

传统 CADD：物理与规则驱动

CADD 已有数十年历史，核心是用物理化学原理和经验规则来建模分子与靶点的相互作用，主要两条路线：

基于结构（SBDD）：分子对接（Docking）、分子动力学（MD）、自由能微扰（FEP）、药效团。
基于配体（LBDD）：QSAR、相似性搜索、药效团匹配。

优点是机制清晰、可解释、有物理基础；缺点是计算昂贵、打分函数近似、对柔性与水分子等处理有限。

AIDD：数据驱动的学习

AIDD 用机器学习/深度学习从大量数据中「学」出规律，而不是显式编码物理：

表征学习：让模型自动学到分子的有用特征（如图神经网络、分子语言模型）。
生成模型：直接生成满足约束的新分子。
端到端预测：活性、ADMET、相互作用等任务的快速预测。

优点是快、能处理物理难以建模的任务；缺点是依赖数据质量与数量，存在分布外失效、数据泄漏制造虚假高分等陷阱。

边界与互补

AI 不替代物理：很多「AI 管线」内部仍在用对接、MD、FEP 做打分或验证。
物理增强 AI：机器学习力场（MLFF）、AlphaFold + 对接等混合方案正在兴起。
按问题选择：有可靠结构和算力时，FEP 等物理方法在先导优化中仍是金标准；数据充足、需要海量筛选时，AI 更高效。

关键要点

CADD = 机制 / 物理 / 可解释；AIDD = 数据 / 模式 / 高吞吐；
现代项目几乎都是「AI + CADD」混合，而非二选一；
警惕：测试集高分 ≠ 真实可用，先理解数据划分与泄漏。

延伸资源

「结构与模拟」模块：Docking、MD 与自由能的系统介绍。
「AI 模型」模块：模型范式、方法论与常见陷阱（含 Benchmark 数据泄漏）。