AI 药物发现是典型的交叉学科,需要三条主线的基础:生物学、药物化学、算法与编程。没人能同时精通三者,关键是认清自己缺哪块、按优先级补齐。
三条主线各学什么
- 生物学主线:分子与细胞生物学、疾病机制、靶点与通路、组学数据的基本概念。决定你「为什么做这个靶点」。
- 药物化学主线:构效关系(SAR)、ADMET 与成药性、类药规则、基本的合成可行性直觉。决定你「这个分子能不能成药」。
- 算法主线:Python 编程、机器学习与深度学习基础、化学信息学(RDKit)、图神经网络与生成模型。决定你「怎么把问题变成可计算的任务」。
按出身规划最短路径
- 计算机 / 算法背景:算法主线已有,重点补生物与药化常识,先能看懂任务的生物意义与成药性约束,再深入。建议从「分子表示」「成药性」模块入手。
- 生物 / 药学背景:懂生物与药化,重点补编程与 ML。先把 Python + RDKit 跑通,再学经典模型,避免一上来啃复杂论文。
- 化学 / 计算化学背景:熟悉结构与模拟,重点补数据科学与深度学习范式,把 CADD 直觉迁移到数据驱动方法上。
一个务实的学习顺序
- 先建立全局地图(本模块 001、002);
- 打通工具链:Python + RDKit + 一个 AI 框架(DeepChem,见 004);
- 系统认识数据与任务(TDC,见 005、009);
- 补深度学习基础(6.S191,见 007)与图模型(CS224W,见 006);
- 进入实战:跑一条 DMTA 工作流(「实战流程」模块)。
关键要点
- 不要三线齐头并进,先补「能看懂任务」的最低限度,再纵深;
- 工具先跑起来,再回头补理论,正反馈最重要;
- 以「做出一条端到端流程」为阶段目标,而非刷完所有课。
延伸资源
- 004《DeepChem 教程体系入门》、005《TDC 教程》:最快搭起工具与数据基础。
- 「分子表示」模块:算法背景补化学常识的最佳入口。