对有药物化学背景、想补计算能力的人来说,Pat Walters(Patrick Walters)维护的 Practical Cheminformatics 博客是最实战的入口。他长期在药企/Biotech 做计算,文章从真实问题出发,几乎每篇都带可运行的 RDKit 与机器学习代码。
这个博客好在哪
- 问题导向:不是教语法,而是回答「相似性怎么算才靠谱」「数据集怎么划分不作弊」这类一线问题。
- 代码可跑:配套 Jupyter Notebook,强调可复现与常见坑。
- 有判断:会指出方法的局限与误用,培养「批判地用工具」的习惯。
适合谁、怎么用
- 药化 / 生物背景:把它当「计算直觉」的来源,先读与你项目相关的主题。
- 算法背景:用它理解化学问题的真实约束,避免做出「分数高但没用」的模型。
- 读法建议:挑一个主题(如指纹与相似性),把对应 Notebook 跑一遍再读下一篇。
关键要点
- 问题导向 + 可运行代码,是药化补计算的最佳实战读物;
- 重点学它「对方法局限的判断」,而非只抄代码;
- 和 RDKit Cookbook(013)配合:一个讲思路,一个查用法。
延伸资源
- 博客:practicalcheminformatics.blogspot.com
- 配套代码:作者在 GitHub 的 PatWalters 仓库。