面对海量论文,用「带排行榜的任务索引」来导航,比逐篇读高效得多。Papers with Code 曾是这类索引的代表,把论文、代码与基准排行榜关联起来。本篇以「分子性质预测」为例,讲如何用这种方式定位 SOTA。
现状提示:Papers with Code 已于 2025 年由 Meta 关停,部分内容迁移至 Hugging Face Papers(huggingface.co/papers)。下面的「用排行榜导航」方法,同样适用于其它带基准的资源。
怎么用排行榜导航
- 先锁定任务与数据集:如「ESOL 溶解度回归」「BBBP 分类」,对应 MoleculeNet / TDC 中的标准任务。
- 看排行榜挑方法:按指标排序,找出当前领先的几个模型,再去读它们的论文与代码。
- 警惕泄漏:高分可能来自不合理的数据划分;优先信任用骨架划分、有标准基准的结果。
分子性质预测常见基准
- MoleculeNet 的 ESOL、FreeSolv、Lipophilicity(回归)、BBBP、Tox21(分类);
- TDC 的 ADMET Benchmark Group;
- 代表方法:Chemprop(D-MPNN)、Uni-Mol、各类 GNN 与分子语言模型。
关键要点
- 用「任务 + 排行榜」导航,比逐篇读论文高效;
- PwC 已关停,方法迁移到 Hugging Face Papers 等仍适用;
- 看榜先看数据划分,提防虚高分数。
延伸资源
- Hugging Face Papers:huggingface.co/papers
- 基准来源:MoleculeNet、TDC(见「数据资源」模块)。