MACCS Keys 是一套经典的结构键指纹。公开版本用 166 个预先定义的子结构片段(每个对应一个 SMARTS 模式),分子命中某片段则对应位置 1。
它的特点
- 固定且可解释:每一位都有明确化学含义,便于人理解。
- 短而快:仅 166 位,计算与比较都很快。
- 表达力有限:预定义片段覆盖面有限,区分细微差异不如 ECFP。
什么时候用
- 作为基线:快速做相似性筛选或建模对照。
- 需要可解释时:想知道「因为哪些子结构而相似」。
- 追求性能时,通常改用 ECFP / Morgan 或图表示。
关键要点
- MACCS = 166 个预定义子结构的指纹;
- 简单、快、可解释,但表达力有限;
- 适合做基线与可解释分析。
延伸资源
- 实操:RDKit
MACCSkeys.GenMACCSKeys(mol)。 - 对照:035《分子指纹是什么》、036《Morgan Fingerprint》。