QSAR(Quantitative Structure–Activity Relationship,定量构效关系)是化学信息学最经典的建模范式:用分子的描述符或指纹作为输入,建立「结构 → 生物活性」的定量预测模型。
QSAR 的基本流程
- 特征化:把分子转成描述符或指纹(见 035)。
- 建模:用回归/分类模型(线性模型、随机森林、神经网络)拟合活性。
- 验证:用合理划分的测试集评估,关注泛化而非训练分数。
用好 QSAR 的关键
- 适用域(applicability domain):模型只在与训练集相似的化学空间里可信,外推要小心。
- 数据质量:活性数据需统一来源与单位,噪声直接决定上限。
- 划分方式:随机划分常高估,优先骨架划分(见 051)。
关键要点
- QSAR = 用结构特征定量预测活性;
- 核心是适用域意识与诚实的验证;
- 它仍是很多任务的强基线。
延伸资源
- 对照:045《QSPR 入门》(预测理化性质)。
- 「AI 模型」模块:活性预测模型与现代方法。