除了字符串,分子还能天然地表示为图(graph):原子是节点(node),化学键是边(edge)。这正是图神经网络(GNN)能直接在分子上学习的基础。
分子图里有什么
- 节点特征:元素类型、形式电荷、杂化方式、芳香性、是否在环中等。
- 边特征:键级(单/双/三/芳香)、是否共轭、是否在环中。
- 整体:一个分子 = 一组带特征的节点 + 边的连接关系。
为什么这种表示重要
- 无需手工指纹:GNN 通过「消息传递」让原子沿键交换信息,自动学到表征。
- 保留拓扑:相比固定长度指纹,图保留了完整连接结构。
- 可扩展到 3D:加入坐标即成 3D 图,配合等变网络处理空间任务。
关键要点
- 分子 = 图(原子=节点、键=边);
- GNN 用消息传递自动学表征,免去手工指纹;
- 加坐标即可扩展到 3D 任务。
延伸资源
- 配套阅读:001 模块的 006《CS224W 图神经网络》、「AI 模型」模块《图神经网络 GNN》《Chemprop》。
- 实操:RDKit 可导出原子/键特征,喂给 PyTorch Geometric / DGL。