AIDD·Atlas AI 制药学习地图
034

分子图表示:原子、键与图神经网络的连接方式

把分子看成「原子为节点、化学键为边」的图,是图神经网络直接学习分子的基础表示。

除了字符串,分子还能天然地表示为图(graph):原子是节点(node),化学键是边(edge)。这正是图神经网络(GNN)能直接在分子上学习的基础。

分子图里有什么

  • 节点特征:元素类型、形式电荷、杂化方式、芳香性、是否在环中等。
  • 边特征:键级(单/双/三/芳香)、是否共轭、是否在环中。
  • 整体:一个分子 = 一组带特征的节点 + 边的连接关系。

为什么这种表示重要

  • 无需手工指纹:GNN 通过「消息传递」让原子沿键交换信息,自动学到表征。
  • 保留拓扑:相比固定长度指纹,图保留了完整连接结构。
  • 可扩展到 3D:加入坐标即成 3D 图,配合等变网络处理空间任务。

关键要点

  • 分子 = 图(原子=节点、键=边);
  • GNN 用消息传递自动学表征,免去手工指纹;
  • 加坐标即可扩展到 3D 任务。

延伸资源

  • 配套阅读:001 模块的 006《CS224W 图神经网络》、「AI 模型」模块《图神经网络 GNN》《Chemprop》。
  • 实操:RDKit 可导出原子/键特征,喂给 PyTorch Geometric / DGL。