英文原题:General Framework for Geometric Deep Learning on Tensorial Properties of Molecules and Crystals.
通讯作者:徐昕 教授
作者:颜文杰、赖昕铭、陈逸诚、张文昊、吴剑鸣 副研究员

结构-性质关系始终是物理、化学与材料学的理论研究中被广泛关注的核心问题,随着人工智能与深度学习技术在科学计算领域的迅速发展,研究者已经能够利用基于数据驱动范式的机器学习模型高效预测原子体系的能量、电荷等物理化学性质,极大拓展了可探索的化学与材料空间。然而,相比于这些标量(几何变换不变量)性质,真正决定分子和材料功能性的,往往是各类响应性质,如偶极矩、极化率、介电性以及弹性系数等,反映了体系在外场/外力扰动下的响应信息,直接对应于光谱学、电磁学与力学实验中的可观测量。
这些性质在数学形式上属于张量 (tensor),具有严格的几何等变性 (equivariance) 与基本对称性(fundamental symmetry)约束,这些特性为机器学习建模带来了显著区分于标量性质的复杂度与挑战,特别对于目前使用原子体系的几何变换不变量作为特征的各类模型而言,几乎是难以胜任的。相比之下,等变图神经网络(Equivariant Graph Neural Network, EGNN)在设计理念上天然适合于对张量性质的建模任务,但相关的工作往往仅针对某种特定的张量性质进行模型的设计,这些策略受制于原子体系特点与目标张量的数学结构(阶数与对称性)往往无法被进一步推广,这造成了现有的大部分方案在对高阶张量的建模中由于其复杂的对称性约束而不适用。此外,在晶体体系中,张量性质还须服从由所属空间群所决定的内禀对称性 (intrinsic symmetry),如何在不显式硬编码晶体对称规则的情况下,让模型“学会”这些严格的几何约束,是当前几何深度学习中的一个开放难题。

图1:结合等变图网络的张量性质模拟的流程示意:(a) 以分子或晶体的原子结构为输入,通过等变图神经网络生成体系的几何表示,最终在输出阶段构建满足基本对称性约束的张量性质;(b) XPaiNN 模型的结构示意,通过分离的标量通道与等变张量通道兼顾模型的等变性与可表示性(非线性拟合能力);(c)、(d) 本研究中设计的“节点自耦合层”输出模块。
在这一背景下,由徐昕教授所领导的研究团队基于“张量的基本对称性与旋转群不可约表示的直和分解一一对应”这一群论基本事实,结合等变图神经网络模型的特点,设计提出了一种通用的张量输出模块——“节点自耦合层”,通过将对称性约束处理集中在输出阶段,使等变图神经网络能够端到端地预测任意阶数、任意基本对称性的张量性质,且适用于从原子局域性质到分子与周期性晶体的广泛体系中。通过将这一输出模块与研究团队早先提出的等变图神经网络架构 XPaiNN 结合,实现了对于各类原子体系张量响应性质,包括极化率、超极化率、化学位移、介电系数、Born 有效电荷、弹性系数的高效、高精度预测,在相关的基准测试集上均取得了优于现有最好水平的结果。值得一提的是,针对于弹性系数(四阶张量)的进一步研究表明,我们的方案对于晶体张量的内禀对称性约束是天然满足的,这得益于 XPaiNN 消息传递网络给出了符合体系几何对称性约束的隐藏层特征表示,而无需额外的硬编码,这一结果使得从高阶张量中计算得到的各向同性的弹性模量具有相比于其他方案更好的数值稳定性与更低的数值误差,为进一步的材料高通量筛选提供了可靠的保证。
总体而言,这项工作在方法上为几何深度学习提供了一种处理张量性质的系统性范式,在应用上拓展了机器学习方法在光、电、力学等功能性分子与材料设计中的边界,特别为各向异性/非线性材料领域的人工智能辅助设计与发现提供了新的见解与有力的工具,为进一步释放人工智能在科学发现领域的潜力提供了可能。
论文原文:
J. Am. Chem. Soc. 2025, 147, 51, 47044–47056.
https://doi.org/10.1021/jacs.5c12428