联系我们
地址: 安徽省合肥市高新区望江西路5089号
邮编: 230026
电话: 0551-62391679
邮箱: iai@iai.ustc.edu.cn
人工智能研究院团队提出高性能通用电子结构哈密顿量预测模型
文章来源:本站原创 发布时间:2026-04-07 10:24:38 文章作者:本站编辑

图1:论文被ICLR 2026录用
近日,合肥综合性国家科学中心人工智能研究院与中国科学技术大学团队提出通用电子结构预测模型 NextHAM,实现了跨元素周期表、覆盖 60 余种常用元素的电子结构哈密顿量高精度预测。团队同步开源 Materials-HAM-SOC 数据集,填补了相关领域的数据空白。相关成果已发表于国际人工智能顶级会议 ICLR(CCF-A类),标志着 AI 电子结构计算迈出关键一步。
电子结构计算是理解凝聚态体系中电子行为的关键理论工具,为预测材料的电导性、磁性、光学响应及拓扑等重要物性提供了基础支撑,在半导体、新能源和功能材料等多个领域中发挥着核心作用。其本质在于求解体系的电子哈密顿量矩阵,并由此获得轨道能量、能带结构及电子波函数等关键物理量。
传统密度泛函理论(DFT)方法以自洽迭代为核心,需要反复对大规模矩阵进行对角化运算,计算复杂度随体系规模迅速增长。巨大的计算开销使得 DFT 方法难以直接应用于大原子数和复杂结构体系,显著制约了其应用范围。近年来,深度学习方法在电子结构计算中展现出显著优势。通过直接预测哈密顿量矩阵,此类方法可绕过传统自洽迭代过程,大幅降低计算成本,为大规模原子体系的电子结构预测提供了全新的技术路径,显著拓展了材料仿真与设计的研究边界。然而,现有深度学习模型在通用性和精确性方面仍面临严峻挑战:面对元素周期表中种类繁多的原子类型、复杂多变的晶体结构以及哈密顿量本身的高维特性,模型往往难以在不同材料体系间保持稳健的泛化能力。为降低建模难度,现有研究常被迫作出妥协,如限制元素种类、忽略自旋轨道耦合(SOC) 效应或对轨道基组进行裁剪,从而在一定程度上削弱了模型的实际应用价值。
针对上述挑战,来自合肥综合性国家科学中心人工智能研究院和中国科学技术大学的研究团队近日取得重要研究进展,成功研发出跨元素周期表的人工智能电子结构预测模型 NextHAM(如图 2 所示),在覆盖60多种元素的材料空间中表现优异(如图3所示)。团队构建了基于 Transformer 架构的非线性 E(3) 等变模型,在严格保持旋转、平移和反演等空间对称性的同时,系统性地解决了电子哈密顿量预测中的关键困难。
在模型设计上,NextHAM 引入初始电子哈密顿量作为核心物理描述符,并以此为基准学习真实哈密顿量与初始近似之间的“差值结构”,而非从零开始直接回归完整矩阵元。这一策略显著降低了学习任务的难度,使模型能够更有效地捕捉由化学环境、轨道杂化及相对论效应引起的精细修正,从而在预测精度和跨元素泛化能力上均取得显著提升。实践表明,该方法在复杂多元素体系中尤为关键,是模型能够稳定覆盖大范围元素周期表的重要基础。
此外,仅在实空间学习哈密顿量时,能带预测中往往会出现非物理的“鬼态”。针对这一问题,NextHAM 在倒空间中引入了基于精确解子空间的一致性惩罚约束,从而有效抑制“鬼态”的产生,使预测能谱在整个能量范围内更加稳定和可信(如图4 所示)。
得益于上述创新,NextHAM 在多项关键指标上实现突破:其 SOC 相关矩阵元的预测误差首次进入 sub-µeV 量级(表 1),预测能带结构与 DFT 结果高度一致(图 5)。更为重要的是,该方法首次展示了对训练集外元素的稳定泛化能力(如图 3 中的 Ne 元素不在训练集中),充分验证了模型在跨元素、跨结构应用场景中的通用性。这项成果是人工智能材料模型领域的重要突破,为大体系材料的机理分析、逆向设计和高通量筛选提供了高性能工具,有望促进新材料研发效率的跨越式提升。
此外,为解决该领域长期缺乏高质量、广覆盖的大规模公开电子结构数据集的痛点,研究团队构建并开源了基准数据集 Materials-HAM-SOC。该数据集包含约 17,000 个晶体结构的电子哈密顿量,覆盖元素周期表前六周期的 60 余种元素。所有数据均基于高精度数值原子轨道基组(最高至 f 轨道)生成,并完整保留SOC效应信息。数据集依托团队自主研发的高性能第一性原理计算软件 ABACUS 和 PYATB 构建,具有统一标准和良好可复现性。Materials-HAM-SOC 的发布填补了通用电子结构预测领域在 SOC 数据方面的空白,为学术界提供了权威基准,有望有力推动人工智能驱动材料科学(AI for Materials)的基础设施建设与生态发展。
上述成果以题为“Advancing Universal Deep Learning for Electronic-Structure Hamiltonian Prediction of Materials”的论文被Fourteenth International Conference on Learning Representations (ICLR 2026) 录用,合肥人工智能研究院为第一署名单位。论文作者为殷实、戴祖建、潘欣阳、何力新,其中殷实、戴祖建、潘欣阳为共同第一作者,何力新教授与殷实副研究员为通讯作者。ICLR是中国计算机学会推荐的A类会议,谷歌H5指数高达362,在人工智能领域出版物中影响力排名前三。该会议与NeurIPS、ICML一同被称为人工智能“三大会”,是人工智能领域目前权威度最高、发表难度最大、影响最为深广的出版平台。
NextHAM在材料研发的工程应用中具备巨大潜力与价值。由于计算效率的大幅提升,它可用于半导体、电池、合金、催化剂等新材料研发的机理解析和高通量筛选。通过智能化数字孪生计算,大规模、高通量筛选出潜在的优质候选材料,有效缓解物理世界试错法实验周期长、效率低、成本高的痛点问题,最终实现新材料研发由“经验驱动”向“计算驱动”的转变,是推动材料科学与工程发展的强大工具。
本工作得到了国家科技重大专项“先进材料”(项目编号 2025ZD0618401)、国家自然科学基金(项目编号 12134012, 62506112)、中国科学院战略性先导科技专项(项目编号 XDB0500201)、量子科技创新计划(项目编号 2021ZD0301200)以及人工智能研究院项目的资助支持。未来,人工智能研究院将继续深化人工智能与基础科学的交叉融合,推动创新成果在材料计算、工业设计等领域的规模化应用,加速科研到产业的价值转化。
论文链接: https://openreview.net/forum?id=YvmR4vNai2
项目链接:https://github.com/DavidYin94/NextHAM

图2:NextHAM方法图示

图3:NextHAM方法在Materials-HAM-SOC测试集上预测误差(Gauge MAE)的元素级统计
表1:NextHAM在Materials-HAM-SOC 测试集上的分区域预测误差(Gauge MAE)统计
图4:NextHAM模型有效消除非物理“鬼态”并精准预测物理性质。 (a) 未引入倒空间(k空间)损失函数的模型(Ablation@Loss-k)在能带预测中出现了非物理的突变“鬼态”; (b) 引入联合优化策略的完整NextHAM模型(Full Method)彻底消除了“鬼态”,其能带结构与DFT真实值(红线)几乎完美重合; (c)-(d) 完整模型(蓝色虚线)在光电导率(实部与虚部)的预测上同样展现出极高的物理保真度,显著优于未引入倒空间优化的模型(黑色虚线)。

图5:NextHAM方法在测试样例上的能带预测结果