AI4EC logo
当前位置:首页 - 动态 - 动态详情
合作成果在WAIC-“AISI超越边界:探索下一代大模型的基础研究论坛”发布
AI4EC Lab2024/7/13

为进一步激发人工智能的创新效能,推进 “AI for Science 基础设施建设”和“下一代通用人工智能方法”两大前沿技术,7月4日由世界人工智能大会组委会办公室主办,上海算法创新研究院和北京科学智能研究院承办的“超越边界,探索下一代大模型的基础研究论坛”正式召开。

在本次论坛的产品发布环节,北京科学智能研究院院长、深势科技创始人、AI4EC Lab副主任张林峰正式发布了大原子模型(OpenLAM),由AI4EC Lab与北京科学智能研究院、深势科技合作研发的“DPA-DynaCat”作为动态催化领域模型解决方案,参与了OpenLAM产品发布。DPA-DynaCat是针对常见金属元素团簇表面动态催化反应体系构建的通用机器学习势函数模型,由不同元素组成、团簇尺寸的反应态数据集训练而来,可实现基于分子动力学与增强采样算法的动态催化反应自由能计算。

研究背景

随着能源与环境问题成为世界各国所高度重视的战略问题,催化科学在开发新能源、减少碳排放等热点领域也焕发出新的活力。为了在原子尺度上全面认知催化过程,探索催化剂结构在反应原位条件下的动态演化,AI4EC Lab于上半年推出了自主开发的动态催化智能计算工作流软件包ai²-cat,可以通过构造用于模拟动态催化过程的机器学习势函数,实现自动化批量反应自由能计算,进而获取反映催化反应过程的关键信息。

基于ai²-cat产生的大规模、高精度计算数据,我们推出了一个囊括常见金属纳米团簇催化小分子解离过程的动态催化专题数据库-DynaCat,该数据库基于高效的自动化计算工作流建设和标准化数据收集管理,为催化剂研究提供了新的思路和工具,并将扩展相关数据的规模和维度。

图2:DynaCat数据库

随着数据的积累与规模的扩展,我们的综合物化性质数据库将实现更加高效的数据管理和运营。在上述高效工作流及专题数据库的基础上,我们与北京科学智能研究院、深势科技合作研发并推出面向金属纳米团簇表面动态催化基元反应的通用势函数模型——DPA-DynaCat,以加速金属纳米催化剂在反应环境下的动态性质计算与预测。

适用范围

DPA-DynaCat模型的训练数据来源于对Au/Ag/Cu/Pt/Pd/Ni纯金属团簇及二元合金团簇上发生的O2、H2、H2O、CO、CO2、CH4等小分子解离反应进行增强采样得到的亚稳态和过渡态结构,旨在覆盖反应坐标上的各点,克服常规采样方法中仅包括亚稳态结构的不足,高效训练可对整个反应体系进行描述的势函数。

训练数据基于CP2K进行DFT计算标注,采用PBE泛函、TZV2P基组计算,共计619642个覆盖9000余种反应体系DFT计算数据点,采用DPA-1框架从头训练得到适用于上述反应体系的通用势函数。

能力评测

我们从以下三个方面对模型效果进行了测试:(1) 训练集能量/力误差;(2)测试集能量/力误差;(3)反应自由能计算误差。

(1) 训练集能量/力误差

经测试,模型对训练集的整理能量预测的均方根误差(RMSE)在26.8 meV/atom,力预测的RMSE在199.5 meV/Å,从下图对不同体系训练集数据的测试结果可看出,DPA-DynaCat对除Pt以外的其他金属及合金团簇上吸附反应态分子或原子的结构能量和原子受力都显示较好的预测能力。

图3: 模型对不同元素组成的金属团簇上吸附反应态的结构所对应能量预测偏差分布
图4: 模型对不同元素组成的金属团簇上吸附反应态的结构原子受力预测偏差分布

(2)测试集能量/力误差

我们选取15种二元合金中数据集未覆盖的合金比例及尺寸,构建催化反应体系进行了增强采样模拟,并构建了测试数据集并测试模型的计算精度。从以下评测结果可见训练得到的通用势函数整体上能够在各组分下取得较为准确的能量和力的预测,其中能量预测的RMSE在10-30 meV/atom,力的RMSE整体在100-200 meV/Å之间,整体符合预期。

图5: 在不同组成的合金团簇测试集上模型的预测能量偏差分布
图6: 在不同组成的合金团簇测试集上模型的预测原子受力的偏差分布

模型对不同合金体系能量和力的预测RMSE如下所示:

(3)反应自由能计算误差

相比于对单一体系进行模型训练及模拟得到的baseline反应自由能面,目前的通用模型对于能垒和反应自由能可以给出较好的预测,纯金属体系结合DPA2通过微调后可得到几乎吻合的自由能面。但目前模型针对合金体系的预测仍然差强人意,这一误差来源于能量预测上的偏差。

图7:模型反应自由能误差

试用申请

DPA-DynaCat现已上线科学智能广场AlS-Square(https://www.aissquare.com/openlam),模型可以直接下载,在自己的机器环境部署,或者在APP上使用。