AI4EC logo
当前位置:首页 - 动态 - 动态详情
AI4EC Lab参与数据科学辅助解析有机催化二硫开环聚合中过渡态的稳定化机制
AI4EC Lab2025/5/23

研究背景

团队将机器学习与化学机理研究结合,构建了完整的"数据驱动"研究框架。他们首先从PubChem数据库中筛选13,250种异硫氰酸酯,运用主成分分析(PCA)和k-means聚类,最终合成了44种具有不同芳基取代基(邻、间、对)的硫脲催化剂(图1)。

核磁共振(NMR)谱作为一种无损且对局域结构敏感的表征手段,适合用于溶剂化结构中特定原子核化学环境的表征。此外,实验NMR谱还能揭示弛豫时间、交换动力学等信息。然而,将观测到的NMR谱变化与内在分子结构变化联系起来是一项极具挑战性的任务。一些采用密度泛函理论(DFT)计算的研究,通过复杂的采样方法进行团簇提取,能够为电解质NMR谱的变化趋势提供有限信息。已有许多静态计算尝试利用第一性原理方法计算¹H、⁷Li、¹⁷O、²⁵Mg、⁴³Ca、⁶⁷Zn NMR谱来解释结构-光谱关系。尽管如此,实验化学位移反映的是来自不同局域位点的加权平均,融合了局域结构和动力学信息,这种统计平均使得信号分辨变得复杂,也加大了解析谱构关系的难度。

图1 催化剂库构建:数据驱动的1,2-二硫戊环可控ROP阴离子结合催化剂设计工作流。

以(R)-硫辛酸甲酯为模型单体,团队通过¹H和¹³C NMR量化了聚合速率(kₚ)和区域选择性(Pₛₛ),发现活性差异近两个数量级(0.15–7.31 h⁻¹),选择性范围较窄(0.61–0.76)。研究采用极端梯度提升(XGBoost)结合逐步回归分析高通量反应数据及62个分子描述符(图2),并通过SHAP(沙普利加和解释)量化特征贡献(图3–4)。

图2 机器学习模型:(A)XGBoost与逐步回归结合的工作流程;(B)反应速率(kₚ)和(C)区域选择性(Pₛₛ)的XGBoost性能。
图3 XGBoost识别的反应活性(kₚ)关键催化剂特征:(A)前五位特征的SHAP图;(B)13种代表性催化剂的SHAP分析,按(C)结构特征分为快、中、慢反应活性簇(红、绿、蓝虚线圆圈)。
图4 区域选择性(Pₛₛ)关键催化剂特征:(A)前五位特征的SHAP图;(B)Vbur(H5)和(C)ALIEmin(N27)的图形定义;(D)空间特征Vbur(H5)和(E)电子特征ALIEmin(N27)对14种催化剂的SHAP分析,按Vbur(H5)值升序排列。

研究内容

研究通过数据科学揭示了过渡态稳定机制,证明硫脲催化剂中构象、电子和空间特征的协同效应。芳基二面角(Major Φ)和构象比例(γ)对反应活性起决定性作用——更平面的芳基(如间位−NO₂取代的催化剂20)减少旋转异构体并提升活性(图3)。区域选择性则受芳基NH位点空间位阻(Vbur(H5))和胺氮给电子能力(ALIEmin(N27))共同调控(图4)。电子效应方面,吸电子基团增强芳基π平面与单体的范德华接触以提高选择性,供电子基团则稳定阳离子以降低能垒。最终,团队发现卤素取代催化剂(如24、25、26、40)通过适度电正性和最小位阻实现活性-选择性平衡,得到了比前作性能更加优异的催化剂。

团队通过密度泛函理论(DFT)计算发现高选择性催化剂8的芳基扭曲构象可形成更紧密的过渡态(范德华接触距离缩短0.11 Å),而高活性催化剂20因构象单一性实现高效预组织(图5)。这些结果与机器学习预测高度吻合,证实了数据驱动方法的可靠性。

图5 最高选择性催化剂(8)与最高活性催化剂(20)对比:(A)反应活性和(B)区域选择性的关键差异特征;(C)松弛扫描的构象分布和(D)DFT优化过渡态几何中的临界距离进一步阐释。

总结与展望

该研究开创了数据科学工具在聚合催化机理分析中的系统性应用,突破传统局限,为复杂催化体系的理性设计提供了新范式。提出的"活性-选择性权衡"原则和卤素取代优化策略对有机催化体系设计有重要参考意义,展现了人工智能在化学机理研究中的强大潜力。未来工作将探索更广泛的催化剂骨架和反应类型。

作者介绍

刘允博士,北京大学化学与分子工程学院研究员、博士生导师,国家自然科学基金优秀青年科学基金(海外)获得者(2022年)。2017年获美国印第安纳大学化学博士学位,2011年获厦门大学化学学士学位,2017-2021年在美国伊利诺伊大学厄巴纳-香槟分校(UIUC)贝克曼先进科学技术研究所从事博士后研究,师从Jeffrey S. Moore院士。2021年9月加入北京大学任独立PI,课题组专注于动态聚合物合成及聚合物物理化学研究。

汪骋,厦门大学化学化工学院教授,国家高层次青年人才,2020年度中国化学会青年化学奖得主。北京大学学士毕业后(2009),美国北卡罗莱那大学教堂山分校获得博士学位(2013),开展MOF催化研究。之后在芝加哥大学开展博士后研究,从事飞秒超快光谱(2013-2015)。2015.07-至今在厦门大学任教授。发表论文120余篇,他引10000余次。课题组目前主要研究方向为:金属有机层(MOLs)的设计开发及其在催化中的应用,多孔材料的3D打印光子材料制备,以及基于人工智能的催化材料开发(包括CO2电还原、氢同位素分离和肽添加剂光催化等方向,率先将机器学习和大语言模型引入催化剂设计与机理解析)。

原文链接:https://onlinelibrary.wiley.com/doi/10.1002/anie.202502090