Hehson财经ESG评级中心提供包括资讯、报告、培训、咨询等在内的14项ESG服务,助力上市公司传播ESG理念,提升ESG可持续发展表现。点击查看【ESG评级中心服务手册】
图片摘要
成果简介
近日,华东师范大学关小红教授团队在环境领域顶级期刊《Environmental Science & Technology》发表题为“TP-Transformer: An Interpretable Model for Predicting the Transformation Pathways of Organic Pollutants in Chemical Oxidation Processes”的研究论文。团队开发出首个预测有机污染物化学转化路径的可解释深度学习框架TP-Transformer,结合迁移学习与条件嵌入技术,实现精准预测化学氧化过程中污染物的降解产物(TPs)及其生成路径,测试集准确率达86.28%,并使用5个训练集中未有的污染物进行实验验证,模型预测准确率高达80.20~92.86%。该模型通过迭代预测构建完整降解路径,解决了传统实验方法成本高、通量低的难题,为水处理工艺优化与生态风险评估提供了颠覆性工具,并已部署为开源在线平台(https://TP-Transformer.streamlit.app)。
引言
化学氧化技术是水体有机污染物降解的核心手段,但这类技术往往难以实现污染物的完全矿化,常产生毒性高于母体污染物的降解产物(TPs),对生态系统和人类健康构成潜在威胁。例如:轮胎添加剂6PPD经臭氧氧化生成的6PPD-醌,对鲑鱼的毒性比母体高出14000倍。传统质谱鉴定方法耗时昂贵,难以应对全球超35万种商用化学品的风险评估需求。现有预测模型(如量子化学计算、模板法)受限于反应条件兼容性与新结构泛化能力。虽然深度学习在预测有机合成产物领域取得突破,但却无法应用于有机污染物降解产物的预测,原因在于有机污染物降解产物的预测存在独特挑战:
1.化学氧化反应是多步串联反应,导致降解路径复杂
2.同一有机污染物在同一化学氧化过程中存在多条降解路径
3.pH、共存离子等操作条件显著影响降解产物
为解决环境化学领域这一长期悬而未决的挑战,研究团队创新性地将Transformer架构引入环境化学领域,通过构建专业数据集Chem_Oxi_2K(涵盖39种氧化活性物种、2780组反应),开发出可解析有机污染物复杂降解路径的深度学习模型TP-Transformer。
图文导读
TP-Transformer的开发流程
图1:(a)有机合成预测与污染物降解预测的共性,两者均涉及SMILES至SMILES的分子结构转换。(b)TP-Transformer模型的开发流程。(c)有机合成反应与有机降解反应的差异。
与有机合成反应不同,有机污染物降解的过程通常是单个污染物分子的分解,产物大小不一,且降解产物受反应条件影响显著,并涉及连续的多步降解路径。为应对这些挑战,研究团队首先在一个大型有机合成数据集(USPTO-MIT)上预训练了一个分子Transformer模型,然后在一个专门构建的包含2780个污染物降解反应的数据集(Chem_Oxi_2K)上进行微调,最终得到了TP-Transformer模型。该模型不仅能预测单个降解产物,还能通过迭代过程——将上一步预测的产物作为下一步的输入——来重构完整的降解路径,直至预测到CO2或不可降解的最终产物为止。
创新设计:基于Transformer架构,将污染物分子结构(SMILES)、氧化剂(如HO●、SO₄●-、O3)及反应条件(pH)作为输入,通过注意力机制识别反应位点。
路径预测:首创迭代预测机制,以上游产物作为下游输入,直至生成CO2、稳定产物或低于预设的置信度阈值(图1b)
数据突破:构建专属数据集Chem_Oxi_2K(2780组污染物降解反应),解决传统数据中路径非唯一性、中间体不稳定性等难题。
数据预处理的流程
图2:数据集Chem_Oxi_x的预处理和优化过程示意图。模型的性能经过了系统性的优化(图2)。研究发现,数据质量对模型性能有显著影响,通过对数据集中机制不合理或不明确的反应数据进行清洗和修正,模型准确率从最初的19.23%提升至63.32%。随后,团队探究了模型超参数的影响,发现当编码器和解码器的层数增加到12层时,模型性能达到峰值,这表明污染物降解预测任务具有内在的复杂性,需要更高容量的模型。此外,模型性能随着训练数据量的增加而稳步提升,当使用完整的Chem_Oxi_2K数据集(包含2780个反应)进行训练时,最终的TP-Transformer模型准确率达到了86.28%(图3)。
模型超参数和数据集容量对模型性能的影响
图4:MolecularTransformer(上图)与TP-Transformer(下图)对草甘膦在不同条件下降解反应的注意力机制分析。
模型的“化学家式”可解释性
图4:MolecularTransformer(上图)与TP-Transformer(下图)对草甘膦在不同条件下降解反应的注意力机制分析。
TP-Transformer的核心是注意力机制,它使模型能够像化学家一样“思考”。通过可视化编码器的注意力权重矩阵,可以清晰地看到模型在进行预测时关注了哪些关键的原子和反应条件。以草甘膦在不同体系中的降解为例(该反应未包含在训练数据中),在O2•⁻介导的反应中,TP-Transformer的注意力高度集中在氮原子上,准确预测了C-N键断裂;而在锰氧化物介导的反应中,其注意力则聚焦于-PO3基团的解离。这些预测结果与实验报道完全一致,证明了模型不仅能给出正确答案,其内在的决策逻辑也符合化学反应原理。
真实高级氧化反应中的降解产物验证
图5:TP-Transformer预测的阿昔洛韦(ACY)在UV/H2O2体系中的降解路径I。
为了检验TP-Transformer在实际应用中的能力,研究团队选取了五种未包含在训练集中的污染物(阿昔洛韦、阿替洛尔等),在UV/ H2O2体系中进行降解实验,并使用UPLC-QTOF-MS/MS对产物进行分析。以抗病毒药物阿昔洛韦(ACY)为例,TP-Transformer共预测了四条主要降解路径,包含98种降解产物。实验中成功鉴定出其中的79种,路径预测准确率(PPA)高达80.61%。对于阿替洛尔(ATL)、乙硫苯威(ETFC)等其他四种农药,PPA分别为92.31%、92.86%、85.42%和83.33%。这些结果充分证明,TP-Transformer能够提供比文献报道更详尽、更准确的降解图谱,为研究人员分析质谱数据、揭示降解机理提供了强有力的参考。
小结
本研究通过在一个定制化的污染物降解数据集上微调Transformer模型,成功开发出TP-Transformer。研究团队系统地解决了污染物降解数据集中存在的复杂路径、数据容量小、多产物共存以及反应条件影响等挑战,使模型达到了优异的预测性能,并通过了严格的实验验证。TP-Transformer不仅能准确预测降解产物,其内在的注意力机制还揭示了模型“像化学家一样思考”的能力,为“黑箱”模型提供了可解释性。这项工作为快速、大规模地识别污染物降解产物提供了变革性的工具,将极大地促进水污染风险评估、高级氧化技术机理研究以及环境友好型化学品的设计,对保障水环境安全具有重要的科学价值和应用前景。
本项目得到了国家自然科学基金委的资助。
通讯作者简介
钟士发:博士,研究员,博导。主要研究方向为机器学习在环境科学与工程领域的应用。目前,以第一/共一作者发表22篇,包括11篇Environ Sci Technol(lett.)、1篇Water Res以及ACS ES&T Engg、Chem Eng J、J Hazard Mater等论文9篇。其中3篇被选为封面论文,2篇入选ESI高被引论文并获得ES&T最佳论文奖。
关小红:华东师范大学特聘教授,华东师范大学生态与环境科学学院副院长,国家杰出青年基金获得者,英国皇家化学学会会士,研究方向为水污染控制化学。以第一/通讯作者在Angew Chem Int Ed、Environ Sci Technol、Water Res等期刊发表SCI论文140余篇,入选科睿唯安2024年度“全球高被引科学家”,连续五年入选爱思唯尔高被引学者榜单,多次入选全球前2%顶尖科学家终身成就奖榜单。科研成果获中国发明协会的发明创业奖成果奖一等(排名1)、上海市自然科学奖二等(排名1)、教育部自然科学二等奖(排名2)、重庆市自然科学二等奖(排名2)、ES&T最佳论文奖等科技奖励。作为主编,出版了专著《高质量SCI论文入门必备-从选题到发表》、《水污染控制高级氧化技术》和《水化学》。主持了包括9项国家自然基金和重点研发计划课题在内的项目30余项。曾任Water Research、Journal of Hazardous Materials、Water Environment Research和Journal of Water Process Engineering的副主编。目前担任Water Research的编辑。
第一作者:戴振华,博士研究生,现就读于华东师范大学生态与环境科学学院。
(生态修复网)(转自:生态修复网)
Hehson财经ESG评级中心简介
Hehson财经ESG评级中心是业内首个中文ESG专业资讯和评级聚合平台,致力于宣传和推广可持续发展,责任投资,与ESG(环境、社会和公司治理)价值理念,传播ESG的企业实践行动和榜样力量,推动中国ESG事业的发展,促进中国ESG评估标准的建立和企业评级的提升。
依托ESG评级中心,Hehson财经发布多只ESG创新指数,为关注企业ESG表现的投资者提供更多选择。同时,Hehson财经成立中国ESG领导者组织论坛,携手中国ESG领导企业和合作伙伴,通过环境、社会和公司治理理念,推动建立适合中国时代特征的ESG评价标准体系,促进中国资产管理行业ESG投资发展。
上一篇:特朗普称伊朗袭击前通知了美方