11月6日,我所能源研究技术平台(DNL20)靳艳研究员团队开发的“CataAI表征专家系统”在2024科学智能峰会上正式发布,会上,靳艳详细介绍了该系统及其开发过程。“CataAI表征专家系统”是由DNL20独立研发的能源催化材料表征数据智能分析系统,可智能化分析源于电子显微镜、红外光谱、质谱、X射线衍射等的多维度、多模态的能源催化材料表征数据。
近年来,人工智能技术驱动已成为材料研究领域的新范式。人工智能技术的应用实现了新材料的高通量合成,但同时,也产生了大量的表征数据,高效分析表征数据成为影响材料研发的关键步骤。
针对表征数据量大、多维数据交叉、数据间互译和耦合难等问题,研究团队开发了“CataAI表征专家系统”,在表征数据中的图像和谱图的智能处理方面取得系列进展:建立了双阶段神经网络模型,对图像中的颗粒目标进行检测和识别,利用损失函数确定最优目标框并送入分割模型进行像素分类,最终得到了精确的颗粒边界信息,实现催化剂材料中纳米粒子、团簇和单原子等复杂信息的精准分析;针对特定反应过程设计了可解释的红外光谱数据预处理模型,包括去基线、拟合分峰等,通过数据特征提取、深度学习模型训练,实现了原位光谱中催化反应过程下材料表面官能团物种的实时、智能的识别和分析;通过自建数据库和新算法,实现了从质谱图到分子结构推荐;构建了数据管理、分类储存、图谱数据的特征参数智能提取等功能。
“CataAI表征专家系统”将作为首个案例应用在DICP AI Lab上。DICP AI Lab是我所与北京深势科技有限公司合作共同打造的“大连化物所专属AI生态圈”,旨在为我所AI相关研究提供实践与共享生态环境。
此外,DNL20将进一步建设智能化的表征实验室,“CataAI表征专家系统”有望作为智能表征实验室的智慧大脑,为能源催化研究提供高水平技术支持,推动能源催化领域的创新和进步。
上述工作得到了榆林中科洁净能源创新研究院人工智能科技专项等项目的支持。(文/图 刘岳峰、刘源)