2022年10月,中国科学技术大学罗毅、江俊教授团队与尚伟伟教授合作开发的全方位人工智能全流程机器化学家为未来化学科研工作带来了一个完整的研究范式。他们根据此前Cooper课题组等人工智能化学工作站的研发思路,完善了原有人工智能辅助科研中存在的“自主科研思维缺失”问题,成功建立了一个能根据已有科学知识自主提出科学假设并建立实验计划、能自主完成完整实验流程中合成到表征一系列实验操作、能自主通过理论计算和实验数据反馈调整预测模型完成任务目标构建的全能机器化学家。

  相比于其他的AI辅助化学工作站,这套体系中我认为最引人注目的就是所谓的“机器阅读模块”和“计算大脑模块”。其中“机器阅读模块”能够以超乎常人的速度分析阅读历史上的科研文献结果,反馈到人工智能神经网络模型中;而“计算大脑模块”能够进行理论计算生成预测模型,起到了人工智能化学研究的方向引导作用。其中更具开创性的“机器阅读模块”基于句子的语构分析、数据单位分析和CRF等机器学习模型,将文献中关键的反应和化合物信息、实验方案和试剂信息,以及物理化学性质等信息提取出来,转化为机器学习神经网络的训练语料,从而建立起一个自然语言科学文本数据挖掘处理系统,实现传统科研中人类研究者查文献、搜性质、找反应参考等一系列流程。机器学习的结果还能存储于知识数据库中,为后续预测模型和贝叶斯优化以及未来需要进行的其他方向研究做支撑。
  有了这两套模块,人类研究者只需要给人工智能化学家提出自己想要研究的科学问题,它就能自主从海量化学文献中高速汲取知识,结合理论计算自主生成假说模型,再结合移动机器人模块自动完成假说需要的一系列实验,同时结合实验反馈实时优化实验方向,极大地解放了传统科研工作中人类研究者需要消耗的大量文献阅读和机械重复实验精力,让人类研究者能够将更多时间花在“提出问题”上,从而提高我们“解决问题”的效率。

屏幕截图 2022-11-28 005119-min.png

  文章中还利用他们开发的AI化学家完成了三个主题的实验,对各个模块的可用性及可靠性进行了验证。第一个主题人类研究者向AI化学家提出“寻找生物相容性聚集诱导发光材料”的问题指示,AI化学家首先从15979篇论文中找到了4865个于聚集诱导发光有关的分子,根据预设好的选择规则进一步筛选出306个候选分子,最后根据出现频率和发射波长确定了研究目标分子为氯化小檗碱。确定研究对象后AI化学家通过一系列自动化合成、光学性质探究实验得到了其最佳工作浓度与相应光学性能。我认为该实验重点验证了AI化学家“机器阅读模块”的信息提取能力。
  第二个主题人类研究者向AI化学家提出“优化金属氧化物光催化剂的氢参杂策略”的问题指示,AI化学家通过自动工作站合成了一系列不同氢化量的氧化钼催化剂样品,研究其罗丹明B光催化降解效果,结合各类检测手段最终得到了催化剂的最佳氢参杂比例。我认为该实验重点验证了AI化学家“移动机器人模块”的实验自动化执行能力。文章中还提到了一种多任务动态优化方案,大大缩短了AI化学家执行任务的时间消耗。
  最后他们利用AI化学家进行全方位化学研究能力验证,让其研究非贵金属基析氧反应电催化剂的组成比例问题,这是一个具有庞大潜在选择组成比例的问题。最终AI化学家通过贝叶斯优化方案完成了对巨大搜索空间的缩小,快速找到了一个“最佳解决方案”,并经过人类研究者的验证,证明了结果的全局最优性。最后的实验全面考察了机器阅读模块、移动机器人模块和计算大脑模块的稳定性、可靠性、可重复性和可信度,重点验证了计算大脑模块的全局自主探究能力。
  中科大团队的AI化学家被验证具有高水平化学研究能力,从文章中的介绍可以看出,它非常适合完成那些需要传统遍历搜索的化学探究问题,智能化的理论与实验交融的筛选方式能够极大缩短和减小某些材料筛选所需的周期和人力物力。这样AI化学家的诞生对人类未来面对更加复杂的材料开发需求无疑是一件喜事,同时也给化学工作者未来的研究路径和方法提供了一个新的方向和范式。

参考文献

[1]Zhu Q, Zhang F, Huang Y, et al. An all-round AI-Chemist with a scientific mind[J]. National Science Review, 2022, 9(10): nwac190.

文章目录