“人工智能+大数据”让化学研究焕然一新
机器人在操作台之间来回穿梭,伸出机械臂,“手握”试管,称量取样,配制试剂……走进中国科学技术大学机器化学家实验室,一种全新的化学研究场景让人眼前一亮。这里看不到身穿白大褂的实验操作人员,瓶瓶罐罐的实验工作都由一台机器人完成。
这台机器人由中科大化学物理系教授江俊团队研发。它不仅能根据指令操作实验,还能够利用机器智能去查找和阅读文献,从海量研究数据中汲取专家经验,在前人知识与数据的基础上,提出科学假说并制订实验方案。
此外,它产生的高质量机器实验数据还能够与理论预训练模型融合,产生理实交融的智能模型来寻找全局最优解。
“我们的机器化学家拥有‘超强化学大脑’,它能够从数以亿计的可能组合中找到最优解,将科学家一生都不能做完的工作,缩短到几周内完成。”在近日举行的中科院记者行活动上,江俊告诉科技日报记者。
用好人工智能和大数据的“东风”
当前,数据驱动的人工智能正在改变整个科学研究。科学家希望,利用人工智能和大数据技术解放自己的双手,提升科研的效率和准确性,进而催生更多创新成果。在化学领域,科研人员尤其希望得到大数据和人工智能的助力,加快材料研发。
说起个中原因,中科大教授李震宇告诉记者:“过去的150年里,化学研究主要靠猜测、尝试、纠错,再猜测、再尝试……在这种研究范式下,科研人员像集邮一样逐步积累素材,在不断试错的过程中取得发现,研究效率低、成本高。”
同时,随着化学研究对象日益复杂化、高维化,面对庞大的化学空间,配方和工艺的搜索常常止步于局部最优,无法进行全局探索。
因此,改变化学研究范式,实现化学研究精准化、智能化,一直是化学家的梦想。
逐渐兴起并快速迭代进化的大数据与人工智能技术,让科研人员看到了解决这些难题的新机遇。“我们希望借此东风,建立新的化学研究范式,在精准化和智能化双轮驱动下,赋予人工智能机器化学家化学智慧。”李震宇说。
于是,2014年,江俊团队提出“机器化学家”概念并开展相关科研工作。
“我们组建了一支涵盖化学、计算机、数学、自动化等的跨学科团队,经过8年攻关,成功研制出数据智能驱动的‘全流程机器化学家’。”江俊介绍,该机器化学家集成了移动机器人、化学工作站、智能操作系统、科学数据库等多项技术。
缺乏高质量的科学数据是个大难题
如今,拥有“超强化学大脑”的机器化学家正在展现它的价值。
专注于光学薄膜材料研究的中科大教授邹纲,一直想提高手性相关光学薄膜的性能,然而,材料配比的可能性有上百万种,依赖人工一一验证根本不现实。团队努力了10年,将不对称因子提高到了1.2,但离理论极限2.0还有非常大的差距。
借助机器化学家,科研人员仅用一个多月时间,就找到了不对称因子高达1.95的工艺条件,高度逼近理论极限,为开发优质薄膜材料开辟了新方法。
对江俊来说,机器化学家只是开始。“我们的目标是建成机器化学家大科学装置,在一整栋大楼里,布置上百个机器人、上千个智能化学工作站,真正解放化学家的双手,加快新化学品和新材料的研发创制。”江俊说。
今年1月,中国科学院精准智能化学重点实验室正式获批建设,李震宇担任实验室主任。“我们希望把实验室建设成为精准智能化学领域国际顶尖的研究机构,形成一个新的精准智能化学范式,建立我们国家主导的精准化学数据体系和智能化学软硬件标准。”李震宇说。
在李震宇看来,建立精准智能化学研究新范式最大的困难是缺乏高质量的科学数据。“已有的数据质量参差不齐。这些数据混在一起,让人工智能去学习,很可能会学到一些错误的知识。所以,我们希望形成一套数据标准,在这个基础上去做数据驱动的智能化学。”李震宇说。
或许有人会担心,具备“最强科学大脑”的机器化学家的出现,会不会让化学家失业?对此,江俊表示:“一个好的技术工具,会赋予更多的可能性,让科研人员做更多的事情,发现更多的前沿理论。”