在人們的傳統印象里,在實驗室搞研究的都是穿白大褂的科研人員。但在中國科學技術大學(以下簡稱中國科大)機器化學家實驗室里,卻是另一番景象:這里沒有一個人,只有動作靈活的機器人在操作臺之間來回穿梭,伸出機械手臂配制試劑。它不僅能夠做實驗,還會自主設計實驗步驟和方案。
這款全球首個集閱讀文獻、設計實驗、自主優化等功能于一體,覆蓋化學品開發全流程的機器化學家平臺,被科研人員形象地稱為“機器化學家”。
實驗室負責人、中國科大化學物理系教授江俊介紹:“從數百萬種材料的可能組合中找到最優解,科研人員也許一生都做不完;有了機器化學家,可能只需要一兩周時間。”
機器化學家融合了大數據、人工智能和自動化的強大優勢,為化學這一傳統學科提供了新的研究范式。
那么,這款如此聰慧的機器化學家是如何誕生的?時任中國科大化學物理系執行主任、現任中國科大合肥微尺度物質科學國家研究中心主任羅毅說:“這是天時、地利、人和的結果。”
機器化學家“小來”在做實驗。中國科大供圖
天時:科研發展的必然
2011年底,江俊決定回國加入中國科大,與他在瑞典皇家理工學院攻讀博士學位的導師羅毅再次攜手。
兩人都從事理論和計算化學方面的研究,但各有側重。羅毅主攻解析高分辨單分子化學成像,江俊則更關注材料設計和微觀機理的研究。
2013年底的一天,羅毅與江俊一起出差。在路上,羅毅拋出一個問題:基于獨立事例的理論計算,雖然符合傳統研究范式,但效率太低。有沒有可能通過大數據技術提高效率?
江俊經過調研后發現,我國嚴重缺乏科學數據的積累,在學術上非常被動。
“我們做了大量研究工作,但最終成果發表在外文期刊上。引用這些論文數據時還得花錢買,并且只有訪問權,不允許大量下載。”江俊認為,要用好大數據技術,必須首先建立數據系統。
從2014年起,江俊帶領學生收集教科書、論文、專利中“沉淀”的化學經驗和知識,用3年搭建起“中國人自己的化學材料大數據庫”。
有了足夠的數據后,接下來的問題就是如何使用。在技術上,人工智能是處理大數據最好的手段。然而,這對羅毅、江俊而言是一個全新的工具。
不懂就學,知難而上。他們以自己熟悉的譜學、催化為抓手,應用人工智能方法開展研究,取得了良好的效果。值得一提的是,江俊發現的多個功能強大的描述符,被《科學》雜志兩次專文推薦。
雖然融合了人工智能技術,但如何用大數據解決實際的化學問題,依舊是個挑戰。“因為數據本身缺乏知識邏輯的關聯。”羅毅說。
2017年的一天,羅毅想到一個好點子:可否借助本校兩位教授在發光材料、催化劑領域的深厚積累,將他們的知識與大數據庫融合?
他激動地將江俊叫到辦公室,說:“你把張國慶、熊宇杰發表的論文全部讀一遍,這樣就能形成一個‘張國慶大腦’、一個‘熊宇杰大腦’。研究發光材料時,就調用‘張國慶大腦’;設計催化劑時,就調用‘熊宇杰大腦’。這樣一來,我們這些化學知識不足的人也可以用好數據了。”
就這樣,江俊和同學們一起對海量文本數據進行人工標注,逐步賦予計算機自主閱讀并分析文獻資料的能力,僅用兩年就成功培育出一顆“化學大腦”。
“化學大腦”有了,下一步就是想辦法給大腦配上可以實際操作的“雙手”。
2020年,英國利物浦大學安德魯·庫珀團隊建造了世界首個移動機器人實驗員。研讀完他們發表的相關文章,江俊信心滿滿地對羅毅說:“我們不但可以讓機器人做實驗,還可以給機器人配上‘化學大腦’。”
同年,在中國科大的一次交叉學科論壇上,江俊認識了該校信息科學技術學院從事機器人研究的副教授尚偉偉,兩人在聯手研發機器化學家上一拍即合。
于是,在江俊的帶領下,他們迅速組織了一個青年團隊,夜以繼日協同攻關。
2021年12月,全球首個數據智能驅動的機器化學家,終于在中國誕生了。它融合“化學大腦”,集成了兩臺移動機器人、19個智能化學工作站和高通量計算系統,覆蓋科學研究方法論全流程。
2022年9月,相關研究成果發表在《國家科學評論》上。審稿專家如此評價:這款機器化學家的“機器人系統、工作站和智能化學大腦都是最先進的”,“將對化學科學產生巨大影響”。
“機器化學家不是某天一拍腦袋就能做出來的。”羅毅說,“這是我們與時俱進、吸納新知識、利用新技術解決問題的過程,也是持續進行科研探索的必然結果。”
地利:多學科交叉的優勢
創造出這樣一位能閱讀、能思考、能實踐、能最終解決問題的機器化學家,并非易事。
江俊認為,這主要得益于中國科學院集成攻關的傳統和中國科大寬松的科研環境、多學科交叉的優勢。
他回憶,大數據模型建立后,需要在實驗中進一步驗證,這意味著更大的投入。
2021年初,中國科學院發布了當年基礎前沿和關鍵核心技術中的重大科學問題清單,“數據驅動的化學、材料和生物科學的機器科學家”是46個項目之一。
江俊鼓起勇氣,決定“揭榜掛帥”。很快,他的項目申請獲得通過。從2021年到2025年,中國科學院將拿出2000萬元經費,給予江俊團隊連續5年的穩定支持。
也是在2021年,江俊向中國科大提交了一份“‘雙一流’學科重點項目建議表”。學校研究后,給予1000萬元經費支持。同時,中國科大合肥微尺度物質科學國家研究中心、化學與材料科學學院出手相援,為研發團隊提供了研發場地、調配了研究設備。
“這種快速決策、快速支持、快速撥款的響應機制給了我很大激勵,也為研究提供了及時、充分的保障。在人工智能領域,技術迭代速度極快,一步落后就會步步落后。”江俊說。
中國科大還有一個天然優勢:這里會聚了不同學科背景的科研人員,他們可以優勢互補、協同攻關,更加快速地把構想變成現實。
例如,機器人是整個平臺中的重要一環。當初,尚偉偉與江俊商量后,愿意改變團隊的研究方向,專門研發實驗機器人。
安德魯·庫珀在參觀機器化學家實驗室時,最羨慕的就是江俊他們擁有自己的機器人研發團隊。江俊頗為自豪地說:“化學機器人指令集的每一行代碼都是我們團隊自己寫出來的,如果要做一個新的動作,可以隨時調整代碼。安德魯·庫珀則必須請公司改代碼,因為他的機器人是買來的。”
研究團隊在控制室分析電催化機器實驗數據結果。張大崗/攝
人和:年輕團隊的助力
和機器化學家一樣年輕的,是研發團隊——其成員以朝氣蓬勃的“90后”“95后”為主。
“這群年輕人做出的東西比我想象的好得多,每一步的研究結果都超出預期。”羅毅說。
例如,在早期的數據采集工作中,還是中國科大少年班學院本科生的肖恒宇、霍姚遠、馮超就表現出超強的研發能力。
剛開始,羅毅、江俊定期開討論會,為學生們提供指導。但在討論會上,他倆發現很多時候根本插不上話。之后經常出現的場面是,學生熱火朝天地討論,老師在一旁安靜地聽、欣慰地看。
“不得不承認,信息科學時代,年輕人比我們的感覺更敏銳、理解力更強,他們的思維方式早就‘數字化’了。”于是,羅毅與江俊達成一致——把最重要、最困難的事情交給年輕人去做。
結果證明,他們的決定是對的。
在機器化學家創建中,除了搭建數據庫外,肖恒宇還自學計算機軟件,開發出操作系統1.0版本。該操作系統既符合化學實驗的操作習慣,又能發揮機器人的自動化優勢,還能嵌入智能模型。
近期,肖恒宇又將操作系統升級到2.0版本,實現了硬件即插即用、模型普適遷移和操作云端共享。
專業工程師看了該架構都驚嘆不已:“類似的框架只在西門子智能實驗室看到過,只有經驗豐富的工程師團隊花費很高成本才能開發出來。”
人工智能領域有一句話:有多少智能,背后就有多少人工。
培育“化學大腦”最重要的是賦予計算機理解物質的能力。當時,正在讀碩士研究生的張百成,沒日沒夜地標注了幾個星期,文獻讀得頭昏腦漲,但完成的工作量微乎其微。
后來他改變“打法”,找了多位有專業背景的同學聯合作戰。他們一起構建化學詞典、整理反應數據,很快設計出第一代文獻閱讀系統,得到了第一批高質量的標記數據。
“95后”趙路遠結合本科學的電子工程知識,主攻化學工作站改造。她記得,與師弟曹嘉祺一起編寫固體進樣儀器的驅動程序時,由于信息掌握不充分,無法準確理解并調用儀器接口。他們多次咨詢國外廠商和代理商,得到的回應都是“無可奉告”“商業機密”。
“后來,我們花了3個星期,重復做了3000次發送信號、等待反饋和記錄響應實驗,逐步逆向試出底層控制邏輯,成功實現了對機器人的遠程控制。”趙路遠說,國外廠商反過來主動聯系他們,想購買他們研發的驅動程序。
類似這樣的事,在機器化學家項目攻關中并不鮮見。
令江俊欣慰的是,這群年輕人從不以專業限制自己,而是主動學習、迎難而上,想方設法解決問題。
眼下,這群學生已成為實驗室的骨干,各有各的絕活兒。其中,肖恒宇正在設計集中式大規模機器科學家平臺,張百成在賦予機器人譜學智能,趙路遠在探索適配產業應用的化學工作站。
表現:科研能力超強
數千年來,人類在化學領域不斷解鎖物質世界的奧秘,制造出許多令人驚嘆的物品和材料。
然而,化學又是一門需要一點“運氣”的學科。能產生反應的物質有很多,不同的量會帶來不同的結果。更關鍵的是,反應釜完全是個“黑箱”,里面會發生什么、過程如何,在很多情況下是無法計算和計量的。
因此,在化學領域總有一些“無心插柳”的成果,也有一些“徒勞無功”的無奈。得到想要的結果,可能需要很長的時間。
機器化學家的誕生有望改變這一狀況。
江俊介紹,機器化學家通過機器人精準的自動化操作能力,可以“不知疲倦”地執行任務。與此同時,“化學大腦”同步進行量子化學仿真模擬,再融合理論大數據和實驗小數據產生具有預測能力的人工智能模型,最終得到算法預測、驗證全局最優的實驗配方。
正是這種理實交融的研究范式,能夠從數百萬種可能的配方中迅速識別最佳組合,極大加速了新物質的發現過程。
江俊以創制“高熵非貴金屬產氧催化劑”為例,展示機器化學家的超強能力。
高熵材料具有高混亂、高無序、高復雜度的特點,能提高能源電池的穩定性,對新能源發展非常重要。如果按照以往的方法,科研人員要從29種非貴金屬元素中選出5種進行超過55萬種配比組合,“試錯”研究可能需要1400年。
而機器化學家通過閱讀1.6萬篇催化論文,自主遴選出5種非貴金屬元素,并融合2.5萬組理論計算數據和207組全流程機器實驗數據,建立并優化預測模型,將創制周期縮短為5個星期。
體現機器化學家強大科研能力的,還有一項基于火星隕石的催化劑研究。
一直以來,火星移民是人類的夢想。實現這一夢想,首先要解決火星大氣中氧氣缺乏的難題。
就在前不久,機器化學家利用火星隕石成功創制出實用的產氧電催化劑。該成果在《自然-合成》發表后,引發了很大反響。《自然》網站相關文章認為,此項研究“為火星探測和地外文明探索提供了新的技術手段”。
江俊介紹,如果用人工方式做實驗,以5種不同的火星礦石作為原料,有超過376萬個配方的排列組合。按每個實驗驗證至少5小時計算,找到最佳配方可能需要2000年。而機器化學家只用了5個星期就做完了實驗。給出的優化后催化劑配方,可以提供足夠的氧氣。
江俊等人親切地把機器化學家命名為“小來”,意味著開啟未來物質科學探索的新紀元。它與人類智慧的結合將創建物質科學全新的可能,引領人類在星辰大海中不斷拓寬知識的邊界。
江俊在機器化學家實驗室里調試操作指令。張大崗/攝
目標:數據與智能驅動的化學研究新范式
放眼全球,在機器化學家領域,目前只有英國格拉斯哥大學和中國科大實現了自動化文獻閱讀功能、英國利物浦大學和中國科大實現了機器人可移動性。最為重要的是,國外同行研發的同類產品均未實現文獻調研、合成、表征、測試、數據處理全流程,可進行的研究類型較為單一,離智能化尚有差距。
“這說明我國的機器化學家研發與國際同行處于并跑階段,并在某些方面具有領跑優勢,發展潛力巨大。”江俊說。
從機器化學家的成功經驗看,羅毅認為,未來可以將科學工程化,把優秀科研人員聚集在一起,以機器為載體,以數據為要素,做有組織的科研。
羅毅表示,他們的目標是迅速擴大機器化學家這一技術平臺的規模,增強其能力,建成世界上最好的“化學醫院”。
“我們希望可以擴大平臺規模、多地聯動,建成不同形態的智能機器人,比如天上飛的、地上跑的、桌面微操作的機器人,日均完成萬次以上化學實驗操作,滿足航空航天、醫療衛生、材料科學、化工原料、生物醫藥等領域的研發需求。”
目前,研發團隊正在賦予機器人對化學過程的感知、預判能力。“比如,賦予機器人譜學智能。以前是訓練機器人如何做實驗,現在希望機器人通過譜學智能直接看到微觀世界的變化,這樣就能夠更快地預判化學變化,超越人對實驗的理解。”羅毅說。
羅毅期待更多科研人員將重要的科學問題放到機器化學家這個平臺上,以提高科研效率、產出更多新成果。
“我們處在一個技術快速迭代的時代,要主動擁抱新技術,以積極開放的心態迎接世界的變化。”羅毅這樣闡述團隊的終極目標:創造出具備創造力的智能化學家,及早形成數據與智能驅動的化學研究新范式。
《中國科學報》 (2024-04-11 第4版 專題)
聲明:化學加刊發或者轉載此文只是出于傳遞、分享更多信息之目的,并不意味認同其觀點或證實其描述。若有來源標注錯誤或侵犯了您的合法權益,請作者持權屬證明與本網聯系,我們將及時更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@huaxuejia.cn