
人工智能與(yu) 材料學發展相互影響。圖片來源:unsplash
■本報記者 袁一雪
近日,《NPJ—計算材料》雜誌上刊發了一項研究論文。該論文由美國桑迪亞(ya) 國家實驗室一個(ge) 實驗小組撰寫(xie) ,記錄了他們(men) 開發的一種機器學習(xi) 算法。這種算法能夠以比正常速度快近4萬(wan) 倍的速度為(wei) 材料科學家進行模擬計算,相當於(yu) 人們(men) 可以在播種三分鍾後吃下一個(ge) 新鮮的西紅柿,或者在半秒鍾內(nei) 從(cong) 紐約飛到洛杉磯。
近幾年,人工智能助力材料學發展的研究比比皆是。
1月8日,牛津大學教授Volker L. Deringer團隊開發了一種基於(yu) 第一性原理計算數據集的原子尺度精確機器學習(xi) 方法。使用更普適的、基於(yu) 機器學習(xi) 模型的、具有第一性原理計算精度的高斯近似勢能(Gaussian Approximation Potentials,簡稱GAP)分子動力學模擬(GAP-MD),研究者對包含10萬(wan) 個(ge) 矽原子(十納米尺度)係統的液體(ti) —非晶態和非晶態—非晶態轉變過程進行了研究,同時預測了其結構、穩定性和電子性質。該方法成功地描述和解釋了與(yu) 實驗觀察一致的非晶矽的全部相變過程。這項裏程碑式的成果以封麵文章的形式刊登在《自然》。
為(wei) 什麽(me) 是材料科學
中國科學院物理研究所特聘研究員劉淼更看重後一項研究成果。他在接受《中國科學報》采訪時介紹道,GAP方法自10年前誕生後,不斷提升。“GAP是用量子力學的方式產(chan) 生大量的數據,再用這些數據構建機器學習(xi) 模型,從(cong) 而提升計算的效率與(yu) 精度,將計算難度簡化,甚至完成之前無法完成的事情。”劉淼解釋說,“GAP從(cong) 大量密度泛函理論數據出發,提取原子間相互作用的信息,將材料計算研究對象的空間尺度放大103~104倍,時間尺度擴展103倍,且精度接近密度泛函理論計算精度。”
在該項研究中,研究人員通過仿真揭示了更廣泛範圍內(nei) 矽的液態和非晶態轉變過程,為(wei) 極富挑戰性實驗條件下的材料預測建模開辟了新途徑。此外,除了矽這一特定材料,原子尺度機器學習(xi) 方法還具備引領新的科學發現的能力。由於(yu) 該方法能夠獲得有關(guan) 原子穩定結構、原子間相互作用等物性的精確預測,精度接近量子力學方法模擬,可被用於(yu) 揭示迄今未知的諸多現象,探索介觀係統、液態係統、非晶多晶、生物等複雜體(ti) 係的動力學演化過程。
而前文提到的美國桑迪亞(ya) 國家實驗室的研究則建立在一個(ge) 擁有128個(ge) 處理核的高性能計算集群上。研究人員在該計算集群上進行了一次單獨的、無輔助的模擬。機器學習(xi) 的情況下,同樣的模擬在使用36個(ge) 核的情況下花費了60毫秒——相當於(yu) 在同等的計算機上快了42000倍。這意味著研究人員現在可以在15分鍾內(nei) 完成通常需要一年時間的計算過程。
而且,一直以來,機器學習(xi) 被用於(yu) 快速模擬,計算原子和分子之間的相互作用如何隨時間變化。但此次桑迪亞(ya) 國家實驗室公布的結果首次展示了機器學習(xi) 在相對較大的微觀尺度上加速材料模擬。通過這種模擬,科學家可以快速模擬熔化金屬的微小液滴在冷卻和凝固時是如何聚集在一起的,或者當混合物熔化時是如何分解成的。
不僅(jin) 如此,新算法得出的答案正確率也十分高,與(yu) 標準模擬的結果相差5%。“我們(men) 的機器學習(xi) 框架達到了與(yu) 高保真模型基本相同的精度,但計算成本很低。”參與(yu) 該項目的桑迪亞(ya) 材料科學家雷米·丁格維爾表示。
中國科學院深圳先進技術研究院研究員歐勇盛在解釋這項研究時談道,這是應用計算機仿真加快計算過程的嚐試,而實現這一目標的原因是材料學本身更注重實驗,換言之,實驗過程的數據計算是人工智能所擅長的領域。“因此,材料學與(yu) 人工智能之間擦出了火花。”
兩(liang) 者相互影響
其實與(yu) 材料學一樣注重實驗的學科很多,因此人工智能與(yu) 其他學科結合的交叉學科也很多。“近期人工智能飛速發展的動能在於(yu) 算力進步,算力進步使生產(chan) 、處理海量數據成為(wei) 可能,進而使人工智能滲透進了各行各業(ye) 。”劉淼說,“剛好材料科學進入了數據積累快速發展期,高通量實驗和計算等一些新技術正在為(wei) 材料科學領域生產(chan) 大量數據,人工智能使大數據分析處理成為(wei) 可能。”
“通過實驗,研究人員可以總結和歸納其中的規律,計算機算法就是計算機實驗的過程,之後計算機才能夠總結並歸納其中的規律,然後完成某項工作。例如,計算機寫(xie) 詩。”歐勇盛介紹道。
2019年2月,美國國家科學院發布了針對材料研究的第三次十年調查——《材料研究前沿:十年調查》,評估了過去十年中材料研究領域的進展,確定了未來十年材料研究的機遇、挑戰和新方向。其中,在納米材料、高熵合金等前沿材料研究領域,人工智能被寄予厚望。機器學習(xi) 方法在材料設計和材料篩選方麵表現出巨大潛力,有望極大推動新型材料的發現和傳(chuan) 統材料的更新。
反過來,人工智能的發展也離不開材料科學的助力,智能機器人、可穿戴醫療設備、虛擬現實(VR)成像、物聯網城市係統……未來的智能傳(chuan) 感器需要極高的靈敏度、柔韌度、透明度和穩定性,這對材料提出了新的要求。
“人工智能與(yu) 材料科學,兩(liang) 者應加深交流,相互促進。”中國科學院院士趙忠賢在2019年粵港澳大灣區科技創新論壇上提出,未來,解決(jue) 人工智能使用的敏感元器件問題要靠材料科學,同時也有必要根據材料科學的需求去發展人工智能技術和理論。
先有數據再有算法
“人工智能是個(ge) 雛形,可以推動很多領域進步,還需要專(zhuan) 業(ye) 人士去改造。”歐勇盛說,“現在,交叉學科是創新的原動力,人工智能作為(wei) 一種工具,更需要與(yu) 其他學科合作才能發揮其最大的作用。”
作為(wei) 人工智能深度學習(xi) 的基礎,數據的質量和數量是這一學科的關(guan) 鍵。目前,不少國家擁有自己的材料學數據庫。“有了數據庫,人工智能方法如深度學習(xi) 等才能提取數據之間的關(guan) 聯和規律。”劉淼表示,“有些學科與(yu) 人工智能交叉得少,就是因為(wei) 數據量不夠大。”
2018年,由劉淼等人聯手正式開始創建我國材料科學數據庫Atomly,該數據庫已經在2020年8月上線。
“材料學數據庫上線後,主要影響有兩(liang) 方麵。”劉淼解釋說。首先,目前大多數研究都是基於(yu) 經驗指導,即研究人員會(hui) 根據自己的經驗做判斷,通過實驗合成表征對材料進行試錯和驗證,而當大數據和人工智能介入後,通過數據驅動的方式進行預測,讓實驗更加有的放矢。其次,人類個(ge) 體(ti) 的認知能力有限,即便是積累畢生所學,依然會(hui) 遇到瓶頸,計算機則可不斷橫向擴展,無上限可言。“2016年AlphaGo打敗了人類棋手,未來人工智能和材料科學數據庫也有望不斷進步,成為(wei) 人類材料科研的好幫手。”劉淼說。
相關(guan) 論文信息:
https://doi.org/10.1038/s41524-020-00471-8
https://doi.org/10.1038/s41586-020-03072-z
《中國科學報》 (2021-01-28 第3版 信息技術)