-新建數據庫填補我國材料學大數據空白
作者:原鳴
發布時間:2021-01-28
瀏覽次數:1497
-新建數據庫填補我國材料學大數據空白

 

Atomly作為(wei) 材料數據庫中的“後起之秀”,不僅(jin) 集各個(ge) 前輩之大成,還在某些方麵超越了其前輩們(men) ,甚至實現了諸多創新功能。圖片來源:unsplash

■原鳴

自2020年8月正式上線以來,由中國科學院物理研究所、鬆山湖材料實驗室、懷柔材料基因研究平台共同打造的材料科學數據庫Atomly,注冊(ce) 人數已經突破1000人。“該數據庫填補了我國材料學領域無大型數據庫的空白。”中國科學院物理研究所特聘研究員、Atomly材料數據庫開創人劉淼說。

此前,世界其他國家,例如美國、德國、瑞士、日本等都建立了屬於(yu) 自己的材料科學數據庫。材料科學數據庫把材料的基本性能,如原子結構、電子結構、穩定性、力學性能等信息,帶到了研究人員觸手可及之處,由此引發了材料科學研究方式的革命性進步。例如,近期興(xing) 起的材料基因組方法的核心思想就是借助材料大數據方法提升材料科學的研發效率,降低研發成本。

由此基礎出發,Atomly作為(wei) 材料數據庫中的“後起之秀”,不僅(jin) 集各個(ge) 前輩之大成,還在某些方麵超越了其前輩們(men) ,甚至實現了諸多創新功能。

像鋼鐵俠(xia) 一樣製作材料

美國漫威經典人物鋼鐵俠(xia) 在全息投影中點擊幾個(ge) 化學元素,就能得到由其合成的材料的相關(guan) 數據,並由電腦匹配出最符合要求的複合材料。

這樣的電影場景作為(wei) 劉淼講解Atomly係統PPT的開頭,引發了不少聽他講座的觀眾(zhong) 興(xing) 趣。事實上,Atomly係統雖然不是全息界麵,但是在電腦屏幕上的操作界麵確實由元素周期表組成。“如果用戶想要查詢某種化合物的性能,隻需要點擊化合物的元素組成,係統會(hui) 自動彈出所有與(yu) 之相關(guan) 的化合物。”劉淼講解到。

到目前為(wei) 止,Atomly已經收錄了17萬(wan) 餘(yu) 種材料的相關(guan) 數據,這些材料包含了經過數據庫比對去重後的無機晶體(ti) 結構數據庫 (ICSD) 中的大部分結構。劉淼解釋說,ICSD在實驗合成及晶體(ti) 研究領域久負盛名,也包含了一大批以往DFT計算研究中提出的假想結構。因此,Atomly內(nei) 含的材料數據不僅(jin) 全麵,而且和材料實驗的聯係十分緊密。

材料庫不僅(jin) 提供已知化合物查詢,也為(wei) 材料創新提供更多可能。“麵對嚐試新材料的研究人員,我們(men) 開發了Run4U這一功能。這一功能支持用戶在線自主上傳(chuan) 新的結構,我們(men) 的後台會(hui) 對這些結構進行初步的篩選,如果數據庫中真的沒有包含,就會(hui) 自動進行第一性原理計算,兩(liang) 三天後用戶便可在列表中看到想要的計算結果。”劉淼表示。這一功能也同樣適用於(yu) 不熟悉第一性原理計算軟件的用戶。使用Run4U功能時,用戶可以“零學習(xi) 成本”獲得指定材料的DFT的計算數據;同時,計算的結果可以自動被後台分析入庫,能複查、複用。

為(wei) 材料學不斷突破提供可能

愛迪生嚐試了成百上千次才成功找到適合做燈絲(si) 的材料。從(cong) 那時起到LED燈的出現,又過去了120年。由此可見,材料的研發過程十分緩慢。但是通過高通量計算,材料大數據讓人工智能尋找新材料,卻能讓新材料研發過程不斷縮短。過去70年人類平均每年發現3.3個(ge) 氮化物材料,但是美國加州大學伯克利分校的Ceder組通過高通量計算等材料大數據方法,一年內(nei) 發現了92種新材料,並用實驗合成7種。

“我國研究人員一直使用國外材料數據庫,國外數據庫不但對國內(nei) 研究人員在材料信息顯示上有所保留,而且對我國的數據安全也有威脅。對方能通過監測我國研究人員訪問行為(wei) 獲得我們(men) 材料研發的信息,不利於(yu) 我國材料學的發展。”劉淼坦言。Atomly的上線徹底改變了這一現狀。

為(wei) 了更好地讓人工智能學習(xi) 勢函數,劉淼與(yu) 其他研究人員一起開發了一套精準的機器學習(xi) 勢函數工具包(HAAIFF),可以精確擬合分子動力學中所需的體(ti) 係能量、原子受力等參量。

此外,在保證精準的前提下,研究人員對程序包進行了優(you) 化,使其可在GPU上進行訓練以及預測,極大提高了該機器學習(xi) 勢函數的速度,為(wei) 運行分子動力學提供了便利。用戶可以同時獲得密度泛函理論計算的精度和經典分子動力學的速度。該工具包可供用戶自行使用。同時,為(wei) 了節省用戶收集DFT計算數據帶來的成本,研究人員還提供了由該工具包訓練的機器學習(xi) 勢函數庫,用戶可在這些函數庫的基礎上,進行二度訓練,這樣既可以節省收集數據時間,又可以擴增機器學習(xi) 勢函數適用範圍。

上線僅(jin) 僅(jin) 是一個(ge) 開始

材料是人類社會(hui) 的物質基礎,實現材料的按需設計是一直以來人類的終極夢想。如今,材料計算已經成為(wei) 指導新材料研發的常規方法。

劉淼表示,材料基因工程是物理所近期布局的重要發展領域,Atomly的上線僅(jin) 僅(jin) 是一個(ge) 開始。目前,仍有數以萬(wan) 計的新結構正在計算,各材料的介電函數、聲子譜等重要且獨特的物理信息也正在上線的路上。

在擁有材料大數據積累的前提下,機器學習(xi) 等更多新型人工智能方法將使材料數據庫的整體(ti) 性和優(you) 越性不斷完善和提高,為(wei) 新材料的研發提供更加智能的捷徑。

《中國科學報》 (2021-01-28 第3版 信息技術)




關注【深圳科普】微信公眾號,在對話框:
回複【最新活動】,了解近期科普活動
回複【科普行】,了解最新深圳科普行活動
回複【研學營】,了解最新科普研學營
回複【科普課堂】,了解最新科普課堂
回複【科普書籍】,了解最新科普書籍
回複【團體定製】,了解最新團體定製活動
回複【科普基地】,了解深圳科普基地詳情
回複【觀鳥星空体育官网入口网站】,學習觀鳥相關科普星空体育官网入口网站

聽說,打賞我的人最後都找到了真愛。