
最近火到不行不行的人工智能,引起了全球人類的關(guān)注。其中,有人期待人工智能帶來更大的便利,同時也有人擔(dān)憂人工智能會不會搶走自己的飯碗,甚至于未來《終結(jié)者》中的情形將發(fā)生。
那么現(xiàn)在,擔(dān)憂自己的飯碗的可能又要加入一部分材料科研工作者了。 5月4日,Nature封面刊登題為《人工智能將創(chuàng)造更優(yōu)秀的材料?》(《Can artificial intelligence create the next wonder material?》)的文章。一部分科研人員認為人工智能將給材料科學(xué)帶來革命性的改變。
該文章認為,通過計算機建模和機器學(xué)習(xí)技術(shù),可以很快地根據(jù)人們所需要的性能預(yù)測出相應(yīng)候選材料。因此,科學(xué)家們將不再需要瞎貓撞死耗子般地制作新材料,而是按照計算機計算結(jié)果的指導(dǎo),制作出相應(yīng)候選材料并測試,從而加快了新材料的研發(fā)的速度和效率。
不過,人工智能變革材料科學(xué)研究方法尚存在不少問題:一是受制于材料數(shù)據(jù)、材料性能控制因素、計算能力,目前僅對少部分材料奏效。二是要計算機預(yù)測的材料,并不一定能夠在實驗室成功合成乃至規(guī)模量產(chǎn),這個過程可能會很長。
以下是該文章的內(nèi)容:
這是一個堪比最極客的畫面:當(dāng)游客駐足Nicola Marzari的辦公室,他會迫不及待地展示一臺屏幕上不間斷地滾動著數(shù)字和符號的智能手機,“從2010年開始,我的手機正在實時地計算硅的電子結(jié)構(gòu)。”
Marzari是供職于洛桑聯(lián)邦理工學(xué)院的物理學(xué)家,他的手機僅需40秒就可以完成超級計算機花費數(shù)小時的量子力學(xué)計算。此舉展示了理論計算在過去數(shù)十年的飛躍,同時也展示了未來改變材料科學(xué)的潛能。
目前材料科研的方法是靠運氣碰到一種新材料,然后在實驗室精心測量它的性能。Marzari和他的同行正在用計算機建模和機器學(xué)習(xí)技術(shù)生成一個數(shù)以萬計的候選材料庫。即使是失敗實驗所得到的數(shù)據(jù)也可以提供有效參考。雖然大量候選材料是完全假想的,但是工程師們可以通過搜索預(yù)期性能篩選出值得合成和測試的材料。例如他們可以限定材料作為導(dǎo)體或絕緣體的性能,是否有磁性,可抗多高的溫度和壓力等等。
行業(yè)先鋒、加州大學(xué)伯克利分校材料科學(xué)家Gerbrand Ceder認為它將是對發(fā)現(xiàn)材料的速度和效率的一個極大飛躍。他指出我們僅僅知道現(xiàn)有材料1%的性能,并以磷酸鐵鋰為例。該材料合成是在20世紀30年代,但直到1996年才發(fā)現(xiàn)它是現(xiàn)有鋰離子電池絕佳的替代材料,“因為沒有人測它的電壓”。
世界上目前至少有三大材料數(shù)據(jù)庫,保存有數(shù)萬或者數(shù)十萬材料的數(shù)據(jù)。Marzari的材料云項目在今年下半年運行,由此吸引了更廣泛的關(guān)注。倫敦帝國學(xué)院副院長、材料科學(xué)家Neil Alford給以評價道“我們正在目睹一個實驗者想要的理論者傳遞的東西的聚集。”他目前尚未隸屬于任何材料數(shù)據(jù)庫項目。
但支持者迅速地指出,從計算機預(yù)測到現(xiàn)實世界技術(shù)這個過程并不容易?,F(xiàn)存的材料數(shù)據(jù)庫遠遠稱不上收錄所有已知材料,罔論所有可能材料。由此,靠數(shù)據(jù)庫驅(qū)動工作或許將對某些材料有用,另外一些則不然。即使是計算機標(biāo)出了一種可能材料,但是實驗室要做出來又有好幾年。Ceder認為“相比于能做什么,我們更了解想要什么。”
盡管如此,研究者們?nèi)匀幌嘈胚@是一個有待發(fā)掘的財寶,并在電子、能源、機器人、醫(yī)療和交通方面連帶創(chuàng)新。芝加哥材料計算科學(xué)家Giulia Galli介紹“我們是在將謎題的不同部分拼湊在一起,當(dāng)所有部分湊對位置,材料的預(yù)測就會成真。”
基因組計劃的激勵
Ceder關(guān)于利用大量數(shù)據(jù)驅(qū)動材料研究的設(shè)想大約成熟于21世紀初,那時他供職于Massachusetts Institute of Technology (MIT),他的想法很大程度上受到人類基因組計劃的啟發(fā)。
Ceder解釋道:“人類基因組本身并不能用于材料研究,不過他卻為材料研究提供了一種新的方法。”材料學(xué)者能否借鑒基因?qū)W者們的經(jīng)驗,建立材料基因組即解碼材料的不同組成成分和性能的對應(yīng)關(guān)系——就像解碼生物性狀和DNA堿基配對的對應(yīng)關(guān)系一樣。
Ceder認為:想要實現(xiàn)上述過程,解碼必須關(guān)注于給定材料的構(gòu)成原子,電子以及空間排布規(guī)律(晶體結(jié)構(gòu))。在2003年,Ceder和他的團隊首次展示了如何利用量子力學(xué)計算的基礎(chǔ)數(shù)據(jù)庫預(yù)測一種合金最有可能的晶體結(jié)構(gòu),這是在商業(yè)中探索一種新材料的關(guān)鍵數(shù)據(jù)。
過去,這些計算非常復(fù)雜,即使使用超級計算機也很難實現(xiàn)。這種計算機制必須透過一系列復(fù)雜的試驗點以及謬誤點直指物質(zhì)的基礎(chǔ)狀態(tài)即是物質(zhì)能量最低,受力平衡的晶體結(jié)構(gòu)和電子排布。但是在Ceder2003的文章,研究人員描述了一種捷徑。研究人員首先計算了相同晶體結(jié)構(gòu)的二元合金,而后設(shè)計了一種“學(xué)習(xí)機制”算法,通過該算法新的計算可以從二元合金中調(diào)取模板,計算出新材料最可能的基礎(chǔ)狀態(tài)。這種算法運行良好,它大幅縮短了計算時間。

“那篇文章介紹了一種建立公共數(shù)據(jù)庫探究材料性質(zhì)的新方法,我們所需要做的是填補數(shù)據(jù)庫的空白”Stefano Curtarolo解釋道。他于論文發(fā)表的同一年離開Ceder課題組,在Duke大學(xué)組建了自己的實驗室。這一想法直接催生了兩項獨立計劃的產(chǎn)生。在2006年,Ceder在MIT成立了材料基因組計劃,他們使用優(yōu)化后的算法預(yù)測鋰基材料在電動車電池上應(yīng)用的相關(guān)性能。截止到2010年,這項計劃已經(jīng)預(yù)測了20000種化合物。“我們從現(xiàn)有材料入手,調(diào)整了他們的晶體結(jié)構(gòu),把一種成分從一處挪到另一處并計算可能發(fā)生的現(xiàn)象”,Kristin Persson解釋道,她在Ceder課題組工作到了2008年。
與此同時,在Duke,Curtarolo 成立了材料基因組中心,他們著重于探究合金。通過與 Brigham Young大學(xué)Israel's Negev Nuclear Research Center的合作,他于2003年成功為材料基因組引入了,AFLOW系統(tǒng),該系統(tǒng)可自動根據(jù)已有的晶體結(jié)構(gòu)技術(shù)新的結(jié)構(gòu)。
無論是原課題組成員還是外界研究人員,大家都對這種大數(shù)據(jù)計算產(chǎn)生了極大的興趣?;瘜W(xué)家Jens N rskov曾使用該方法探究能夠使水分解成氫氣和氧氣的催化劑。后來,他的研究擴大成為了SUNCAT Center的原型。
Marzari同樣對該技術(shù)很感興趣。他曾是Quantum Espresso計劃的一員,該計劃成立于2009致力于量子力學(xué)計算。
材料基因組
但是,直到2011年6月計算材料學(xué)仍然沒有成為主流,此時白宮剛宣布材料基因組計劃(MGI)。James Warren是美國國家標(biāo)準與技術(shù)局的一名材料科學(xué)家,也是MGI的執(zhí)行秘書,他說“當(dāng)白宮的人逐漸熟悉Ceder的工作,他們就變得興奮起來”。人們已經(jīng)普遍認識到電腦模擬能夠?qū)?chuàng)新和制造業(yè)產(chǎn)生積極作用”。
從2011年開始,這項計劃已經(jīng)投資了超過2.5億美元用于軟件工具、收集和報道實驗數(shù)據(jù)的標(biāo)準化技術(shù)、主要大學(xué)建立計算材料學(xué)中心、對特定應(yīng)用建立大學(xué)與企業(yè)部門之間的合作。但是,目前并不清楚如此巨大的投資對這門學(xué)科推動作用有多大。Ceder說,“MGI帶來的好處很多,而且還產(chǎn)生了一點品牌效應(yīng),一些團隊把他們的研究稱作基因X或基因XXX,雖然他們的工作幾乎與此并不相關(guān)”
然而,MGI真真切切做到了一件事,那就是在幫助Ceder 和其他人實現(xiàn)了他們建立材料性能在線數(shù)據(jù)庫的愿景。在2011年年末,Ceder 和 Persson將材料基因組計劃作為Materials Project重新啟動,此項目曾經(jīng)被白宮要求放棄“基因”標(biāo)簽以防止與國家的努力混淆。來年,Curtarolo發(fā)布了用自己開發(fā)的軟件而做的數(shù)據(jù)庫,叫做Curtarolo。2013年,西北大學(xué)的材料研究員Chris Wolverton推出了開放量子材料數(shù)據(jù)庫(OQMD),他表示自己的idea來自于Materials Project和AFLOWlib項目,但軟件和數(shù)據(jù)是自己開發(fā)的。
這三個數(shù)據(jù)庫都分享了5萬余種已知材料的核心數(shù)據(jù),這些材料來自于人們廣泛使用的實驗資料庫,即無機晶體結(jié)構(gòu)數(shù)據(jù)庫。這些材料被實驗室制作出來過至少一次或者有文獻對其進行報道,但是其中的電性能或磁性能可能從來沒有被仔細研究;這些材料可能是我們獲得新材料起點。
三個數(shù)據(jù)庫的不同之處在于其中所包含的的假設(shè)性材料。Materials Project包含的相對較少,其中包含15000種Ceder和Persson根據(jù)鋰電池研究而得到的計算結(jié)構(gòu)。Persson說,如果我們自信計算結(jié)果正確并且有機會將其做出來,才會將其假如數(shù)據(jù)庫。另外,還有13萬左右的結(jié)構(gòu)由明尼蘇達大學(xué)的納米多孔材料基因中心預(yù)測,這個數(shù)據(jù)庫主要包含沸石和MOF。
AFLOWlib 是最大的數(shù)據(jù)庫,其特點是擁有超過一百萬種不同的材料和大約1億的計算得到的性能。這是因為它包含成千上萬的假設(shè)材料,其中許多在實際中僅能存極短的時間。Curtarolo 說,當(dāng)你想預(yù)測某種材料可以如何制備時,這些數(shù)據(jù)就很有價值。例如,他使用AFLOWlib 的數(shù)據(jù)庫數(shù)據(jù)來研究為什么一些合金可以形成金屬玻璃——一種具有無序顯微結(jié)構(gòu)的獨特金屬。事實證明,一種材料能否形成金屬玻璃取決于不穩(wěn)定晶體結(jié)構(gòu)的數(shù)量和能量,這些不穩(wěn)定結(jié)構(gòu)在合金冷卻時與基態(tài)原子相競爭。
Wolverton的 OQMD 數(shù)據(jù)庫包含約40萬種假設(shè)性材料,這些材料由自然界中常見的晶體結(jié)構(gòu)以及用元素周期表各部分的元素修飾計算而來。其中鈣鈦礦的相關(guān)數(shù)據(jù)非常多,其晶體結(jié)構(gòu)通常表現(xiàn)出諸如超導(dǎo)等吸引人的特性,而且還應(yīng)用于太陽能電池中。與名字所暗示的一樣,這個項目是三個中是最開放的:用戶可以下載整個數(shù)據(jù)庫而不僅僅是單個搜索結(jié)果。
所有這些數(shù)據(jù)庫還在發(fā)展,它們的創(chuàng)建者認為其還不夠完美,所以花費大量時間來添加更多的化合物并且完善計算結(jié)果。這些數(shù)據(jù)越來越善于預(yù)測某種晶體是否穩(wěn)定,但是在預(yù)測光吸收性能以及導(dǎo)電性等方面并不是很好。Marzari 指出,即使是在計算材料學(xué)最有成功經(jīng)驗的電池材料領(lǐng)域,標(biāo)準計算仍然有平均半伏的誤差,導(dǎo)致性能方面存在許多差異。“事實是,理論本身存在一些錯誤:我們可能永遠無法改正”,Curtarolo 說。
每個團隊都正在開發(fā)自己的技術(shù)來調(diào)整計算并彌補這些系統(tǒng)誤差。但是,與此同時他們已經(jīng)在使用這些數(shù)據(jù)來進行科學(xué)研究,來自其他團隊的用戶也在做同樣的事。Marerials Project 確定了幾個極有前景的正極材料,其性能可能超過已經(jīng)存在的鋰電池材料。同時確定了幾種金屬氧化物,可以提高太陽能電池陽的光吸收效率和能量轉(zhuǎn)化效率。今年早些時候,來自Dublin 的Trinity 學(xué)院的研究人員使用 AFLOWlib 數(shù)據(jù)庫預(yù)測20種Heusler合金,其可以用于傳感器或電腦記憶體的磁鐵,他們還成功地合成了兩種該類合金,結(jié)果表明其磁特性非常接近預(yù)測結(jié)果。
進擊的歐洲
材料基因組同樣在歐盟得以開展,盡管可能用的是其他名字。例如,瑞士建設(shè)了MARVEL,一個計算材料科學(xué)研究網(wǎng)絡(luò),以洛桑聯(lián)邦理工學(xué)院為首,Marzari是主管。他通過使用全新的計算平臺,創(chuàng)建了一個名為“材料云”的數(shù)據(jù)庫,以用于檢索二維材料,例如石墨烯。這些材料可以應(yīng)用于納米層級的電子產(chǎn)品到生物醫(yī)藥設(shè)備。為了找到優(yōu)秀的候選材料。Marzari提交了超過15萬種已知材料到他所謂的“計算剝離”:計算出將原晶體表面剝離一個單原子層需要多少能量。今年下半年他的數(shù)據(jù)庫就將向公眾開放,預(yù)計將可以讓1500種可能的二維結(jié)構(gòu)測試。
而計算化學(xué)家Berend Smit興建了另一個中心,以發(fā)展預(yù)測數(shù)以萬計的納米沸石分子篩和金屬有機框架的算法,以及其他算法。他的工作同樣得到了材料基因組可以帶來壞消息。很多研究人員期望使用納米沸石材料以打造一種再更少的空間可以儲存更多的甲醇的汽車油箱。但搜尋了超過650000種計算材料之后,Smit的團隊得到的結(jié)果顯示,現(xiàn)有的材料已經(jīng)是較優(yōu)解。新材料的改進效果會非常小,因此目前美國機構(gòu)設(shè)置的重大技術(shù)改進甲烷存儲目標(biāo)可能是不切實際的。
正是這樣那樣的結(jié)果顯示,材料基因組要達到預(yù)期效果還有很多難題。其中一個問題是計算結(jié)果只能對實驗室合成新材料提供一些線索,更別提實現(xiàn)產(chǎn)業(yè)化了。Ceder介紹,“要做出計算所得的材料,我們有時候要花2周,有時候是半年甚至更長。而且我們也搞不清到底是沒有用正確的方法合成,還是壓根就做不到。”
Ceder和Curtarolo都在嘗試用機器學(xué)習(xí)算法從現(xiàn)有的制造工藝中提取規(guī)律以指導(dǎo)材料合成。
另一個限制是,目前材料基因組一直被應(yīng)用于工程師所謂的功能材料--即可以實現(xiàn)某種功能的化合物。但該技術(shù)不被用于研究結(jié)構(gòu)材料,因為材料的彈性和硬度這樣的機械性能依賴于加工工藝。
即使是在功能材料領(lǐng)域,目前的計算機程序也只能很好地對材料結(jié)構(gòu)中很小的一部分——完美晶體結(jié)構(gòu)進行分析。Galli介紹,“未來最有趣的材料可能會以創(chuàng)造性的在微觀層面進行組裝。它們可能是納米顆粒和晶體結(jié)構(gòu)中特地布入缺陷的組合物,或者是纏結(jié)了不同化合物和相的異質(zhì)材料。為了預(yù)測這種材料,需要一次性計算許多性能,以及計算在特定溫度和時間下系統(tǒng)如何變化。如此計算成本將非常高昂。
在短期內(nèi),更多的實驗數(shù)據(jù)交換可以對計算進行現(xiàn)實檢查,并有助于完善。為此,Ceder正在與MIT從事軟件研究的團隊進行合作,使用一種軟件可以讀取實驗類材料科學(xué)的論文,并自動以標(biāo)準格式提取晶體結(jié)構(gòu)的信息。他們計劃開始在幾個月內(nèi)將這些數(shù)據(jù)傳送到材料項目上。
從長遠來看,摩爾定律或許可以幫上忙:隨著計算能力的不斷提高,一些超出目前計算的技術(shù)可能很快變得可用。
Marzari說“我們已經(jīng)從計算材料科學(xué)的手工時代發(fā)展到了工業(yè)時代,我們現(xiàn)在可以創(chuàng)建模擬裝配鏈進行工作,還可以用全新的方法探究問題。雖然現(xiàn)在市場上還沒有通過計算預(yù)測得到的材料,但十年之后或許會很多。”
Nature原文地址:Can artificial intelligence create the next wonder material?