作為全球頂級(jí)科技盛會(huì),云棲大會(huì)被視為科技界的創(chuàng)新風(fēng)向標(biāo),主論壇的話題尤為受關(guān)注,代表了最具前沿性、探索性和想象空間的科技方向。
2021年度,AI和Science是兩個(gè)很有熱度的詞。AlphaFold2以深度學(xué)習(xí)技術(shù)在預(yù)測蛋白質(zhì)結(jié)構(gòu)上做出突破,這項(xiàng)計(jì)算工作展現(xiàn)出AI在科學(xué)領(lǐng)域解決問題的巨大潛力。從生物這一單一場景延展開來,在物理、化學(xué)、材料、地質(zhì)等多領(lǐng)域,以深度學(xué)習(xí)為代表的AI與科學(xué)計(jì)算結(jié)合形成新的計(jì)算方法,可以產(chǎn)生怎樣新的科學(xué)模型、新的實(shí)驗(yàn)方法、新的產(chǎn)業(yè)業(yè)態(tài)?
思潮之下,“AI+Science”也成為2021云棲大會(huì)討論碰撞的焦點(diǎn)。
解決傳統(tǒng)科學(xué)計(jì)算問題,AI的系統(tǒng)性機(jī)會(huì)在哪里
張林峰博士此次演講的題目是“‘AI+Science’從科學(xué)愿景走向大規(guī)模工程化”。
令人關(guān)注的是,他所帶領(lǐng)的深勢科技團(tuán)隊(duì)引領(lǐng)的跨尺度建模技術(shù)成功應(yīng)用了人工智能和高性能計(jì)算等能力,于2020年在世界上最大的超級(jí)計(jì)算機(jī)上將量子精度的分子動(dòng)力學(xué)模擬推向了上億個(gè)原子,革命性地提高了微觀科學(xué)計(jì)算的尺度和精度。這一研究成果在全球范圍內(nèi)都處于領(lǐng)先位置,獲美國計(jì)算機(jī)協(xié)會(huì)ACM公布的2020年戈登貝爾獎(jiǎng),并當(dāng)選中國科學(xué)院、中國工程院主辦,中國科學(xué)院院士和中國工程院院士評(píng)選的2020年中國十大科技進(jìn)展。并被認(rèn)為有望為力學(xué)、化學(xué)、材料、生物乃至工程領(lǐng)域解決實(shí)際問題發(fā)揮更大作用。
張林峰認(rèn)為,長期以來我們對(duì)世界的認(rèn)知遵循著兩大范式:開普勒范式和牛頓范式。前者從數(shù)據(jù)中提取規(guī)律,后者尋求基本原理。兩者都能用來解決實(shí)際問題。當(dāng)代AI在CV/NLP等領(lǐng)域的應(yīng)用是集前者之大成,而當(dāng)代仿真模擬和工業(yè)設(shè)計(jì)軟件則是后者的精華沉淀。開普勒范式面臨的挑戰(zhàn)是所謂“知其然不知其所以然”的問題,即模型的可解釋性、可遷移性等;而牛頓范式面臨的挑戰(zhàn)是帶來棘手又漫長的計(jì)算過程,即所謂“維度災(zāi)難”。“AI+Science”的本質(zhì)實(shí)則是兩種范式的結(jié)合。
由此,帶來“AI+Science”的系統(tǒng)性機(jī)會(huì)。以機(jī)器學(xué)習(xí)為代表的AI具備復(fù)雜數(shù)據(jù)處理的能力,可以使得訓(xùn)練出來的物理模型兼具微觀尺度的精度和宏觀尺度的效率,能夠真正有效解決科學(xué)計(jì)算中的“維度災(zāi)難”問題。以斬獲戈登貝爾獎(jiǎng)的Deep Potential方法為例,張林峰博士展示了AI和分子動(dòng)力學(xué)模型的有效結(jié)合,在保證精度的同時(shí),指數(shù)級(jí)地提升了物理模型的效率。以這套方法為代表的全新范式,可以系統(tǒng)性地解決藥物設(shè)計(jì)、材料設(shè)計(jì)和化工設(shè)計(jì)等領(lǐng)域中的微觀設(shè)計(jì)層面問題,實(shí)現(xiàn)“既快又準(zhǔn)”的計(jì)算模擬。
事實(shí)上,AI+Science的應(yīng)用場景遠(yuǎn)不止于微觀層面設(shè)計(jì),在宏觀的飛機(jī)、汽車、火箭也將有豐富的應(yīng)用。
“AI+Science”的工程化正當(dāng)時(shí)
做Science(科學(xué))是探索和理解未知的世界,而工程是還原到實(shí)踐的過程。
談到“AI+Science”的工程化,張林峰博士強(qiáng)調(diào),“AI+Science”的工程化正當(dāng)時(shí)!從規(guī)模、數(shù)據(jù)、性能三個(gè)維度的工程化來理解:對(duì)于AI+Science,“規(guī)模工程”將更加面向計(jì)算本身;“數(shù)據(jù)工程”,將需要面向物理、尊重物理約束;“性能工程”,將不再是軟件對(duì)硬件的適配,而會(huì)是硬件對(duì)算法的定制。
“這樣的工程化需要的是科學(xué)家、工程師以及各行各業(yè)共同的努力。“開源去中心的協(xié)同開發(fā)、在開發(fā)基礎(chǔ)上快速地實(shí)現(xiàn)分布式評(píng)審,就是一種被驗(yàn)證且最佳的軟件協(xié)同發(fā)展模式。張林峰指出打造“AI+Science”新一代基礎(chǔ)設(shè)施的新思路——“開源協(xié)同”。
開源模式在過去的半個(gè)世紀(jì)給計(jì)算機(jī)領(lǐng)域帶來了高速發(fā)展,在科學(xué)計(jì)算領(lǐng)域尚屬新事物,但這種基于開放共享精神和同行評(píng)價(jià)機(jī)制的高效合作模式發(fā)展非常迅速。張林峰博士作為核心發(fā)起人并推動(dòng)的DeepModeling開源社區(qū)之上,新一代的AI+Science體系正在建立:底層算力調(diào)度、各尺度物理引擎、數(shù)據(jù)庫、面向各類計(jì)算需求的工作流都在快速迭代。基于DeePMD開源軟件,來自世界各地的數(shù)千個(gè)材料、化學(xué)、生物等領(lǐng)域的研究組正在拓寬著他們的科研邊界,也產(chǎn)生了很多優(yōu)質(zhì)的科研成果。
AI+Science的未來:解放科學(xué)研究與工業(yè)設(shè)計(jì)的生產(chǎn)力
張林峰博士最后強(qiáng)調(diào),AI+Science的未來在于解放科學(xué)研究與工業(yè)設(shè)計(jì)的生產(chǎn)力。
他所帶領(lǐng)的深勢科技正在聚焦微觀尺度,打造微尺度工業(yè)設(shè)計(jì)平臺(tái),用開源社區(qū)和Lebesgue科學(xué)計(jì)算平臺(tái)解放科學(xué)家的生產(chǎn)力,用藥物設(shè)計(jì)和材料設(shè)計(jì)兩大平臺(tái)解放這兩個(gè)行業(yè)的研發(fā)生產(chǎn)力。為微觀尺度的工業(yè)設(shè)計(jì)解決難題,這也是深勢科技創(chuàng)立的初衷。
關(guān)于深勢科技
深勢科技有限公司(“深勢科技”)是一家成立于2019年的科技公司,致力于以新一代分子模擬技術(shù)解決微觀尺度工業(yè)設(shè)計(jì)難題。 以打造切實(shí)服務(wù)于藥企、材料商和科研機(jī)構(gòu)的模擬研發(fā)平臺(tái)為主要業(yè)務(wù)方向,以解放研發(fā)工作者的生產(chǎn)力為主要業(yè)務(wù)目標(biāo)。
深勢科技具有強(qiáng)大的科研與產(chǎn)業(yè)落地能力。其新一代分子模擬算法在保持量子力學(xué)精度的基礎(chǔ)上,將分子動(dòng)力學(xué)的計(jì)算速度提升了至少五個(gè)數(shù)量級(jí),且對(duì)算力的需求與體系的原子數(shù)量呈線性依賴;結(jié)合高性能計(jì)算,能夠?qū)?shù)十億原子規(guī)模的體系進(jìn)行量子力學(xué)精度的計(jì)算模擬。團(tuán)隊(duì)核心成員獲得2020年全球計(jì)算機(jī)高性能計(jì)算領(lǐng)域的最高獎(jiǎng)項(xiàng)“戈登·貝爾獎(jiǎng)”,相關(guān)工作當(dāng)選2020年中國十大科技進(jìn)展,以及2020年全球人工智能十大科技進(jìn)展。
公司核心團(tuán)隊(duì)由中國科學(xué)院院士領(lǐng)銜,研發(fā)隊(duì)伍由物理建模、數(shù)值算法、機(jī)器學(xué)習(xí)、高性能計(jì)算及藥物和材料計(jì)算等多個(gè)領(lǐng)域的數(shù)十名優(yōu)秀青年科學(xué)家和工程師構(gòu)成。