国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

熱搜: 佳士科技  irobot  工業(yè)機(jī)器人  機(jī)器人  ABB  機(jī)器人產(chǎn)業(yè)聯(lián)盟  機(jī)械手  發(fā)那科  機(jī)器人展覽  碼垛機(jī)器人 

從AlphaGo到AlphaFold,什么是AI工具的最佳用法?

   日期:2022-07-29     來(lái)源:觀察未來(lái)科技     評(píng)論:0    
標(biāo)簽:
  兩年前,2020年12月,Science雜志評(píng)選了該年度十個(gè)重大科學(xué)突破,除了在特殊大背景下的mRNA疫苗,還有一項(xiàng)就是蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的人工智能——AlphaFold。AlphaFold是由谷歌公司深度學(xué)習(xí)方面的核心團(tuán)隊(duì)DeepMind所開(kāi)發(fā),該團(tuán)隊(duì)一直致力于用人工智能和神經(jīng)網(wǎng)絡(luò)技術(shù)解決不同場(chǎng)景下的學(xué)習(xí)問(wèn)題——大名鼎鼎的AlphaGo就出自DeepMind麾下。
 
  在圍棋博弈算法AlphaGo大獲成功后,DeepMind又轉(zhuǎn)向了基于氨基酸序列的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè),提出了名為AlphaFold的深度學(xué)習(xí)算法,并在國(guó)際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)比賽CASP13中取得了優(yōu)異的成績(jī)。AlphaFold的橫空問(wèn)世在幾年的時(shí)間里徹底改變了生物學(xué),不過(guò),目前,科學(xué)家們似乎仍在尋找AlphaFold這類(lèi)人工智能工具的最佳用法。撥開(kāi)制藥迷霧
 
  制藥業(yè)是危險(xiǎn)與迷人并存的行業(yè)。傳統(tǒng)上,如果某家制藥公司想要開(kāi)發(fā)一種新藥,只能為了找到潛在的候選藥物而去搜索龐大的醫(yī)學(xué)資料庫(kù)。但顯然,這種方法存在巨大的不確定性,需要科學(xué)家們付出多年的努力,而且即使找到了候選藥物也只是一個(gè)起點(diǎn)。一旦確定了候選藥物,接下來(lái),科學(xué)家們就要對(duì)它們進(jìn)行分析、合成,整個(gè)過(guò)程可能又需要好幾年。
 
  最后,研究人員還要對(duì)發(fā)現(xiàn)的藥物進(jìn)行臨床試驗(yàn),一開(kāi)始是在動(dòng)物身上進(jìn)行,然后是在一小群人身上,最后是在一大群人身上。簡(jiǎn)而言之,藥品的開(kāi)發(fā)是一場(chǎng)耗時(shí)又耗錢(qián)的漫長(zhǎng)“戰(zhàn)爭(zhēng)”。除此之外,這場(chǎng)戰(zhàn)爭(zhēng)中的“陣亡者”數(shù)量也很大——根據(jù)《自然》數(shù)據(jù),一款新藥的研發(fā)成本大約是26億美元,耗時(shí)約10年,而成功率則不到十分之一。
 
  盡管面臨重重阻礙,但計(jì)算機(jī)科學(xué)家出身的生物物理學(xué)家亞歷克斯·扎沃龍科夫(AlexZhavoronkov)卻創(chuàng)造性地提出了一條可能的捷徑。2012年前后,扎沃龍科夫開(kāi)始注意到,人工智能在圖像、語(yǔ)音和文本識(shí)別方面變得越來(lái)越擅長(zhǎng)了。在他看來(lái),這三個(gè)任務(wù)都有一個(gè)關(guān)鍵的共同點(diǎn),那就是在每一種情況下都需要龐大的數(shù)據(jù)庫(kù),從而用于訓(xùn)練人工智能。
 
  類(lèi)似的數(shù)據(jù)庫(kù)也出現(xiàn)在了藥理學(xué)中。因此,在2014年,扎沃龍科夫開(kāi)始考慮是否可以利用這些數(shù)據(jù)庫(kù)和人工智能技術(shù)來(lái)加快藥物開(kāi)發(fā)的過(guò)程。
 
  為了把這些想法變成現(xiàn)實(shí),扎沃龍科夫在馬里蘭州巴爾的摩市的約翰霍普金斯大學(xué)一個(gè)名為InsilicoMedicine的機(jī)構(gòu),開(kāi)始了研究。InsilicoMedicine的“藥物發(fā)現(xiàn)引擎”的起點(diǎn)就是對(duì)數(shù)百萬(wàn)的數(shù)據(jù)樣本進(jìn)行篩選,以確定特定疾病的生物學(xué)特征,然后再利用這個(gè)引擎確定最有希望的治療靶點(diǎn),并運(yùn)用生成性對(duì)抗網(wǎng)絡(luò)去生成完全適合這些靶點(diǎn)的分子。
微信圖片_20220729092424
  3年后,扎沃龍科夫獲得了成功,扎沃龍科夫開(kāi)發(fā)出的系統(tǒng),發(fā)現(xiàn)了潛在藥物靶點(diǎn)的爆炸性增長(zhǎng)和一個(gè)更有效的測(cè)試過(guò)程,讓一場(chǎng)以往持續(xù)時(shí)間長(zhǎng)達(dá)10年或“持久戰(zhàn)”變成了一個(gè)月內(nèi)就可以結(jié)束的“小沖突”。在2018年年底,InsilicoMedicine在不到46天的時(shí)間里就得到了一系列新分子,而且他們的成果不僅包括最初的發(fā)現(xiàn),還包括藥物的合成和計(jì)算機(jī)模擬的驗(yàn)證實(shí)驗(yàn)。
 
  新藥發(fā)明的過(guò)程還包括了一個(gè)關(guān)鍵的步驟,即識(shí)別新藥靶點(diǎn),也就是藥物在體內(nèi)的結(jié)合位置,這是藥物研發(fā)過(guò)程的另一個(gè)關(guān)鍵部分。
 
  實(shí)際上,從1980年到2006年,盡管每年的投資高達(dá)300多億美元,但是平均而言研究人員每年仍然只能找到5種新藥。其中關(guān)鍵的問(wèn)題就在于復(fù)雜性。大多數(shù)潛在藥物的靶點(diǎn)都是蛋白質(zhì),而蛋白質(zhì)的結(jié)構(gòu),即2D氨基酸序列折疊成3D蛋白質(zhì)的方式?jīng)Q定了它的功能。
 
  一個(gè)只有100個(gè)氨基酸的蛋白質(zhì),已經(jīng)是一個(gè)非常小的蛋白質(zhì)了,但就是這么小的蛋白質(zhì),可以產(chǎn)生的可能形狀的種類(lèi)依然是一個(gè)天文數(shù)字,大約是一個(gè)1后面跟著300個(gè)0。這也正是蛋白質(zhì)折疊一直被認(rèn)為是一個(gè)即使大型超級(jí)計(jì)算機(jī)也無(wú)法解決的難題的原因。
 
  從1994年開(kāi)始,為了監(jiān)測(cè)這種超越超級(jí)計(jì)算機(jī)能力的蛋白質(zhì)折疊過(guò)程,科學(xué)界每年都會(huì)舉辦一次蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)關(guān)鍵評(píng)估(CASP)大賽。直到2018年幾乎沒(méi)有人取得過(guò)成功。但是,DeepMind的開(kāi)發(fā)者們利用神經(jīng)網(wǎng)絡(luò)化解了這個(gè)難題。他們開(kāi)發(fā)出了一種人工智能,可以通過(guò)挖掘大量的數(shù)據(jù)集來(lái)確定蛋白質(zhì)堿基對(duì)與它們的化學(xué)鍵的角之間的可能距離——這是蛋白質(zhì)折疊的基礎(chǔ)。他們把這個(gè)人工智能命名為AlphaFold。典型的量變,巨大的質(zhì)變
 
  2018年,AlphaFold首次參加了CASP大賽,并摘得頭魁。在2018年的比賽中,AlphaFold需要與其他參賽的人工智能比賽,解決43個(gè)蛋白質(zhì)折疊的問(wèn)題。最終,AlphaFold答對(duì)了25個(gè),而獲得第二名的人工智能只勉強(qiáng)答對(duì)了3個(gè)。AlphaFold的誕生,成為了蛋白質(zhì)結(jié)構(gòu)解析領(lǐng)域里程碑,也徹底改變了成千上萬(wàn)生物學(xué)家的研究。
 
  2020年,DeepMind發(fā)布了AlphaFold軟件的第二個(gè)版本。相較于第二個(gè)版本,2018年的更早版本并不夠好,不能取代使用實(shí)驗(yàn)方法解析的結(jié)構(gòu),而AlphaFold2的預(yù)測(cè)結(jié)果平均而言已與實(shí)驗(yàn)結(jié)果相差無(wú)幾。當(dāng)時(shí),AlphaFold2再一次在CASP大賽上一舉奪魁。CASP大賽每?jī)赡昱e辦一次,呈現(xiàn)了生物學(xué)界在一項(xiàng)艱巨挑戰(zhàn)上的最新進(jìn)展。
 
  2020年的這項(xiàng)挑戰(zhàn)是如何僅憑蛋白質(zhì)的氨基酸序列確定其3D結(jié)構(gòu)。計(jì)算機(jī)軟件給出的結(jié)構(gòu)會(huì)拿來(lái)與經(jīng)過(guò)X射線(xiàn)晶體學(xué)或冷凍電鏡(cryo-EM)這類(lèi)實(shí)驗(yàn)方法確認(rèn)的結(jié)果進(jìn)行對(duì)比。X射線(xiàn)晶體學(xué)和冷凍電鏡分別通過(guò)X射線(xiàn)和電子束照射蛋白質(zhì)的方式來(lái)對(duì)蛋白質(zhì)的結(jié)構(gòu)進(jìn)行成像。
微信圖片_20220729092422
  AlphaFold的預(yù)測(cè)用被稱(chēng)為“427組”,多個(gè)預(yù)測(cè)達(dá)到了驚人的準(zhǔn)確性,讓它們脫穎而出。當(dāng)然,AlphaFold的預(yù)測(cè)水平有高有低,但將近三分之二的預(yù)測(cè)結(jié)果都與實(shí)驗(yàn)結(jié)果在質(zhì)量上不相上下。AlphaFold的預(yù)測(cè)甚至幫助確定了Lupas實(shí)驗(yàn)室多年來(lái)一直想要破解的一種細(xì)菌蛋白的結(jié)構(gòu)。
 
  一年后,2021年7月15日,AlphaFold2的論文發(fā)表,同時(shí)公開(kāi)的還有免費(fèi)的開(kāi)源代碼等信息,讓業(yè)內(nèi)的研究人員們可以打造屬于自己的版本。一周后,DeepMind宣布已經(jīng)用AlphaFold預(yù)測(cè)了人體內(nèi)近乎所有蛋白質(zhì)的結(jié)構(gòu),以及20個(gè)其他被大量研究的生物體的完整“蛋白質(zhì)組”,其中包括小鼠和大腸桿菌,累計(jì)共有36.5萬(wàn)個(gè)結(jié)構(gòu)。
 
  DeepMind還將這些信息上傳到了由EMBL歐洲生物信息學(xué)研究所(EMBL–EBI)維護(hù)的數(shù)據(jù)庫(kù)。在那之后,這個(gè)數(shù)據(jù)庫(kù)已經(jīng)收錄了近100萬(wàn)個(gè)結(jié)構(gòu)。根據(jù)DeepMind的統(tǒng)計(jì),目前已有超40萬(wàn)人使用過(guò)EMBL-EBI的AlphaFold數(shù)據(jù)庫(kù)。此外,還有一些AlphaFold的“超級(jí)用戶(hù)”:這些研究人員在自己服務(wù)器上安裝了AlphaFold,或是打造了AlphaFold的云版本,用來(lái)預(yù)測(cè)不在EMBL-EBI數(shù)據(jù)庫(kù)中的結(jié)構(gòu),或是探索AlphaFold的新用途。
 
  今年,DeepMind還計(jì)劃發(fā)布總計(jì)1億多個(gè)結(jié)構(gòu)預(yù)測(cè)——相當(dāng)于所有已知蛋白的近一半,是蛋白質(zhì)數(shù)據(jù)銀行(PDB)結(jié)構(gòu)數(shù)據(jù)庫(kù)中經(jīng)過(guò)實(shí)驗(yàn)解析的蛋白數(shù)量的幾百倍之多。
 
  要知道,過(guò)去半個(gè)多世紀(jì),人類(lèi)一共解析了五萬(wàn)多個(gè)人源蛋白質(zhì)的結(jié)構(gòu),人類(lèi)蛋白質(zhì)組里大約17%的氨基酸已有結(jié)構(gòu)信息;而AlphaFold的預(yù)測(cè)結(jié)構(gòu)將這一數(shù)字從17%大幅提高到58%;因?yàn)闊o(wú)固定結(jié)構(gòu)的氨基酸比例很大,58%的結(jié)構(gòu)預(yù)測(cè)幾乎已經(jīng)接近極限。這是一個(gè)典型的量變引起巨大的質(zhì)變,而這一量變是在短短一年之內(nèi)發(fā)生的。
 
  AlphaFold的最佳用法
 
  除了在制藥領(lǐng)域發(fā)揮作用,AlphaFold還被應(yīng)用到了更多領(lǐng)域。
 
  一方面,AlphaFold的結(jié)構(gòu)解析能力極大解放了生物學(xué)家們的研究:有研究團(tuán)隊(duì)還在搜索另一個(gè)包含從海洋和廢水中提取的DNA序列的數(shù)據(jù)庫(kù),試圖發(fā)現(xiàn)新的食塑酶。通過(guò)讓AlphaFold快速預(yù)測(cè)數(shù)千個(gè)蛋白的結(jié)構(gòu),該團(tuán)隊(duì)希望能更好地理解酶是如何通過(guò)演化擁有分解塑料的能力,并能進(jìn)一步優(yōu)化它們。
 
  哈佛大學(xué)演化生物學(xué)家SergeyOvchinnikov認(rèn)為,這種將任何蛋白編碼基因序列轉(zhuǎn)化為可靠結(jié)構(gòu)的能力,對(duì)于演化研究來(lái)說(shuō)非常有用。研究人員通過(guò)比較基因序列來(lái)確定不同物種的生物體與它們基因之間的親緣關(guān)系。而對(duì)于親緣關(guān)系較遠(yuǎn)的基因來(lái)說(shuō),這種比較可能無(wú)法發(fā)現(xiàn)演化近親,因?yàn)檫@些序列已經(jīng)變了很多。但通過(guò)比較變化速度比基因序列更慢的蛋白質(zhì)結(jié)構(gòu),研究人員或許能揭示之前沒(méi)注意到的古代關(guān)系。
 
  另一方面,AlphaFold還是個(gè)絕佳的實(shí)驗(yàn)工具,AlphaFold能提供一個(gè)初步預(yù)測(cè),之后再由實(shí)驗(yàn)驗(yàn)證或優(yōu)化。比如,來(lái)自X射線(xiàn)晶體學(xué)的原始數(shù)據(jù)以衍射X射線(xiàn)的圖樣呈現(xiàn)。一般來(lái)說(shuō),科學(xué)家需要對(duì)蛋白質(zhì)結(jié)構(gòu)有個(gè)初步猜測(cè),才能解釋這些圖樣。而AlphaFold的預(yù)測(cè)讓大部分X射線(xiàn)圖樣不再需要這些方法。
 
  另外,AlphaFold不僅改變了科學(xué)家測(cè)定蛋白質(zhì)結(jié)構(gòu)的方式。一些研究人員還在利用這些工具打造全新的蛋白質(zhì)。華盛頓大學(xué)生物化學(xué)家、蛋白質(zhì)設(shè)計(jì)和結(jié)構(gòu)預(yù)測(cè)領(lǐng)域帶頭人DavidBaker表示,深度學(xué)習(xí)徹底改變了他們團(tuán)隊(duì)設(shè)計(jì)蛋白質(zhì)的方式。Baker的團(tuán)隊(duì)讓AlphaFold和另一個(gè)AI工具RoseTTAFold來(lái)設(shè)計(jì)新的蛋白。他們改寫(xiě)了人工智能的代碼,讓軟件在得到隨機(jī)氨基酸序列的情況下,對(duì)它們進(jìn)行優(yōu)化,直到合成出能被這些神經(jīng)網(wǎng)絡(luò)識(shí)別為蛋白的東西。
 
  2021年12月,Baker的研究團(tuán)隊(duì)報(bào)告了他們?cè)诩?xì)菌中表達(dá)了129種這些幻想蛋白,發(fā)現(xiàn)其中約1/5的蛋白會(huì)折疊成類(lèi)似他們預(yù)測(cè)的結(jié)構(gòu)。而這是這種網(wǎng)絡(luò)能用來(lái)設(shè)計(jì)蛋白質(zhì)的首個(gè)證明。
 
  基于此,今年7月21日,來(lái)自華盛頓大學(xué)等機(jī)構(gòu)的科學(xué)家們?cè)赟cience雜志上發(fā)布了一款新的AI軟件,該軟件能夠?yàn)樽匀唤缰猩胁淮嬖诘牡鞍踪|(zhì)繪制結(jié)構(gòu)。更重要的是,科學(xué)家們已經(jīng)利用這一軟件創(chuàng)造出潛在用于工業(yè)反應(yīng)、癌癥治療、甚至用于預(yù)防呼吸道合胞病毒(RSV)感染的候選疫苗的原始化合物。
 
  雖然AlphaFold的出現(xiàn)推動(dòng)了巨大進(jìn)展,但科學(xué)家認(rèn)為有必要說(shuō)明它的局限性:一些研究人員嘗試將AlphaFold應(yīng)用于會(huì)破壞蛋白天然結(jié)構(gòu)的各類(lèi)突變,包括與早期乳腺癌有關(guān)的一個(gè)突變,這些嘗試證實(shí)了AlphaFold還無(wú)法預(yù)測(cè)新的突變對(duì)蛋白質(zhì)的影響,因?yàn)闆](méi)有演化上相關(guān)的序列可以用來(lái)研究。
 
  并且,AlphaFold無(wú)法很好地處理會(huì)在不同構(gòu)象中呈現(xiàn)不同結(jié)構(gòu)的蛋白。這些預(yù)測(cè)是針對(duì)單獨(dú)的結(jié)構(gòu),而許多蛋白質(zhì)其實(shí)會(huì)與配體一起發(fā)揮功能,如DNA和RNA、脂肪分子、鐵等礦物質(zhì)。
 
  目前,AlphaFold掀起的革命會(huì)走向何方依然無(wú)法預(yù)見(jiàn),但每一天,AlphaFold都顯示出推動(dòng)的巨大力量。EMBL-EBI的計(jì)算生物學(xué)家JanetThornton認(rèn)為AlphaFold帶來(lái)的最大轉(zhuǎn)變之一,可能是讓生物學(xué)家更愿意接受計(jì)算機(jī)和理論的研究方法。換言之,真正的變革是人們思維方式的變化,這其實(shí)就是AI工具的最佳用法。AlphaFold所彰顯的意義,是科技的力量。
 
  試想一下,在未來(lái),如果把人工智能AlphaFold與生成式對(duì)抗網(wǎng)絡(luò)Insilico結(jié)合起來(lái),再加上量子計(jì)算領(lǐng)域可預(yù)期的突破,我們就將真正走出制藥的迷霧,連同生物領(lǐng)域的百年來(lái)的困惑,而走向一條未來(lái)生物學(xué)的坦途。
 
 
聲明:凡資訊來(lái)源注明為其他媒體來(lái)源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點(diǎn),也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問(wèn)或質(zhì)疑,請(qǐng)立即與中國(guó)機(jī)器人網(wǎng)(www.baoxianwx.cn)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話(huà):021-39553798-8007
更多>相關(guān)資訊
0相關(guān)評(píng)論

推薦圖文
推薦資訊
點(diǎn)擊排行
?