計(jì)算機(jī)人工智能系統(tǒng)AlphaFold最近預(yù)測了數(shù)萬種蛋白質(zhì)的以前未知的三維結(jié)構(gòu)。
美因茨約翰內(nèi)斯·古騰堡大學(xué)(JGU)的研究團(tuán)隊(duì)專注于具有高置信度分?jǐn)?shù)的子集,研究人員通過算法分析這些預(yù)測,發(fā)現(xiàn)蛋白質(zhì)骨架表現(xiàn)出罕見的拓?fù)鋸?fù)雜性,即打結(jié)。
其中,研究人員發(fā)現(xiàn)了一個(gè)71-結(jié),這是迄今為止在蛋白質(zhì)中發(fā)現(xiàn)的最復(fù)雜的拓?fù)浣Y(jié),以及幾個(gè)由兩個(gè)甲基轉(zhuǎn)移酶或碳酸酐酶結(jié)構(gòu)域組成的六交叉復(fù)合結(jié),每個(gè)結(jié)構(gòu)域都包含一個(gè)簡單的三葉結(jié)。這些深深嵌入的復(fù)合結(jié)顯然是通過基因復(fù)制和打結(jié)二聚體的相互連接而發(fā)生的。
另外,該團(tuán)隊(duì)還報(bào)告了兩個(gè)新的五交叉結(jié),包括第一個(gè)51-結(jié)。該工作分析的結(jié)構(gòu)列表構(gòu)成了未來實(shí)驗(yàn)研究的基礎(chǔ),以確認(rèn)這些新型打結(jié)拓?fù)洳⑻剿髌鋸?fù)雜的折疊機(jī)制。
該研究以「AlphaFoldpredictsthemostcomplexproteinknotandcompositeproteinknots」為題,于2022年7月13日發(fā)布在《ProteinScience》。
谷歌DeepMind開發(fā)的人工智能(AI)系統(tǒng)AlphaFold兩次主導(dǎo)蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)(CASP)的關(guān)鍵評(píng)估。AlphaFold2是一個(gè)深度學(xué)習(xí)系統(tǒng),它結(jié)合了基于蛋白質(zhì)結(jié)構(gòu)的進(jìn)化、物理和幾何約束的訓(xùn)練程序。它的特點(diǎn)是預(yù)測的迭代細(xì)化,并允許使用自蒸餾和自估計(jì)準(zhǔn)確性從未標(biāo)記的蛋白質(zhì)序列中學(xué)習(xí),以使用一級(jí)結(jié)構(gòu)和同源物的對(duì)齊序列直接預(yù)測給定蛋白質(zhì)的所有重原子的3D坐標(biāo)。
AlphaFold2目前已經(jīng)預(yù)測了數(shù)十萬種蛋白質(zhì)結(jié)構(gòu),其中大部分不包含在蛋白質(zhì)數(shù)據(jù)庫(PDB)中,該數(shù)據(jù)庫主要存檔實(shí)驗(yàn)確定的結(jié)構(gòu)。因此,AlphaFold的預(yù)測數(shù)據(jù)庫可能具有巨大的價(jià)值,特別是對(duì)于研究不常見但仍與了解蛋白質(zhì)折疊潛在機(jī)制的復(fù)雜性具有高度相關(guān)性的蛋白質(zhì)現(xiàn)象。對(duì)于在其多肽骨架中包含拓?fù)浣Y(jié)的蛋白質(zhì),會(huì)出現(xiàn)一個(gè)特別令人著迷的現(xiàn)象,即從兩端拉出后不會(huì)完全解開的蛋白質(zhì)。
在過去的二十年中,僅發(fā)現(xiàn)了大約20種不同的含有結(jié)的蛋白質(zhì)家族。然而,打結(jié)的蛋白質(zhì)對(duì)蛋白質(zhì)折疊和進(jìn)化提出了挑戰(zhàn)。模擬算法經(jīng)常高估蛋白質(zhì)的打結(jié)概率,因?yàn)楹笳叩陀陔S機(jī)鏈的打結(jié)概率。
此外,同源物之間的蛋白質(zhì)拓?fù)浣Y(jié)構(gòu)通常相似,這意味著在進(jìn)化中密切相關(guān)的蛋白質(zhì)中往往會(huì)保留打結(jié)的折疊。由于這些原因,并且由于天然蛋白質(zhì)之間打結(jié)的罕見性,在預(yù)測蛋白質(zhì)結(jié)構(gòu)的龐大新數(shù)據(jù)庫中可能存在打結(jié)拓?fù)浣Y(jié)構(gòu)引起了人們的濃厚興趣。
目前,在蛋白質(zhì)中發(fā)現(xiàn)的最復(fù)雜的結(jié)是單個(gè)結(jié),在任何投影到平面上都有六個(gè)基本交叉點(diǎn);尚未觀察到復(fù)合結(jié)。
復(fù)合結(jié)的產(chǎn)生機(jī)制
研究人員通過調(diào)查發(fā)現(xiàn)了9個(gè)以前未知的復(fù)合結(jié)案例。這些都是兩個(gè)基本上獨(dú)立的三葉結(jié)存在于一個(gè)較長的蛋白質(zhì)鏈中的例子。
于是他們提出了一種基于基因復(fù)制和打結(jié)同源二聚體互連來生成這種復(fù)合結(jié)的新機(jī)制。有趣的是,這種機(jī)制類似于用于創(chuàng)建第一個(gè)人工蛋白質(zhì)結(jié)的策略,其中未打結(jié)的二聚體被「連接」以形成三葉草。
經(jīng)過驗(yàn)證,復(fù)合三葉結(jié)可以認(rèn)定為俗稱的「奶奶結(jié)」。復(fù)合結(jié)的手性與先前報(bào)告甲基轉(zhuǎn)移酶和碳酸酐酶中單個(gè)三葉結(jié)的正手性的結(jié)果一致。研究人員在兩個(gè)不同的蛋白質(zhì)家族和兩種結(jié)構(gòu)變化中觀察到了相同的現(xiàn)象,他們認(rèn)為這是一種產(chǎn)生復(fù)合結(jié)的潛在機(jī)制。

圖示:蛋白質(zhì)P54212(碳酸酐酶)的3D結(jié)構(gòu)(上)和簡化表示(下)。
蛋白質(zhì)中的第一個(gè)71-結(jié)
下圖描述了蛋白質(zhì)P73136和Q9PR55,其長度分別為112和89個(gè)氨基酸。兩者都沒有特征,使用PDBeFold無法識(shí)別可能的同源物。然而,它們具有48%的序列同一性和71%的二級(jí)結(jié)構(gòu)匹配,這表明它們可能是同源物。
蛋白質(zhì)Q9PR55包含最復(fù)雜的結(jié),一個(gè)71-結(jié),迄今為止已知在殘基27和83之間有一個(gè)打結(jié)的核心。蛋白質(zhì)P73136的類似結(jié)構(gòu)包含一個(gè)51-結(jié),在殘基45和94之間有一個(gè)打結(jié)的核心。以前沒有觀察到這兩種蛋白質(zhì)具有不同的非平凡拓?fù)浣Y(jié)構(gòu)的這種同源物對(duì)。
仔細(xì)觀察會(huì)發(fā)現(xiàn),蛋白質(zhì)Q9PR55更復(fù)雜的拓?fù)浣Y(jié)構(gòu)是由一個(gè)引入額外纏繞的蛋白質(zhì)片段引起的;71環(huán)面結(jié)本質(zhì)上是一個(gè)51環(huán)面結(jié),在環(huán)面上有一個(gè)額外的纏繞;兩個(gè)結(jié)都具有正手性。

新的51和52結(jié)
該團(tuán)隊(duì)發(fā)現(xiàn)了兩個(gè)以前未知的具有五個(gè)基本交叉點(diǎn)的結(jié),包括第一個(gè)51-結(jié)。
準(zhǔn)確性測試
由于該發(fā)現(xiàn)的新穎性,通過獨(dú)立方法進(jìn)行驗(yàn)證將很重要。在實(shí)驗(yàn)研究之前,研究人員應(yīng)用正交計(jì)算工具ERRAT來評(píng)估預(yù)測的打結(jié)結(jié)構(gòu)。ERRAT算法評(píng)估C、N和O原子之間的非鍵合接觸模式,并與高分辨率結(jié)構(gòu)進(jìn)行統(tǒng)計(jì)比較。通過與AlphaFold(和其他預(yù)測方法)中使用的指標(biāo)不同,它提供了獨(dú)立的評(píng)估。
研究人員在打結(jié)結(jié)構(gòu)集上運(yùn)行了ERRAT。剔除某些模型中偶爾出現(xiàn)的擴(kuò)展末端,所有測試的模型都顯示出良好的分?jǐn)?shù);所有蛋白都有>90%的蛋白質(zhì)鏈落在(低于)拒絕不太可能構(gòu)象的95%閾值內(nèi)。因此,總體來看,預(yù)測的結(jié)構(gòu)是正確的,至少在很大程度上是正確的。
然而,在某些情況下,結(jié)構(gòu)的局部區(qū)域似乎存在潛在問題。重要的是要注意蛋白質(zhì)鏈路徑中的微小差異——例如,那些會(huì)改變上/下交叉的差異——可能會(huì)改變拓?fù)浣Y(jié)構(gòu),可能導(dǎo)致結(jié)的錯(cuò)誤分配。
研究人員注意到,對(duì)于復(fù)合結(jié)Q4D5S2,ERRAT程序?qū)埢?00-110周圍的beta鏈段標(biāo)記為結(jié)構(gòu)上可能不正確。值得注意的是,該區(qū)域中鏈的通過對(duì)于打結(jié)拓?fù)浜苤匾?/div>
結(jié)語
總之,該團(tuán)隊(duì)分析了AlphaFoldAI系統(tǒng)對(duì)新拓?fù)鋸?fù)雜蛋白質(zhì)的所有蛋白質(zhì)3D結(jié)構(gòu)預(yù)測。我們對(duì)AlphaFold提供的數(shù)據(jù)的完整分析揭示了幾種包含深度復(fù)雜結(jié)的高置信度蛋白質(zhì),這些蛋白質(zhì)適用于對(duì)其3D結(jié)構(gòu)的實(shí)驗(yàn)驗(yàn)證。
在這個(gè)數(shù)據(jù)集中,研究人員發(fā)現(xiàn)了一個(gè)71-結(jié),這是迄今為止在蛋白質(zhì)中發(fā)現(xiàn)的最復(fù)雜的一個(gè),以及同源結(jié)構(gòu)中的一個(gè)新的51-結(jié),以及復(fù)合蛋白質(zhì)節(jié)的第一個(gè)實(shí)例。對(duì)于后者,研究人員提出了一種通過基因復(fù)制創(chuàng)造它們的進(jìn)化機(jī)制。
由于蛋白質(zhì)拓?fù)浣Y(jié)構(gòu)是蛋白質(zhì)折疊算法的持續(xù)挑戰(zhàn),因此通過實(shí)驗(yàn)驗(yàn)證所討論的結(jié)構(gòu)預(yù)測將非常重要。不僅可以獲得對(duì)AlphaFold系統(tǒng)正確預(yù)測復(fù)雜蛋白質(zhì)拓?fù)浣Y(jié)構(gòu)的能力的精細(xì)衡量,而且重要的是確認(rèn)這里發(fā)現(xiàn)的大量新蛋白質(zhì)結(jié)。
聲明:凡資訊來源注明為其他媒體來源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點(diǎn),也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問或質(zhì)疑,請(qǐng)立即與中國機(jī)器人網(wǎng)(www.baoxianwx.cn)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話:021-39553798-8007
電話:021-39553798-8007
更多>相關(guān)資訊
0 條相關(guān)評(píng)論