PRODUCT CLASSIFICATION
產(chǎn)品分類了解蛋白質(zhì)挑戰(zhàn)的AI解決方案
根據(jù)一項嚴(yán)格的獨立研究,在一項重大的科學(xué)進(jìn)步中,DeepMind的AI系統(tǒng)AlphaFold的-新版本已被認(rèn)為是解決已有50年歷史的蛋白質(zhì)結(jié)構(gòu)預(yù)測挑戰(zhàn)(通常稱為“蛋白質(zhì)折疊問題”)的解決方案。評定。從長遠(yuǎn)來看,這一突破可以大大促進(jìn)生物學(xué)研究,從而在疾病理解和藥物發(fā)現(xiàn)等領(lǐng)域開辟新的可能性。
CASP14的結(jié)果表明,DeepMind的-新AlphaFold系統(tǒng)在結(jié)構(gòu)預(yù)測中達(dá)到了無與-倫比的準(zhǔn)確性。該系統(tǒng)能夠在幾天之內(nèi)確定高精度結(jié)構(gòu)。CASP是蛋白質(zhì)結(jié)構(gòu)預(yù)測的關(guān)鍵評估,是始于1994年的兩年一次的社區(qū)運行評估,是評估預(yù)測技術(shù)的金標(biāo)準(zhǔn)。參加者必須盲目地預(yù)測剛剛通過實驗確定的蛋白質(zhì)(或者在某些情況下尚未確定)的蛋白質(zhì)結(jié)構(gòu),并等待將其預(yù)測與實驗數(shù)據(jù)進(jìn)行比較。
CASP使用“全-球距離測試(GDT)”度量標(biāo)準(zhǔn)來評估精度,范圍為0-100。新的AlphaFold系統(tǒng)在所有目標(biāo)上的GDT總體平均得分為92.4。系統(tǒng)的平均誤差約為1.6埃,大約是原子的寬度。根據(jù)CASP聯(lián)合創(chuàng)始人兼主席John Moult教授的說法,大約90 GDT的分?jǐn)?shù)被非正式地認(rèn)為與通過實驗方法獲得的結(jié)果具有競爭力。
馬里蘭大學(xué)CASP聯(lián)合創(chuàng)始人兼主席John Moult教授說:“近50年來,我們一直在解決這個問題(蛋白質(zhì)如何折疊)這一問題。親身經(jīng)歷了DeepMind對此的解決方案在這個問題上停留了這么長時間,經(jīng)過了無數(shù)停頓,開始思考我們是否會到達(dá)那里,這是一個非常特殊的時刻。”
對現(xiàn)實世界的影響
DeepMind很高興能與其他人合作,以了解有關(guān)AlphaFold潛力的更多信息,AlphaFold團(tuán)隊正在研究蛋白質(zhì)結(jié)構(gòu)預(yù)測如何與少數(shù)專家小組一起幫助理解某些疾病。
還有跡象表明,作為科學(xué)界開發(fā)的許多工具之一,蛋白質(zhì)結(jié)構(gòu)預(yù)測可能在未來的大流行應(yīng)對工作中有用。今年早些時候,DeepMind預(yù)測了SARS-CoV-2病毒的幾種蛋白質(zhì)結(jié)構(gòu),實驗人員令人印象深刻的快速工作現(xiàn)已證實AlphaFold在其預(yù)測中達(dá)到了很高的準(zhǔn)確性。
AlphaFold是DeepMind迄今為止重要的改進(jìn)之一。但是,與所有科學(xué)研究一樣,還有許多工作要做,包括弄清楚多種蛋白質(zhì)如何形成復(fù)合物,它們?nèi)绾闻cDNA,RNA或小分子相互作用以及如何確定所有氨基酸側(cè)鏈的精-確位置。
與早期的CASP13 AlphaFold系統(tǒng)一樣,DeepMind計劃在適當(dāng)?shù)臅r候向同行評審的期刊提交詳細(xì)介紹該系統(tǒng)工作原理的論文,并同時探索如何-好地以可擴(kuò)展的方式為系統(tǒng)提供更廣泛的訪問。
AlphaFold在展示AI作為輔助基礎(chǔ)科學(xué)發(fā)現(xiàn)的工具的驚人潛力方面開辟了新天地。DeepMind期待與他人合作以釋放這種潛力。
諾貝爾獎得主,皇-家學(xué)會主席Venki Ramakrishnan教授說:“這項計算工作代表了蛋白質(zhì)折疊問題的驚人進(jìn)展,蛋白質(zhì)折疊問題是生物學(xué)界50年來的巨大挑戰(zhàn)。它已經(jīng)發(fā)生了數(shù)十年,而該領(lǐng)域的許多人將我們已經(jīng)預(yù)見到了。很高興看到它將從根本上改變生物學(xué)研究的許多方式。”
為什么蛋白質(zhì)結(jié)構(gòu)預(yù)測很重要
蛋白質(zhì)對生命至關(guān)重要,其形狀與功能密切相關(guān)。準(zhǔn)確預(yù)測蛋白質(zhì)結(jié)構(gòu)的能力使人們能夠更好地了解它們的作用及其運作方式。目前,主數(shù)據(jù)庫中有超過2億種蛋白質(zhì),而它們的3-D結(jié)構(gòu)中只有一小部分已經(jīng)被繪制出來。
一個主要的挑戰(zhàn)是蛋白質(zhì)在理論上可以折疊成終的3-D結(jié)構(gòu)之前可以折疊的天文方法。從根本上說,社會面臨的許多大挑戰(zhàn),例如開發(fā)疾病的治療方法或?qū)ふ铱煞纸夤I(yè)廢物的酶,都與蛋白質(zhì)及其作用密切相關(guān)。確定蛋白質(zhì)的形狀和功能是科學(xué)研究的一個主要領(lǐng)域,主要是使用實驗技術(shù),每個結(jié)構(gòu)可能要花費數(shù)年的艱辛和艱巨的工作,并且需要使用數(shù)百萬美元的設(shè)備。
DeepMind解決蛋白質(zhì)折疊問題的方法
突破性突破是DeepMind在2018年*參加CASP13的基礎(chǔ)上,初的AlphaFold版本在所有參與者中都達(dá)到了-高的準(zhǔn)確性?,F(xiàn)在,DeepMind為CASP14開發(fā)了新的深度學(xué)習(xí)體系結(jié)構(gòu),從生物學(xué),物理學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域以及過去半個世紀(jì)蛋白質(zhì)折疊領(lǐng)域的許多科學(xué)家的工作中汲取了靈感。
折疊的蛋白質(zhì)可以被認(rèn)為是“空間圖”,其中殘基是結(jié)點,邊緣將殘基緊密相連。該圖對于理解蛋白質(zhì)內(nèi)的物理相互作用及其進(jìn)化歷史非常重要。對于在CASP14上使用的-新版本的AlphaFold,DeepMind創(chuàng)建了一個基于注意力的神經(jīng)網(wǎng)絡(luò)系統(tǒng),端到端進(jìn)行了培訓(xùn),該系統(tǒng)試圖解釋該圖的結(jié)構(gòu),同時對所構(gòu)建的隱式圖進(jìn)行推理。它使用進(jìn)化相關(guān)序列,多序列比對(MSA)和氨基酸殘基對表示來完善此圖。
通過重復(fù)此過程,系統(tǒng)可以對蛋白質(zhì)的潛在物理結(jié)構(gòu)進(jìn)行強(qiáng)有力的預(yù)測。此外,AlphaFold可以使用內(nèi)部置信度量度來預(yù)測每個預(yù)測的蛋白質(zhì)結(jié)構(gòu)的哪些部分是可靠的。
該系統(tǒng)接受了來自蛋白質(zhì)數(shù)據(jù)庫中約170,000種蛋白質(zhì)結(jié)構(gòu)組成的公開數(shù)據(jù)的培訓(xùn),使用的是現(xiàn)代機(jī)器學(xué)習(xí)標(biāo)準(zhǔn),使用的計算量相對較小-大約運行了128個TPUv3核(大約相當(dāng)于100-200個GPU)幾個星期。
郵箱:1170233632@qq.com
傳真:021-51870610
地址:上海市顧戴路2988號B幢7樓