十多年來,德國馬克斯普朗克生物物理研究所分子生物學(xué)家馬丁·貝克及其同事一直試圖拼湊出世界上最難的拼圖游戲之一:人類細(xì)胞中最大分子機(jī)器的詳細(xì)模型。這個(gè)龐然大物被稱為核孔復(fù)合體,控制著分子進(jìn)出細(xì)胞核的流動(dòng),而細(xì)胞核正是基因組所在之處。每個(gè)細(xì)胞中都存在數(shù)百個(gè)這樣的復(fù)合物,每個(gè)都由超過1000種蛋白組成,它們形成一個(gè)環(huán),鑲嵌在核膜上。
這1000塊拼圖由30多種蛋白質(zhì)構(gòu)建塊組成,它們以多種方式交織在一起。讓拼圖更難的是,實(shí)驗(yàn)確定的這些構(gòu)建塊的三維結(jié)構(gòu)是來自許多物種的結(jié)構(gòu)大雜燴,并不能總是很好地融合在一起。而且,拼圖的終極目標(biāo),即核孔復(fù)合體的低分辨率三維視圖缺乏足夠的細(xì)節(jié),人們無法知道需要有多少塊能精確地拼在一起。
2016年,貝克團(tuán)隊(duì)報(bào)告了一個(gè)模型,它覆蓋了核孔復(fù)合體約30%以及30個(gè)構(gòu)建塊的約一半,稱為Nup蛋白。2021年7月,深度思維公司公開了一款名為阿爾法折疊2的人工智能(AI)工具。該軟件可從蛋白質(zhì)的基因序列中預(yù)測(cè)其三維結(jié)構(gòu),并且大部分情況下是精確的。這改變了貝克的任務(wù),以及成千上萬其他生物學(xué)家的研究。
在某些情況下,AI為科學(xué)家們節(jié)省了時(shí)間;在其他情況下,它使以前難以想象或極不現(xiàn)實(shí)的研究成為可能。盡管它有局限性,但它的發(fā)展已經(jīng)不可阻擋。
“一鳴驚人”的成功
2020年12月,阿爾法折疊引起了轟動(dòng)。當(dāng)時(shí),它在一場(chǎng)名為“蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)關(guān)鍵評(píng)估”的比賽中大放異彩。而阿爾法折疊2的預(yù)測(cè)平均而言已與大多數(shù)實(shí)驗(yàn)數(shù)據(jù)不相上下。
在阿爾法折疊算法廣泛開源之前,美國華盛頓大學(xué)醫(yī)學(xué)院蛋白質(zhì)設(shè)計(jì)研究所研究人員開發(fā)了AI工具RoseTTAFold,其擁有可媲美阿爾法折疊2的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)超高準(zhǔn)確度,而且速度更快、所需計(jì)算機(jī)處理能力更低。
2021年7月15日,深度思維宣布,它已經(jīng)使用阿爾法折疊預(yù)測(cè)了幾乎每一種人類制造的蛋白質(zhì)的結(jié)構(gòu),以及其他20種被廣泛研究的生物的整個(gè)蛋白質(zhì)組(比如小鼠和大腸桿菌),共計(jì)超過36.5萬個(gè)結(jié)構(gòu)。深度思維還將這些數(shù)據(jù)公開發(fā)布到歐洲生物信息學(xué)研究所維護(hù)的數(shù)據(jù)庫中,這個(gè)數(shù)據(jù)庫已擴(kuò)展到近100萬個(gè)結(jié)構(gòu)。
今年,深度思維計(jì)劃發(fā)布總計(jì)超過1億個(gè)結(jié)構(gòu)預(yù)測(cè)。這幾乎占所有已知蛋白質(zhì)的一半,是蛋白質(zhì)數(shù)據(jù)庫(PDB)結(jié)構(gòu)庫中實(shí)驗(yàn)確定的蛋白質(zhì)數(shù)量的數(shù)百倍。阿爾法折疊還部署了深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),目前已經(jīng)接受了PDB和其他數(shù)據(jù)庫中的數(shù)十萬個(gè)實(shí)驗(yàn)確定的蛋白質(zhì)結(jié)構(gòu)和序列的訓(xùn)練。
從結(jié)構(gòu)角度解答新科學(xué)問題
阿爾法折疊解決結(jié)構(gòu)的能力給生物學(xué)家們留下了深刻的印象。“只要一種蛋白質(zhì)卷曲成單一的明確的三維結(jié)構(gòu),阿爾法折疊的預(yù)測(cè)就很難被推翻。”瑞典斯德哥爾摩大學(xué)蛋白質(zhì)生物信息學(xué)家阿恩·埃洛夫松說,“這是一種一鍵式解決方案,你可能會(huì)得到最佳模型。”
英國倫敦大學(xué)學(xué)院計(jì)算生物學(xué)家克里斯汀·奧倫戈團(tuán)隊(duì)正在利用其確定新的蛋白質(zhì)種類,并發(fā)現(xiàn)了數(shù)百、甚至數(shù)千個(gè)潛在的新蛋白質(zhì)家族,擴(kuò)大了科學(xué)家對(duì)蛋白質(zhì)外觀和功能的了解。在另一項(xiàng)工作中,該團(tuán)隊(duì)正在搜索從海洋和廢水中收集的DNA序列數(shù)據(jù)庫,試圖識(shí)別新的分解塑料的酶。
美國哈佛大學(xué)進(jìn)化生物學(xué)家謝爾蓋·奧夫欽尼科夫表示,將任何蛋白質(zhì)編碼的基因序列轉(zhuǎn)化為可靠結(jié)構(gòu)的能力都非??少F。研究人員通過比較基因序列,以確定生物及其基因在不同物種之間的關(guān)系。但對(duì)于遠(yuǎn)親基因,僅通過比較,可能找不到進(jìn)化上的近親,因?yàn)樾蛄邪l(fā)生了太大的變化。而通過比較蛋白質(zhì)結(jié)構(gòu),其變化速度往往不如基因序列那么快,研究人員或能揭示被忽視的古老關(guān)系。這為研究蛋白質(zhì)的進(jìn)化和生命起源提供了一個(gè)絕佳的機(jī)會(huì)。
存在一定局限性
目前已有嘗試證明,阿爾法折疊不具備預(yù)測(cè)蛋白質(zhì)新突變后果的能力,因?yàn)闆]有與進(jìn)化相關(guān)的序列來檢驗(yàn)。
研究人員表示,許多蛋白質(zhì)具有多種構(gòu)象,并與DNA和RNA等配體、脂肪分子和鐵等礦物質(zhì)一起發(fā)揮作用,但阿爾法折疊的預(yù)測(cè)是針對(duì)孤立結(jié)構(gòu),它不能真正處理那些可在不同構(gòu)象中采用不同結(jié)構(gòu)的蛋白質(zhì)。
美國哥倫比亞大學(xué)的計(jì)算生物學(xué)家穆罕默德·庫雷希說,開發(fā)下一代神經(jīng)網(wǎng)絡(luò)將是一個(gè)巨大的挑戰(zhàn)。目前還無法獲得大量的數(shù)據(jù)來捕捉蛋白質(zhì)動(dòng)力學(xué),或者蛋白質(zhì)可能與之相互作用的數(shù)萬億個(gè)較小分子的形狀。
歐洲生物信息學(xué)研究所計(jì)算生物學(xué)家珍妮特·桑頓認(rèn)為,阿爾法折疊最大的影響之一可能只是說服生物學(xué)家對(duì)計(jì)算和理論方法的見解持更開放的態(tài)度。“對(duì)我來說,這場(chǎng)革命就是觀念的改變”。
但阿爾法折疊革命激發(fā)了歐洲分子生物學(xué)實(shí)驗(yàn)室結(jié)構(gòu)建模師揚(yáng)·科辛斯基的遠(yuǎn)大夢(mèng)想。他設(shè)想,受阿爾法折疊啟發(fā)的工具不僅可用來對(duì)單個(gè)蛋白質(zhì)和復(fù)合體進(jìn)行建模,還可用來對(duì)整個(gè)細(xì)胞器甚至細(xì)胞進(jìn)行建模,直到完整單個(gè)蛋白質(zhì)分子,“這是我們?cè)诮酉聛淼膸资昀镆穼さ膲?mèng)想”。(科技日?qǐng)?bào)實(shí)習(xí)記者 張佳欣)
標(biāo)簽: 人工智能 預(yù)測(cè)蛋白質(zhì) 結(jié)構(gòu)數(shù)量 阿爾法折疊革命
十多年來,德國馬克斯普朗克生物物理研究所分子生物學(xué)家馬丁·貝克及其同事一直試圖拼湊出世界上最難的拼圖游戲之一:人類細(xì)胞中最大分子機(jī)
雖然新冠介導(dǎo)的嗅覺喪失的破壞性影響眾所周知,但其背后的生物學(xué)機(jī)制仍然是一個(gè)謎。18日發(fā)表在《美國醫(yī)學(xué)會(huì)神經(jīng)病學(xué)雜志》上的一項(xiàng)研究表明
英國《自然·通訊》雜志19日發(fā)表的一項(xiàng)行星科學(xué)研究指出,基于來自格陵蘭冰蓋的數(shù)據(jù),木星衛(wèi)星木衛(wèi)二上可能存在很淺的液態(tài)水。研究結(jié)果或?yàn)?/p>
據(jù)歐洲核子研究中心官網(wǎng)19日?qǐng)?bào)道,大型強(qiáng)子對(duì)撞機(jī)(LHC)的緊湊渺子線圈(CMS)合作組對(duì)頂夸克的質(zhì)量進(jìn)行了迄今最精確的測(cè)量,新測(cè)量出來的質(zhì)量
盡管3D打印技術(shù)在過去十年中取得了長足的進(jìn)步,但該技術(shù)仍然面臨一個(gè)基本限制:物體必須逐層構(gòu)建。美國研究人員開發(fā)了一種在固定體積的樹脂
十多年來,德國馬克斯普朗克生物物理研究所分子生物學(xué)家馬丁·貝克及其同事一直試圖拼湊出世界上最難的拼圖游戲之一:人類細(xì)胞中最大分子機(jī)
雖然新冠介導(dǎo)的嗅覺喪失的破壞性影響眾所周知,但其背后的生物學(xué)機(jī)制仍然是一個(gè)謎。18日發(fā)表在《美國醫(yī)學(xué)會(huì)神經(jīng)病學(xué)雜志》上的一項(xiàng)研究表明
英國《自然·通訊》雜志19日發(fā)表的一項(xiàng)行星科學(xué)研究指出,基于來自格陵蘭冰蓋的數(shù)據(jù),木星衛(wèi)星木衛(wèi)二上可能存在很淺的液態(tài)水。研究結(jié)果或?yàn)?/p>
據(jù)歐洲核子研究中心官網(wǎng)19日?qǐng)?bào)道,大型強(qiáng)子對(duì)撞機(jī)(LHC)的緊湊渺子線圈(CMS)合作組對(duì)頂夸克的質(zhì)量進(jìn)行了迄今最精確的測(cè)量,新測(cè)量出來的質(zhì)量
盡管3D打印技術(shù)在過去十年中取得了長足的進(jìn)步,但該技術(shù)仍然面臨一個(gè)基本限制:物體必須逐層構(gòu)建。美國研究人員開發(fā)了一種在固定體積的樹脂
近日,一個(gè)國際天文學(xué)家團(tuán)隊(duì)使用歐洲南方天文臺(tái)(ESO)的甚大望遠(yuǎn)鏡首次觀測(cè)并確認(rèn)一種新型的恒星爆炸,其強(qiáng)度約為新星爆發(fā)的百萬分之一,暫
日本北海道大學(xué)理學(xué)院科學(xué)家成功開發(fā)出世界上第一個(gè)利用集群策略工作的微型機(jī)器人,首次證明分子機(jī)器人能夠通過采用集群策略完成貨物遞送,
近日,由北京積水潭醫(yī)院牽頭的多國學(xué)者合作的研究工作肌肉密度是髖部再次骨折的獨(dú)立風(fēng)險(xiǎn)因素:一項(xiàng)隨訪隊(duì)列研究在線發(fā)表于老年醫(yī)學(xué)領(lǐng)域權(quán)威
頭方向細(xì)胞被認(rèn)為是大腦內(nèi)部的指南針,但人們對(duì)頭方向細(xì)胞的編碼機(jī)制知之甚少。4月19日,記者從陸軍軍醫(yī)大學(xué)新橋醫(yī)院獲悉,該院神經(jīng)外科張
這是一個(gè)困擾科學(xué)家多年的謎團(tuán)——為什么不同的動(dòng)物有如此不同的壽命?人類可以活到80歲左右,而長頸鹿往往在24歲時(shí)死亡,裸鼴鼠的成年個(gè)體
旗袍,中國和世界華人女性的傳統(tǒng)服裝,被譽(yù)為中國國粹和女性國服。雖然其定義和產(chǎn)生的時(shí)間至今還存有諸多爭(zhēng)議,但它仍然是中國悠久服飾文化
7月21日,北京市政府發(fā)布《北京市電影局關(guān)于在疫情防控常態(tài)化條件下有序推進(jìn)電影院恢復(fù)開放的通知》,宣布全市低風(fēng)險(xiǎn)地區(qū)影院,可于7月24日
?武漢7·16渡江節(jié)組委會(huì)14日發(fā)布公告,由于長江武漢關(guān)水位超警戒水位,按照規(guī)定取消2020年第46屆武漢7·16渡江節(jié)。受近期持續(xù)強(qiáng)降雨影響,
過去一段時(shí)間,國家級(jí)非遺項(xiàng)目灰塑傳承人邵成村,多次在陳家祠等工作現(xiàn)場(chǎng),向身邊那些帶著好奇目光的人們講解灰塑的種種技術(shù)細(xì)節(jié):草根灰、
7月13日,位于璧山區(qū)南門唐城夜市街區(qū)的璧山冷酒夜市開街。這是璧山區(qū)打造夜間經(jīng)濟(jì)消費(fèi)載體、培育夜間經(jīng)濟(jì)活動(dòng)品牌的舉措之一。璧山市民一