專家解讀諾貝爾化學(xué)獎，化學(xué)家還不會“失業(yè)”

[日期：2024-10-11]

作者：季敬杰次瀏覽

[字體：大中小]

“生命的奧秘不是純粹的生物學(xué)問題，它不是孤立的。要研究這樣一個復(fù)雜生命過程，需要用到生物、化學(xué)、物理、數(shù)學(xué)、計算機等等。”

人類研究者在對問題的敏銳上是目前AI比不上的，也能夠很快地?fù)肀录夹g(shù)助力研究。

北京時間10月9日下午，2024年諾貝爾化學(xué)獎在瑞典揭曉。獎項授予大衛(wèi)·貝克（David Baker）、德米斯·哈薩比斯（Demis Hassabis）和約翰·詹珀（John Jumper），以表彰他們在使用機器算法解讀蛋白質(zhì)結(jié)構(gòu)方面所作出的巨大貢獻(xiàn)。

解析蛋白質(zhì)結(jié)構(gòu)是困擾了科學(xué)家50年的難題。蛋白質(zhì)是生命的基石，不僅組成了我們身體的器官組織等基本結(jié)構(gòu)，還作為荷爾蒙、生物信號傳遞物質(zhì)、抗體等廣泛參與各種生命過程。蛋白質(zhì)由20個氨基酸排列組合成的長鏈折疊而成，就像同樣的紙能折成紙鶴也能折成盒子，不同的折疊方式所形成的結(jié)構(gòu)決定了蛋白質(zhì)的功能。

氨基酸鏈條在被細(xì)胞生產(chǎn)出來之后，會迅速自發(fā)折疊成具有特定結(jié)構(gòu)的蛋白質(zhì)?？茖W(xué)家們后來發(fā)現(xiàn)，指導(dǎo)折疊的“命令”就藏在氨基酸鏈條的序列之中，自此開啟了對氨基酸序列和蛋白質(zhì)結(jié)構(gòu)之間關(guān)系的科學(xué)探索。

與這個領(lǐng)域差不多同時開始發(fā)展的是計算機科學(xué)中神經(jīng)網(wǎng)絡(luò)的研究。這種算法的設(shè)想是建立類似大腦的計算系統(tǒng)，其中每個神經(jīng)元節(jié)點能夠接收來自其他節(jié)點的信號，并計算是否向下一個節(jié)點發(fā)送信息。在這樣的網(wǎng)絡(luò)中，信息通過多層次的神經(jīng)元加權(quán)計算，就能最終形成對輸入信息模式的識別?？茖W(xué)家們早已嘗試通過這種技術(shù)來計算氨基酸序列和蛋白質(zhì)結(jié)構(gòu)之間的關(guān)系，但這兩個領(lǐng)域都進(jìn)展緩慢。

在2010年之后，神經(jīng)網(wǎng)絡(luò)技術(shù)得到了重大突破，神經(jīng)元的層數(shù)從2層增加到了成百上千層，從淺層網(wǎng)絡(luò)變成“深度學(xué)習(xí)”和“人工智能”（AI），并能夠完成對話、圖像識別和生成等復(fù)雜任務(wù)。與此同時，通過實驗生物學(xué)家的不斷努力和冷凍電鏡等觀測技術(shù)的發(fā)明，被解析出來的蛋白質(zhì)結(jié)構(gòu)從幾種暴漲到14萬種，為深度學(xué)習(xí)提供了數(shù)據(jù)基礎(chǔ)。

復(fù)雜的蛋白質(zhì)結(jié)構(gòu)問題最終迎來“人工智能”時刻。來自谷歌公司的哈薩比斯和詹珀創(chuàng)造了AlphaFold系列算法，通過不斷迭代，2020年誕生的AlphaFold2已經(jīng)能夠以超過90%的正確率通過氨基酸序列預(yù)測人類所知的2億種蛋白質(zhì)結(jié)構(gòu)。而蛋白質(zhì)計算領(lǐng)域的先驅(qū)者貝克除了創(chuàng)造多種預(yù)測算法外，更加開創(chuàng)了在沒有現(xiàn)存蛋白質(zhì)結(jié)構(gòu)參考的情況下“從頭設(shè)計”蛋白質(zhì)的先河，為藥物設(shè)計等領(lǐng)域作出了巨大貢獻(xiàn)。

今年是諾貝爾獎的“AI年”，物理學(xué)獎與化學(xué)獎都頒給了AI相關(guān)的工作。這是否意味著AI已經(jīng)能夠取代科學(xué)家的工作？本屆得主為何獲得化學(xué)獎而非生理學(xué)或醫(yī)學(xué)獎？蛋白質(zhì)結(jié)構(gòu)問題已經(jīng)被解決了嗎？為了解答這些問題，澎湃科技采訪了上海交通大學(xué)化學(xué)化工學(xué)院長聘教軌副教授沈琦。

頒給蛋白質(zhì)結(jié)構(gòu)問題，更是頒給AI

為何蛋白質(zhì)研究沒有獲得生理學(xué)獎或醫(yī)學(xué)獎而是獲化學(xué)獎，而AI又能獲得化學(xué)獎？對此，沈琦表示，生命的問題本質(zhì)上就涉及到交叉學(xué)科，而像AI這樣的強力工具能幫助人們進(jìn)行探索。

“生命的奧秘不是純粹的生物學(xué)問題，它不是孤立的。要研究這樣一個復(fù)雜生命過程，需要用到生物、化學(xué)、物理、數(shù)學(xué)、計算機等等?！彼f。

以蛋白質(zhì)為例。組成蛋白質(zhì)的基本單元氨基酸是由一個氨基、一個羧基、一個氫原子和一個側(cè)鏈基團組成。不同氨基酸的區(qū)別在于它們的側(cè)鏈基團不同，這影響了它們在蛋白質(zhì)結(jié)構(gòu)中的相互作用和功能。當(dāng)兩個氨基酸相遇時，其中一個的羧基結(jié)構(gòu)會和另一個的氨基發(fā)生反應(yīng)，形成肽鍵將它們連接在一起，如此形成多肽鏈。這便是蛋白質(zhì)的“一級結(jié)構(gòu)”。

多肽鏈會以螺旋或折疊的方式形成特定的“二級結(jié)構(gòu)”，這些二級結(jié)構(gòu)又能通過連接結(jié)構(gòu)形成更復(fù)雜的三級結(jié)構(gòu)。正如在折紙時涉及到紙張硬度、施力大小等多種物理、材料規(guī)律，多肽鏈的折疊也是由氨基酸序列中原子和分子的相互作用決定的，如氫鍵、疏水作用、離子鍵、范德華力等。

沈琦說，要研究這個過程，就涉及到微觀層面的物理化學(xué)知識，如力場等。“能量最小化”是研究蛋白質(zhì)折疊的一個重要線索。就像“水往低處流”一樣，蛋白質(zhì)折疊也傾向于形成能量最小的狀態(tài)，科學(xué)家們因此可以通過計算分子間的相互作用力，模擬蛋白質(zhì)的折疊和動態(tài)行為。

從這個角度上來說，“蛋白質(zhì)結(jié)構(gòu)問題的研究頒生命科學(xué)、化學(xué)甚至物理獎，都是可以的?！倍S著AI的出現(xiàn)，蛋白質(zhì)預(yù)測的準(zhǔn)確率和效率都得到了前所未有的提高，解決了困擾化學(xué)家多年的重大科學(xué)難題，并成為廣大科研人員手中的得力工具，獲獎實至名歸。

沈琦告訴澎湃科技，有了這些預(yù)測工具之后，科學(xué)家們能夠根據(jù)氨基酸序列快速計算出蛋白質(zhì)的精細(xì)結(jié)構(gòu)，大大提高工作效率。另外，通過AI也能高效設(shè)計和驗證新的蛋白結(jié)構(gòu)，幫助新藥開發(fā)和人工生命體的構(gòu)建。

“從蛋白質(zhì)一級結(jié)構(gòu)預(yù)測高級結(jié)構(gòu)是化學(xué)生物學(xué)家、結(jié)構(gòu)生物學(xué)家和物理化學(xué)家都非常關(guān)心的一個重要問題?！彼f，“AI確實在某種程度上解決了它?！?/span>

AI只是工具：生物化學(xué)家還不會“失業(yè)”

“自己辛辛苦苦花費數(shù)年解析出來的蛋白質(zhì)結(jié)構(gòu)被AI很快精準(zhǔn)預(yù)測了，很多結(jié)構(gòu)生物學(xué)家心里確實會不舒服。”沈琦說。不過在他看來，AI在蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域還有很長的路要走。

他認(rèn)為，蛋白質(zhì)結(jié)構(gòu)預(yù)測的終極問題還未被解決，AI算法對我們徹底理解底層生物規(guī)律的幫助有限。AlphaFold一類的大模型本質(zhì)是通過對已有的大量氨基酸序列和蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)的比對而形成概率預(yù)測，發(fā)現(xiàn)更有可能的結(jié)構(gòu)，對于蛋白折疊過程背后的科學(xué)規(guī)律的認(rèn)識還很有限。

雖然目前AI預(yù)測蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確率很高，但也不是完全精確。“對于蛋白質(zhì)來說，序列上百分之幾的差異可能就是完全不同的功能。現(xiàn)在的AI還做不到那么精確，仍然需要依靠實驗觀測去解析。”沈琦說。

此外，對于蛋白質(zhì)的動態(tài)結(jié)構(gòu)以及蛋白質(zhì)的相互作用，AI的表現(xiàn)也差強人意。“蛋白質(zhì)在溶液中是動態(tài)的，彼此之間還會進(jìn)行復(fù)雜的相互作用。另外，細(xì)胞中存在大量沒有正常結(jié)構(gòu)的‘天然無序蛋白’，但卻發(fā)揮著重要的作用。這些AI都還不能很好地預(yù)測?！?/span>

沈琦認(rèn)為，AI的成就是以傳統(tǒng)結(jié)構(gòu)生物學(xué)家數(shù)十年的努力作為基礎(chǔ)的?！皼]有他們通過實驗解析所得到的結(jié)構(gòu)數(shù)據(jù)，AI是無法訓(xùn)練的。”

此外，人類研究者在對問題的敏銳上是目前AI比不上的，也能夠很快地?fù)肀录夹g(shù)助力研究?！皬腦射線晶體學(xué)，到冷凍電鏡，再到現(xiàn)在的AI，仔細(xì)觀察的話優(yōu)秀的學(xué)者并沒有被技術(shù)的更新所淘汰，而是能夠很快地?fù)肀录夹g(shù)。”他說。

對于人類來說，知識背后的邏輯和直覺或許是最大的優(yōu)勢?！白屢粋€生物學(xué)家去學(xué)AI，或許比讓AI工程師更容易在生命科學(xué)領(lǐng)域出成果”。另外，沈琦表示，“一個好的技術(shù)最終是要做到普及性，讓大家可以比較快地去學(xué)習(xí)。以后用AI去預(yù)測蛋白，就像查手機地圖那樣簡單?！?/span>

（原標(biāo)題：2024化學(xué)諾獎專家解讀：頒給蛋白質(zhì)預(yù)測和AI實至名歸，化學(xué)家還不會“失業(yè)”）

上一條：美報告建議投巨資研究甲烷去除

下一條：FCSE 前沿研究：從煤直接液化石腦油中萃取精餾環(huán)烷烴單體

專家解讀諾貝爾化學(xué)獎，化學(xué)家還不會“失業(yè)”

專家解讀諾貝爾化學(xué)獎，化學(xué)家還不會“失業(yè)”