在過去兩年中,機器學習徹底改變了蛋白質(zhì)結(jié)構(gòu)預測。最近,《科學》雜志上的3篇論文描述了蛋白質(zhì)設計方面的革命:華盛頓大學醫(yī)學院生物學家的研究表明,機器學習可比以前更準確、更快速地創(chuàng)建蛋白質(zhì)分子。科學家們希望這一進步將帶來更多新的疫苗、療法、碳捕獲工具和可持續(xù)生物材料。
論文資深作者、華盛頓大學醫(yī)學院生物化學教授、2021年生命科學突破獎獲得者大衛(wèi)·貝克表示,蛋白質(zhì)是整個生物學的基礎,但迄今在每種植物、動物和微生物中發(fā)現(xiàn)的蛋白質(zhì),遠不到所有可能蛋白質(zhì)的百分之一。有了這些新的軟件工具,研究人員應該能夠找到解決醫(yī)學、能源和技術方面長期挑戰(zhàn)的方案。
為了超越自然界中發(fā)現(xiàn)的蛋白質(zhì),貝克團隊成員將蛋白質(zhì)設計的挑戰(zhàn)分解為3個部分,并為每個部分使用新的軟件解決方案。
首先,必須生成新的蛋白質(zhì)形狀。在《科學》雜志上稍早發(fā)表的論文中,該團隊設計人工智能(AI)通過兩種方式生成新的蛋白質(zhì)形狀:第一種稱為“幻覺”,類似于基于簡單提示就能產(chǎn)生輸出的工具;第二種稱為“修復”,類似于現(xiàn)代搜索欄中的自動完成功能。
其次,為加快這一過程,團隊設計了一種生成氨基酸序列的新算法。最近發(fā)表的論文描述了這個名為ProteinMPNN的工具,運行時間約為1秒,比以前最好的軟件快200多倍。它不但結(jié)果優(yōu)于以前的工具,還不需要專家定制即可運行。
第三,該團隊使用“深度思維”公司開發(fā)的“阿爾法折疊”來獨立評估他們提出的氨基酸序列是否可能折疊成預期的形狀。
研究人員表示,預測蛋白質(zhì)結(jié)構(gòu)的軟件是解決方案的一部分,但它本身無法提出任何新的東西。ProteinMPNN之于蛋白質(zhì)設計,就像“阿爾法折疊”之于蛋白質(zhì)結(jié)構(gòu)預測。
在另一篇論文中,貝克實驗室的一個團隊證實,新機器學習工具的組合能可靠地生成在實驗室中起作用的新蛋白質(zhì)。
研究發(fā)現(xiàn),新制造的蛋白質(zhì)更有可能按預期折疊,因此可使用這一方法創(chuàng)建非常復雜的蛋白質(zhì)組裝體。“這是蛋白質(zhì)設計中機器學習的開端?!必惪苏f。
(來源:科技日報)