<bdo id="ks4iu"><del id="ks4iu"></del></bdo>
  • 
    <pre id="ks4iu"></pre>
  • <bdo id="ks4iu"><del id="ks4iu"></del></bdo>
    <input id="ks4iu"><em id="ks4iu"></em></input>
    
    
  • <center id="ks4iu"><cite id="ks4iu"></cite></center>
  • 首頁 > 冰箱 >

    AI加速破解生命密碼

    每一個產業風口的開啟,總有一些標志性事件。就像2016年Google DeepMind的AlphaGo與李世石下棋,2020年年底Google DeepMind的AlphaFold2參加2020年第14屆國際蛋白質結構預測競賽(CASP14)。前者昭示了AI第三次浪潮的來臨,而后者有可能開啟生命科技數字化的黃金十年。

    今年7月15日,谷歌DeepMind團隊與華盛頓大學貝克團隊(David Baker)分別開源了AlphaFold2與RoseTTAFold。當這兩種創造了前所未有準確度的預測蛋白質結構算法開源后,預示著用AI破解生命密碼的時代拉開大幕。而在這場用AI破解蛋白質結構的全球競賽中,中國陣營給出了不錯的成績單。日前,來自中國的人工智能企業天壤宣布,其自研的深度學習蛋白質折疊預測平臺TRFold在基于CASP14蛋白質測試集的評估中排名全球第二,僅次于AlphaFold2。在對400個氨基酸的蛋白鏈預測時,TRFold僅耗時16秒。這是目前國內所有公開蛋白質結構預測模型中取得的最好成績,標志著我國在計算生物學領域的表現已經處于世界第一梯隊。

    與此同時,深勢科技也宣布推出蛋白質結構預測工具Uni-Fold。它能夠復現AlphaFold2的全規模訓練,并開源訓練代碼與推理代碼。相應解決方案已集成至深勢科技自主研發的藥物設計平臺Hermite,供用戶測試使用。

    用AI預測蛋白質結構,對于加速生命科技的數字化至關重要,在全球生物數字化的競賽中,中國陣營正采用新思路、新路徑,加速推進。

    生命數字化開啟新風口 蛋白質結構預測是關鍵

    拼多多創始人黃崢和字節跳動創始人張一鳴宣布卸任CEO之時,未來規劃中有一個共同選項,就是希望投入更多的精力在生命科技的研究與探索上。事實上,其他如百度創始人李彥宏、阿里創始人馬云等,都將個人的下一個興趣目標定在了生命科技上。生物世界的數字化,正在成為新風口。

    新晉中國工程院外籍院士張亞勤幾天前表示,過去30年,信息產業推動了內容的數字化、企業的數字化,而未來的重點是物理世界的數字化和生物世界的數字化,下一個10年是AI與生物制藥融合的大好時機。

    “一方面我們的身體從大腦、器官到細胞、蛋白質、基因、分子都在數字化,另一方面人工智能算法、算力和系統的快速發展讓大量數據有了使用的場所。”張亞勤說,以前新藥研發需要十幾年的周期,10億美元的投入,AI正在改變這種狀況。

    每一個產業的發展都有一些關鍵基石,而生物數字化、生命數字化的一個關鍵是利用數字技術破解蛋白質結構之謎。

    蛋白質為什么關鍵,因為它是生命構成的基本要素,用北京航空航天大學大數據精準醫療高精尖創新中心特聘研究員葉盛的話來說,人體細胞乃至地球上任何一種生命的細胞,都是由蛋白質構成的。可以說,幾乎所有的生物學問題都會牽涉蛋白質,而幾乎所有的蛋白質功能問題最終都要通過結構研究去回答。不同的蛋白質通過折疊構成形態各異的三維結構,執行多種多樣的生理功能。

    長期以來,從氨基酸序列到對應蛋白質三維結構的預測問題被認為是生物學領域最具有挑戰性的問題之一。蛋白質結構研究為什么難?是因為蛋白質的尺寸為納米級,比人類肉眼的可見光波還要小,超越了光學顯微鏡的觀察極限,因此要想研究蛋白質的結構,必須采用某種間接的方式。

    而且解蛋白質結構之題,遠遠難于基因。“蛋白質結構測定與基因組測序最大的區別在于,基因組序列是一維的、線性的;而蛋白質結構是三維的。因此,基因組測序無論測什么物種的基因組,本質上都是在做同一件事,可以通過機器進行自動化、規模化的操作,而蛋白質結構測定則是不同的課題,科學家始終沒有找到批量處理的方法。”葉盛說。

    在過去幾十年中,結構生物學家為探測蛋白質結構研究出三大實驗手段——X射線晶體學、核磁共振和冷凍電鏡,但實驗方法成本高、周期長。目前人類有數十億個已知蛋白質序列,還原出結構的卻只有十幾萬個。生物學發展因此頗受掣肘。

    人工智能的發展為解決這一問題帶來了一些新的可能。在2020年的國際蛋白質結構預測頂級競賽CASP14上,Google DeepMind推出AlphaFold2(簡稱AF2)預測的大部分單體蛋白質結構準確度與實驗足夠接近,遠超此前所有方法。這一結果也標志著蛋白質單體結構的問題在一定意義上得到了解決。中國結構生物學家施一公對此的評價為“這是AI對科學領域的最大一次貢獻”。結構生物學家Petr Leiman表示:“我用價值1000萬美元的電鏡努力了好幾年,AF2竟然一下就算出來了。”

    除了AlphaFold2,另外一個被高度關注的AI算法是華盛頓大學醫學院蛋白質設計研究所的貝克團隊,有人說因為DeepMind的成功觸動貝克團隊重視AI,于是他們聯合很多大學與機構研發了一款基于深度學習的蛋白質預測新工具RoseTTAFold,并在預測蛋白質結構上取得了媲美AF2的超高準確率,而且速度更快、所需要的計算機處理能力也較低。

    總之,AlphaFold2與RoseTTAFold是AI預測蛋白質結構的兩個“明星”,破解了出現50年之久的蛋白質分子折疊問題,打開了人類預測蛋白質結構的另一扇窗。今年7月,DeepMind團隊與貝克團隊分別開源了他們各自的算法,這給全球研究機構進行蛋白質結構預測帶來福音,大大降低了研究蛋白質結構的門檻,將幫助科研人員弄清引發某些疾病的機制,并為研發藥物、農作物增產,以及可降解塑料的“超級酶”等鋪平道路。

    蛋白質結構預測的中國智慧

    AlphaFold2與RoseTTAFold首次展現了AI在蛋白質結構預測領域的巨大想象力,意識到它可能帶來劃時代的意義,中國的AI公司、研究團隊同樣加入了這場解碼生命難題之戰。

    或許有人會問,AF2與RoseTTAFold都已經開源,中國有必要再自主研發蛋白質結構預測的算法嗎?答案是當然必須。因為開源帶來的也并不全是便利,只有占據自主研發的高地才能避免在未來科技競爭中“卡脖子”。雖然DeepMind開源了AF2模型的推理代碼,但其訓練代碼并未公布,且模型不可商用。

    無法深入過程,就無法對不同的方法優勢進行量化,也不能將最有價值的創新進行更大范圍的應用。天壤創始人薛貴榮認為:“AF2的成功是蛋白質結構預測方向的重大突破,但是圍繞蛋白質結構功能問題且能夠達到實際落地應用準確度要求的AI算法的開發才剛剛開始,沒有訓練模型經驗,或者沒有具備能夠訓練出AF2結果的能力是無法把該技術推進解決更深層次問題的。”

    在這一點上,中科院院士、北京大學教授、深勢科技首席科學顧問鄂維南表達了與薛貴榮一致的觀點:“盡管DeepMind開源了推理代碼,但模型的訓練技術才是核心競爭力。”

    應該說,利用AI解密蛋白質結構之謎的大門才剛剛開啟,在這個新賽道,中國必須參與其中。基于此,人工智能創業公司天壤在兩年前組建了自己的X-Lab團隊,經過艱苦努力和多次迭代,研發出具有自主知識產權的蛋白質折疊預測平臺TRFold。在基于CASP14蛋白質測試集的評估中排名全球第二,僅次于AlphaFold2,而且在400個氨基酸的蛋白鏈預測中,TRFold僅耗時16秒。這意味著,中國在該領域進入了世界第一陣營。

    相對于AF2,天壤的TRFold在許多維度實現了創新和優化。在內存優化方面,TRFold模型參數量接近5000萬,為AF2的一半。在訓練數據方面,TRFold的算法模型所用數據量比AF2更少。在模型表達方面,AF2采用的是端到端模型,而TRFold采用的是分段式結構。這些創新和優化,意味著TRFold所用的算力資源更少、產生結果的速度更快,在大規模蛋白與蛋白的相互關系分析上,更具有優勢,而且能夠加速應用在不同場景中。

    與此同時,包括中科院、騰訊、復旦大學等AI企業、研究機構也加入了這場競賽。其中,深勢科技推出的蛋白質結構預測工具Uni-Fold,克服了AF2未開源訓練代碼、硬件支持單一、模型不可商用等局限性,復現AF2的全規模訓練,并開源訓練代碼與推理代碼,為更多人參與推動該領域進一步發展提供了基礎。

    期待更多資源、更大范圍的協同

    利用AI破解蛋白質結構之謎,將改變人類對生命的認知,有可能重塑生物應用的邏輯,并將開啟一個廣闊和巨大的市場。英國《自然》雜志有一組數據:新藥的研發成本大約是26億美元,耗時約10年,成功率不到1/10。而AI的加入,有望大幅降低成本,縮短研發周期。目前因為AI的應用,部分新藥研發減少了35%的成本,研發周期從5~10年縮短為1~3年。

    AI破解蛋白質結構展示了美好前景,但仍然處于發展早期,還有許多難題期待AI加速破解。此前,葉盛曾談及了蛋白質結構的設計,這遠比蛋白質結構的預測更難。

    目前AF2只是解決了單個蛋白質結構的預測問題,之后兩個蛋白質的相互作用以及一大堆蛋白質的相互作用,再疊加環境變量,是更大的挑戰。薛貴榮表示,利用AI加速破解生命的密碼,需要更多的產業資源協同。“蛋白質折疊預測是全方位的創新項目,需要行業、機構更多方參與協同,才能把這個體系做起來。”薛貴榮表示。

    薛貴榮在談及TRFold的研發與未來發展時,曾提及了算力挑戰。與Google DeepMind相比,天壤沒有如此巨大的算力支持,所以天壤選擇了其他路徑。事實上,在中國有許多云計算巨頭,各地也建立了不少的超算中心、智算中心。在抗擊疫情時,許多計算資源機構都拿出了大量的計算資源支持抗疫,筆者認為這些算力資源也應該向AI破解生物難題做更多的傾斜。另外薛貴榮還談到了數據資源的共享與制藥機構的協作問題。

    數據資源也是巨大的挑戰之一。國際金融論壇(IFF)副理事長、香港特別行政區財政司原司長梁錦松在國際金融論壇第18屆全球年會上表示,近年來,包括在新藥研究、醫療服務等領域,生命科技產業在全球發展加速。香港有很多世界級的優秀學者和研究員,而且大部分與生物科技有關,但是缺乏患者資源,要做臨床試驗比較困難;而廣州和深圳有很多大學,特別是在AI和機器人方面處于領先地位,加之擁有龐大的患者資源和醫療市場,這些對于發展生命科技能產生聚合效應。

    鄂維南認為,生命科學是AI的下一個主戰場,算力、算法、數據的協同發展正在縮短理論研究與解決實際問題之間的距離。AI在科研領域與應用場景深入的過程中,需要各領域、多學科的交叉與合作。而開源是一個很重要的協作模式,能夠更大范圍地協同各個維度的行業資源。

    張亞勤表示,AI和生命科學有很多可合作的地方,比如新冠疫苗去年年底進入臨床試驗,今年大規模使用,這可能是人類歷史上最快的一次計算機科學包括人工智能加速疫苗開發的例子。另外遷移學習用少量原始數據加上動物模型快速發現了對罕見病的藥物,幾何深度學習找出了廣譜、穩定的新冠抗體,對變種株也有效。

    李彥宏今年投資了一家生物計算公司——百圖生科。他認為,當前生物計算的發展十分迅速,與20年前的互聯網有諸多相似之處。基因組學研究帶來的人體數據、新藥研發過程當中所積累的知識和新生的各類機器學習算法三大關鍵指標在快速增長,會帶來巨大的突破和進步。他認為:“生物計算產業的發展,需要生態和產業鏈的協同,一家乃至100家的企業可能都遠遠不夠,我們希望和科學家、企業家一起構建開放的生物計算創新生態,去探索廣袤浩瀚的生命科學無人區。”

    計算與生命科學的融合,是沒有盡頭的星辰大海,希望中國企業、研究機構能夠在其中貢獻更多的中國智慧。

    責任編輯:Rex_08

    推薦閱讀
    欧美国产在线一区,免费看成年视频网页,国产亚洲福利精品一区,亚洲一区二区约美女探花
    <bdo id="ks4iu"><del id="ks4iu"></del></bdo>
  • 
    <pre id="ks4iu"></pre>
  • <bdo id="ks4iu"><del id="ks4iu"></del></bdo>
    <input id="ks4iu"><em id="ks4iu"></em></input>
    
    
  • <center id="ks4iu"><cite id="ks4iu"></cite></center>
  • 主站蜘蛛池模板: 一本一本久久a久久精品综合| 国产精品91av| 国产手机精品一区二区| 制服丝袜人妻中文字幕在线| 中文无码av一区二区三区| 调教家政妇第38话无删减| 日韩欧美一区二区三区在线 | 啊灬啊灬啊快日出水了| 亚洲国产成人高清在线观看| 不卡一卡二卡三亚洲| 91香蕉视频直播| 欧美香蕉爽爽人人爽| 成人性视频在线| 国产欧美日韩综合精品一区二区| 人妻精品久久久久中文字幕一冢本| 一本加勒比HEZYO无码人妻| 青青青国产在线视频| 欧美日韩亚洲国产精品一区二区| 工作女郎在线看| 国产亚AV手机在线观看| 久久国产精品萌白酱免费| 97av麻豆蜜桃一区二区| 精品3d动漫视频一区在线观看| 小小视频在线版观看| 免费久久一级欧美特大黄| 99热在线观看| 精品不卡一区二区| 夫妇交换性3中文字幕| 亚洲视频在线观看一区| 丁香色欲久久久久久综合网| 香蕉在线视频播放| 欧美一级久久久久久久大片| 国产成人综合久久精品下载| 亚洲国产情侣一区二区三区| 亚洲精品国产国语| 日韩欧美中文精品电影| 国产a级一级久久毛片| 一区二区在线免费观看| 爱穿丝袜的麻麻3d漫画免费 | 日本乱子伦xxxx| 国产成人无码专区|