近日,AI預(yù)測蛋白質(zhì)結(jié)構(gòu)又取得新突破。“深層思維”公司宣布,該公司開發(fā)的人工智能程序“阿爾法折疊”(AlphaFold)已預(yù)測出約100萬
個物種的超過2億種蛋白質(zhì)的結(jié)構(gòu),涵蓋科學(xué)界已編錄的幾乎每一種蛋白質(zhì)。
據(jù)介紹,這些信息將上傳至可公開訪問的“阿爾法折疊蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫”。該數(shù)據(jù)庫由“深層思維”公司和歐洲生物信息學(xué)研究所合作開發(fā),
去年7月上線時已包含98.5%的人類蛋白質(zhì)結(jié)構(gòu)。
近幾年,AI預(yù)測蛋白質(zhì)結(jié)構(gòu)成績亮眼,各大國內(nèi)外企業(yè)也紛紛入局。在AI激活、數(shù)據(jù)驅(qū)動下,AI預(yù)測蛋白質(zhì)結(jié)構(gòu)正從幕后走向臺前,其產(chǎn)業(yè)化發(fā)
展也正進(jìn)入一個新的階段。
AI預(yù)測蛋白質(zhì)結(jié)構(gòu)背后的計算生物學(xué)
蛋白質(zhì)的三維結(jié)構(gòu)決定了它在細(xì)胞中的功能。明確蛋白質(zhì)的結(jié)構(gòu)信息,在藥物研發(fā)等領(lǐng)域十分重要。傳統(tǒng)上,研究人員使用X射線晶體學(xué)等手段
測定蛋白質(zhì)結(jié)構(gòu),耗時費(fèi)力且花銷不菲,卻常無法獲得所需結(jié)果。“阿爾法折疊”通過學(xué)習(xí)實驗測定出的蛋白質(zhì)結(jié)構(gòu)信息,來預(yù)測其他蛋白質(zhì)的三維
結(jié)構(gòu),其預(yù)測準(zhǔn)確度相當(dāng)高。歐洲生物信息學(xué)研究所的數(shù)據(jù)顯示,阿爾法折疊有35%的預(yù)測是高度準(zhǔn)確的,可媲美實驗測定結(jié)果;另有45%的預(yù)測足
以在很多場景使用。
人工智能極大提升了蛋白質(zhì)結(jié)構(gòu)預(yù)測的效率,這也是AI預(yù)測蛋白質(zhì)結(jié)構(gòu)近幾年被人熟知的原因,但其背后的計算生物學(xué)卻已經(jīng)歷多年發(fā)展。計算
生物學(xué)是根據(jù)不同類型的生物數(shù)據(jù)構(gòu)建算法和模型,從而理解生物系統(tǒng)本身,并推進(jìn)相關(guān)研究及應(yīng)用的學(xué)科。
隨著人工智能的發(fā)展,計算生物學(xué)正在被激活。浦發(fā)硅谷銀行《醫(yī)療健康行業(yè)投資與退出趨勢》報告顯示,2021年美國市場投向計算生物學(xué)公司
的金額達(dá)到59億美元,一年增長高達(dá)3倍,超過非計算生物學(xué)公司投資的兩倍。在2019年以來首次完成種子輪/A輪融資的707家生物制藥和研發(fā)工具公
司中,計算生物學(xué)公司有129家,占比為18%。2021年對計算生物學(xué)公司的投資額激增,幾乎是2019年和2020年募集資金總和的兩倍。
在我國,各研究機(jī)構(gòu)和企業(yè)也正開展相關(guān)布局。如近日,由清華大學(xué)人工智能產(chǎn)業(yè)研究院孵化的AI制藥企業(yè)華深智藥對外宣布,其在AI和生命科學(xué)
結(jié)合領(lǐng)域取得突破:研究人員在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面開發(fā)出全新技術(shù)。據(jù)華深智藥官方介紹,該技術(shù)僅從單條蛋白序列就能預(yù)測出蛋白質(zhì)3D結(jié)構(gòu)的算法。
加速藥物研發(fā)、為精準(zhǔn)醫(yī)療提供助力
計算生物學(xué)正在改善傳統(tǒng)制藥行業(yè)高投入、高技術(shù)、高風(fēng)險、長周期的特性,加速藥物研發(fā)過程。有分析機(jī)構(gòu)認(rèn)為,目前我國計算生物學(xué)發(fā)展的主
要方向仍是AI制藥,相關(guān)創(chuàng)業(yè)公司在2017—2021年呈現(xiàn)出爆發(fā)式增長,且都已獲融資。從商業(yè)模式上看,整個行業(yè)以面向企業(yè)提供服務(wù)為主。
除此之外,計算生物學(xué)也為精準(zhǔn)醫(yī)療的實現(xiàn)提供了助力。
有分析機(jī)構(gòu)認(rèn)為,在應(yīng)用方面,計算生物學(xué)產(chǎn)業(yè)可大致分為三類:一是計算推演生物性質(zhì)及原理,如蛋白質(zhì)結(jié)構(gòu)預(yù)測、致病機(jī)理研究、蛋白質(zhì)相互
作用預(yù)測、抗體和抗原的表位預(yù)測、基于基因組學(xué)尋找疾病成因或?qū)ふ倚滦偷纳飿?biāo)志物等。二是搭建預(yù)測及判斷模型,如AI制藥中基于靶點的化合物性
質(zhì)預(yù)測,疾病診斷、監(jiān)控、治療建模,涵蓋細(xì)胞、器官、人體的生物模擬器等。三是對生物體進(jìn)行控制改造,如新療法、藥物開發(fā)、精準(zhǔn)醫(yī)療和生物制
造。其中精準(zhǔn)醫(yī)療或?qū)⒊蔀橛嬎闵飳W(xué)長期的重點發(fā)力方向。在這個方向上,國外已出現(xiàn)了基于多組學(xué)布局的企業(yè)。
如2021年11月,阿斯利康、德國默克、輝瑞和梯瓦等6家大藥廠與亞馬遜、以色列生物科技基金共同推出了創(chuàng)新實驗室——AION Labs。該實驗室
的模式是:在以色列初創(chuàng)生態(tài)系統(tǒng)下,建立和投資基于AI和計算生物學(xué)技術(shù)進(jìn)行藥物發(fā)現(xiàn)和開發(fā)的初創(chuàng)公司,并為這些公司提供資源、指導(dǎo),以及合作開
發(fā)新技術(shù),最后反哺制藥行業(yè)。AION Labs 在一份聲明中指出,其投資的初創(chuàng)公司將利用AI和云計算更快、更高效地找到新的治療方法,推進(jìn)以患者為
中心的精準(zhǔn)醫(yī)療。
實現(xiàn)商業(yè)化,計算生物學(xué)還需邁過這些坎
雖然計算生物學(xué)已逐漸走入人們的視野,但它要想實現(xiàn)商業(yè)化還面臨著一些關(guān)鍵瓶頸問題有待突破。
首先是對生物底層原理的進(jìn)一步明確。目前,還有大量關(guān)于生物學(xué)本身的底層機(jī)制有待研究透徹,在進(jìn)行模型構(gòu)建、生物驗證時,需要引入這些知識
來減少不符合領(lǐng)域認(rèn)知的偏差,保證準(zhǔn)確率。
其次是要有統(tǒng)一的計算和數(shù)據(jù)框架。計算生物學(xué)要最終落地,模型要能夠覆蓋多組學(xué)數(shù)據(jù)、多環(huán)節(jié)及功能并行。同時,還需要保證計算生物學(xué)中的多
種異構(gòu)數(shù)據(jù),例如圖像、視頻、分子圖譜、DNA代碼、基因表達(dá)、電信號等,有明確的標(biāo)準(zhǔn)和通用格式,以便在不同算法和平臺之間互操作。
此外,還有消費(fèi)級數(shù)據(jù)的獲取、工程落地能力、行業(yè)信任與模型可解釋性問題,以及數(shù)據(jù)隱私問題等。