生物科普:生物計算是怎麽幫助人類對抗疫情的?
來源:萬物揀史
發布時間:2021-03-19
瀏覽次數:777

2010年,《自然》雜誌就刊登了這樣一篇集體(ti) 智慧的結晶,而且好幾萬(wan) 人都是同一款遊戲的玩家,他們(men) 幫生物化學家解決(jue) 了蛋白質折疊的關(guan) 鍵問題。

圖片

這款遊戲叫Foldit,發布於(yu) 2008年5月,發起者是美國西雅圖華盛頓大學的生物化學教授戴維·貝克。在遊戲中,玩家從(cong) 一些基礎的蛋白質開始,通過點擊、拖拽其中的氨基酸來操縱改變蛋白質的結構,直到後者形成穩定的形狀。

圖片

在遊戲排行榜上,新結構的穩定性越高,得分越高。隨著大量玩家加入,Foldit用眾(zhong) 包思維實現了大眾(zhong) 為(wei) 科研“打工”。

2011年,一群玩家就用不到3周的時間,把一種可以導致恒河猴艾滋病的蛋白質拚了出來,這個(ge) 新結構隨後通過實驗得到確認。此前,這個(ge) 難題已經困擾了生物化學家15年之久。

圖片
科學家為(wei) 什麽(me) 不自己折疊蛋白質呢?當然是因為(wei) 難啊!

回顧一下高中生物:蛋白質是由一條條的肽鏈構成的,肽鏈是二級結構,還需要折疊成有功能的立體(ti) 結構。問題在於(yu) ,測序隻能知道氨基酸的基因序列,測不出三維結構。

圖片

這時就顯出人多力量大了,基於(yu) 氨基酸相互作用的原理,數十萬(wan) 玩家能通過遊戲幫科學家模擬預測蛋白質的結構,事半功倍。

以遊戲的形式實現科研眾(zhong) 包已經有很多實例,例如“EteRNA”平台是通過玩家構建RNA的多維結構。這類遊戲大多出現在天文觀測和生物醫學領域,因為(wei) 有大量的聲音或圖像數據需要處理。

圖片

但有些情況,是召集多少玩家都不太夠,最終得求助於(yu) AI。還得聯係到蛋白質。

新冠疫情全球流行,疫苗的研製成了當務之急。目前,輝瑞與(yu) 複星生物合作的mRNA疫苗已經在全球範圍內(nei) 接種,這種疫苗可以快速問世,得益於(yu) 先進的算法。

圖片

傳(chuan) 統疫苗主要是用滅活或減毒的病毒誘發人體(ti) 的免疫反應。mRNA疫苗技高一籌,用一小段信使RNA教我們(men) 的細胞製造出蛋白質或蛋白質片段,再觸發免疫反應,換句話說,mRNA疫苗虛晃一槍,讓宿主自己製造出病毒蛋白,之後人體(ti) 就能辨認出入侵的病毒。

圖片

聽起來容易,但要研發出二級結構穩定且有效的mRNA疫苗,全世界的科學家都犯愁。新冠mRNA疫苗模仿的是新冠病毒表麵刺突蛋白的mRNA片段,經過一些改動後作為(wei) 備選序列,但它的序列和二級結構通常很不穩定。

圖片
mRNA由多個(ge) 核苷酸串聯而成,每三個(ge) 核苷酸決(jue) 定一個(ge) 氨基酸。具體(ti) 來說,新冠病毒的刺突蛋白,也就是抗原上有1273個(ge) 氨基酸,換算出來,能翻譯成這種刺突蛋白的mRNA序列有10的632次方……

圖片

簡單點來說,用一台超級計算機來處理,一秒鍾算出一個(ge) 新冠RNA序列的二級結構,即使從(cong) 宇宙誕生時開始算,連“潛在”序列的億(yi) 萬(wan) 分之一都算不完。

好在有強大的算法拯救世界。2020年5月,百度研究院推出全球首個(ge) mRNA疫苗基因序列設計算法LinearDesign。這種算法能在理論上設計出結構最穩定、蛋白質表達效率最高的mRNA序列,時間最快可以縮短到11分鍾。

圖片

這樣一來,全世界的生物化學家就能在極短時間內(nei) 獲得一係列優(you) 良的mRNA疫苗序列,進而通過實驗測試效果,這就是計算生物學的威力。將生物學難題成功轉化為(wei) 計算機語言學上的經典問題,用計算機設計出更穩定、蛋白質表達水平更高的mRNA序列。

圖片

由於(yu) 計算機科學和AI的運用,疫苗研發這個(ge) 世界性難題被加快了解題速度。除了疫苗研發,算法還為(wei) 全球抗疫做出了很多貢獻。為(wei) 了了解新冠病毒的進化和各個(ge) 基因的功能,各國科學家從(cong) 不同年齡、性別、種族的患者身上收集病毒基因組並進行測序,每周都有成千上萬(wan) 的新序列公布。

然而,海量的新數據需要大量時間和精力進行分析,目前亦沒有可以自動注釋病毒基因突變的軟件。對此,百度推出的CoV-Seq分析平台為(wei) 科學家和醫生們(men) 自動過濾掉低質量的序列並刪除重複序列,執行序列比對,對變異進行定位和注釋,自動提供可視化的分析結果。

圖片

麵對突如其來的疫情,百度第一時間對外免費開放了提升新冠RNA二級結構分析速度的LinearFold服務,其推出的LinearDesign算法有效助力mRNA疫苗的研發,CoV-Seq工具平台為(wei) 研究人員加速科研進展。技術與(yu) 工具的組合,換來了對抗疫情的時間和效率。

圖片

正如百度CEO李彥宏說的那樣,“由於(yu) 人工智能技術的賦能,大量的生命信息被轉化,生物計算大顯身手,新藥研發的速度大大加快。人工智能技術在疾病早篩方麵,在精準診療等方麵,都可以施展威力。

比起壽命的數字,戰勝疾病、健康生活更有意義(yi) 。

如果你對開頭我們(men) 提到的的Foldit感興(xing) 趣的話,可以去下載玩一玩,說不定你的名字也會(hui) 出現在下一篇論文裏。

編輯:趙國賀
編導:摸鷹知鵝 阿四 基德A排版:新桐

參考資料:[1]. Cooper, S., Khatib, F., Treuille, A. et al. Predicting protein structures with a multiplayer online game. Nature 466, 756–760 (2010). https://doi.org/10.1038/nature09304

[2]. LinearDesign: Efficient Algorithms for Optimized mRNA Sequence Design arXiv:2004.10177v4

[3]. COVID-19 Genomic Sequence Database and Visualization Cov-Seq

[4]. Liang Huang, **He Zhang, **Dezhong Deng, Kai Zhao, Kaibo Liu, David Hendrix, and David H. Mathews (2019). LinearFold: Linear-Time Approximate RNA Folding by 5’-to-3’ Dynamic Programming and Beam Search. Bioinformatics, Volume 35, Issue 14, July 2019, Pages i295–i304. ISMB 2019


關(guan) 注【深圳科普】微信公眾(zhong) 號,在對話框:
回複【最新活動】,了解近期科普活動
回複【科普行】,了解最新深圳科普行活動
回複【研學營】,了解最新科普研學營
回複【科普課堂】,了解最新科普課堂
回複【科普書(shu) 籍】,了解最新科普書(shu) 籍
回複【團體(ti) 定製】,了解最新團體(ti) 定製活動
回複【科普基地】,了解深圳科普基地詳情
回複【觀鳥星空体育官网入口网站】,學習(xi) 觀鳥相關(guan) 科普星空体育官网入口网站
回複【博物學院】,了解更多博物學院活動詳情

聽說,打賞我的人最後都找到了真愛。
做科普,我們是認真的!
掃描關注深i科普公眾號
加入科普活動群
  • 參加最新科普活動
  • 認識科普小朋友
  • 成為科學小記者