AI醫學:用自然語言處理算法預測病毒的免疫逃逸
來源:環球科學
發布時間:2021-05-13
瀏覽次數:961
AI醫學:用自然語言處理算法預測病毒的免疫逃逸

圖片來源:Pixabay
近日,來自美國麻省理工學院的科研團隊使用人工智能進行了一次“跨專業”研究。他們使用了原本用於自然語言處理(NLP)的算法來預測病毒蛋白質序列中能導致免疫逃逸的突變。相關研究1月15日發表於《科學》(Science)。
病毒的免疫逃逸一般是指病毒通過突變改變自身的特征蛋白,以躲過宿主免疫識別的過程。並不是所有的突變都會導致免疫逃逸。與免疫逃逸相關的變異通常會導致病毒特征蛋白結構的改變。這樣的改變使宿主的免疫細胞無法有效識別出病毒。而之前因為這種病毒感染而分泌出的抗體也無法有效的中和突變後的病毒。這一機製會使已經接種的疫苗失效,從而為疫苗的開發帶來阻礙。


圖片來源:Pixabay
研究人員發現了病毒蛋白質序列與自然語言的相似之處。每一種病毒對蛋白質的編碼是有特定規律的,這種規律類似語法。而構成蛋白質的氨基酸則類似句子中的單詞。免疫係統識別病毒蛋白的過程類似於人類理解句意的過程。無論語法還是語義的改變都能改變句子的意思,從而實現免疫逃逸。依據這樣的對應關係他們就可以使用 NLP 的相關算法來分析病毒的蛋白質序列了。
一種被稱為限製性語義轉換檢索(CSCS)的方法被用來尋找經常發生且與免疫逃逸相關的突變。為了尋找這些突變位點,研究人員使用了長短期記憶(LSTM)這一用於自然語言分析的算法對幾種病毒的特征蛋白序列進行了建模。包括流感病毒的血凝集素(一種蛋白),艾滋病病毒包膜糖蛋白以及SARS病毒刺突蛋白。


圖片來源:Pixabay
最終他們發現,病毒蛋白需要遵守一定的編碼規則(語法)以保持自身的感染能力,同時又需要一定程度的突變(語義的改變)來實現免疫逃逸。而相關位點是否經常發生變異也是重要的指標。保持感染能力、實現免疫逃逸,並且易於發生突變的區域將會是免疫逃逸相關突變的高發區。研究結果表明,流感病毒血凝集素的頂端、艾滋病病毒包膜糖蛋白的V1/V2超變區,以及SARS病毒刺突蛋白的受體結合結構域和氨基末端域都是免疫逃逸的高發區。由此研究人員實現了某種程度上對免疫逃逸的預測。
研究人員表示,此類研究將可用於揭示病毒演化的規律並有助於疫苗的開發。人們每年都要接種流感疫苗就是因為流感病毒的強變異性和這一特性引起的免疫逃逸。而艾滋病疫苗的開發也受製於艾滋病病毒的免疫逃逸現象。如果能夠一定程度的預測某種病毒的免疫逃逸,則會減輕對應疫苗的開發難度。
翻譯:全季康
編輯:魏瀟
引進來源:美國科學促進會
引進鏈接:https://eurekalert.org/emb_releases/2021-01/aaft-adt011121.php


關注【深圳科普】微信公眾號,在對話框:
回複【最新活動】,了解近期科普活動
回複【科普行】,了解最新深圳科普行活動
回複【研學營】,了解最新科普研學營
回複【科普課堂】,了解最新科普課堂
回複【科普書籍】,了解最新科普書籍
回複【團體定製】,了解最新團體定製活動
回複【科普基地】,了解深圳科普基地詳情
回複【觀鳥星空体育官网入口网站】,學習觀鳥相關科普星空体育官网入口网站
回複【博物學院】,了解更多博物學院活動詳情
 
聽說,打賞我的人最後都找到了真愛。
做科普,我們是認真的!
掃描關注深i科普公眾號
加入科普活動群
  • 參加最新科普活動
  • 認識科普小朋友
  • 成為科學小記者