科技前沿:終身學習的人工智能
來源:環球科學
發布時間:2021-05-26
瀏覽次數:1026
科技前沿:終身學習的人工智能

圖片來源:Pixabay
如果你畢業後就不再學習會怎麽樣?這麽做可能會讓你變得落伍,但這正是大部分機器學習係統被訓練的方式——當它們能勝任某項任務後便被用於實際場景。不過目前,一些計算機科學家正在開發像人類大腦那樣可以持續學習和改進的人工智能。
機器學習算法通常采用神經網絡的形式,即很多簡單的計算元件(神經元)通過彼此間強度(權重)不同的聯係來相互交流。比如在設計一種用來識別圖片的算法時,如果在訓練時,算法錯誤標記了一張圖片,那麽權重就會被調整。當錯誤被降低到特定閾值以下時,權重就不會再變,會被凍結在設定值上。

圖片來源:Pixabay
新技術將每個權重都分成了兩個數值,二者共同影響了一個神經元在多大程度上能激活另一個神經元。其中第一個數值與傳統係統中訓練和凍結的方式相同。但是第二個數值會不斷根據網絡中周圍的活動進行調整。很關鍵的是,該算法還會學習如何調整這些權重。因此,該神經網絡不僅學到了行為模式,還學會了如何根據新環境來修改行為的各個部分。研究人員在瑞典斯德哥爾摩召開的一次會議中展示了他們的這項技術。
該團隊使用這項技術創造了一個神經網絡,在看到完整圖片僅幾次後就能把被擦掉了一半的圖片複原。與之相比,傳統的神經網絡得看到更多圖片才能恢複原始圖片。研究人員還創造了一個神經網絡,能在僅看到一個例子後便學著識別出了手寫字母——手寫體與打印體不同,是不規整的。

圖片來源:Pixabay
在另一項任務中,神經網絡控製一個角色在一個簡單迷宮中尋找獎勵。在100萬次嚐試後,能半調節權重的係統在每次嚐試中找到獎勵的次數,比固定權重的係統多出兩倍。半調節權重中固定的部分顯然掌握了迷宮的結構,動態的部分則掌握了如何發現新的獎勵的位置。“這太厲害了,”美國加利福尼亞大學伯克利分校的計算機科學家尼基爾·米什拉(Nikhil Mishra,未參與此項研究)說,“因為這樣的算法能更快適應新任務和新場景,就像人一樣”。
共享出行公司Uber的計算機科學家、論文的第一作者托馬斯·米科尼(Thomas Miconi)說,他們的團隊目前打算解決更複雜的任務,比如控製機器人和語音識別。米科尼想在此類新任務中模擬“神經調節”,這是一種即時的、基於神經網絡的、適應性的調節,使得人類在發生了新奇或者重要的事情時能夠吸收星空体育官网入口网站。
撰文:馬修·赫特森(Matthew Hutson)
翻譯:張哲
文章來源:環球科學


關注【深圳科普】微信公眾號,在對話框:
回複【最新活動】,了解近期科普活動
回複【科普行】,了解最新深圳科普行活動
回複【研學營】,了解最新科普研學營
回複【科普課堂】,了解最新科普課堂
回複【科普書籍】,了解最新科普書籍
回複【團體定製】,了解最新團體定製活動
回複【科普基地】,了解深圳科普基地詳情
回複【觀鳥星空体育官网入口网站】,學習觀鳥相關科普星空体育官网入口网站
回複【博物學院】,了解更多博物學院活動詳情
 
聽說,打賞我的人最後都找到了真愛。
做科普,我們是認真的!
掃描關注深i科普公眾號
加入科普活動群
  • 參加最新科普活動
  • 認識科普小朋友
  • 成為科學小記者