AI能憶起昨天的你了，但觸景生情還有點難.-深i科普

微信谘詢

谘詢電話

公眾號

TOP

首頁 > 星空体育官网入口网站 > 天文

智能科普：AI能憶起昨天的你了，但觸景生情還有點難.

來源：科普中國

發布時間：2019-12-18

瀏覽次數：1297

　人工智能要形成長期記憶，還需要腦科學、神經科學、心理學和行為(wei) 經濟學等多學科的交叉研究。

　　記住一些東(dong) 西並能回憶起來，對於(yu) 人類來說是與(yu) 生俱來的能力。記憶可以讓我們(men) 回憶過往之事，並基於(yu) 此對未來做出決(jue) 策。能否讓AI智能體(ti) 也做到這點呢？近日，穀歌旗下人工智能企業(ye) “深層思維”（DeepMind）提出一種方法，能夠讓智能體(ti) 使用特定的記憶來信任過去的行為(wei) ，並對未來做出正確的決(jue) 策。相關(guan) 成果發表於(yu) 最新一期的《自然·通訊》上。

　　那麽(me) ，目前我們(men) 讓AI產(chan) 生的記憶和人類的記憶是一回事嗎？人工智能可以用什麽(me) 方法產(chan) 生記憶？與(yu) 以往相比，此次“深層思維”提出的新方法有何不同？在賦予人工智能記憶方麵，我們(men) 尚需做哪些努力？

　　四種方法讓AI產(chan) 生“記憶”

　　記憶是我們(men) 對過去的經曆進行編碼、存儲(chu) 、回憶等的能力。一般而言，可以將其視為(wei) 利用過去的經驗來影響當前行為(wei) 的能力。它使人類能夠學習(xi) 以前的經驗並與(yu) 現在的實踐建立聯係。

　　生活中那些感動我們(men) 的人或事往往會(hui) 觸發回憶，也就是我們(men) 通常所說的觸景生情。“人類的長期記憶實際上是呈現多模態、場景化特征的，即一個(ge) 記憶事件在存儲(chu) 時包含多個(ge) 維度，觸發某個(ge) 維度就可以快速找到線索並進行回憶。”遠望智庫人工智能事業(ye) 部部長、圖靈機器人首席戰略官譚茗洲在接受科技日報記者采訪時表示，但人們(men) 往往高估了記憶量，其實我們(men) 的記憶容量很有限，所以人類記憶本身是高度抽象的，在記憶時我們(men) 通常選擇對事件進行特征提煉，其中有好多要素隻是概況並且是模糊的。如回憶電影，我們(men) 不會(hui) 精準地回憶一幀一幀的完整成像，但如果類似場景再現，我們(men) 就會(hui) 回想起之前的一幕。

　　在以往的研究中，采用什麽(me) 方法可以讓AI產(chan) 生回憶？

　　譚茗洲介紹說，比較常用的有四種方法：第一種是長短期記憶網絡。它是由一個(ge) 被嵌入到網絡中的顯性記憶單元組成，功能是記住較長周期的信息。這一技術主要被穀歌、亞(ya) 馬遜和微軟等公司用於(yu) 語言識別、智能助手等。第二種方式是彈性權重鞏固算法。這種算法主要用於(yu) 序列學習(xi) 多種遊戲。“深層思維”采用的就是這種與(yu) 記憶鞏固有關(guan) 的算法，目的是讓機器學習(xi) 、記住並能夠提取信息。第三種方法是可微分神經計算機，這種計算機的特點是將神經網絡與(yu) 記憶係統聯係起來，並像傳(chuan) 統計算機一樣存儲(chu) 信息，還可從(cong) 例子中進行學習(xi) 。第四種方法是連續神經網絡，主要用於(yu) 迷宮學習(xi) ，解決(jue) 複雜的連續性任務，同時可以遷移星空体育官网入口网站。

　　解決(jue) 長期信用分配問題是關(guan) 鍵

　　那目前，AI產(chan) 生的記憶與(yu) 人類的記憶是一回事嗎？譚茗洲答道：“目前AI的記憶仍隻是停留在將學習(xi) 所獲得的信息進行編碼、存儲(chu) ，進而轉化為(wei) 認知的過程。以前的做法隻是讓AI將所發生的一切悉數存儲(chu) ，然而記憶與(yu) 存儲(chu) 是有區別的，記憶是為(wei) 了能夠有效回憶。人類回憶的方式，往往是跨各種閾界的，如通過某個(ge) 品牌忽然想起某個(ge) 事。因此，要讓AI智能體(ti) 對過去所發生的一些事情，判斷該不該記憶，關(guan) 鍵要采取一些方法令其做出評定，達到人類回憶的效果。”

　　要讓AI能夠實現回憶過去的事情，涉及到長期信用分配問題：即如何評估行為(wei) 在長期行為(wei) 序列中的效用。但人工智能現有的信度分配方法無法解決(jue) 行為(wei) 與(yu) 結果之間存在長時間延遲的任務。

　　據介紹，人工智能的研究中，在一個(ge) 長序列內(nei) 評估個(ge) 人行為(wei) 的效用問題，被稱為(wei) 信用分配問題。該評估可以對過去的行動或計劃的未來行動進行評分。

　　譚茗洲解釋道：“具體(ti) 在強化學習(xi) 中，智能體(ti) 獲得指導的唯一途徑是通過獎勵，而獎勵通常是稀疏和延遲的。當智能體(ti) 得到獎勵時，很難知道哪些行為(wei) 應該被信任，哪些該被責備，這就是信用分配問題。”

　　此外，譚茗洲介紹道，想讓AI像人類那樣產(chan) 生回憶，首先需要讓AI學會(hui) 情景記憶以及自傳(chuan) 式記憶。AI之所以很難做到這點，是因為(wei) 情景記憶和自傳(chuan) 式記憶有著非常強的個(ge) 體(ti) 體(ti) 驗特性。情景記憶與(yu) 自傳(chuan) 式記憶一旦和當事人割裂開來，就失去了生命力，對於(yu) 機器而言，這很難想像。畢竟對於(yu) 機器而言，精神可以獨立於(yu) 物質存在，體(ti) 驗可以獨立於(yu) 主體(ti) 存在。此外還要防止機器可能出現的災難性遺忘。認知心理學研究表明，人類自然認知係統的遺忘並不需要完全抹除先前的信息。但是對於(yu) 機器而言，遺忘就是災難性的，即需要抹除先前的信息。

　　與(yu) 人類複雜記憶相比仍是初級階段

　　據譚茗洲介紹，此次“深層思維”提出將範例建立在深入的強化學習(xi) 基礎上，並引入長期信用分配的原則。首先，智能體(ti) 需編碼並存儲(chu) 感知和事件記憶；然後，智能體(ti) 需通過識別和訪問過去事件的記憶來預測未來的回報；再有，智能體(ti) 需根據其對未來獎勵的貢獻來重新評估這些過去的事件。這樣可讓智能體(ti) 使用特定的記憶來信任過去的行為(wei) ，並對未來做出正確的決(jue) 策。

　　為(wei) 了做到這一點，“深層思維”論文顯示，其做的首要工作是形式化任務結構，主要包括兩(liang) 種類型的任務。具體(ti) 而言，在第一種信息獲取任務中：一階段，智能體(ti) 需在無即時獎勵情況下探索一個(ge) 環境來獲取信息；二階段，智能體(ti) 在很長一段時間內(nei) 從(cong) 事一項不相關(guan) 的幹擾任務，並獲得許多附帶獎勵；三階段，智能體(ti) 需利用一階段中得到的信息獲取遠端獎勵。

　　在第二種因果任務中：一階段，智能體(ti) 需采取行動觸發僅(jin) 具有長期因果關(guan) 係的某事件；二階段，同樣是一個(ge) 幹擾任務；三階段，為(wei) 了取得成功，智能體(ti) 需利用一階段活動引起的環境變化來獲得成功。

　　而在研究這種結構的完整任務之前，研究人員考慮讓智能體(ti) 實現一個(ge) 更簡單的被動過程的任務——“被動視覺匹配”，即智能體(ti) 不用采取任何主動措施去采集信息，如同一個(ge) 人在街上走路，不經意間就觀察到某些信息一樣。

　　“深層思維”的論文呈現一個(ge) 打遊戲過程中的簡單場景，並讓AI智能體(ti) 對探索過的路徑及攻略進行記憶，當然與(yu) 人類複雜的記憶機製相比，還是相當初期的階段。

　　譚茗洲強調，正如論文所述，新方法的範式拓寬了AI研究的範疇。這是一個(ge) 有趣的話題，涉及人腦科學的研究，以及神經科學、心理學和行為(wei) 經濟學等多學科交叉研究的嚐試，今後還有很長的路要走，需要更多開放性的探索。

　　目前人工智能係統還不具備長期記憶

　　人腦從(cong) 功能的角度可分為(wei) 幾個(ge) 模塊：寄存器、短期記憶、長期記憶、中央控製模塊。人腦通過五種傳(chuan) 感器，視覺、觸覺等，從(cong) 外部接受信息，存在寄存器，如果我們(men) 的注意力關(guan) 注這些信息，大腦可以把這些信息變成短期記憶裏的內(nei) 容，短期記憶可以持續30秒左右，如果我們(men) 有意識要記住這些內(nei) 容的話，大腦又會(hui) 將短期記憶的內(nei) 容轉到長期記憶中。

　　長期記憶的內(nei) 容既有信息，也有星空体育官网入口网站。簡單地說，信息表示的是世界的事實，星空体育官网入口网站表示的是人們(men) 對世界的理解，兩(liang) 者之間並不一定有明確的界線。人在長期記憶裏存儲(chu) 信息和星空体育官网入口网站時，新的內(nei) 容和已有的內(nei) 容聯係到一起，規模不斷增大，這就是長期記憶的特點。長期記憶實際上存在於(yu) 大腦皮層，在大腦皮層，記憶意味著改變腦細胞之間的鏈接，構建新的鏈路，形成新的網絡模式。

　　我們(men) 可以認為(wei) ，現在的人工智能係統是沒有長期記憶的。無論是阿爾法狗，還是自動駕駛汽車，都是重複使用已經學習(xi) 好的模型或者已經被人工定義(yi) 好的模型，不具備不斷獲取信息和星空体育官网入口网站，並把新的信息與(yu) 星空体育官网入口网站加入到係統中的機製。

　　有學者認為(wei) ，具有長期記憶將使人工智能係統演進到一個(ge) 更高的階段。暢想5—10年後，有可能構建這樣的智能係統，在這個(ge) 係統中，有語言處理模塊，包括短期記憶、長期記憶，係統能自己不斷去讀取數據，能把數據裏麵的星空体育官网入口网站做壓縮後放到長期記憶模塊。構建擁有長期記憶的智能問答係統，正是我們(men) 現在的願景。