版權歸原作者所有,如有侵權,請聯係我們(men)
人工智能會(hui) 下棋,甚至打敗過世界圍棋冠軍(jun) ,這已經是老生常談。
別看AI這麽(me) 厲害,它隻是借助了深度學習(xi) 的方式,通過無數次的訓練,讓它能夠在麵對實際問題時,從(cong) 訓練數據庫中計算尋得最優(you) 解,這並不代表機器人能夠像人一樣進行自主思考。
7月11日,Deep Mind公司最新的一項關(guan) 於(yu) AI的文章有了突破性進展,研究者運用發展心理學領域的星空体育官网入口网站可以讓AI能像人類嬰兒(er) 一樣“學會(hui) 思考”。而此前,最先進的AI係統仍然難以捕捉到日常人類場景中的“常識性”星空体育官网入口网站,比如指導預測、推理和行動。
可以說,Deep Mind的這項研究,大大推進了人工智能在直覺感知方麵的發展。此後,人工智能真的更像“人”了。
撰文 | 徐詩露
出品:科普中國-星空計劃
圖片來自Deep Mind
早在機器人問世之時,就有許多人想象過:如果機器人能夠像人一樣思考,世界將會(hui) 變成什麽(me) 樣子?(相信你腦海中已經浮現出相應的電影場景了)
這個(ge) 問題已經塵封多年,但是近期的一項發表在《自然·人類行為(wei) 》上的研究顯示,人工智能或許擁有了“像嬰兒(er) 一樣思考”的能力:能像嬰兒(er) 一樣理解直觀物理學。值得一提的是,這是知名人工智能公司Deep Mind科研人員發表的成果。
論文通訊作者Luis Piloto,此前他在普林斯頓大學學習(xi)
Luis Piloto和他的同事做了一個(ge) 能學習(xi) 直觀物理學的深度學習(xi) 係統,名為(wei) PLATO。PLATO包含的係統受到了嬰兒(er) 學習(xi) 方法相關(guan) 研究的啟發。並且,PLATO遵循認為(wei) 物體(ti) 在我們(men) 周圍物理世界的表示和預測中扮演核心作用的理論。
具體(ti) 來說,研究者通過給PLATO觀看許多描繪簡單場景的視頻來訓練它,比如球落到地上,球滾到其他物體(ti) 後麵又再次出現,很多球之間彈來彈去。訓練之後,PLATO在看到沒有意義(yi) 的場景(如物體(ti) 互相穿過卻沒有發生相互作用)時表現出了像人類嬰兒(er) 那樣“驚訝”。
令人驚訝的是,PLATO隻觀看了28小時的視頻就獲得了以上學習(xi) 效果。
我們(men) 不禁發問,直觀物理學是什麽(me) ,嬰兒(er) 是如何理解它的?AI又是如何學到這一點的呢?
嬰兒(er) 眼裏的直觀物理學是什麽(me) ?
首先我們(men) 來明確一個(ge) 概念,直觀物理學是什麽(me) ?我們(men) 可以簡單地把它理解為(wei) “直覺”或者“常識”。
比如我們(men) 在桌子上方丟(diu) 下一串鑰匙,所有人都知道,鑰匙不會(hui) 漂浮在半空中,也不會(hui) 穿過桌麵掉到地上,而是會(hui) 掉落在桌麵上。
這就是“直觀物理學”,它是我們(men) 了解世界的基礎物理概念,也是思維中“常識”的關(guan) 鍵組成部分。
在發展心理學領域中,直觀物理學被分為(wei) 5個(ge) 方麵的概念:
1. 連續性:物體(ti) 不會(hui) 從(cong) 一個(ge) 地方傳(chuan) 送到另一個(ge) 地方,而是在時間和空間中有一定的連續路徑;
2. 對象持久性:物體(ti) 在看不見時不會(hui) 消失;
3. 固體(ti) 性:物體(ti) 不會(hui) 相互滲透;
4. 不變性:對象的屬性(如形狀)不會(hui) 更改;
5. 定向慣性:物體(ti) 運動的路徑與(yu) 慣性原理一致。
是不是每一個(ge) 都很好理解?沒錯,這些都是我們(men) 容易理解和接受的“常識性”概念。
如果鑰匙的掉落過程違背了我們(men) 的常識,比如懸浮在了半空中、或者穿過了桌子、或者是從(cong) 桌麵上duang的一下彈起來老高,甚至是化成了液體(ti) ,那麽(me) 事情就會(hui) 超出我們(men) 的預期,變得詭異起來。
麵對這種怪異事件,每個(ge) 人都會(hui) 感到驚訝。即使是三個(ge) 月大的嬰兒(er) 也是一樣,他們(men) 也會(hui) 對這樣違背直觀物理學的現象表現出驚訝,這種驚訝反應被稱為(wei) 違反期望(VoE)效應。
至於(yu) 嬰兒(er) 對世界的認識是否和成人一樣,這一點存在一個(ge) 關(guan) 於(yu) “先天”和“後天”的爭(zheng) 議,許多發展科學家認為(wei) 這是“先天”的,也有一些學者更支持從(cong) 無到有的“後天”理論。
那我們(men) 能否設計一個(ge) 模擬嬰兒(er) 思維的程序,通過適當的訓練,使AI能夠像嬰兒(er) 一樣思考呢?
如何把AI訓練得像嬰兒(er) 一樣思考?
為(wei) 了探究這個(ge) 爭(zheng) 論不休的“先天”和“後天”問題,Piloto等人利用PLATO仿真係統,來測試深度學習(xi) 係統是否能夠通過學習(xi) 視覺動畫,來獲得對直觀物理學的理解。
如果“後天”的理論是正確的,那麽(me) 智力發展的關(guan) 鍵就在於(yu) 通過處理大量經驗和大量數據來進行鍛煉。
PLATO仿真係統由兩(liang) 個(ge) 模塊組成:前饋感知模塊(左)和循環動態預測器模塊(右)組成。前饋感知模塊中,通過編碼器將圖像轉換為(wei) 一組對象代碼,通過解碼器模塊將對象代碼解碼成對象的圖像。利用重建和原始圖像之間的差異來訓練編碼器和解碼器的參數。循環動態模塊中,動態模塊通過預先訓練好的解碼器對下一時刻的對象狀態進行預測。
而這項研究使用的訓練數據少到驚人,就讓AI擁有了穩定的違反期望效應。在麵對超出5個(ge) 直觀物理學概念的情況時,PLATO仿真係統會(hui) 顯示出魯棒(即具有穩定性)的VoE效應。這可以解釋一些直觀物理學的概念,但是這種效應與(yu) 嬰兒(er) 身上看到的現象並不完全一致。
研究發現,雖然視覺動畫的經驗對智力發展有很重要的貢獻,但不足以解釋我們(men) 在嬰兒(er) 身上看到的現象。
也就是說,智力發展並非全部依靠於(yu) “後天”的經驗和數據。要形成完整的智力,還需要一些先天的認知,這項研究在“先天”派和“後天”派之間建立了一個(ge) 有趣的中間立場。
當視頻在直觀物理學上變得不可能時,AI表現出的驚訝會(hui) 顯著增加。
此外,PLATO仿真係統可以將符合直觀物理學的期望,歸納為(wei) 一組與(yu) 訓練中不相同的對象和事件。其次,盡管隻是接受了相對較少的視覺動畫訓練,這個(ge) 仿真係統也能夠成功地演示學習(xi) ,在針對嬰兒(er) 研究中也有相似的特征。
可以看到,將仿真建模的工作和發展心理學中的關(guan) 鍵問題融合起來,研究人員得到了意想不到的效果和結論。
目前,研究團隊正在將違反期望效應的研究擴展到神經生理學領域,這可能為(wei) 後續的研究開辟新的可能性,也為(wei) AI的發展提供了更多的可能。
參考資料
1. Can a computer think like a baby? Nature News.
2. Intuitive physics learning in a deep-learning model inspired by developmental psychology.
歡迎掃碼關(guan) 注深i科普!
我們(men) 將定期推出
公益、免費、優(you) 惠的科普活動和科普好物!
