
圖片來源:unsplash
很多時候,選擇或決(jue) 策是困難的。人們(men) 不但會(hui) 麵臨(lin) 諸多兩(liang) 難選擇,還經常受到情緒、偏好、認知水平等因素的影響。同樣,精準地預測人類的選擇也非易事。在人工智能(AI)和大數據相關(guan) 技術日新月異的今天,將決(jue) 策和預測決(jue) 策結果“外包”給人工智能,也許是個(ge) 不錯的選擇。
■本報記者 張雙虎
從(cong) 個(ge) 人衣食住行到國際間邦交誓盟,選擇或決(jue) 策無處不在。
很多時候,選擇或決(jue) 策是困難的。人們(men) 不但會(hui) 麵臨(lin) 諸多兩(liang) 難選擇,還經常受到情緒、偏好、認知水平等因素的影響。同樣,精準地預測人類的選擇也非易事。在人工智能(AI)和大數據相關(guan) 技術日新月異的今天,將決(jue) 策和預測決(jue) 策結果“外包”給人工智能,也許是個(ge) 不錯的選擇。
近日,上海大學悉尼工商學院(擬聘)副教授何黎勝和美國賓夕法尼亞(ya) 大學Sudeep Bhatia合作發表在《科學》的文章,分析了深層神經網絡模擬人類行為(wei) 特征,在預測人類決(jue) 策領域起到的重要作用。
預測決(jue) 策行為(wei) 的瓶頸
以20%的概率得到100美元,或以80%的概率得到50美元。如果麵臨(lin) 這樣的選擇,你會(hui) 選擇哪個(ge) ?
1979年,諾貝爾經濟學獎獲得者卡尼曼等人提出的前景理論(Prospect Theory)認為(wei) ,人們(men) 在麵臨(lin) 獲得時往往小心翼翼,不願冒風險;在失去時會(hui) 很不甘心,更容易冒險。人們(men) 對損失的痛苦感要大大超過獲得時的快樂(le) 感。
前景理論為(wei) 人們(men) 理解決(jue) 策者如何組織決(jue) 策提供了模型,但用前景理論來模擬選擇行為(wei) 並非沒有缺點。依據前景理論提出新理論的研究者通常會(hui) 對諸如感知、注意力、記憶和情感等過程,以及幹擾和選擇錯誤的原因做出複雜的假設。
Sudeep Bhatia認為(wei) ,這些理論本身隻在“小數據集”的選擇上進行測試,很少與(yu) “大數據集”的已有模型進行比較。考慮到決(jue) 策研究的跨學科曆史和風險選擇的複雜性,這是不可避免的:決(jue) 策者很容易憑直覺對預期效用的偏差作出心理解釋。而且,很多新理論模型通常類似於(yu) 先前發布的模型,許多理論在基準數據集上高度模仿彼此的預測。
“盡管新理論模型產(chan) 生的速度正在加快,但在過去20年中,這些數據集的預測精度幾乎沒有提高。”何黎勝告訴《中國科學報》,“其根本原因是我們(men) 的認知係統具有高度複雜性。”
何黎勝解釋說,風險決(jue) 策看似簡單。如果問大學生或高中生如何做風險決(jue) 策,他們(men) 中的大多數人可能會(hui) 說“我們(men) 先算出每個(ge) 選項的期望價(jia) 值,然後選擇期望價(jia) 值最高的選項”。
但風險決(jue) 策比這複雜得多,受到多種認知和情感因素影響。以往研究者通過考慮這些影響因素,對風險決(jue) 策行為(wei) 提出了多種理論解釋模型。
“近20年來,這種‘小數據集+小模型’的研究範式遇到了瓶頸,主要表現為(wei) 我們(men) 對決(jue) 策行為(wei) 的解釋越來越多,但對決(jue) 策行為(wei) 的預測能力並沒有顯著提升。”何黎勝說,“這很大程度上取決(jue) 於(yu) 常用的‘小數據集’和‘小模型’(與(yu) 深度神經網絡相比,常規的決(jue) 策模型都是小模型)研究範式。小數據集不足以支撐像深度神經網絡這樣的‘大模型’,而‘小模型’又不足以支撐決(jue) 策過程中複雜的認知與(yu) 情感因素。”
“大模型”顯身手
“人工智能技術雖然發展迅速,但計算機不會(hui) 有人類意義(yi) 上的感情,短期內(nei) 也不可能產(chan) 生人類特征的情緒。”天津大學自動化學院副教授楊正瓴對《中國科學報》說,“這也許會(hui) 成為(wei) 人工智能的優(you) 勢,讓它在某些領域比人類做得更好。比如,利用‘大數據’的人工智能決(jue) 策,的確可以幫助人類減少決(jue) 策失誤。”
近年來,不同學科之間的交叉研究提供了新的突破口,特別是行為(wei) 決(jue) 策、認知科學和機器學習(xi) 等領域的交叉。
“總體(ti) 而言,在‘小模型’範圍內(nei) ,前景理論的預測精度是上佳的,是迄今為(wei) 止預測精度最好的風險決(jue) 策模型之一。”何黎勝說,“如果我們(men) 把視野放到更廣闊的‘大模型’(例如深度神經網絡等機器學習(xi) 算法),前景理論等小模型的預測劣勢就顯現出來了。”
不久前,美國學者喬(qiao) 舒亞(ya) ·彼得森等人發表於(yu) 《科學》的文章,係統地比較了“大模型”與(yu) “小模型”(如前景理論)對風險決(jue) 策行為(wei) 的預測能力。結果發現,深度神經網絡的預測能力比前景理論高出幾個(ge) 能級。研究者首先針對10000多個(ge) 不同的選擇問題(涉及概率貨幣回報的賭博,超過了先前數據集的大小)和人類最終在這些問題中作出的決(jue) 定,來訓練深度神經網絡,發現這種網絡能夠以非常高的準確率模擬人類決(jue) 策,大大優(you) 於(yu) 現有的(人為(wei) )風險選擇模型。
“在我與(yu) 南丹麥大學教授Pantelis Analytis和賓夕法尼亞(ya) 大學教授Sudeep Bhatia共同完成的另一項研究中,通過群體(ti) 智慧算法整合不同的認知與(yu) 情感因素,我們(men) 發現這樣的集成模型能顯著地提高對決(jue) 策行為(wei) 的預測能力。”何黎勝說,“這裏的集成模型也是一種‘大模型’,它的預測精度也超過了前景理論。”
前景理論提出至今,給後續研究帶來極大的啟發,成為(wei) 決(jue) 策科學中的經典研究。當前,研究人員在此基礎上,利用人工智能和大數據算法,一方麵不斷完善前景理論,另一方麵通過新的技術方法不斷拓展決(jue) 策理論的邊界,提高預測精度。
實現決(jue) 策智能化
“經過學習(xi) 和訓練,深度神經網絡能夠模仿人類的行為(wei) ,它甚至可以像人類在做選擇時會(hui) 有不理性的行為(wei) 那樣,表現出非理性。”Sudeep Bhatia告訴《中國科學報》,“因此,用它來預測人類決(jue) 策行為(wei) 會(hui) 大大提高預測精度。”
“人工智能、認知神經科學的發展,將為(wei) 心理學、決(jue) 策科學的發展提供有力的研究手段。”何黎勝說,“得益於(yu) 學術界和工業(ye) 界的大模型投入,近年來人工智能和認知神經科學發展迅速,湧現出大量的開創性研究,也為(wei) 其他學科提供了成熟的研究工具。”
何黎勝認為(wei) ,在決(jue) 策研究中,研究人員會(hui) 研究不同類型的決(jue) 策,像風險決(jue) 策、跨期決(jue) 策、社會(hui) 決(jue) 策、博弈決(jue) 策等。目前,對這些不同決(jue) 策類型的研究和建模工作通常相互獨立。然而,從(cong) 認知的角度,不同的決(jue) 策類型必然有互聞共通的認知與(yu) 情感機製。“而不同決(jue) 策類型之間互聞共通的建模研究還非常稀缺,未來完全有可能通過與(yu) 人工智能、認知神經科學融合,實現不同決(jue) 策類型的互聞建模。”
“機器生成理論在決(jue) 策和管理場景中有巨大的應用潛力,其核心的變革在於(yu) 管理自動化。這個(ge) 轉變類似於(yu) 計算視覺研究中的深度神經網絡模型在醫學圖像處理中的應用。”何黎勝說。
目前,管理科學越來越趨向於(yu) 數據驅動的決(jue) 策。在工業(ye) 界和公共政策等領域,越來越多的公司和組織實驗方法(如A/B 測試)獲得實證數據,通過分析實證數據達到決(jue) 策優(you) 化的目的。然而,目前這種數據驅動的決(jue) 策有不小的局限性。其中一個(ge) 重要原因是管理者很多時候麵臨(lin) 的是一個(ge) 複雜的動態係統,是由多種因素交織而成的綜合體(ti) 。但A/B測試等方法收集到的數據往往是針對某個(ge) 特定的小點,對複雜決(jue) 策中多因素之間的交錯互動缺乏全局把握,限製了A/B測試實驗數據的適用性。
“機器生成理論可以更大程度地利用A/B測試等方法收集到的數據。更為(wei) 重要的是,機器生成理論足夠靈活,我們(men) 可以用真實的數據去訓練這個(ge) 係統,讓它不斷地逼近真實的管理場景。”何黎勝說,“未來,訓練好的機器生成理論模型可以自動地對複雜管理場景中的事件作出反應。也就是說,機器生成理論有能力將分散的實驗數據升華成具有邏輯一致性的體(ti) 係,實現複雜管理決(jue) 策的自動化、智能化。”
相關(guan) 論文信息:https://doi.org/10.1126/science.abi7668
《中國科學報》 (2021-06-24 第3版 信息技術)