
在撒切爾效應(Thatcher Effect)(左)中,Margaret Thatcher的兩(liang) 個(ge) 倒置版本的圖像在外觀上看似相似,但是如果您將此頁麵上下顛倒,則會(hui) 大不相同。通過比較深度網絡中此類直立和倒置圖像臉部之間的距離,作者能夠追蹤撒切爾效應(Thatcher Effect)是在物體(ti) 訓練的深度網絡還是臉部訓練的深度網絡中產(chan) 生的。 (圖片來源:改編自Jacob等人,2021年)
印度科學研究所(IISc)神經科學中心(CNS)的一項新研究探討了在視覺感知方麵,深層神經網絡相比人腦的優(you) 勢。
深度神經網絡是受人腦中腦細胞或神經元網絡啟發的機器學習(xi) 係統,可以受訓以執行特定的任務。這些網絡在幫助科學家了解我們(men) 的大腦是如何感知所見事物方麵發揮了關(guan) 鍵作用。盡管在過去的十年中,深度網絡已經有了巨大的發展,但在視覺感知方麵,它們(men) 仍遠不及人類的大腦。

(圖片來源:Pixabay)
在最近的一項研究中,CNS的副教授SP Arun和他的團隊將這些深度網絡與(yu) 人腦的各種特性進行了定性的比較。深度網絡雖然是理解人腦如何將對象可視化的良好模型,但其工作原理與(yu) 後者不同。盡管複雜的計算對於(yu) 他們(men) 來說是微不足道的,但對於(yu) 人類而言相對容易實現的某些任務可能對於(yu) 這些網絡卻很難完成。在本次發表於(yu) 《自然通訊》(Nature Communications)上的研究中,Arun和他的團隊試圖理解哪些視覺任務能被深度神經網絡本身構架的特性解決(jue) ,哪些需要進一步的訓練。
該小組研究了13種不同的知覺效應,並揭示了深度網絡與(yu) 人腦之間先前未知的能力差異。撒切爾效應(Thatcher effect)就是其中的一個(ge) 例子,人類更容易發現正立圖像中局部特征的變化,但當圖像被上下顛倒後,這就變得困難了。與(yu) 經過訓練可識別物體(ti) 的網絡相比,經過訓練可識別正立麵孔的深層網絡表現出撒切爾效應(Thatcher effect)。在這些網絡上測試的另一種人腦視覺特性為(wei) 鏡像混淆。人類的另一種視覺特性稱為(wei) 鏡像混淆,對人類而言,沿垂直軸的鏡麵反射看起來比沿水平軸的鏡麵反射更相似。研究人員發現,與(yu) 水平反射圖像相比,深度網絡在垂直方向上表現出更強的鏡像混淆。

(圖片來源:Pixabay)
人腦特有的另一種現象是,它首先關(guan) 注較粗糙的細節。這就是所謂的整體(ti) 優(you) 勢效應。例如,在樹的圖像中,我們(men) 的大腦會(hui) 首先注意到樹的整體(ti) ,然後注意到其中葉子的細節。相似地,該論文的第一作者和CNS的博士生Georgin Jacob解釋說,當給人類呈現一張臉部圖像時,人類首先會(hui) 注意到整個(ge) 臉部,然後再專(zhuan) 注於(yu) 更細微的細節,例如眼睛,鼻子,嘴巴等。他說:“令人驚訝的是,神經網絡顯示出細節優(you) 勢。”這意味著,與(yu) 大腦不同,網絡首先關(guan) 注圖像的細節。因此,即使這些神經網絡和人腦執行相同的對象識別任務,二者所遵循的步驟也大不相同。
這項研究的資深作者Arun說:“多數研究都顯示出深層網絡與(yu) 大腦之間的相似性,但沒有人真正研究過他們(men) 之間係統的差異。”找出這些差異可以使神經網絡更像人類的大腦。”
這樣的分析可以幫助研究人員建立更強大的神經網絡,不僅(jin) 具備更好的性能,而且抵禦針對攻擊的能力更強。
作者:Sangeetha Devi Kumar
翻譯:彭琛
審校:董子晨曦
引進來源:印度科學研究所

