
我們(men) 所生活的世界充滿了各種垃圾,不僅(jin) 有橘子皮、快遞盒、舊家具和舊電視等生活垃圾,還有短信、電子郵件、視頻和電影等信息垃圾。對於(yu) 很多數字信息,我們(men) 可能隻會(hui) 看上幾眼,就把它們(men) 丟(diu) 到雲(yun) 裏。對於(yu) 生活垃圾,人類似乎還在尋找解決(jue) 危機的方法,但對於(yu) 信息垃圾,我們(men) 則極少關(guan) 注。這在某種程度上有些不可思議。有朝一日,我們(men) 或許會(hui) 迎來數字存儲(chu) 空間的枯竭。這種假設合理嗎?數字空間真的會(hui) 被用完嗎?
弗朗西斯卡·穆西亞(ya) 尼(法國國家科學研究中心助理研究教授,互聯網與(yu) 社會(hui) 中心副主任,主要研究互聯網治理,特別是作為(wei) 治理工具的基礎設施)
要想找到答案,可能需要明確這裏的“我們(men) ”是誰,或者是什麽(me) 。
如果“我們(men) ”指的是地球上的人口,那“我們(men) ”很可能不會(hui) 耗盡數字存儲(chu) 空間。到目前為(wei) 止的曆史表明,隨著存儲(chu) 數據量的增加(特別是過去十年中的數據量增長非常驚人),存儲(chu) 係統的容量和效率也得到了提高和優(you) 化。在工程師和技術操作人員中似乎有一個(ge) 總體(ti) 共識,即對於(yu) 實際應用而言,由於(yu) 許多技術和經濟因素,在可預見的未來並不會(hui) 耗盡存儲(chu) 空間(我們(men) 現在就已經在討論原子和量子計算了)。
如果這個(ge) “我們(men) ”指的是某個(ge) 特定的IT公司及其用戶群,那答案就有點微妙了。尋找和分配存儲(chu) 空間是一個(ge) 非常具體(ti) 和現實的基礎設施問題,大型科技公司比其他公司更有可能通過“蠻力”來增加其存儲(chu) 空間的數量和質量。這最終——事實上可能已經如此——將加劇數字生態係統中的不平等。然而,摩爾定律真的成立嗎?如果是的話,要等到什麽(me) 時候?甚至網絡巨頭有時也需要做出一些選擇。
去中心化的存儲(chu) 解決(jue) 方案怎麽(me) 樣?在一個(ge) 存儲(chu) 能力看似極大豐(feng) 富的時代中,去中心化是否可以引導我們(men) 走上節製和可持續性的道路?與(yu) 集中式存儲(chu) 相比,區塊鏈有很多優(you) 點,但從(cong) 節製的角度來看,這似乎並不是一條可取之路,因為(wei) 其本身就具有內(nei) 置的冗餘(yu) 特性,即“區塊鏈膨脹”。不過,一些更“老式”的點對點(利用空閑存儲(chu) 空間和CPU容量)解決(jue) 方案已經出現,例如Wuala(不幸的是存在時間很短暫),其中一些有趣的實驗試圖避免“蠻力”擴展,並將建立全新的大規模數據中心作為(wei) 規劃未來存儲(chu) 的唯一方式。
最後,一個(ge) 比“找到存儲(chu) 數據的地方”更有實際意義(yi) 的問題可能是“如何找到你想要的數據”。隨著數據量的增加和存儲(chu) 能力的增加——這是個(ge) 必然的趨勢——我們(men) 用來處理和檢索有用信息的工具能否保持同步,以便在我們(men) 需要的時候派上用場?
約翰·D·維拉森諾(美國加州大學洛杉磯分校電子與(yu) 計算機工程教授)
簡短的回答是不會(hui) 。當然,我並不是說磁盤、終端設備或雲(yun) 存儲(chu) 帳戶永遠不會(hui) 被填滿。我的意思是,對於(yu) 大多數應用程序而言,存儲(chu) 成本已經不再是一個(ge) 障礙。如今,很少有人會(hui) 說“這些數據很重要,但我們(men) 不能保留它們(men) ,因為(wei) 那需要花很多錢在存儲(chu) 上”。
十年前,我通過布魯金斯學會(hui) 發表了一篇論文,研究了數十年來存儲(chu) 成本呈指數級下降的趨勢所帶來的影響。論文中的許多觀點在今天仍然適用——考慮到持續的成本降低,可能還更適用。存儲(chu) 變得如此廉價(jia) 的事實帶來了很多積極的結果,比如存儲(chu) 大量照片的能力。但它在隱私和威權政府的影響力方麵也會(hui) 帶來負麵效應,威權政府可以利用監控數據創建龐大的數據庫。
如今,數據麵臨(lin) 的最大挑戰不是如何存儲(chu) 數據,而是數據本身的質量問題。有大量的數據不夠完整,帶有偏見,也有的很嘈雜,或侵犯隱私,或是有其他問題。解決(jue) 這些缺陷需要作為(wei) 今後幾年的研究重點。
倫(lun) 納德·克蘭(lan) 羅克(加州大學洛杉磯分校計算機科學傑出教授,他提出了數據包網絡的數學理論,數據包網絡是互聯網的基礎技術)
我們(men) 是否會(hui) 耗盡數字存儲(chu) 空間?最有可能的答案是不會(hui) !
未來對數據存儲(chu) 的需求是壓倒性的。我們(men) 生成數據的速度遠快於(yu) 使用現有存儲(chu) 技術來存儲(chu) 數據的速度(據估計,到2025年,我們(men) 每年生成的字節數將超過可觀測宇宙中恒星的數量)。顯然,我們(men) 需要極大地改變存儲(chu) 數據的方式。
然而,就在十年前甚至幾十年前,我們(men) 就遇見過這樣的挑戰,也沒有任何理由懷疑我們(men) 能夠繼續保持這樣的能力。過去幾十年來,基礎技術的發展不斷帶給我們(men) 驚喜,從(cong) 處理速度到通信帶寬,以及我們(men) 這裏提到的數字存儲(chu) ,皆是如此。科學家和工程師們(men) 通過發揮聰明才智和創造力,實現了這一場持續的魔術表演。因此,盡管數據存儲(chu) 的需求增長巨大,但不要低估新的解決(jue) 方案出現的潛力。
我們(men) 已經看到,許多技術為(wei) 解決(jue) 未來的數據存儲(chu) 需求帶來了希望,但每一項技術也都麵臨(lin) 著有待解決(jue) 的挑戰。除此之外,我們(men) 還可以期待即將出現的技術和解決(jue) 方案,先進的數據壓縮技術也可能帶來意想不到的收獲。
一項有趣的技術是使用單分子磁鐵。當這些由新材料(一種過渡金屬)製成的磁鐵被磁場磁化後,如果把磁場移除,它們(men) 仍能保持磁化狀態。過渡金屬具有可切換的磁性,如自旋交叉(將一個(ge) 或多個(ge) 電子的自旋從(cong) 上變為(wei) 下,或反過來),並能在一段時間內(nei) 保持這種變化。這意味著每個(ge) 分子可以包含1比特的信息,從(cong) 而提供巨大的存儲(chu) 密度。當然,想要將這種巨大的存儲(chu) 能力(如每平方英寸幾百兆兆字節)變為(wei) 現實,研究人員還需要克服很多障礙,包括:製造分子所需的過冷條件;存儲(chu) 時間過短,目前還隻能以秒計;此外,還有相鄰磁體(ti) 互斥的問題。
另一種技術是使用飛秒激光寫(xie) 入,將數百兆兆字節的數據蝕刻到納米結構的石英玻璃盤上。這些盤可以保存數千年,甚至可能存在數十億(yi) 年。盡管目前該技術的讀寫(xie) 速度很慢,但不需要過冷條件,而且石英玻璃盤在非常高的溫度下依然可以安然無虞。
大自然在很久以前就提供了一種可能滿足我們(men) 未來數據存儲(chu) 需求的方案——DNA存儲(chu) 。自然母親(qin) 知道如何以DNA的形式安全地存儲(chu) 大量信息,而DNA正是生命的基石。現在,一些研究人員(生物學家、化學家和信息技術專(zhuan) 家)正在嚐試將數據(如文字、圖像、音樂(le) )通過DNA堿基對——由腺嘌呤(A)、胞嘧啶(C)、鳥嘌呤(G)和胸腺嘧啶(T)4種堿基組成——編碼成合成聚合物。DNA的可用存儲(chu) 密度遠遠大於(yu) 任何電子設備;事實上,1克DNA的數據密度可達1澤字節(zettabyte,即10^21字節)。要理解如此巨大的數據密度,我們(men) 可以想象將人類記錄的所有數據存儲(chu) 到一個(ge) 裝滿DNA的容器中,其體(ti) 積隻需要幾個(ge) 鞋盒大小,而驅動這個(ge) DNA數據中心所需的能量將非常小。此外,DNA存儲(chu) 可以保存數千年,同時可以有效地防禦黑客攻擊。因此,合成聚合物DNA的優(you) 點是:容量大;體(ti) 積非常小;持久耐用;低能量需求;無需過冷條件;以及強大的安全性。伴隨這些優(you) 勢的是一些很難克服的障礙,我們(men) 發現,用化學方法寫(xie) 或讀DNA的成本非常昂貴,而且這些操作的速度都太慢了。
綜上所述,我們(men) 確實有了一些令人興(xing) 奮的候選方案,可以解決(jue) 未來的數據存儲(chu) 需求問題。而且,隨著我們(men) 一步步解決(jue) 未來的挑戰,目前尚未發現的解決(jue) 方案可能就會(hui) 浮出水麵。
肖恩·格林斯坦(美國哈佛商學院工商管理教授、哈佛商學院數字計劃聯席主席)
世界怎麽(me) 會(hui) 耗盡存儲(chu) 空間呢?這似乎是不可能的。一個(ge) 超大規模的數據中心包含幾十萬(wan) 台服務器,其存儲(chu) 空間足以容納整個(ge) 維基百科——人類有史以來第三大的文字收藏(僅(jin) 次於(yu) 美國國會(hui) 圖書(shu) 館和大英圖書(shu) 館)。這表明存儲(chu) 空間是取之不盡的,任何耗盡存儲(chu) 空間的可能性都遙不可及,遠遠超出了社會(hui) 永遠無法觸及的地平線。
但也不完全如此。對數據的新用途不斷出現,而這些需求會(hui) 促使人們(men) 更多地利用現有的存儲(chu) 資源。也許最有趣的問題是需求是否會(hui) 停止增長。我認為(wei) 至少在未來幾十年不會(hui) ,有兩(liang) 個(ge) 基本原因。首先,這是互聯網的邊際要求的;其次,人類的創造力也遠未耗盡,會(hui) 不斷推出富有想象力的新應用。
先來說說互聯網的邊際。任何瓶頸的存在都會(hui) 將無限的資源變成有限的資源,而每個(ge) 係統至少都包含一個(ge) 瓶頸。互聯網上有很多這樣的瓶頸。一個(ge) 網絡衝(chong) 浪者搭上了曼哈頓第五大道下高速行駛的地鐵,同時想要毫不延遲地發表一篇文章。要做到這一點,就需要所有的組成部分——高速線路、多個(ge) 天線、緩存內(nei) 容和係統邊際的更多存儲(chu) 空間——都以最好的狀態工作。隨著視頻做得越來越好、越來越大,其內(nei) 容的數據強度也在增加,因此到達的速度會(hui) 變慢,性能也會(hui) 下降。維基百科需要你的捐助,才能使其運營不至於(yu) 成為(wei) 瓶頸。不太明顯的一點是,數據的運營商想要你的業(ye) 務,而這份收入中有一部分將用於(yu) 係統升級。當然,還有邊際的前沿存儲(chu) ,存在於(yu) 你的智能手機、服務器和內(nei) 容傳(chuan) 遞網絡中。換句話說,現代互聯網包含了誘導使用更多存儲(chu) 空間的市場機製。
隨著存儲(chu) 成本的降低,人類找到了越來越聰明的方法來對數據資源加以利用。去年的前沿到了明年,可能就會(hui) 變成日常。曾經有一段時間,人們(men) 對發送嬰兒(er) 和貓的視頻,或分享更多的時尚和八卦感到很新奇。未來幾年後,自動駕駛汽車的係統或許就能處理這一切。沒有人會(hui) 相信這種獨創性會(hui) 止步不前。去年,一組科學家發布了一個(ge) 黑洞周圍碎片的可視化圖像。研究人員收集的數據如此之多,以至於(yu) 無法通過互聯網傳(chuan) 輸。他們(men) 不得不把數據分成許多包裹,並通過郵寄的方式將磁盤郵寄出去。科學家們(men) 對黑洞的觀察還遠沒有到達盡頭,但更重要的是,這個(ge) 先例將激勵某些聰明的發明家,在地球上尋找能夠超越視覺表現界限的東(dong) 西;當他或她獲得這樣的圖像時,我們(men) 都會(hui) 投以敬畏的目光。
克裏斯蒂安·福克斯[英國威斯敏斯特大學媒體(ti) 與(yu) 傳(chuan) 播研究教授,《社交媒體(ti) :一個(ge) 批判性的介紹》(Social Media: A Critical Introduction)一書(shu) 作者]
我們(men) 並不是生活在一個(ge) “數據和數字社會(hui) ”,而是生活在大數據資本主義(yi) 和數字資本主義(yi) 之下。在這種社會(hui) 形態中,企業(ye) 和政治權力的目標是盡可能多地存儲(chu) 關(guan) 於(yu) 每個(ge) 人的數據,以便從(cong) 人們(men) 的生活中獲得利益,並將我們(men) 的公民身份證券化。如果數據和數字資本主義(yi) 以一種無限的方式持續下去,並耗盡計算所需的不可再生資源,那麽(me) 在某個(ge) 時候,構建計算和存儲(chu) 設備所需的物理資源就可能耗盡。但摩爾定律也降低了數據存儲(chu) 的成本,降低了對量子計算等新計算形式的探索,這緩解了這些限製,並可能導致克服了存儲(chu) 限製的新數據形式和數字資本主義(yi) 。
然而,關(guan) 鍵並不在於(yu) 技術問題,而是道德和政治問題:我們(men) 真的想要將生活的幾乎所有方麵存儲(chu) 起來嗎?如果一個(ge) 社會(hui) 將我們(men) 對人類生活的思想和活動越來越多地貨幣化和證券化,那將會(hui) 有什麽(me) 樣的後果和影響?最大的危險是,數字資本主義(yi) 將變成數字獨裁和數字法西斯主義(yi) 。因此,解決(jue) 方案是我們(men) 將存儲(chu) 的數據最小化到運行計算機和社會(hui) 所必需的最小值。為(wei) 了避免數字法西斯主義(yi) 的興(xing) 起,我們(men) 需要數字民主而不是數字資本主義(yi) 。
埃裏克·奧斯特威爾(喬(qiao) 治梅森大學計算機科學助理教授)
我認為(wei) ,以一種不可能被捕獲、存儲(chu) 和/或保存所有數據的速率產(chan) 生數據當然是有可能的,例如歐洲核子研究中心的大型強子對撞機在進行實驗時所丟(diu) 失的所有數據。我認為(wei) 我們(men) 應該關(guan) 心的是,存儲(chu) 那些可以用來幫助我們(men) 了解相關(guan) 意義(yi) (對於(yu) 我們(men) 的生活,對於(yu) 研究,對於(yu) 商業(ye) 利益,等等)的數據。
我之所以這樣區分,是因為(wei) 我認為(wei) 我們(men) 實際上是在存儲(chu) 讓我們(men) 獲得意義(yi) 的數據,並且經常存儲(chu) 處理過的數據(對數據進行匯總或陳述,或者壓縮數據,以及使數據具有更多語義(yi) ,等等)。這往往意味著我們(men) 要猜測我們(men) 需要和/或想要的哪一部分的數據。
當我們(men) 努力增加存儲(chu) 容量,並記錄(可能)更加精細的數據時,我們(men) 需要認識到,我們(men) 的數字足跡可能會(hui) 成為(wei) 一個(ge) 不利因素。作為(wei) 一名從(cong) 事數據分析的網絡安全研究者,我越來越清楚地發現,我們(men) 在網上留下的足跡是不可磨滅的,是不會(hui) 被時間衝(chong) 走的。更重要的是,我們(men) 的社區數據分析技術(大數據、ML/AI等)正變得更加有洞察力,其數據集也變得更加互聯。我想把這個(ge) 問題反過來問:我們(men) 是否會(hui) 達到這樣一個(ge) 地步,即人們(men) 希望數字存儲(chu) 空間耗盡,這樣他們(men) 的數字足跡就會(hui) 隨著年齡的增長而消失?問題在於(yu) ,我們(men) 已經在網上分享了幾十年的信息,潘多拉的盒子很可能早已打開。
凱文·柯倫(lun) (英國阿爾斯特大學網絡安全教授兼法律創新中心聯席執行主任)
所有的數字數據都存儲(chu) 在硬盤上。和其他技術一樣,硬盤容量已經取得了令人難以置信的進步。主要的變化是從(cong) 旋轉硬盤驅動器發展為(wei) 沒有移動部件的固態硬盤,磁盤容量也大幅增加。有趣的是,我們(men) 第一次看到因芯片短缺而導致的產(chan) 品延遲生產(chan) ,部分是由於(yu) 新冠疫情。芯片也是硬盤驅動器的組成部分,如果未來出現這種硬盤驅動器核心組件的短缺,那數字存儲(chu) 空間就可能會(hui) 耗盡。不過,一個(ge) 方法是回收現有的硬盤驅動器,並基本上覆蓋舊的文件。這可能會(hui) 緩解一些問題,但當然,互聯網巨頭可能很難收回足夠的存儲(chu) 空間。屆時,由於(yu) 數字存儲(chu) 價(jia) 格的大幅上漲,將隻有富人才能存儲(chu) 他們(men) 的數據;經濟規律也可能在這方麵發揮很大作用。
關(guan) 注【深圳科普】微信公眾(zhong) 號,在對話框:
回複【最新活動】,了解近期科普活動
回複【科普行】,了解最新深圳科普行活動
回複【研學營】,了解最新科普研學營
回複【科普課堂】,了解最新科普課堂
回複【科普書(shu) 籍】,了解最新科普書(shu) 籍
回複【團體(ti) 定製】,了解最新團體(ti) 定製活動
回複【科普基地】,了解深圳科普基地詳情
回複【觀鳥星空体育官网入口网站】,學習(xi) 觀鳥相關(guan) 科普星空体育官网入口网站
回複【博物學院】,了解更多博物學院活動詳情
![]()