空間智能將成AI攀登的下一座高峰
人工智能(AI)的發展正在進入一個全新階段,或將從“理解語言”走向“理解世界”。 11月10日,美國斯坦福大學教授、World Labs聯合創始人李飛飛發文《從語言到世界:空間智能是AI的下一個前沿》,提出空間智能將成為AI攀登的下一座高峰。她指出,當前以大型語言模型為代表的AI系統雖然能熟練生成文字與圖像,卻仍停留在“語言的世界”中,困于“紙上談兵”,缺乏對現實空間、物理規律與因果關系的真正理解。而具備空間智能的AI將突破這一瓶頸,像人類一樣在現實世界中感知、推理和行動。 李飛飛認為,當前以大型語言模型和圖像分類器為主導的人工智能時代已經達到了極限。 圖片來源:pymnts.com網站 從算法智能到空間智能 當今的大型語言模型在閱讀、寫作和模式識別上表現出色,卻在物理世界的表征與交互上存在根本局限。即使是最新的多模態大模型,在估算距離、方向、大小時的表現也往往不及隨機水平。它們無法在空間中導航、辨識捷徑,也不能穩定預測最基本的物理規律。此外,AI生成的視頻雖令人印象深刻,卻往往在幾秒之內失去連貫性。 這些局限使得AI難以真正賦能人類的創造性工作。無論是幫助學生理解復雜的分子化學概念,協助建筑師構思空間結構,還是為導演、游戲設計師構建虛擬世界,目前的AI距離這一目標尚遠。 在李飛飛看來,空間智能是人類認知建構的腳手架,驅動著想象、創造與推理,是連接感知與行動的核心能力。這種能力讓人們輕松完成停車時估算車距、在人群中自如穿行等日常動作,其核心在于將想象、感知與行動融為一體,實現從“知道”到“理解”的跨越。 她認為,空間智能代表著超越語言的邊界,融合了想象、感知與行動,讓機器不僅理解“看到了什么”,還理解“這些東西如何關聯、意味著什么、為何重要”。這類AI將能真正拓展人類的創造力與理解力,從醫療健康到藝術創作,從科學探索到日常輔助,將會帶來前所未有的變革。 構建世界模型是實現路徑 李飛飛文中提出,要實現真正的空間智能,就需要突破現有大型語言模型的范式,轉向一種更為根本的世界模型。這種新模型不僅能理解語義關系,更能在幾何、物理和動態規則上一致地“想象”和“重建”世界。它應當能感知多模態輸入,預測場景變化,并與環境進行交互。 當前研究方向包括生成三維物體與場景的3D生成模型、模擬動態過程的物理引擎,以及通過交互學習的具身智能系統。但真正能整合上述全部能力的通用世界模型仍處于起步階段。 李飛飛創立的World Labs正嘗試推動這一前沿研究。其團隊研發的世界模型可在語義與幾何層面理解復雜3D場景,推理其中的物理屬性與交互關系,并生成連貫、可探索的虛擬空間,交互中還可遵守物理與幾何規律。 其開發的Marble平臺已率先應用了這些能力,創作者無需傳統3D建模工具,就能快速創建和編輯完整的虛擬世界。這意味著AI正在從理解語言邁向理解空間,從生成圖像邁向生成世界。 重塑人類如何與世界共處 “距自然界第一次在遠古動物中孕育出空間智能,已過去近五億年。如今,我們有幸成為可能賦予機器同樣能力的一代技術人?!崩铒w飛文中寫道。她認為,空間智能將重新定義AI的功能和行為方式。借助世界模型,機器將從被動分析轉向主動規劃和適應。例如,倉庫機器人可繞過不斷變化的庫存規劃路徑,而不是在被阻擋時停止;自動駕駛汽車可預測行人的移動,而不是等待明確的信號;甚至有一天,數字助理也能解讀手勢、空間環境或共享的視覺框架。 具體而言,在創意與敘事領域,空間智能將重新定義人類的創造方式。導演和游戲設計師可自由構建虛擬世界,建筑師能即時可視化結構與比例,個人創作者與學生也能借助虛擬現實、擴展現實技術在三維空間中“造世界”。 在機器人領域,空間智能是實現具身智能的關鍵。它讓機器人能在虛擬環境中高效訓練、理解空間關系與人類意圖,從實驗室助手到家庭陪護都能安全協作。未來,從納米醫療機器人到軟體探測機器人,AI都將具備環境感知與自適應能力。 在科學、醫療與教育中,空間智能將成為人類探索的倍增器:AI可模擬實驗、預測結果,加速藥物研發與影像診斷;在課堂上,它能讓學生“走進”分子或歷史現場,使抽象知識具象可感。 李飛飛強調,空間智能的目標并非取代人類,而是增強人類的專業判斷力、創造力與共情力,讓技術更深地服務于人性。具備空間智能的AI將幫助人類理解疾病、重塑敘事形式、陪伴脆弱群體,加速科學發現與社會關懷。 她認為,空間智能不僅將改變AI能做什么,更將重塑人類如何與世界共處。從語言到空間,從文字到世界,AI正邁向一個真正能理解現實的新時代。(記者 張佳欣)
【責任編輯:朱家齊】