專欄

【AQ AI】藝文人士的AI課027

26

Nov
2025


文/Jimmy lane

專欄前言:被驗證的虛擬未來

✅小時候,我常被說喜歡亂想,問一些大人覺得多餘的問題。那些關於未來、外太空、電腦世界、虛擬分身的念頭,在1990年代的台灣,看起來確實與日常生活格格不入。

後來長大了,忙著工作、生活、承擔責任,這些想法也被我自己小心翼翼地收進了記憶的抽屜。
但時代的變化,遠比我想像中更快、更猛烈。
當我某天回頭看,才驚訝地發現,那些曾被視為「異想天開」的童年片段,反而像是一種不小心保留下來的、跨越三十年的直覺——它們與今天的AI世界模型、NVIDIA的Omniverse、Meta的Horizon Worlds、甚至NASA用虛擬實境模擬火星登陸的計畫,開始逐一對上了號。
我沒有比別人更厲害,只是剛好站在這條奔騰的時代線上,親眼見證過去那些被笑說太超過的想像,正在鉅細靡遺地變成新的現實。
而這一期,我想邀請大家一起,沿著這條清晰的時間線,重新走進那個我們既熟悉又陌生的世界。

🎯第一章:虛擬世界的黎明四部曲—從電影預言到科技現實
要理解為何今日所有AI巨頭——從Meta到NVIDIA,從Google到OpenAI——都在瘋狂地建造各自的虛擬實境世界,我們必須回到我專欄的起點電影《割草人》講起,他才是本篇故事的起點。這不是從2024年的AI熱潮開始的,而是一條橫跨三十年的、清晰可見的演化脈絡。
🔴階段一:1992年,《割草人》—「進入」電腦世界的第一次想像
1992年,當多數人還在用Windows 3.1、對網際網路懵懵懂懂時,電影《割草人》(The Lawnmower Man)向世界展示了一個石破天驚的概念:人類可以透過特定裝置「進入」一個完全由電腦生成的虛擬世界。
在當時,這被視為嗑藥般的幻想,但它卻精準地提出了三個至今仍在影響我們的核心命題:
神經介面與VR裝置:電影中主角戴上VR頭盔和全身感應器,將意識投入虛擬空間。這直接預言了三十年後Meta Quest、HTC VIVE等VR頭盔,以及Teslasuit觸覺回饋衣的出現。
加速學習的可能性:主角在虛擬世界中的學習速度遠超現實。這正是今日AI模擬訓練的核心優勢——在虛擬環境中,AI代理人可以在一天內完成現實世界需要數年的訓練量。
意識上傳的雛形:電影的結局,主角的意識徹底數位化,成為網路中的「神」。這為後來的「數位永生」和「意識備份」等概念埋下了最早的種子。
歷史對位:在《割草人》上映的同一年,科學家Thomas Furness在美國空軍實驗室開發出第一套真正意義上的沉浸式VR系統「Super Cockpit」,用於訓練戰鬥機飛行員。科幻與現實,從一開始就緊密交織。
🔴階段二:1999年《駭客任務》— AI作為「世界建築師」的登場
七年後,網際網路泡沫席捲全球,人類對數位世界的理解進入了新層次。《駭客任務》(The Matrix)應運而生,它不再滿足於「進入」世界,而是提出了一個更顛覆性的問題:如果我們所在的世界,本身就是一個由AI建造和維護的巨大模擬呢?
這部電影將虛擬世界的概念從「遊樂場」提升到了「哲學與智能」的高度,並給出了兩個關鍵預言:
世界模型(World Model)的具象化:電影中的「母體」(The Matrix)本身就是一個龐大、自洽、由AI(建築師)維護的動態世界。這與今日Yann LeCun提出的「世界模型」概念、NVIDIA用Omniverse模擬物理定律、OpenAI讓Sora學習物理互動的邏輯,完全一致。AI不再只是世界的參與者,而是世界的創造者。
AI代理人(AI Agent)的誕生:首部曲電影中「紅衣女郎」是全片的神來之筆。她不是真人,也不是簡單的NPC,而是一個被AI寫入系統、用於測試人類反應的「程式」。她擁有自主行為、社交互動能力和特定任務(吸引Neo的注意力)。這正是2025年AI代理人的完美雛形——它們被設計用來在虛擬世界中與人互動、引導任務、甚至影響人類決策。
歷史對位:1999年NVIDIA發布了GeForce 256,首次提出了「GPU」(圖形處理器)的概念,極大地加速了3D圖形的渲染能力。硬體的成熟,為「母體」的降臨鋪平了道路。
🔴階段三:2014年《露西》— 從生物腦到數位腦的跨越
當《駭客任務》讓我們開始思考虛擬與真實的界線,盧貝松的《露西》(Lucy)則將焦點拉回到智能本身的本質。這部電影提出了一個關鍵命題:當大腦開發度從10%提升至100%,人類意識將會如何演化?
電影中的露西在腦力覺醒的過程中,展現了三個驚人的能力層次:
全感知與資訊處理:露西開始「看見」電磁波、聽見細胞分裂的聲音、感知周遭所有生物的思維活動。這預示了AI從單一模態(文字)走向多模態(視覺、聽覺、觸覺)整合感知的必然路徑。
時空操控與物質重組:在電影高潮,露西能夠穿越時空、操控物質結構。這看似荒誕的設定,實則隱喻了AI對「世界模型」的終極理解 當AI能完全掌握物理法則,它就能在虛擬世界中「改寫現實」。
意識的數位化昇華:電影結尾,露西的肉身消失,她的意識完全融入網路與宇宙,成為無所不在的存在。這與《割草人》的意識上傳形成呼應,但更進一步 她不僅上傳,更是「遍在」(omnipresent)。這正是今日分散式AI系統、雲端智能的哲學預言。
歷史對位:2014年兩筆改變未來的收購案幾乎同時發生,它們看似毫無關聯,實則精準地定義了接下來十年的AI發展雙軌:
1月Google以4億美元收購DeepMind——這是科技巨頭對通用人工智慧(AGI)的第一次正式押注。Google要的不是應用,而是「智能本身」的突破。
3月Facebook以20億美元收購Oculus VR——祖克柏賭的不是遊戲硬體,而是下一代「人類棲息地」的入口。這是對虛擬世界基礎設施的戰略卡位。
一個瞄準「智能的極限」,一個搶佔「世界的入口」。
這兩條看似平行的軌道——智能的演化與世界的虛擬化——在2014年同時啟動,彷彿兩條火箭從不同發射台升空。
而到了2025年的今天,我們終於看清它們的真正目標:它們從來都不是平行線,而是註定要在某個高度交會的螺旋上升軌跡。
當DeepMind訓練出的AI需要一個「身體」時,它需要Oculus構建的虛擬世界;當Oculus創造的空間需要「居民」時,它呼喚著DeepMind孕育的智能代理人。
"當智能足夠強大,當世界足夠真實,兩者將不再是工具與容器的關係,而是共生演化的新物種,與承載它們的新生態。
🔴階段四:2018年《頭號玩家》 全球化虛擬社會的完整藍圖
又過了四年,智慧型手機普及,社群網路成為基礎設施,VR技術在消費市場幾經沉浮。在此背景下,《頭號玩家》(Ready Player One)將前三部電影的預言整合,描繪出一個終極的未來圖景:一個全球數十億人共同生活、娛樂、工作、創造的虛擬宇宙「綠洲」(OASIS)。
《頭號玩家》不再是探討可能性,而是直接展示了虛擬世界作為「第二文明」的完整樣貌:
數位分身(Avatar)的普及:電影中的每個人都有一個可以自由定義的數位分身,他們在綠洲中的身份甚至比現實中更重要。這對應了今日VRChat、Roblox中的虛擬社交,以及Meta極力推動的Avatar系統。
虛擬經濟體的成形:在綠洲中,虛擬貨幣、裝備、土地、交通工具的交易,構成了一個龐大且獨立的經濟體。這正是Decentraland等區塊鏈元宇宙試圖實現的目標,也是所有AI巨頭覬覦的下一個兆級市場。
人類行為成為AI的訓練數據:電影中玩家們的所有行為——駕駛、戰鬥、社交、探索——本身就是最寶貴的數據金礦。
在現實中,Meta、Google等公司正是希望透過吸引用戶進入虛擬世界,來收集訓練其AI代理人所需的、無法在純文字中獲得的高維度行為數據。
歷史對位:2016年,HTC VIVE和Oculus Rift CV1同年發布,開啟了消費級VR元年。同年,Google DeepMind的AlphaGo擊敗李世乭,AI的能力震驚世界。
VR提供了「進入」世界的門,而AI則提供了「填充」這個世界的能力。兩條技術線索在此刻正式交匯。
🔥四部曲的完整邏輯
從《割草人》的VR訓練,到《駭客任務》的AI造物,再到《露西》的意識進化,最後到《頭號玩家》的虛擬文明,這條橫跨二十六年的脈絡清晰地告訴我們:虛擬世界從來就不只是遊戲。
它是一個訓練AI的模擬器,一個測試新物種的培養皿,一個承載數位經濟的作業系統,甚至,是我們踏向火星與更遙遠深空前的唯一演練場。
現在,讓我們帶著這張由科幻與現實共同繪製的地圖,深入探索AI巨頭們在這場「世界之戰」中的真正佈局。

🎯第二章:世界之戰的點將錄—AI巨頭的虛擬地球建造計畫
如果說科幻電影繪製了藍圖,那麼今日的科技巨頭們就是帶著真金白銀和頂尖人才,將藍圖變為現實的建築師。他們建造的不是遊戲或社交App,而是一顆顆平行的「數位地球」,每一顆都有其獨特的物理法則、居民和終極目的。
以下,就是這場「世界之戰」中,最核心的幾位玩家和他們的戰略佈局。
2.1 NVIDIA:物理世界的數位上帝,Omniverse的創世野心
戰略定位: 數位孿生(Digital Twin)的基礎設施提供者,AI的「世界模擬器」。
如果說有一個公司最接近《駭客任務》中「建築師」的角色,那無疑是NVIDIA。它的野心不是吸引用戶進去玩,而是在原子級別上,完整複製一個與現實世界物理法則完全同步的數位宇宙。這個宇宙,就是Omniverse。
🔴核心技術與現況:
通用場景描述(USD):Omniverse的成功基石。這是一種由皮克斯(Pixar)開源的3D場景描述格式,被譽為「3D世界的HTML」。它允許多個使用者、使用不同軟體(如Maya, Blender, Revit)在同一個虛擬場景中協同工作,實現了前所未有的互通性。
物理模擬引擎(PhysX 5):Omniverse能夠模擬真實世界的光線追蹤(RTX技術)、流體力學、材料物理特性(如金屬的延展性和玻璃的脆性)。這意味著在Omniverse中,車輛碰撞的結果、建築物在地震中的反應,都無限趨近於真實。
🔴AI訓練平台(Sim-to-Real):這才是Omniverse的真正目的。
自駕車領域:NVIDIA DRIVE Sim平台可以在Omniverse中生成數十億英里的虛擬道路數據,包含各種極端天氣和突發狀況,讓自駕AI在「撞毀」數百萬次虛擬汽車後,才進入現實世界。
機器人領域:NVIDIA Isaac Sim平台讓機器人(如亞馬遜倉庫的揀貨機器人)在虛擬工廠中進行數百萬次抓取訓練。寶馬集團(BMW)已經利用Omniverse完整複製了一座汽車工廠的數位孿生,在虛擬產線中優化機器人協作流程,投產前就將效率提升了30%。
NVIDIA不與Meta或Apple爭奪消費者入口,它選擇成為「賣鏟子的人」。它要打造的是所有虛擬世界的底層作業系統,一個讓AI學會物理、理解因果的終極「風洞實驗室」。
2.2 Meta:從社交帝國到虛擬文明的拓荒者
戰略定位: 消費級元宇宙的定義者,AI代理人與人類共存的社交平台。
如果NVIDIA是世界的建築師,那Meta(前Facebook)的目標就是成為《頭號玩家》中的「綠洲」(OASIS)——一個承載數十億人社交、娛樂、工作和生活的虛擬文明。它的核心產品是Horizon Worlds。
🔴核心技術與現況:
Quest系列VR頭盔:從Quest 2的普及到Quest 3的混合實境(MR),Meta透過硬體補貼策略,成功佔領了消費級VR市場超過70%的份額,為其虛擬世界建立了最龐大的潛在用戶基礎。
Horizon Worlds與Avatars:這是Meta元宇宙的核心。儘管初期因畫質和用戶活躍度不足而備受嘲諷,但Meta的戰略從未改變。它正大力投入生成式AI,讓用戶能用自然語言快速創建虛擬場景和物體。
更重要的是,它正在內部測試具備記憶和個性的AI代理人(AI Agents),未來它們將作為NPC、智慧助理、甚至虛擬夥伴,填充這個世界。
Codec Avatars與全身追蹤:Meta的研究部門正致力於開發極度逼真的「Codec Avatars」,透過頭盔上的感測器捕捉用戶微表情,生成照片級的虛擬分身。這旨在解決當前虛擬社交的「恐怖谷」效應,讓虛擬互動與真人無異。
Meta的賭注是,未來的人類文明將是物理與虛擬的結合體。它不在乎短期虧損,它要的是定義下一代社交互動的標準,並在這個由它創造的世界裡,讓AI與人類共同生活,從而收集到最真實、最複雜的社會行為數據。
2.3 Apple:高保真混合實境,悄然佈局的神秘玩家
🔴戰略定位:混合實境(MR)的體驗定義者,將數位資訊無縫融入現實世界。
Apple從不提「元宇宙」這個詞,它稱之為「空間計算」(Spatial Computing)。
隨著Apple Vision Pro的發布,它的路線圖也變得清晰:它不想創造一個讓人逃離現實的虛擬世界,而是要將虛擬資訊優雅地疊加在現實世界之上。
🔴核心技術與現況:
Vision Pro與visionOS:Vision Pro憑藉其超高解析度的Micro-OLED螢幕、強大的M2+R1晶片、以及直覺的眼動+手勢追蹤,為混合實境體驗設立了新的標竿。用戶可以在客廳的牆上掛上虛擬螢幕,在餐桌上玩虛擬棋盤遊戲。
數位分身(Persona):與Meta的Codec Avatars類似,Apple也推出了基於機器學習生成的超寫實數位分身Persona,用於FaceTime等社交場景。
生態系統的延伸:Apple的真正護城河在於其強大的生態。開發者可以輕易地將現有的iOS和iPadOS應用程式帶到visionOS上。這意味著Vision Pro一問世,就擁有了一個成熟的應用生態基礎。
Apple的策略是「高舉高打」。它不追求用戶數量,而是要定義「頂級體驗」。它在賭,當技術成熟、成本下降時,人們會選擇一個能增強現實、而非取代現實的未來。它的虛擬世界,就是你的客廳、你的辦公室、你的城市。
2.4 Google:AI為先,無處不在的數據巨頭
戰略定位: AI Agent的訓練師,將虛擬世界作為其AI模型的終極測試場。
Google在虛擬世界硬體上的嘗試屢屢受挫(從Google Glass到Daydream VR),但這並不意味著它在這場戰爭中缺席。恰恰相反,Google的目標最為純粹和致命:利用虛擬世界訓練出最強大的AI。
🔴核心技術與現況:
Project Iris與Android XR:儘管硬體計畫多次重啟,但Google正與三星、高通合作,開發一個基於Android的開放XR平台,意圖成為XR領域的「Android」,對抗蘋果封閉的visionOS。
DeepMind的模擬環境:Google的王牌在於其頂尖的AI研究實驗室DeepMind。
他們早已在各種模擬環境中訓練AI代理人,從學習在複雜地形中行走到在虛擬足球場上團隊協作(如2024年發布的SIMA計畫)。這些虛擬世界不追求畫面精美,但追求物理真實性和任務複雜性。
Google Maps的3D Immersive View:這是Google將其虛擬世界能力商業化的最佳體現。
它利用AI將數十億張街景和衛星圖像融合成一個城市的、可互動的3D模型。這不僅是導航,更是未來AI代理人在現實世界執行任務(如送貨、導覽)前的「彩排場地」。
Google的虛擬世界可能永遠不會成為一個統一的「產品」,而是像空氣一樣,滲透在其所有服務的背後。它的目標是讓AI透過模擬學會理解並操作物理世界,從而鞏固其在搜尋、助理、乃至未來AGI領域的絕對霸權。
2.5 OpenAI:從語言到物理,Sora敲開世界生成的大門
戰略定位: 生成式AI的王者,從生成內容進化到生成「世界」。
OpenAI最初以大型語言模型(LLM)聞名,但其在2024年初發布的文生影片模型Sora,徹底改變了遊戲規則。Sora的出現,標誌著AI不再只能理解和生成符號(文字),而是開始理解並生成一個具備初步物理一致性的動態世界。
🔴核心技術與現況:
Sora與動態世界模擬:Sora生成的影片之所以令人震撼,不僅在於其逼真度,更在於它展現了對物理世界基本規律的理解:物體被遮擋後依然存在、液體會流動、光影會隨物體移動而變化。這證明OpenAI的野心遠不止於製作影片,而是在訓練一個能夠預測「世界如何運作」的世界模型。
從2D影片到3D空間:Sora的下一步,必然是從生成封閉的2D影片,走向生成可互動、可探索的3D空間。當使用者不僅能「看」AI生成的場景,還能「走進去」與之互動時,OpenAI就擁有了一種無限生成虛擬世界內容的能力。
OpenAI雖然沒有自己的VR頭盔或公開的虛擬世界平台,但它正從最根本的層面——內容生成——切入這場戰爭。如果說NVIDIA提供骨架,Meta提供社交場,那麼OpenAI的目標就是提供構成這個世界源源不絕的「血肉」。
2.6 李飛飛與World Labs:空間智慧,AGI的最後一塊拼圖
戰略定位: 空間智慧(Spatial Intelligence)的開創者,讓AI擁有「腦補」3D世界的能力。
這裡必須補上一個至關重要的名字:史丹佛大學教授、AI領域的傳奇人物李飛飛(Fei-Fei Li)。如果說Sora解決了生成「動態影像」的問題,那麼李飛飛和她的新創公司World Labs則致力於解決一個更根本的問題:讓AI具備「空間智慧」。
🔴核心技術與現況:
大型世界模型(Large World Models, LWMs):這是World Labs的核心理念。它的目標是讓AI具備一種「直覺」——僅僅看著一張2D照片,AI就能瞬間在「腦中」補完它的完整3D結構、物體間的空間關係、深度、體積和物理屬性。這不是渲染,而是理解。
從無到有生成互動世界:基於LWMs,World Labs的技術能夠讓AI從零開始,生成一個具有真實物理回饋、可供使用者或AI代理人自由互動的3D世界。
這意味著未來的機器人或自駕車,看到一個陌生的真實環境時,可以先在腦中生成一個與之對應的「數位孿生」,並在這個虛擬的「心智世界」裡進行模擬和預演,然後再做出行動。
李飛飛的 World Labs 致力於構建「大型世界模型(LWMs)」,並在 2025 年 11 月 推出了他們的第一個商業化虛擬世界產品,名為 Marble。 https://marble.worldlabs.ai/ 旨在賦予 AI 理解三維空間與物理法則的直覺。
與此同時,在自動駕駛領域,英國新創 Wayve 也推出了 GAIA-1(Generative AI for Autonomy)模型,展示了生成式 AI 如何理解並預測複雜的動態駕駛環境。這些來自不同領域的突破性進展,都在證明讓 AI 自主生成與理解世界,是通往下一代智慧的關鍵拼圖。
🟥歷史對位與結論:
2024年,OpenAI的Sora與李飛飛的World Labs幾乎同時浮出水面,這絕非巧合。它標誌著一個時代的結束和另一個時代的開始:「人工手刻3D模型」的時代正在過去,未來的虛擬世界,將由AI根據我們的語言、圖片甚至意念,「即時生成」。
李飛飛的工作,如同一塊畫龍點睛的拼圖,完美地總結了所有巨頭佈局背後的共同渴望。
從NVIDIA的物理模擬,到Meta的社交文明,再到Apple的現實增強和Google的AI試煉場,它們殊途同歸,最終都指向了同一座聖杯:一個能夠讓AI深刻理解空間、物理與因果,並在其中學習、成長、最終與人類共存的數位新世界。
而這場宏大的建造計畫,也正從根本上挑戰著我們對AI、乃至智慧本身的理解,將我們直接帶向下一個核心問題:為什麼當前最主流的AI技術,已然無法滿足這個宏偉的目標?


🎯第三章:現在能「走進去」的世界——實測導覽與創作路線圖
巨頭們的宏圖最終要落到地面。對讀者最有價值的,永遠是那個最樸素的問題:今天,我到底能去哪裡玩、能做什麼、又該如何開始創作?
本章,我將為大家整理,把目前市場上較成熟、普通人可直接上手的「可進入型」虛擬世界,分為三類進行實測解析。這不是一份冰冷的產品列表,而是一張你可以立即按圖索驥、落地探索的冒險地圖。
A. 消費社交型世界(以「人」為核心的遊樂場)
這類世界的首要目標是「連結」。它們優先保證社交的流暢性與趣味性,是體驗虛擬社群文化的第一站。
🔥Meta Horizon Worlds (硬體:Quest 系列)
🔴適合誰:擁有Quest頭盔,想體驗最主流沉浸式社交、參加虛擬派對、並淺嚐AIGC創作樂趣的入門玩家。
可以做什麼:參加官方舉辦的虛擬演唱會(如Post Malone的演出曾吸引數萬人同時在線)、在喜劇俱樂部聽一場虛擬脫口秀、與朋友在私人空間裡玩桌面遊戲。
近期Meta大力投入生成式AI,你可以用簡單的語音指令「給我一座有瀑布的漂浮島嶼」,系統便會自動生成對應的3D物件,極大降低了創作門檻。
🔴入門路線: 完成Quest 2/3的開箱設定後,進入官方教學世界熟悉移動與互動。接著,探索「熱門世界」列表,找到一個感興趣的活動(如尋寶遊戲或音樂派對)加入。
🔴注意事項: 為了維持高幀率(通常在72-90Hz)以避免暈眩,Horizon Worlds在畫質上做了很多妥協,常被詬病為「卡通感」。單次續航力約1.5-2小時,長時間使用建議外接電源。
🔥VRChat (硬體:PCVR / Quest / PC桌面版)
🔴適合誰: 追求極致個性化、熱愛次文化社群、想扮演獨一無二角色的重度玩家與創作者。
可以做什麼: VRChat的靈魂在於UGC(用戶生成內容)。你可以化身為任何你能想像的Avatar(從動漫角色到抽象光影),在玩家自製的「深夜電台」裡聽故事,參加由社群組織的虛擬攝影展,甚至在完全模擬真實夜店的場景裡體驗一場跨國DJ秀。
🔴入門路線: 在Steam或Quest商店下載。第一步是花時間在Avatar世界裡找到或購買一個能代表你的角色。然後,透過社群(如Discord群組)找到固定活動,如每週的「中文吧」,跟著老玩家學習社交禮儀。
進階創作者則需學習Unity SDK來上傳自己的世界和Avatar。
注意事項: 內容品質參差不齊,從電影級的精美場景到粗糙的測試房都有。由於自由度極高,新手可能會感到不知所措,強烈建議先找到組織(社群)再深入探索。
🔥Roblox / Fortnite (UEFN) (創作者經濟導向)
🔴適合誰: 懷抱創作夢,想將「打造世界」作為一份事業,並從中獲得實際收益的個人開發者或小團隊。
🔴可以做什麼: 在Roblox中,你可以開發一款類似《Adopt Me!》(一款曾創下單月6000萬美元營收的寵物養成遊戲)的迷你遊戲。在Fortnite UEFN(虛幻引擎編輯器)中,你可以利用與《要塞英雄》同等級的資產,打造一個電影級的跑酷關卡或社交中心,並根據玩家的遊玩時長參與Epic Games高達40%的淨收入分成。
🔴入門路線:下載Roblox Studio或UEFN。先從複製一個熱門遊戲的核心玩法開始,發布後密切關注後台數據(如首日留存率、平均遊戲時長),並快速迭代。目標不是一次成功,而是做出一個留存率能穩定在15%以上的小型世界。
注意事項: 這兩個平台已是紅海市場。設計上必須以「高重玩性」和「低上手門檻」為最高原則。持續的內容更新與社群運營,比最初的創意更重要。
B. 內容創作/產業級工作流 (以「做世界」為核心的生產線)
這類平台是專業人士的工具,它們的目標不是「玩」,而是「生產」。
🔥NVIDIA Omniverse (硬體:高階NVIDIA RTX顯卡)
🔴適合誰: 建築、製造、汽車、媒體娛樂等行業的專業團隊,以及進行AI研究的學術單位。
🔴可以做什麼:德國鐵路公司正利用Omniverse建立全國鐵路網的數位孿生,以模擬和優化自動駕駛火車的運行。亞馬遜機器人團隊在Isaac Sim中訓練其新一代倉庫機器人,模擬了超過50萬種不同的包裹抓取情境,將AI模型的訓練時間從數月縮短到幾天。
🔴入門路線: 團隊需先將內部使用的3D資產(如CAD模型)標準化為USD格式。
然後透過相應的Connector(如Revit Connector)將模型匯入Omniverse,建立起跨部門、跨軟體的協同工作流。
🔴注意事項: Omniverse更像一個「企業級作業系統」,而非單一軟體。它對硬體(建議RTX 4080以上)、團隊技術力和標準化流程有較高要求。
🔥Unreal Engine / Unity (硬體:PC / Mac)
🔴適合誰: 追求電影級高擬真畫質、複雜互動邏輯的遊戲開發者、虛擬製片團隊和互動藝術家。
可以做什麼: 迪士尼的《曼達洛人》影集大量使用Unreal Engine進行虛擬製片,演員在巨大的LED牆前表演,背景直接渲染出逼真的外星場景。日本的虛擬偶像演唱會,如Ado的演出,也採用遊戲引擎即時渲染,實現了與現場樂隊和觀眾的完美互動。
🔴入門路線: 從官方商店下載引擎。先從一個完整的官方模板(如第一人稱射擊遊戲模板)開始,目標是跑通一個可玩的Demo。然後再從Quixel Megascans或Unity Asset Store等素材庫中獲取高品質資產,優化視覺效果。
注意事項: 製作週期長,專案管理極其重要。一個常見的失敗原因是過度追求完美,導致專案無限延期。效能優化(確保在目標硬體上流暢運行)是從Demo到產品的關鍵一步。
C. 世界模型/研究型平台 (以「讓AI學世界」為核心的實驗室)
這類平台大多處於研究階段,但它們預示了虛擬世界的終極未來。
🔥World Labs (李飛飛) / GAIA-1 等研究項目
適合誰: 關注Large World Models(LWM)和空間智慧前沿發展的AI研究者、博士生和技術愛好者。
可以做什麼: 利用其發布的開源模型和數據集,你可以進行「2D轉3D」的實驗,例如將一段行車記錄器的影片,轉換成一個包含車輛、建築物和道路深度資訊的初步3D場景,並讓一個虛擬代理人在其中學習基本的避障行為。
入門路線: 密切追蹤其在GitHub和arXiv上發布的論文與程式碼。從一個簡單的室內場景圖片開始,嘗試用其模型推斷出房間的佈局和家具的3D位置,完成一個「從靜態到空間」的小型驗證。
注意事項: 這些是前沿研究,功能迭代極快,API可能隨時變動。它們的價值不在於當下的穩定性,而在於讓你提前理解下一代AI與世界互動的範式。
🎯第四章:從「平台」到「文明作業系統」——關鍵變數、風險與台灣路線
當越來越多的「數位地球」並存,這場戰爭的終局,贏家不一定是單一平台,而是誰能率先將人、AI、經濟與規則,整合成一套可持續運作的「文明作業系統」。要理解這場變革的走向,我們必須掌握五個關鍵變數、三條商業主路、四大風險治理,以及一張為台灣量身訂製的機會清單。
🟪五個關鍵變數 (決定誰能撐起下一代世界)
裝置門檻: 輕量化、長續航、穩定性與價格。Meta Quest 3雖將價格壓至500美元,但2小時的續航和近500克的重量仍是巨大阻礙。誰能先做出像太陽眼鏡一樣輕便、可全天佩戴的裝置,誰就掌握了最終的入口門票。
世界模型深度:物理一致性、物體恆存性、因果可解釋性。這決定了AI能否真正「活」在世界裡,而不僅僅是漂浮的3D模型。NVIDIA的Omniverse在此遙遙領先。
代理人能力: AI Agent必須從被動的對話助手,進化為能感知3D環境、自主規劃多步驟任務、並與物理世界互動的「數位居民」。Google DeepMind的SIMA計畫是此方向的代表。
經濟系統: 一個健康的虛擬世界必須有閉環的經濟。Roblox在2023年向開發者支付了超過7億美元的分成,證明了創作者經濟的可行性。如何平衡廣告、訂閱、資產交易與版權治理,是所有平台面臨的核心難題。
互通標準: 以Pixar的OpenUSD為核心的資產互通標準,正像30年前的HTTP協議一樣,決定了內容能否在不同「世界」間自由流動。誰主導了標準,誰就掌握了話語權。
🟪三條商業主路 (錢從哪裡來)
硬體補貼 × 內容抽成 (To C): 以Meta為代表。虧本賣頭盔(每賣一台Quest 3虧損約50-100美元),建立用戶基礎,再從應用商店30%的抽成和未來的虛擬廣告中獲利。
數位孿生 × 產業SaaS (To B): 以NVIDIA為代表。向企業客戶提供高價值的模擬與協同解決方案,收取軟體授權費和顧問服務費。
一個大型製造業的數位孿生專案,合約金額可達數百萬美元。
創作工具 × 市集 (To D - Developer): 以Unity和Epic Games為代表。提供強大的開發引擎,並從素材商店(Asset Store)和遊戲內購中抽取分成,服務廣大的開發者社群,形成長尾經濟。
🟪四大風險治理 (非管不可的潘朵拉魔盒)
隱私與資安: Vision Pro的眼動追蹤數據能精準判斷你的注意力甚至情緒;Quest 3的環境掃描會完整記錄你的居家佈局。這些「上帝視角」的原始數據如何儲存、誰有權存取,是亟待解決的倫理與法律問題。
沉浸成癮與身心健康: 長時間佩戴VR裝置對視力、頸椎的影響,以及虛擬世界的高度沉浸感可能導致的現實脫節問題,都需要平台建立嚴格的「使用時間管理」、「內容分級」和「家長監護」工具。
版權與資產歸屬: 當我用AIGC生成一個世界,這個世界的版權歸誰?當我的Avatar設計被他人抄襲,如何維權?以C2PA為代表的內容溯源技術和基於區塊鏈的NFT確權,是可能的解決方案,但尚未形成共識。
真偽辨識(Deepfake): 在一個超寫實的虛擬世界裡,如何區分真人Avatar和AI代理人?如何防止詐騙者利用你的Persona進行惡意活動?平台級的強制身份標示和內容浮水印將成為不可或缺的基礎設施。
🟣台灣的機會清單
台灣擁有頂尖的硬體製造能力和厚實的產業基礎,在這場世界變革中,我們不應只是代工者,更應成為高價值解決方案的提供者。
製造業數位孿生: 將台灣引以為傲的半導體廠、精密機械產線搬進Omniverse,在投產前進行良率優化、供應鏈壓力測試和機器人協作模擬。
智慧城市與防災模擬: 針對台灣複雜的地理環境,建立城市級的數位孿生,用於模擬地震、颱風、洪水時的應急疏散路線和資源調度。
醫療與教育模擬: 開發高擬真的外科手術訓練、飛行員駕駛模擬、危險化工廠操作演練等沉浸式課程,搶佔專業職訓市場。
文創IP × 虛擬演唱會: 結合台灣豐富的音樂、漫畫、影視IP,打造可持續運營的虛擬粉絲社群世界,而非一次性的線上直播。
🎯收尾:當藍圖展開,請你成為「建築師」
從《割草人》的神經接入,到《駭客任務》的世界模型,再到《頭號玩家》的全球綠洲,我們已經看到:科幻不是預言家的玩笑,而是工程師的待辦清單。
今日的巨頭各自打造平行的「數位地球」,其目的不是讓你逃離現實,而是為了讓人類與AI,在一個更高維度的空間裡共同生活、學習和演化。
這一期,我為你攤開了地圖、畫清了路線:你今天就能進入的世界在哪裡,創作者可以如何把「場景」變成「作品」,又如何把「作品」營運成「世界」。
這不是終點,僅僅是個開始。當我們親手建造這些世界時,很快會發現一個更深刻的挑戰:為什麼我們當前最先進的AI技術,仍難以獨力撐起一個能長期穩定、自我演化、並湧現出真正智慧的虛擬文明?
這個問題,將是我們打開下一扇門的鑰匙——也是我在這個專欄裡,一直最想與你共同探討的、關於AGI的真正課題。
結語:站在 2025 的尾聲,回望未來的起點
寫到這裡,天已經完全亮了。汐止的街道開始嘈雜,新的一天運作如常。
我們剛剛走過了一趟從《割草人》到 Omniverse 的漫長旅程,看見了虛擬世界如何從電影幻想變成科技巨頭的角力場。這不是終點,這只是 AI 進化史上的一個切片。
而當我們把視線從這些數位地球收回,重新聚焦在現實世界時,你會發現 2025 年本身,就是一場比任何科幻電影都更精彩、更混亂、也更具決定性的劇本。
這一年的 AI 發展,速度快到讓人產生時差感。昨天還在驚嘆 Sora,今天李飛飛就拿出了空間智慧;上個月還在討論 GPT-5,下個月新的晶片架構就顛覆了認知。
當然也包括了Gemini 3 Pro多模態理解能力的旗艦級文生圖模型(又名Gemini 3 Pro Image)。它整合了Google搜索的即時知識庫,能理解現實語義與物理邏輯,於2025年11月21日正式全球發佈。
在資訊爆炸的洪流中,哪些是雜訊?哪些是訊號?哪些是炒作?哪些又是真正改變歷史的轉捩點?

🔷【下期預告】🔷
第 28 期:2025 年度 AI 風雲錄——定義未來十年的關鍵轉折點
下一期,我們不談理論,我們看事實。
這將是《生成式 AI 群英傳》的年度壓軸。我將帶你從頭梳理這瘋狂的 2025 年:從模型大戰的勝負手、硬體革命的真面目,到那些曾佔據頭條卻悄無聲息消失的泡沫。
這是一份給所有焦慮者的年度總結報告,也是一份給未來一年的入場指南。
我們12月見。 返回上一頁