黄色A片电影天堂5av,三级黄色日韩中文字幕99页

Meta人事巨震、AI教母站臺通往AGI之路遇上分岔路口

原創(chuàng)

2025-11-15 09:48 星期六

科創(chuàng)板日報鄭遠(yuǎn)方

①LeCun離職創(chuàng)業(yè)投身世界模型，李飛飛公司推出基于世界模型的首款產(chǎn)品，王興興與哈勃也對世界模型表現(xiàn)出高度關(guān)注。
②這是一場關(guān)于智能本質(zhì)的辯論，或?qū)Q定下一個十年誰將引領(lǐng)通往AGI的征途。

《科創(chuàng)板日報》11月15日訊 Meta一場人事巨震，讓業(yè)界目光再次聚焦向世界模型。

Meta首席AI科學(xué)家、圖靈獎得主Yann LeCun（楊立昆）在被曝準(zhǔn)備離職創(chuàng)業(yè)。LeCun在Meta任職12年，技術(shù)發(fā)展愿景卻一直與押注AI大語言模型的扎克伯格相悖，而他創(chuàng)業(yè)公司的核心使命，正是推進(jìn)他多年來心心念念的世界模型架構(gòu)。

在這一場“看似簡單”的人事變動背后，AI發(fā)展已來到岔路口。世界模型還是大語言模型？這是一場關(guān)于智能本質(zhì)的辯論，或?qū)Q定下一個十年誰將引領(lǐng)通往AGI的征途。

無獨(dú)有偶，AI教母李飛飛的創(chuàng)業(yè)公司W(wǎng)orldLabs在11月13日推出了首款產(chǎn)品Marble，由多模態(tài)世界模型驅(qū)動，這個被其稱為“構(gòu)建空間智能未來的基礎(chǔ)”的產(chǎn)品，能從一張圖片、一段視頻或一句話中構(gòu)建持久的3D世界。

大洋彼岸的這一邊，王興興與華為哈勃近日也對世界模型表現(xiàn)出高度關(guān)注：

極佳視界日前完成新一輪億元級A1輪融資，將持續(xù)推進(jìn)世界模型為中心的物理AI智能模型研發(fā)迭代，加速通用具身人形本體研發(fā)，同時將繼續(xù)打造標(biāo)桿場景商業(yè)化應(yīng)用落地。根據(jù)工商變更信息顯示，極佳視界新增投資方為哈勃投資、華控基金。

宇樹科技創(chuàng)始人、董事長王興興則在第八屆虹橋國際經(jīng)濟(jì)論壇上表示，目前具身智能兩種主流模型，一是VLA+RL模型，可以用仿真環(huán)境做訓(xùn)練，或者用真實場景做訓(xùn)練，但也面臨很多挑戰(zhàn)，泛化能力相對不是特別夠。 “而基于視頻生成的世界模型，個人還是非常喜歡。但這個模型面臨比較大的挑戰(zhàn)，中小型機(jī)器人公司這個模型跑不太動，因為視頻生成模型對算力的需求非常大，需要的算力卡比較多，反而是一些大的AI公司、互聯(lián)網(wǎng)公司對視頻模型的資源更加豐富，可以做出來的概率更大一點(diǎn)?！?

▌讀萬卷書，還要行萬里路

盡管具體技術(shù)和產(chǎn)品形態(tài)各異，但“世界模型派”的核心共識是：當(dāng)前主導(dǎo)AI領(lǐng)域的大語言模型存在根本局限。

語言哲學(xué)奠基人維特根斯坦曾《邏輯哲學(xué)論》中提出：“我的語言極限，就是我世界的極限?！钡@對AI而言或許并不適用，李飛飛表示，“我不是哲學(xué)家，但我深知，至少對AI而言，世界遠(yuǎn)不止于文字?！?/p>

在最新萬字長文中她直言，語言終究是人類為了交流而創(chuàng)造出來的一種抽象信號，自然界中本沒有文字，物理世界遵循的是它自身的規(guī)律。AI 如果想要真正地理解世界、與世界互動，就不能只停留在文本的符號游戲里，做一個“黑暗中的文字大師”。

LeCun也多次批評大語言模型，認(rèn)為它們充其量只是一個強(qiáng)大的文本數(shù)據(jù)庫，記住了海量文本，卻完全不理解文本背后的物理世界。

所謂的世界模型到底是什么？

世界模型的本質(zhì)，是通過對真實世界的高維認(rèn)知建模，賦予智能體理解、預(yù)測和規(guī)劃能力。其通過繞開語言轉(zhuǎn)化環(huán)節(jié)，直接將空間感知數(shù)據(jù)輸入模型，在模型潛空間內(nèi)完成物理規(guī)律推演，并直接輸出指令，實現(xiàn)對現(xiàn)實世界的“內(nèi)在理解”與“主動推理”。

用李飛飛的話來說，它能讓“看見”晉升為“推理”，讓“感知”轉(zhuǎn)化為“行動”，讓“想象”落地為“創(chuàng)造”。

它要求AI不僅會讀萬卷書，更能行萬里路——理解一個杯子為何會碎，預(yù)測一輛汽車如何轉(zhuǎn)彎，從而為真正的具身智能、自動駕駛和能與人類無縫協(xié)作的機(jī)器人奠定基石。

值得一提的是，硅谷中聲援世界模型的并非只有李飛飛和LeCun這些技術(shù)大牛，科技巨頭中谷歌同樣也已跑在前列。

短短一年半時間里，其旗下的DeepMind就將世界模型Genie從2D一路升級至能實時生成交互式3D環(huán)境的Genie 3。只需一句話，Genie 3就能在720p分辨率下創(chuàng)造一個用戶可以邊走邊看的動態(tài)世界，場景細(xì)節(jié)能在長達(dá)一分鐘的記憶中保持連貫。除了游戲外，Genie 3還能為機(jī)器人或自動駕駛系統(tǒng)提供多元化訓(xùn)練場景，可以為AI智能體研究提供更長、更穩(wěn)定的交互回合。

必須承認(rèn)，目前世界模型的研究仍處于早期階段。相較于適合快速迭代、短期內(nèi)易于落地的VLA路線，世界模型代表了更底層的認(rèn)知方式，強(qiáng)調(diào)物理規(guī)律和空間理解力，適合長期演進(jìn)。但在這條平行賽道上，一場定義AI下一個十年的角逐已經(jīng)鳴槍起跑，AI正在努力超越文本，嘗試?yán)斫獠⒅厮芪覀兯诘奈锢硎澜纭?/p>

閱107.33W

我要評論

反饋意見