国精产品一区二区三区有限|久热香蕉在线视频资源福利站|91岛国在线观看永久|aa片免费看一级片片AV|无码三级在线观看入口|亚洲第一色站妻免费毛A片|日韩免费Av特级无码毛片|天堂av2024|成人免费A级黄色片|91精产国品一二三产免费

Meta人事巨震、AI教母站臺 通往AGI之路遇上分岔路口
原創(chuàng)
2025-11-15 09:48 星期六
科創(chuàng)板日報 鄭遠(yuǎn)方
①LeCun離職創(chuàng)業(yè)投身世界模型,李飛飛公司推出基于世界模型的首款產(chǎn)品,王興興與哈勃也對世界模型表現(xiàn)出高度關(guān)注。
②這是一場關(guān)于智能本質(zhì)的辯論,或?qū)Q定下一個十年誰將引領(lǐng)通往AGI的征途。

《科創(chuàng)板日報》11月15日訊 Meta一場人事巨震,讓業(yè)界目光再次聚焦向世界模型。

Meta首席AI科學(xué)家、圖靈獎得主Yann LeCun(楊立昆)在被曝準(zhǔn)備離職創(chuàng)業(yè)。LeCun在Meta任職12年,技術(shù)發(fā)展愿景卻一直與押注AI大語言模型的扎克伯格相悖,而他創(chuàng)業(yè)公司的核心使命,正是推進(jìn)他多年來心心念念的世界模型架構(gòu)。

在這一場“看似簡單”的人事變動背后,AI發(fā)展已來到岔路口。世界模型還是大語言模型?這是一場關(guān)于智能本質(zhì)的辯論,或?qū)Q定下一個十年誰將引領(lǐng)通往AGI的征途。

無獨(dú)有偶,AI教母李飛飛的創(chuàng)業(yè)公司W(wǎng)orldLabs在11月13日推出了首款產(chǎn)品Marble,由多模態(tài)世界模型驅(qū)動,這個被其稱為“構(gòu)建空間智能未來的基礎(chǔ)”的產(chǎn)品,能從一張圖片、一段視頻或一句話中構(gòu)建持久的3D世界。

大洋彼岸的這一邊,王興興與華為哈勃近日也對世界模型表現(xiàn)出高度關(guān)注:

極佳視界日前完成新一輪億元級A1輪融資,將持續(xù)推進(jìn)世界模型為中心的物理AI智能模型研發(fā)迭代,加速通用具身人形本體研發(fā),同時將繼續(xù)打造標(biāo)桿場景商業(yè)化應(yīng)用落地。根據(jù)工商變更信息顯示,極佳視界新增投資方為哈勃投資、華控基金。

宇樹科技創(chuàng)始人、董事長王興興則在第八屆虹橋國際經(jīng)濟(jì)論壇上表示,目前具身智能兩種主流模型,一是VLA+RL模型,可以用仿真環(huán)境做訓(xùn)練,或者用真實場景做訓(xùn)練,但也面臨很多挑戰(zhàn),泛化能力相對不是特別夠。 “而基于視頻生成的世界模型,個人還是非常喜歡。但這個模型面臨比較大的挑戰(zhàn),中小型機(jī)器人公司這個模型跑不太動,因為視頻生成模型對算力的需求非常大,需要的算力卡比較多,反而是一些大的AI公司、互聯(lián)網(wǎng)公司對視頻模型的資源更加豐富,可以做出來的概率更大一點(diǎn)?!?

▌讀萬卷書,還要行萬里路

盡管具體技術(shù)和產(chǎn)品形態(tài)各異,但“世界模型派”的核心共識是:當(dāng)前主導(dǎo)AI領(lǐng)域的大語言模型存在根本局限。

語言哲學(xué)奠基人維特根斯坦曾《邏輯哲學(xué)論》中提出:“我的語言極限,就是我世界的極限?!钡@對AI而言或許并不適用,李飛飛表示,“我不是哲學(xué)家,但我深知,至少對AI而言,世界遠(yuǎn)不止于文字?!?/p>

在最新萬字長文中她直言,語言終究是人類為了交流而創(chuàng)造出來的一種抽象信號,自然界中本沒有文字,物理世界遵循的是它自身的規(guī)律。AI 如果想要真正地理解世界、與世界互動,就不能只停留在文本的符號游戲里,做一個“黑暗中的文字大師”。

LeCun也多次批評大語言模型,認(rèn)為它們充其量只是一個強(qiáng)大的文本數(shù)據(jù)庫,記住了海量文本,卻完全不理解文本背后的物理世界。

所謂的世界模型到底是什么?

世界模型的本質(zhì),是通過對真實世界的高維認(rèn)知建模,賦予智能體理解、預(yù)測和規(guī)劃能力。其通過繞開語言轉(zhuǎn)化環(huán)節(jié),直接將空間感知數(shù)據(jù)輸入模型,在模型潛空間內(nèi)完成物理規(guī)律推演,并直接輸出指令,實現(xiàn)對現(xiàn)實世界的“內(nèi)在理解”與“主動推理”。

用李飛飛的話來說,它能讓“看見”晉升為“推理”,讓“感知”轉(zhuǎn)化為“行動”,讓“想象”落地為“創(chuàng)造”。

它要求AI不僅會讀萬卷書,更能行萬里路——理解一個杯子為何會碎,預(yù)測一輛汽車如何轉(zhuǎn)彎,從而為真正的具身智能、自動駕駛和能與人類無縫協(xié)作的機(jī)器人奠定基石。

值得一提的是,硅谷中聲援世界模型的并非只有李飛飛和LeCun這些技術(shù)大牛,科技巨頭中谷歌同樣也已跑在前列。

短短一年半時間里,其旗下的DeepMind就將世界模型Genie從2D一路升級至能實時生成交互式3D環(huán)境的Genie 3。只需一句話,Genie 3就能在720p分辨率下創(chuàng)造一個用戶可以邊走邊看的動態(tài)世界,場景細(xì)節(jié)能在長達(dá)一分鐘的記憶中保持連貫。除了游戲外,Genie 3還能為機(jī)器人或自動駕駛系統(tǒng)提供多元化訓(xùn)練場景,可以為AI智能體研究提供更長、更穩(wěn)定的交互回合。

必須承認(rèn),目前世界模型的研究仍處于早期階段。相較于適合快速迭代、短期內(nèi)易于落地的VLA路線,世界模型代表了更底層的認(rèn)知方式,強(qiáng)調(diào)物理規(guī)律和空間理解力,適合長期演進(jìn)。但在這條平行賽道上,一場定義AI下一個十年的角逐已經(jīng)鳴槍起跑,AI正在努力超越文本,嘗試?yán)斫獠⒅厮芪覀兯诘奈锢硎澜纭?/p>

收藏
107.33W
我要評論
圖片
歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
要聞
股市
關(guān)聯(lián)話題
6.02W 人關(guān)注
1.02W 人關(guān)注