①高盛分析師:人形機(jī)器人技術(shù)拐點(diǎn)仍不明朗,宇樹科技機(jī)器人硬件表現(xiàn)穩(wěn)健,但仍未準(zhǔn)備好履行功能型任務(wù); ②目前的人形機(jī)器人仍停留在“大玩具”階段; ③工業(yè)可能是最先落地場景,家用機(jī)器人道阻且長。
《科創(chuàng)板日報(bào)》2月28日訊(編輯 宋子喬) 2月28日早盤,機(jī)器人板塊走低,截至午間收盤,中大力德跌停,埃夫特、三豐智能跌超10%,鳴志電器、綠的諧波、兆威機(jī)電、豐立智能、步科股份、埃斯頓、拓斯達(dá)等跌超7%。

消息面上,高盛杜茜團(tuán)隊(duì)于2月27日發(fā)布研報(bào)稱,人形機(jī)器人技術(shù)拐點(diǎn)仍不明朗,宇樹科技機(jī)器人硬件表現(xiàn)穩(wěn)健,但仍未準(zhǔn)備好履行功能型任務(wù),給正熱的機(jī)器人板塊澆了一盆冷水。
研報(bào)稱,宇樹人形機(jī)器人H1只有19個(gè)自由度,因此仍然無法處理復(fù)雜而精細(xì)的任務(wù)。關(guān)于商業(yè)化進(jìn)展,宇樹科技表示,未來2-3年人形機(jī)器人難以達(dá)到與人類工人相同的效率,但5-10年后可能會(huì)出現(xiàn)具有實(shí)際意義的應(yīng)用。該公司目前的人形機(jī)器人出貨量為幾百臺(tái),滿足了大學(xué)實(shí)驗(yàn)室研發(fā)以及機(jī)器人數(shù)據(jù)采集和訓(xùn)練的需求。
高盛預(yù)計(jì),到2027/2032年全球人形機(jī)器人出貨量為7.6萬/50.2萬臺(tái),步伐慢于市場預(yù)期,需要更長時(shí)間才能迎來由AI賦能的機(jī)器人。
另據(jù)公開報(bào)道,摩根士丹利在2月17日至21日期間,對中國自動(dòng)化和人形機(jī)器人產(chǎn)業(yè)鏈進(jìn)行了深入調(diào)研,走訪了包括螺絲、減速器、電機(jī)、傳感器等在內(nèi)的多家企業(yè),其調(diào)研報(bào)告稱,盡管在和運(yùn)動(dòng)控制方面進(jìn)展迅速,但要實(shí)現(xiàn)人形機(jī)器人的實(shí)際應(yīng)用仍需算法和硬件的持續(xù)改進(jìn)。
大摩稱,盡管有許多組件供應(yīng)商聲稱他們已經(jīng)開發(fā)并將產(chǎn)品發(fā)送給集成商(包括特斯拉)進(jìn)行測試,但產(chǎn)能建設(shè)(設(shè)備和經(jīng)驗(yàn)豐富的技術(shù)人員/工人)、產(chǎn)能提升(精密加工、產(chǎn)品一致性)在最初幾年都非常具有挑戰(zhàn)性,影響效率、產(chǎn)量和成本。
當(dāng)下人形機(jī)器人的代表產(chǎn)品處于哪一階段?
宇樹科技的人形機(jī)器人G1已經(jīng)對外出售,從第一批嘗鮮者發(fā)出的視頻來看,目前的人形機(jī)器人仍停留在“大玩具”階段,對跳舞、逛街、遛狗(機(jī)器狗)等單一任務(wù)手到擒來,但沒有展現(xiàn)更實(shí)用的應(yīng)用價(jià)值,并不能處理做家務(wù)這類更精細(xì)、更復(fù)雜的任務(wù)。
小鵬汽車CEO何小鵬近日在小鵬X9海外發(fā)運(yùn)儀式上,被問及小鵬人形機(jī)器人的進(jìn)展時(shí)便表示,今天行業(yè)里基本上所有的機(jī)器人都處于L2階段。
能干活的人形機(jī)器人離我們還有多遠(yuǎn)?最先落地場景是什么?
宇樹科技創(chuàng)始人王興興近期在接受央視采訪時(shí)提到,“個(gè)人感覺在今年年底之前,整個(gè)AI的人形機(jī)器人會(huì)達(dá)到一個(gè)新的量級。如果順利的話,到明年或者后年,一些基礎(chǔ)的,比如說服務(wù)業(yè)或者一些工業(yè)其實(shí)基本可以推起來了,但家用可能會(huì)稍微慢一點(diǎn),因?yàn)榧矣每赡軐Π踩缘囊蟾撸€是會(huì)需要技術(shù)相對更成熟一點(diǎn)點(diǎn)。”
從技術(shù)上看,數(shù)據(jù)匱乏扼住了通用機(jī)器人的脖頸。東吳證券詳細(xì)解析了訓(xùn)練出好用的端到端大模型的難點(diǎn)——數(shù)據(jù)瓶頸,目前:
1)數(shù)據(jù)量差距巨大:相較于VLM大模型億條級別的數(shù)據(jù)量,目前機(jī)器人實(shí)際單一場景的訓(xùn)練數(shù)據(jù)量僅僅在千條和萬條級別,差距百倍。
2)機(jī)器人數(shù)據(jù)獲取難度極高:相較于互聯(lián)網(wǎng)上常見的語料供VLM大模型訓(xùn)練,機(jī)器人訓(xùn)練數(shù)據(jù)獲取難度極高。目前有三種數(shù)據(jù)獲取模式:①真實(shí)數(shù)據(jù)遙操采集:問題在于成本極高,目前動(dòng)捕設(shè)備一套價(jià)格在幾十萬區(qū)間,初創(chuàng)企業(yè)如果要靠動(dòng)捕設(shè)備遙操采集數(shù)據(jù),成本非常高;②虛擬生成數(shù)據(jù):例如銀河通用發(fā)布的GraspVLA,通過虛擬仿真技術(shù)生成數(shù)據(jù),用于機(jī)器人訓(xùn)練,但目前難以解決sim-to-real gap。簡單來說,就是用虛擬仿真數(shù)據(jù)訓(xùn)練機(jī)器人效果很差,如果是簡單的抓放搬運(yùn)場景,虛擬數(shù)據(jù)相對可行,但如果涉及到柔性場景,比如說衣服被子等柔性物體,就很難運(yùn)用。因?yàn)樯婕暗饺嵝晕矬w形變仿真,在物理層面本身就很難建模;③真人數(shù)據(jù)映射:UMI和DexCap(斯坦福機(jī)器人團(tuán)隊(duì))等正在探索真人數(shù)據(jù)映射(即采集真實(shí)人的數(shù)據(jù),通過某種映射關(guān)系轉(zhuǎn)化為機(jī)器人數(shù)據(jù)),但目前還比較早期。
3)遙操采集的數(shù)據(jù)本身存在毒性:①人在運(yùn)動(dòng)過程中會(huì)有額外的運(yùn)動(dòng)軌跡:例如簡單的搬箱子,人在遙操錄制過程中,可能會(huì)因?yàn)橥饨绺蓴_停頓幾秒,但這個(gè)停頓對于機(jī)器人來說就存在毒性,因?yàn)槠錈o法理解人為什么要停頓;②人的運(yùn)動(dòng)軌跡和機(jī)器人不一致:目前市面上大量機(jī)器人都是以旋轉(zhuǎn)關(guān)節(jié)為主,而人的上下肢是直線關(guān)節(jié),因此同樣是搬箱子的動(dòng)作,人和機(jī)器人的運(yùn)動(dòng)軌跡就是不一致的,這時(shí)候用真人的數(shù)據(jù)去訓(xùn)練機(jī)器人本身就存在毒性。
4)機(jī)器人本體方案未收斂導(dǎo)致數(shù)據(jù)難以復(fù)用:例如用特斯拉本體采集的數(shù)據(jù)很難給智元的機(jī)器人來訓(xùn)練,因?yàn)楸倔w方案不同。
該機(jī)構(gòu)表示,真實(shí)的情況是,業(yè)界目前還無法解決上述數(shù)據(jù)端的問題。但目前各家都選擇在自己的方案上努力收集數(shù)據(jù),先在單一場景下實(shí)現(xiàn)一定程度的泛化,從而讓更多人形機(jī)器人投入實(shí)際運(yùn)用。該機(jī)構(gòu)認(rèn)為可能是3-5年后,當(dāng)市場上有足夠多的人形機(jī)器人數(shù)據(jù),并且硬件方案逐步收斂,具身智能基礎(chǔ)模型呈現(xiàn)出一定的智能涌現(xiàn),才有可能實(shí)現(xiàn)真正的端到端具身智能大模型。
