①豆包手機(jī)助手上機(jī)引發(fā)的微信、銀行等App集體預(yù)警,這種沖突的核心并不在于用戶授權(quán),核心是AI助手與App開發(fā)者之間的博弈; ②頭部大模型廠商擁有能力優(yōu)勢(shì),手機(jī)廠在AI層面并無明顯優(yōu)勢(shì),但“系統(tǒng)級(jí)控制權(quán)”,手機(jī)廠一定會(huì)抓在手里。
《科創(chuàng)板日?qǐng)?bào)》12月4日訊(記者 張洋洋)豆包手機(jī)助手掀起Agent上機(jī)第一場(chǎng)輿論風(fēng)暴。
近兩日,多名用戶在社交媒體反饋,在使用豆包AI手機(jī)助手操作微信時(shí),觸發(fā)微信“登錄環(huán)境異常”提示,導(dǎo)致微信強(qiáng)制退出且無法正常登錄。根據(jù)一名用戶向《科創(chuàng)板日?qǐng)?bào)》記者提供的手機(jī)界面顯示,“你的微信登錄環(huán)境存在異常。為了賬號(hào)安全,請(qǐng)更換設(shè)備重新登錄?!?/p>
該用戶稱,其手機(jī)啟用了豆包AI手機(jī)助手,最初可以登錄上微信,并且使用了該助手的平臺(tái)比價(jià)、信息收集等功能,沒有操作微信,不久后即被強(qiáng)制下線且無法登錄,但在換手機(jī)后可以登錄。

而在農(nóng)業(yè)銀行、建設(shè)銀行等App端,也先后出現(xiàn)了針對(duì)AI 、手機(jī)屏幕共享監(jiān)測(cè)以及風(fēng)控措施。多名用戶反饋,在使用豆包AI手機(jī)助手時(shí),遭到了農(nóng)行、建行App內(nèi)的強(qiáng)彈窗提醒,要求關(guān)閉AI手機(jī)助手后再進(jìn)行使用。

此事件成為 AI Agent “上機(jī)”后的首場(chǎng)大規(guī)模沖突,也直接暴露AI手機(jī)助手在現(xiàn)有手機(jī)系統(tǒng)生態(tài)內(nèi)的底層矛盾。
▍豆包助手深夜發(fā)文回應(yīng):不存在黑客行為,權(quán)限已向用戶披露
針對(duì)微信強(qiáng)制下線事件,豆包手機(jī)助手微信公眾號(hào)12月3日深夜發(fā)文進(jìn)行了聲明,公司稱下線了手機(jī)助手操作微信的能力,目前,nubia M153上被禁止登錄的微信賬號(hào)正陸續(xù)解封,請(qǐng)用戶等待一段時(shí)間并嘗試重新登錄。
針對(duì)用戶質(zhì)疑的未經(jīng)授權(quán),侵犯隱私乃至黑客突破系統(tǒng)限制等言論,豆包手機(jī)助手方面回應(yīng)表示,不存在任何黑客行為。INJECT_EVENTS確實(shí)是系統(tǒng)級(jí)權(quán)限,技術(shù)實(shí)現(xiàn)依賴Android系統(tǒng)級(jí)權(quán)限,有更嚴(yán)格的使用限制。擁有該權(quán)限許可,相關(guān)產(chǎn)品才能跨屏、跨應(yīng)用來模擬點(diǎn)擊事件,完成用戶操作手機(jī)的任務(wù)需求。
豆包官方稱,豆包手機(jī)助手需要用戶主動(dòng)授權(quán),才可以調(diào)用該權(quán)限,使用操作手機(jī)功能。該權(quán)限的使用,豆包手機(jī)助手也在權(quán)限清單中進(jìn)行了明確的披露。目前行業(yè)的AI助手,均需要使用該權(quán)限(或與其類似的無障礙權(quán)限)才能提供操作手機(jī)的服務(wù)。
豆包手機(jī)助手方面表示,自身也不會(huì)代替用戶進(jìn)行相關(guān)授權(quán)和敏感操作。在使用該權(quán)限時(shí),建立了透明的管理體系。豆包手機(jī)助手在執(zhí)行長(zhǎng)任務(wù)時(shí)會(huì)在屏幕有明確提示,且用戶可以隨時(shí)中斷,全程可控。操作第三方App若遇到敏感授權(quán),如系統(tǒng)敏感權(quán)限授權(quán)彈窗、支付環(huán)節(jié)、身份驗(yàn)證等,任務(wù)會(huì)暫停,并由用戶人工接管完成相關(guān)授權(quán)、支付、驗(yàn)證動(dòng)作,豆包手機(jī)助手不會(huì)代替用戶進(jìn)行相關(guān)授權(quán)和敏感操作。
那么,AI手機(jī)助手在行使功能時(shí),具有讀取屏幕的能力,如何在有該能力的同時(shí),確保用戶隱私不被泄露?
豆包手機(jī)助手則回應(yīng)稱,“非常重視用戶隱私”,比如,手機(jī)助手不會(huì)在云端存儲(chǔ)任何用戶屏幕內(nèi)容。當(dāng)用戶給助手指令,要求操作手機(jī)時(shí),助手確實(shí)需要讀取屏幕,否則無法完成用戶任務(wù),但屏幕和操作過程都不會(huì)在服務(wù)器端留下存儲(chǔ),且所有的相關(guān)內(nèi)容也都不會(huì)進(jìn)入模型訓(xùn)練,確保用戶隱私安全。
豆包手機(jī)助手強(qiáng)調(diào),此次發(fā)布的是一個(gè)“技術(shù)預(yù)覽版”,是一款面向行業(yè)、AI技術(shù)愛好者的探索產(chǎn)品,部分功能和交互比較創(chuàng)新,目前也沒有明確的行業(yè)共識(shí)。這也是豆包手機(jī)助手選擇用“預(yù)覽版”、少量發(fā)售形式的原因。這款產(chǎn)品目前并不面向普通的消費(fèi)者。
▍技術(shù)專家:AI助手與App開發(fā)者之間的博弈
曾任兩家互聯(lián)網(wǎng)大廠安全業(yè)務(wù)的安全專家張耀(化名)向《科創(chuàng)板日?qǐng)?bào)》記者解釋到,豆包助手所使用的能力,本質(zhì)上屬于通過系統(tǒng)權(quán)限,在客戶端模擬用戶對(duì)其他App的操作。豆包AI助手操作指令并非用戶本人直接發(fā)起,第三方應(yīng)用(如微信)會(huì)識(shí)別到“非典型用戶行為”,自然會(huì)觸發(fā)風(fēng)控機(jī)制。
張耀告訴《科創(chuàng)板日?qǐng)?bào)》記者,手機(jī)操作系統(tǒng)出于安全考慮,一直都采用沙箱機(jī)制隔離應(yīng)用,不允許一個(gè)App直接訪問另一個(gè)App的數(shù)據(jù)。AI助手要跨應(yīng)用執(zhí)行任務(wù),就必須請(qǐng)求額外權(quán)限,而這本身就可能引發(fā)爭(zhēng)議。
“如果AI助手不在服務(wù)端代理登錄,那就在客戶端觸碰了不同應(yīng)用的數(shù)據(jù)訪問邊界,應(yīng)用開發(fā)者自然會(huì)敏感”。
在張耀看來,這種沖突的核心并不在于用戶授權(quán),而是AI助手與應(yīng)用開發(fā)者之間的博弈,當(dāng)用戶選擇使用 AI 助手時(shí),實(shí)際上失去了對(duì)“是否允許某個(gè)App被代理操作”的選擇權(quán)。
張耀向《科創(chuàng)板日?qǐng)?bào)》記者表示,這類沖突并不會(huì)很快解決,“要一家一家去協(xié)調(diào),非常難”,且很多應(yīng)用不會(huì)同意被代理操作,強(qiáng)勢(shì)的第三方開發(fā)者也會(huì)抵制,“比如微信就強(qiáng)勢(shì)拒絕在一臺(tái)設(shè)備上多開”。
在張耀看來,這類AI助手上機(jī)過程中,真正擁有主動(dòng)權(quán)的是手機(jī)廠商。AI時(shí)代,大模型上機(jī)是必然,因此廠商可能會(huì)傾向自建系統(tǒng)級(jí)AI助手,而不是將權(quán)限交給第三方模型,比如小米就一直有自己的小愛同學(xué)。
然而,這也面臨現(xiàn)實(shí)困難:手機(jī)廠掌握底層系統(tǒng)權(quán)限,但不一定具備做好AI助手的能力,畢竟誰都不是華為小米和蘋果,最終市場(chǎng)可能出現(xiàn)手機(jī)廠商各自復(fù)制一套AI助手的割裂局面,“模型開源,也許是最終的解決辦法”。
▍AI大模型廠商仍有空間 但手機(jī)廠不會(huì)輕易放權(quán)
在更宏觀的競(jìng)爭(zhēng)層面,張耀指出,頭部大模型廠商擁有能力優(yōu)勢(shì),手機(jī)廠在AI層面并無明顯優(yōu)勢(shì),但“系統(tǒng)級(jí)控制權(quán)”手機(jī)廠一定會(huì)抓在手里。
“豆包和中興合作只是開始,要做大,還得和更多廠商合作。但手機(jī)廠不會(huì)讓任何一個(gè)模型‘通吃’?!睆堃e例稱,蘋果手機(jī)也在采用合作模式,中國(guó)區(qū)采用百度模型,美國(guó)區(qū)采用自家體系,這一分拆反映出系統(tǒng)層主導(dǎo)、模型層協(xié)作的行業(yè)方向,同時(shí)也是符合中美兩國(guó)法規(guī)安全的必然。
從手機(jī)系統(tǒng)生態(tài)目前的發(fā)展情況來看,Omdia分析師鐘曉磊告訴《科創(chuàng)板日?qǐng)?bào)》記者,當(dāng)前,盡管手機(jī)廠商在接入不同大模型方面展現(xiàn)出高度開放的態(tài)度,但AI生態(tài)的碎片化依然客觀存在:一方面,不同模型之間的上下文信息流通仍未完全打通;另一方面,模型與具體應(yīng)用之間的信息共享機(jī)制也尚未完全形成。
“目前以模擬用戶操作為核心的Agent模式具備高度泛用性,但既容易觸及應(yīng)用側(cè)的風(fēng)控邊界,也難以真正解決效率瓶頸?!辩姇岳谡J(rèn)為,未來,行業(yè)仍需要通過應(yīng)用與模型之間的開放協(xié)議或標(biāo)準(zhǔn)化API來實(shí)現(xiàn)數(shù)據(jù)傳輸,以系統(tǒng)性化解風(fēng)控與協(xié)作效率的問題。
鐘曉磊強(qiáng)調(diào),AI時(shí)代的競(jìng)爭(zhēng),本質(zhì)上是“系統(tǒng)對(duì)系統(tǒng)”,而非“廠商對(duì)廠商”,對(duì)于安卓生態(tài),其最大挑戰(zhàn)并不是模型能力,而是系統(tǒng)碎片化程度高,廠商與開發(fā)者之間的話語權(quán)分散,隱私和數(shù)據(jù)安全難以統(tǒng)一。這些因素在AI上機(jī)時(shí)代尤其關(guān)鍵,可能成為未來面對(duì)鴻蒙、iOS時(shí)的最大隱患。
