起底豆包手机豆包手机核心技术探索早已开源 3万台首批备货被一抢而空、在二手市场价格翻番的当红炸子鸡“豆包手机”,更多技术详情得到证实。事实证明,豆包手机助手技术预览版背后,是字节在“系统级GUI Agent”赛道上布局了近两年的大棋。在官方演示中,搭载在工程样机nubia M153上的它,能代替用户操作手机,跨应用自动化执行任务。比如一次性下达多个指令,让它一口气完成在飞书上代为请假、提交差旅申请、预订出差高铁票等复杂任务。而据量子位最新打听到的消息,这套图形界面操作能力,正是建立在字节自研的UI-TARS模型基础之上。开发者对此系列模型应该并不陌生。初代一经开源便引发热议,被评价性能优于当时曝光的OpenAI Operator(UI-TARS在Operator正式发布前就已发布)。“豆包手机”使用的则是UI-TARS闭源版本,不仅性能优于其开源版本,还针对Mobile Use进行了大量优化。换言之,豆包手机助手的核心技术探索方向,实际上早就开源了。PS:关键后来正式发布的Operator,还要开200美元一个月的Pro会员才能用……UI-TARS详情介绍:网页链接


