我这两天在找一些具身智能相关的材料,刚好看到一组数据,很震惊。
物理AI的真机交互数据量,大概只有大语言模型训练数据的十万分之一。
十万分之一,如此夸张的对比......ChatGPT能靠几十万亿词的文本喂出来,但来到机器人这边,连这个数据的零头都凑不齐。
我之前一直觉得,具身智能的瓶颈是算法,或是硬件。但深入了解之后我发现,最底层的卡点其实还是数据。
今天,我刚好刷动态看到觅蜂科技在上海张江开了场发布会,把他们的一站式物理AI数据服务平台正式推出来了。
我花了点时间把发布会相关的信息过了一遍,发现这家公司正在做的事情,真的被严重低估了。
1先聊一个背景。
我们现在聊AI,聊的基本上还是数字世界的AI,比如写文章、画图、做视频、写代码。
但物理AI不同,它需要让智能体走进真实世界,去端杯子、拧螺丝、整理货架、叠衣服。
从数字世界到物理世界,听起来只是场景换了,但底层的数据逻辑完全不同。想要有真机交互数据,你得有一台真实的机器人,配上专用传感器,在特定的场景里,由操作人员遥控着完成一个个动作,同时记录下所有维度的信息。
更麻烦的是,就算你花了大价钱采了一批数据,拿到手一看,格式不统一,标注规范不一样,坐标系定义还对不上。
这就是业内说的数据荒漠。摩根士丹利预测2050年全球具身智能市场规模5万亿美元,这么大的赛道,此刻却被一个最基础的问题卡脖子。
所以当我看到觅蜂把自己定位成「物理AI数据服务平台」的时候,我的第一反应是:这是一个很好的切入点。
2但关键,还是要看他们怎么做。
这里面让我觉得有意思的是觅蜂对问题的拆解方式。
数据荒漠这个问题,拆开来看其实是三层:没数据、数据差、数据不流通。大部分团队解决的是第一层,拼命采集。
但觅蜂同时在解决三层,而且解决的方式不太一样。
先说采集这一层。传统方案是依赖机器人本体的,你得有真机才能录数据。
觅蜂这次发布的MEgo系列,思路反过来了:不用机器人本体,让人来采。
MEgo Gripper是一个480克的采集夹爪,差不多一瓶矿泉水的重量。你拿在手上正常做操作,它就能以毫米级精度捕捉你的动作轨迹、力度、触觉信息。
MEgo View是一个头戴式的空间感知设备,超过300度全景视角加上腕部特写,所有通道1080p 60帧,传感器之间的时间同步做到亚毫秒级。
两个设备配合起来,你去超市整理货架、去家里叠衣服、去工厂拧螺丝,走到哪儿就采到哪儿。
我前段时间跟几个做机器人的朋友聊这个问题的时候,他们最在意的不是采集本身,而是:无本体采集的数据,和真机数据之间有多大差异?
因为很多无本体方案的痛点就在这里。采集端和部署端的硬件差异太大,传感器布局不一样、视角不一样,中间要做大量算法补偿才能把数据用起来。
觅蜂的解法是从硬件设计层面就把这个问题堵住,MEgo系列和智元机器人的精灵G2 Air在夹爪和传感器布局上做了同构设计。
3但采集只是第一步,原始数据到能用的训练数据之间,还隔着一条叫「数据治理」的鸿沟。
觅蜂同步发布了MEgo Engine数据治理平台,覆盖了从原始数据到训练数据的完整链路,其中标注效率比传统人工标注提升了十倍以上。
而且它和MEgo系列采集设备是直接打通的,采完的数据一键上传,全流程自动化处理,最后输出的就是可以直接拿去训练的标准化数据集。
采集加治理的完整闭环,才是真正的护城河。
不过让我觉得更有意思的,是它选择的模式。
觅蜂做的不是传统的数据乙方生意,那种甲方下单、乙方采集交付,一单一单地做。这种模式的问题很明显:标准不统一,规模上不去,供需匹配效率低。
觅蜂走的是平台模式,它要在数据的需求方和供给方之间搭一个基础设施。需求方在平台上找数据,供给方在平台上找订单,觅蜂提供标准、工具和撮合能力。
但这个市场还太早期了,供给和需求两边都还没成规模。
所以觅蜂同时发起了蜂巢数据共创行动,联合上电科、国家数据标委会、工信部赛迪研究院一起,拉了北京国地、上海国地、灵初、光轮智能等几十家机构作为首批参与方。
目标是:打破数据孤岛、统一数据标准、链接全球供需。
觅蜂还有一个比较独特的优势:它不是从零开始的。
觅蜂的创始人姚卯青之前在智元机器人做合伙人和高级副总裁,牵头建了行业最大的数据采集超级工厂,开源了AgiBot World数据集。
这个数据集在Hugging Face上下载量超过110万,GitHub星标接近三万;而且,觅蜂还为英伟达GR00T系列模型提供了80%的预训练真机数据,是目前全球最大的具身真机数据供给方。
它现在做的事情,是把这些能力从自有体系里解耦出来,变成一个开放的平台。
5发布会的圆桌论坛上有个共识:具身智能的核心竞争,本质上是数据采集与转化效率的竞争。
现在做具身智能的公司很多,大家也各有所长,但没有足够量级和质量的数据去训练,最终都很难真正落地。
圆桌上大家预计2026年底全产业有效数据量级将突破千万小时,觅蜂给自己定的目标也是2026年千万小时级产能,2030年百亿小时级。
在这个时间节点上,觅蜂选择做整个产业最基础的那一层。就像淘金热里卖铲子的人,不管最后谁挖到金子,铲子总是要买的。
觅蜂正在建的,不只是一把铲子,还有从铲子到矿石加工到交易市场的一整条链路。采集硬件、数据治理、平台撮合、标准制定,这四件事串起来,才构成完整的基础设施。
而市场,最终也会给出答案。