泡泡资讯网

阿里巴巴近日正式发布千问大模型家族首个完整的具身智能模型系列——Qwen-Rob

阿里巴巴近日正式发布千问大模型家族首个完整的具身智能模型系列——Qwen-Robot,以一套涵盖“手、脚、脑”的全栈技术矩阵,为包括车载机器人在内的各类智能体迈向规模化落地提供了坚实的技术支撑。

此次发布的Qwen-Robot系列包含三大核心模型:专注于精细操作的视觉-语言-动作(VLA)模型Qwen-RobotManip、负责空间理解与路径规划的视觉-语言-导航(VLN)模型Qwen-RobotNav,以及构建环境认知的世界模型Qwen-RobotWorld。这一组合被形象地比喻为给机器人装上了“灵巧的手”、“认路的脚”和“会思考的大脑”。

从技术架构来看,Qwen-RobotManip作为VLA操作模型,解决了传统机器人控制中任务泛化能力弱的痛点,能够理解自然语言指令并直接输出动作轨迹,极大提升了机械臂在非结构化环境下的操作上限。而Qwen-RobotNav则强化了移动机器人的空间感知与决策闭环能力,这对于厂区物流AGV及未来具备自动驾驶能力的移动空间至关重要。

具身智能大模型