《电子技术应用》
您所在的位置:首页 > 人工智能 > 业界动态 > 西湖大学发布机器人领域首个动作泛化大模型

西湖大学发布机器人领域首个动作泛化大模型

领先国际同行6个月以上
2026-03-23
来源:文汇报

日前,西湖大学孵化的西湖机器人公司发布了搭载全球首个机器人领域首个动作泛化大模型人形机器人泰坦o1”,将这一神话场景带入现实——这个名为“GAE身外化身系统”的通用动作预训练大模型,相当于给来自不同厂家的机器人装上了可通用的强大“小脑”,让机器人可突破时空限制,实时模仿人类动作,只需一个人就能操控成百上千个身处天南地北不同地点的机器人“赛博分身”,实时进行同样的操作。

_url=http%3A%2F%2Fdingyue.ws.126.net%2F2026%2F0323%2F4e0e4b2bj00tcbmg60015d000p000gog.jpg

实时复刻动作如影随形

在演示现场,泰坦o1外观呈橙、黑、银拼接,风格颇具未来感。当身着动捕服的工作人员摆手、转身、踢球时,泰坦o1会如影随形地在毫秒间复刻所有动作:无论手臂摆动角度、转身幅度,还是踢球时的步距与抬脚高度,甚至动作节奏,都与工作人员高度一致。

“这些动作并非预先编排,而是对人类随机行为的实时响应。”西湖机器人创始人、西湖大学机器智能实验室研究组长王东林教授介绍,无论操作者是谁、动作如何变化,泰坦o1都能快速跟上。

此外,泰坦o1还有不错的“动作记忆”能力,可通过后台指令复现已示范过的动作。在今年安徽卫视春节联欢晚会上,西湖机器人曾凭借这一能力完成了10台机器人的五禽戏群控表演——仅用数天调试,即可实现自定义动作生成与部署,大幅降低应用门槛。

“只要具备网络环境,穿上动捕设备,就可以远程操控机器人执行任务。”王东林表示,单人可同时控制多台机器人完成一致动作,理论上控制规模不设上限。

最令人惊喜的是,这一系统几乎不设使用门槛。无需编程经验,也不用依赖专业人员指导,用户仅通过动捕设备或电脑端操作,即可让机器人完成对应动作,实现“所想即所动”。

机器人领域首个动作泛化大模型

在人体中,小脑负责协调运动、维持平衡,让动作精准流畅。而GAE则为人形机器人带来了强大的“通用小脑”——它能让机器人在收到信号后瞬间做出最合适的动作。王东林介绍,这套由西湖团队完全自研的算法,比国际上其他团队的同类技术领先至少6个月。

_url=http%3A%2F%2Fdingyue.ws.126.net%2F2026%2F0323%2Fca202ef5j00tcbmg6001wd000p000e2g.jpg

“泰坦o1”在打架子鼓

“目前市面上看到的机器人已经能跑能跳能比武,但其实基本靠提前编程。”王东林说,那就好像“背课文”,需要反复训练才能做到一字不差,而这正是传统机器人的最大技术瓶颈——由于缺乏通用的动作模型,一套程序只能对应一套动作,机器人无法举一反三。

而GAE这个“通用小脑”则能让机器人即使遇到没做过的动作,也能轻松应对。而且,它还具备“跨本体”能力,很多不同结构、不同尺寸的机器人都能搭载这套大模型。

“ChatGPT让AI能理解并生成各种语言,拥有语言的泛化能力;Sora能生成各种视频画面,拥有视觉的泛化能力。”王东林说,GAE则让机器人能模仿和执行各种人类动作,是机器人领域第一个实现动作泛化的大模型。

GAE的问世离不开长期的技术积累与数据支撑。此前,王东林团队已在四足机器人(机器狗)、人形机器人领域深耕多年,积累了丰富的机器人运动控制技术。同时,他们还拥有全球领先、国内最大的高质量全身运动数据集,包含了人类各种日常动作、复杂动作的详细数据,为这颗“通用小脑”提供了充足的“学习素材”。

其实,“分身体验”只是一个开始。王东林表示,泰坦o1更重要的意义在于可替代人类进入高风险场景,如消防救援、矿区作业、高空维护等。

2.jpg

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。