稚晖君重磅再发布,智元灵犀X2全能探索机器人上线,运动灵活、交互智能是AI全能伙伴的样子了

2025-03-11

-

分享到:

编者按

 

3月11日,临港联合所属临港康桥园区企业智元机器人正式发布其最新研发的全能探索机器人——灵犀X2。灵犀X2具备完善的运动、交互及作业能力,展示了人工智能与人形机器人技术的完美融合。

 

“最好的作品永远是下一个作品。”

 

3月11日,智元机器人联合创始人、知名科技圈KOL稚晖君(本名:彭志辉)发布视频称:“这应该是我鸽了2年之后,第一次正儿八经地更新视频。”视频中,智元机器人正式发布双足智能交互人形机器人灵犀X2。据介绍,灵犀X2搭载情感计算引擎,集齐运动、交互、作业三智能。

 

 

彭志辉透露,灵犀X2研发了三个月,视频准备了一个月,是其至今最复杂的一个项目。灵犀X2可以像人一样自然走路,也能跑、能转、能骑自行车。灵犀X2还搭载了多模态交互大模型“硅光动语”,能够通过视觉理解和认知世界,与人进行自然、流畅的交互。

 

灵犀X2正式发布

 

参数方面,灵犀X2全身拥有28个自由度,重33.8千克,采用了小脑控制器Xyber-Edge、域控制器Xyber-DCU以及智能电源管理系统Xyber-BMS等先进技术。

 

 

彭志辉介绍,灵犀X2集三重角色于一身——一款支持高自由度、运动能力的双足人形机器人,一款搭载情感计算引擎的智能交互机器人,以及一款初步具备通用任务执行能力的具身机器人。

 

在灵犀X2的本体设计中,彭志辉团队融合了不少创新思考。比如,把机器人的硬件系统,抽象出一系列可复用的核心组件。通过这些组件,可以快速搭建起一套完整、可靠的人形机器人系统。

 

在机体材料的选择上,灵犀X2使用了非常亲和的柔性材料。彭志辉称,机器人并非一定得是钢筋铁骨,其团队甚至一度考虑过化妆用的美妆蛋。

 

 

 

其中更重要的是,机器人运控算法层面的突破。当前,灵犀X2已经转向能力驱动的强化学习,通过结合深度强化学习和模仿学习算法的优势,灵犀X2能跑、能跳、能转,还能踩滑板车、玩平衡车、骑自行车。

 

 

借助大语言模型技术,彭志辉团队为灵犀X2定制了多模态交互大模型“硅光动语”。因此,灵犀X2也是第一台真正具备复杂交互能力的灵动机器人,并拥有了毫秒级的交互反应。

 

视频显示,灵犀X2能与人类打招呼,回答“狗和机器人同时掉水里,先救谁”的难题。据称,视频中的提问并非预先写好,而是完全随机。灵犀X2还拥有通过视觉理解和认知世界的能力,能够区分咖啡与牛奶、阅读使用说明书等。

 

 

在语音和视觉之外,彭志辉团队还把动作模态也集成到了模型当中。据称,灵犀X2可以有呼吸韵律,有跟人类一样的好奇心和注意力机制,也有机器人自己的肢体语言。

 

“我们的终极期待,是希望机器人能够成为构建社会生产力的重要分母。”彭志辉介绍,灵犀X2的本体可以装配包括灵巧手在内的各种末端,也具备精细操作的能力。视频显示,灵犀X2可以完成“针穿葡萄”等技能。

 

“总有人说,人形机器人是浪漫主义陷阱。但是,莱特兄弟的飞机远比空气重,图灵的计算机也曾占满整个房间,事实是大家总会高估一个技术的短期价值,而往往低估它的长期价值。”在视频片尾,彭志辉说道。

 

首个通用具身基座大模型

 

3月10日,智元机器人发布首个通用具身基座模型——智元启元大模型(Genie Operator-1,下称“GO-1”)。基于该模型,机器人可以利用人类视频学习,完成小样本快速泛化,降低具身智能门槛,并成功部署到智元多款机器人本体,持续进化。

 

据介绍,GO-1具有以下亮点:一是从单一任务到多种任务,机器人能够在不同场景中执行多种任务,而不需要针对每个新任务重新训练。二是从封闭环境到开放世界,机器人不再局限于实验室,而是可以适应多变的真实世界环境。三是从预设程序到指令泛化,机器人能够理解自然语言指令,并根据语义进行组合推理,而不再局限于预设程序。

 

“GO-1大模型借助人类和多种机器人数据,让机器人获得了革命性的学习能力。其中,其具备的小样本快速泛化能力对于机器人商业化而言,意味着企业可以以更低成本、更高效率获取数据。”智元相关负责人表示,以倒水为例,通过GO-1,机器人完成这个动作只需要1000条左右数据,而之前可能需要1万条或5万条数据,差别巨大。

 

智元相关负责人表示,人形机器人仅凭硬件本体无法构建核心竞争力,未来竞争的核心战场将聚焦于AI能力。“智元将AI研发作为公司的战略级投入,接下来几个月将发布基于强化学习的基础模型(Foundation Model)。”

 

 

“不做大模型的机器人公司没有未来”

 

基座大模型极其“烧钱”,国内外选择自研大模型的机器人本体厂商屈指可数。作为一家成立仅两年的初创企业,智元机器人为何要在大模型上下“重注”?

 

“从战略角度来看,机器人公司如果不做大模型是没有未来的。没有智能化,没有作业能力,机器人只是一个硬件,能做的事情非常有限。”智元机器人合伙人、研究院执行院长、具身业务部总裁姚卯青向上证报记者如是答道。

 

发布会上,姚卯青进一步透露,智元机器人在大模型上的投入很高,在团队人才的建设上也花了很大力气。“目前,智元机器人有专门研究具身智能算法的科研团队,近期也有很多重量级专家加入我们。我们的具身智能研发团队还在持续招聘中,以吸引更多的优秀专家、青年才俊,打造国内甚至全球的人才第一梯队。”

 

2月21日,面向具身智能,阶跃星辰宣布与智元机器人达成战略合作,共同探索AI+具身机器人应用场景。双方将在哪些领域展开合作?

 

姚卯青回复记者称,后续,围绕阶跃星辰的多模态、认知规划推理、模型训练、工程化等底层模型能力,智元机器人将与之进行深度合作,将阶跃星辰的能力赋能到机器人上面,最终形成“一加一大于二”的效果。

 

在发布会上,姚卯青明确,今年智元机器人的商业化目标是,营收较去年实现数倍增长,出货量预计在数千台左右。产品的应用场景也比较丰富,除了科研、教育市场,还有智元重点开拓的工业、商业、服务业等领域。

 

据悉,截至目前,智元机器人已完成天使轮、A1、A1+等多轮融资,累计募资超过16亿元。2024年10月25日,智元机器人下线100台。2025年1月6日,智元通用具身智能机器人累计下线1000台。

 

延伸阅读

 

临港康桥商务绿洲园区地处大浦东核心区域,园区入驻了以智元机器人为代表的,人工智能、新材料、生物医药等产业邻域的国内外领先企业。园区东邻上海国际旅行度假区、西靠后世博板块,北衔张江高科技园区,是区域位置优越,周边配套完善的知识型创新社区。

 

来源:上海证券报、临港集团