稚晖君的智元今天发布了首个通用具身基座模型:智元启元大模型Genie Operator-1

基于ViLLA架构的通用具身基座大模型,由VLM和MoE组成,整合了视觉、语言、动作、触觉等多模态输入,能直接输出机器人的动作执行序列

相比现有模型,智元启元大模型平均成功率提高了32%

特点 1、结合互联网视频和人类操作视频学习,增强了对人类行为的理解 2、在极少数据甚至零样本下可快速适应新场景和任务 3、一脑多形,可在不同机器人形态之间迁移,快速适配 4、持续进化能力,通过实际执行中的数据回流,可持续学习和进化

论文:https://agibot-world.com/blog/agibot_go1.pdf

image.png

stodownload.mp4