稚晖君的智元今天发布了首个通用具身基座模型：智元启元大模型Genie Operator-1

稚晖君的智元今天发布了首个通用具身基座模型：智元启元大模型Genie Operator-1

基于ViLLA架构的通用具身基座大模型，由VLM和MoE组成，整合了视觉、语言、动作、触觉等多模态输入，能直接输出机器人的动作执行序列

相比现有模型，智元启元大模型平均成功率提高了32%

特点 1、结合互联网视频和人类操作视频学习，增强了对人类行为的理解 2、在极少数据甚至零样本下可快速适应新场景和任务 3、一脑多形，可在不同机器人形态之间迁移，快速适配 4、持续进化能力，通过实际执行中的数据回流，可持续学习和进化