美团也入局大模型了,放出了:LongCat-Flash,560B,MoE

内置动态计算机制,可以根据上下文需求只激活186亿到 313亿参数,平均约270亿 128K上下文 采用Shortcut-connected MoE / ScMoE架构,扩展了计算-通信重叠窗口,实现了超过每秒100 token的推理速度 具备代码生成和使用工具完成复杂任务的能力

模型:https://huggingface.co/meituan-longcat/LongCat-Flash-Chat

image.png