微软Phi系列刚刚上新了两个小模型:Phi-4-multimodal和Phi-4-mini
Phi-4-multimodal:微软首个多模态 56亿参数 可同时处理语音、图像和文字 擅长语音识别、语音翻译、图像理解以及数学推理 在上下文感知交互方面更自然 支持设备端和边缘计算部署 高效低延迟 支持模型定制化 可以用于智能手机(实时翻译、图像分析)、车载系统(安全监测)、工业检测等边缘计算场景
Phi-4-mini:文本模型 38亿参数 支持128K长文本处理 擅长推理、数学、写代码 相比同类小型模型性能更好 支持函数调用 可以用于金融报告生成、多语言文档翻译、代码辅助等
博客:https://azure.microsoft.com/en-us/blog/empowering-innovation-the-next-generation-of-the-phi-family/ 模型:https://huggingface.co/collections/microsoft/phi-4-677e9380e514feb5577a40e4
