这是个利好小米的大消息,小米正式发布开源模型MiMo-V2-Flash,采用MoE架构,总参数3090亿、活跃参数150亿,性能比肩DeepSeek-V3.2、Kimi-K2等头部模型。其以MIT协议开源,基础权重已上线Hugging Face,凭借架构创新实现150 tokens/秒的推理速度,每百万token输入0.1美元、输出0.3美元的超低成本,还支持深度思考与联网搜索,兼顾日常对话与实时数据场景需求。

这是个利好小米的大消息,小米正式发布开源模型MiMo-V2-Flash,采用MoE架构,总参数3090亿、活跃参数150亿,性能比肩DeepSeek-V3.2、Kimi-K2等头部模型。其以MIT协议开源,基础权重已上线Hugging Face,凭借架构创新实现150 tokens/秒的推理速度,每百万token输入0.1美元、输出0.3美元的超低成本,还支持深度思考与联网搜索,兼顾日常对话与实时数据场景需求。

猜你喜欢
【2评论】【2点赞】
【2评论】
【19评论】【2点赞】
【129评论】【40点赞】
【17评论】【6点赞】
【30评论】【4点赞】
【20评论】【1点赞】
作者最新文章
热门分类
科技TOP
科技最新文章