小米开源最新多模态大模型小米MiMo-VL-7B-2508

小米大模型团队近期震撼发布其最新研发的多模态大模型——Xiaomi MiMo-VL-7B-2508,此次发布包括强化学习(RL)与监督微调(SFT)两大版本,为人工智能领域再添新动力。

官方数据显示,新模型在主体推理、文档理解、图形界面定位、视频理解四大核心能力上创下新纪录。其中,MMMU基准测试首次突破70,ChartQA达到94.4,ScreenSpot-v2达到92.5,VideoMME提升至70.8。

此次模型迭代的关键在于对强化学习稳定性的优化以及对监督微调流程的改进。这些努力使得模型在内部VLM Arena的评分从1093.9大幅提升至1131.2,标志着小米大模型团队在技术研发上的又一次飞跃。

尤为新版模型还引入了一项创新功能:用户可以通过“/no_think”指令自由切换“思考”与“非思考”模式。在“思考”模式下,模型会全程展示推理链条,确保控制成功率达到100%;而在“非思考”模式下,模型则直接生成答案,响应速度更快,且成功率高达99.84%。这一功能无疑为用户提供了更加灵活多样的使用体验。

掌柜微信

一对一服务

添加客服微信

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注