发布时间:2025-12-17
点击次数: 小米正式开源 xiaomi mimo-v2-flash——一款由小米自主研发、专为极致推理性能优化的 moe 大模型,总参数量达 309b(激活参数仅 15b)。该模型创新性融合 hybrid 注意力机制与多层级 mtp 推理加速技术,在多项 agent 能力评测中稳居全球开源模型前两名;其代码生成能力超越所有现有开源模型,与顶级闭源模型 claude 4.5 sonnet 持平,而推理成本仅为后者的 2.5%,生成速度更提升至 2 倍,真正实现了大模型效果与效率的双重突破。

MiMo-V2-Flash 模型整体架构如下:

MiMo-V2-Flash 核心设计亮点:
采用比例为 5:1 的 Sliding Window Attention(SWA)与 Global Attention(GA)协同结构,滑动窗口大小设为 128,原生支持 32K 上下文,并在训练中扩展至 256K。大量前期实验表明,SWA 在通用性、长文本建模及推理稳定性方面全面优于主流 Linear Attention,同时具备固定尺寸的 KV Cache,极大简化了与现有训练与推理基础设施(Infra)的集成适配流程。
通过 Multi-Token Prediction(MTP)方式强化基座模型能力,并在推理阶段实现多 Token 并行验证,有效缓解传统自回归解码在大 Batch 场景下的显存带宽瓶颈。实测数据显示:启用 3 层 MTP 后,接收长度提升 2.8~3.6 倍,端到端推理加速比达 2.0~2.6 倍。
综上,MiMo-V2-Flash 凭借模型结构与训推系统深度协同的创新设计,可在不同硬件平台上灵活调节 Batch Size 与 MTP 层数,充分释放 GPU 算力,兼顾高吞吐、低延迟与极致推理性能。
T
opaz Video AI
一款工业级别的视频增强软件
511
查看详情
Xiaomi MiMo-V2-Flash 全量模型权重与推理代码均已开源。配套 API 当前限时免费开放,Web 版 Demo 已正式上线。

访问 platform.xiaomimimo.com,即可无缝接入 Claude Code、Cursor、Cline、Kilo Code 等主流开发框架。
立即前往 MiMo Studio Web 端:aistudio.xiaomimimo.com,免费体验模型能力。
源码地址:点击下载
以上就是小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型的详细内容,更多请关注其它相关文章!
# ai
# win
# claude
# 小米
# 集体建设用地出让网站
# 桂园网站推广方案
# seo 应用哪些标签
# 河南实力网站优化首选
# 海东爱采购关键词排名了解
# 洛阳全网推广营销中心
# 创业小项目网站建设建议
# 衡水营销推广要多少钱
# 稳定seo推广咨询
# 莆田抖音优化seo
# 设为
# 此前
# 北京
# 首家
# 被称为
# 仍是
# 并在
# 徐州
# 基座
# 开源
# red
# 大模型
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
微软和谷歌面临的人工智能困境:需要投入大量资金才能获得盈利
AI 模型 Stable Diffusion 升级:正常生成五指、图像更逼真
成都大运会闭幕式引入人形机器人展示表演
能抓取玻璃碎片、水下透明物,清华提出通用型透明物体抓取框架,成功率极高
比尔盖茨:AI确实存在风险,但可控
“风乌”气象大模型科学家团队:用AI预报极端天气未来不是梦!
出门问问亮相2025世界人工智能大会,展示AI CoPilot解决方案
人形机器人概念集体爆发,能买吗?
日新月异,脑机接口技术都有哪些新应用?
映宇宙数字人“映映”亮相ChinaJoy,展示AI黑科技实现用户互动
智能客服进入AI 2.0时代 容联云发布语言大模型“赤兔”
原小米 9 号员工李明打造全球首款 AI 安卓桌面机器人
《共同的演化》展览启幕,重新思考人类与人工智能关系
1.6亿美元收购Singularity AI,昆仑万维布局通用人工智能
梦想实现!硬核科幻大片VR智能头盔即将问世
华为云发布华为云盘古模型3.0和升腾AI云服务,亮点亮相2025华为开发者大会
AI连线 | 专访风平智能CEO林洪祥:让AI数字人拥有漂亮的外表和有趣的灵魂,安全问题是重要考量
引领AI变革,九章云极DataCanvas公司重磅发布AIFS+DataPilot
网友自制 AI 版《流浪地球 3》预告片,登上 CCTV6
静安大宁功能区企业云天励飞亮相2025世界人工智能大会,秀出AI硬实力!
阿里云全面支持Llama2训练部署,助力企业快速构建自有大型模型
70年前他本想逃避考试,却影响了整个互联网
Ai智能机器人,chat-免注册登入,直接使用新版gpt4.0!
2025VR&AR显示技术峰会展示歌尔光学最新一代光学模组
苹果式 AI 哲学:不着一字,处处落子
今年,全球客服中心支出将增长 16.2%,迎接对话式 AI 的浪潮,根据 Gartner 报告
“苏南 vs 苏北” AI 分胜负,娱乐性比较工具 EitherChoice 上线
小米又拿下国际比赛第一:AI翻译立功
AI 程序 Text With Jesus 在海外迅速受到关注:与耶稣和撒旦进行对话
英伟达推出 L40S GPU,AI 推理性能超过 A100 约 1.2 倍
编程已死,AI 当立?教授公开“唱反调”:AI 还帮不了程序员
人工智能进入绿植界,智能庭院市场初具规模
RoboNeo安装教程
移远通信率先完成多场5G NTN技术外场验证,为卫星物联网应用落地提速
微软 Azure AI 文本转语音服务升级:新增男性声音和扩展语言支持
前特斯拉总监、OpenAI大牛Karpathy:我被自动驾驶分了心,AI智能体才是未来!
Nature发AIGC禁令!投稿中视觉内容使用AI的概不接收
微软更新服务协议,以防止通过AI服务进行逆向工程和数据抓取
【搞事】时隔4年 谷歌更新安卓logo 机器人头更饱满了
音乐制作元工具AudioCraft发布开源AI工具
微软向美国政府提供GPT大模型,如何保证安全性?
OpenAI限制网络爬虫访问以保护数据免被用于AI模型训练
解决导航“最后50米”难题 高德地图升级AR步行导航找终点功能
常见的五个人工智能误解
首个算网生态体!中国移动元宇宙产业联盟正式成立
企业软件行业更将被AI全面重构!Moka李国兴:未来优秀组织和个人将一定是善于使用AI生产力的
AI新风口?首个高质量「文生视频」模型Zeroscope引发开源大战:最低8G显存可跑
携程发布旅游行业垂直大模型 梁建章:AI策略是做可靠的内容 放心的推荐
令人惊叹!AI模型能够以iPhone照片为基础创作诗歌
iPhone两秒出图,目前已知的最快移动端Stable Diffusion模型来了