400 128 6709

行业新闻

小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型

发布时间:2025-12-17点击次数:

小米正式开源 xiaomi mimo-v2-flash——一款由小米自主研发、专为极致推理性能优化的 moe 大模型,总参数量达 309b(激活参数仅 15b)。该模型创新性融合 hybrid 注意力机制与多层级 mtp 推理加速技术,在多项 agent 能力评测中稳居全球开源模型前两名;其代码生成能力超越所有现有开源模型,与顶级闭源模型 claude 4.5 sonnet 持平,而推理成本仅为后者的 2.5%,生成速度更提升至 2 倍,真正实现了大模型效果与效率的双重突破。

小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型

MiMo-V2-Flash 模型整体架构如下:

小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型

MiMo-V2-Flash 核心设计亮点:

  • 混合注意力机制

采用比例为 5:1 的 Sliding Window Attention(SWA)与 Global Attention(GA)协同结构,滑动窗口大小设为 128,原生支持 32K 上下文,并在训练中扩展至 256K。大量前期实验表明,SWA 在通用性、长文本建模及推理稳定性方面全面优于主流 Linear Attention,同时具备固定尺寸的 KV Cache,极大简化了与现有训练与推理基础设施(Infra)的集成适配流程。

  • MTP 推理加速技术

通过 Multi-Token Prediction(MTP)方式强化基座模型能力,并在推理阶段实现多 Token 并行验证,有效缓解传统自回归解码在大 Batch 场景下的显存带宽瓶颈。实测数据显示:启用 3 层 MTP 后,接收长度提升 2.8~3.6 倍,端到端推理加速比达 2.0~2.6 倍。

综上,MiMo-V2-Flash 凭借模型结构与训推系统深度协同的创新设计,可在不同硬件平台上灵活调节 Batch Size 与 MTP 层数,充分释放 GPU 算力,兼顾高吞吐、低延迟与极致推理性能。

Topaz Video AI Topaz Video AI

一款工业级别的视频增强软件

Topaz Video AI 511 查看详情 Topaz Video AI

Xiaomi MiMo-V2-Flash 全量模型权重与推理代码均已开源。配套 API 当前限时免费开放,Web 版 Demo 已正式上线。

小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型

访问 platform.xiaomimimo.com,即可无缝接入 Claude Code、Cursor、Cline、Kilo Code 等主流开发框架。

立即前往 MiMo Studio Web 端:aistudio.xiaomimimo.com,免费体验模型能力。

源码地址:点击下载

以上就是小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型的详细内容,更多请关注其它相关文章!


# ai  # win  # claude  # 小米  # 集体建设用地出让网站  # 桂园网站推广方案  # seo 应用哪些标签  # 河南实力网站优化首选  # 海东爱采购关键词排名了解  # 洛阳全网推广营销中心  # 创业小项目网站建设建议  # 衡水营销推广要多少钱  # 稳定seo推广咨询  # 莆田抖音优化seo  # 设为  # 此前  # 北京  # 首家  # 被称为  # 仍是  # 并在  # 徐州  # 基座  # 开源  # red  # 大模型 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 微软和谷歌面临的人工智能困境:需要投入大量资金才能获得盈利  AI 模型 Stable Diffusion 升级:正常生成五指、图像更逼真  成都大运会闭幕式引入人形机器人展示表演  能抓取玻璃碎片、水下透明物,清华提出通用型透明物体抓取框架,成功率极高  比尔盖茨:AI确实存在风险,但可控  “风乌”气象大模型科学家团队:用AI预报极端天气未来不是梦!  出门问问亮相2025世界人工智能大会,展示AI CoPilot解决方案  人形机器人概念集体爆发,能买吗?  日新月异,脑机接口技术都有哪些新应用?  映宇宙数字人“映映”亮相ChinaJoy,展示AI黑科技实现用户互动  智能客服进入AI 2.0时代 容联云发布语言大模型“赤兔”  原小米 9 号员工李明打造全球首款 AI 安卓桌面机器人  《共同的演化》展览启幕,重新思考人类与人工智能关系  1.6亿美元收购Singularity AI,昆仑万维布局通用人工智能  梦想实现!硬核科幻大片VR智能头盔即将问世  华为云发布华为云盘古模型3.0和升腾AI云服务,亮点亮相2025华为开发者大会  AI连线 | 专访风平智能CEO林洪祥:让AI数字人拥有漂亮的外表和有趣的灵魂,安全问题是重要考量  引领AI变革,九章云极DataCanvas公司重磅发布AIFS+DataPilot  网友自制 AI 版《流浪地球 3》预告片,登上 CCTV6  静安大宁功能区企业云天励飞亮相2025世界人工智能大会,秀出AI硬实力!  阿里云全面支持Llama2训练部署,助力企业快速构建自有大型模型  70年前他本想逃避考试,却影响了整个互联网  Ai智能机器人,chat-免注册登入,直接使用新版gpt4.0!  2025VR&AR显示技术峰会展示歌尔光学最新一代光学模组  苹果式 AI 哲学:不着一字,处处落子  今年,全球客服中心支出将增长 16.2%,迎接对话式 AI 的浪潮,根据 Gartner 报告  “苏南 vs 苏北” AI 分胜负,娱乐性比较工具 EitherChoice 上线  小米又拿下国际比赛第一:AI翻译立功  AI 程序 Text With Jesus 在海外迅速受到关注:与耶稣和撒旦进行对话  英伟达推出 L40S GPU,AI 推理性能超过 A100 约 1.2 倍  编程已死,AI 当立?教授公开“唱反调”:AI 还帮不了程序员  人工智能进入绿植界,智能庭院市场初具规模  RoboNeo安装教程  移远通信率先完成多场5G NTN技术外场验证,为卫星物联网应用落地提速  微软 Azure AI 文本转语音服务升级:新增男性声音和扩展语言支持  前特斯拉总监、OpenAI大牛Karpathy:我被自动驾驶分了心,AI智能体才是未来!  Nature发AIGC禁令!投稿中视觉内容使用AI的概不接收  微软更新服务协议,以防止通过AI服务进行逆向工程和数据抓取  【搞事】时隔4年 谷歌更新安卓logo 机器人头更饱满了  音乐制作元工具AudioCraft发布开源AI工具  微软向美国政府提供GPT大模型,如何保证安全性?  OpenAI限制网络爬虫访问以保护数据免被用于AI模型训练  解决导航“最后50米”难题 高德地图升级AR步行导航找终点功能  常见的五个人工智能误解  首个算网生态体!中国移动元宇宙产业联盟正式成立  企业软件行业更将被AI全面重构!Moka李国兴:未来优秀组织和个人将一定是善于使用AI生产力的  AI新风口?首个高质量「文生视频」模型Zeroscope引发开源大战:最低8G显存可跑  携程发布旅游行业垂直大模型 梁建章:AI策略是做可靠的内容 放心的推荐  令人惊叹!AI模型能够以iPhone照片为基础创作诗歌  iPhone两秒出图,目前已知的最快移动端Stable Diffusion模型来了 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司