葡萄新京2026最新中国官方网站 小米大模子上线新口头 推理速率突破1000 tokens/s

来源:葡萄新京2026最新中国官方网站 作者: 发布时间: 浏览:98

葡萄新京2026最新中国官方网站 小米大模子上线新口头 推理速率突破1000 tokens/s

新京报贝壳财经讯(记者陈维城)6月8日晚,小米MiMo本领团队发扬上线Xiaomi MiMo-V2.5-Pro-UltraSpeed口头,在通用GPU上推理速率突破1000 tokens/s。

斗鱼体育app中国官网下载

MiMo-V2.5-Pro-UltraSpeed通过对模子推理系统的全链路工程才气优化,在不裁汰模子才气前提下,初次把推理速率擢升至1000 tokens/s,且无需定制芯片、只使用通用GPU即可实现。这一突破冲破了“快、强、通用 GPU无法兼得”的行业不行能三角。

小米MiMo本领团队示意,该突破是基于Xiaomi MiMo-V2.5 Pro的SWA架构,重复了FP4 Experts、DFlash解码以及TileRT团队的扩充系统Co‑design,从模子到推理引擎再到GPU扩充旅途进行了全链路优化。

即日起至6月23日,葡萄新京MiMo-V2-Pro-UltraSpeed口头将秉承苦求制限时通达,通过苦求的用户可接入API 进行体验。

自4月底以来葡萄新京2026最新中国官方网站,小米AI在模子才气、推理资本和推理效果三个维度接连取得突破:4月23日, MiMo-V2.5-Pro在群众巨擘大模子测评平台Artificial Analysis上,取得详尽智能指数与Agent指数群众开源模子比肩第一;5月27日,Xiaomi MiMo-V2.5系列模子API因本领优化告示最高降价99%,并同举止整Token Plan计费体系。6月8日,MiMo-V2.5-Pro-UltraSpeed以1000 tokens/s创下万亿参数旗舰模子推理速率新记录。