4月30日,小米开源首个推理大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。目前,MiMo-7B 已开源4个模型至HuggingFace。
在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 用 7B 的参数规模,超越了OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。
就在昨天,阿里巴巴宣布开源新一代通义千问模型Qwen3。千问3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型。另有市场消息透露,DeepSeek的R2也即将发布。
相关文章:
AI周报|OpenAI发布大模型GPT-5;谷歌推出可交互的世界模型Genie 308-10
一句话创造可漫游的3D世界,业界首个开源3D世界生成模型发布丨2025WAIC07-27
全国首个出租车智慧生态平台在深上线07-25
Llama惨遭抛弃,Meta内部改用Claude写代码07-11
全球首个700M 8T极简5G应急基站在辽宁丹东建成07-08
近期,带孩子出门千万留意这件事!07-05
小米汽车再造爆款,无「故事」不高端纯电06-28
小米股价首次突破60港元06-27