由|有一组SOHU技术|张·杨(Zhang Yating)的天才女孩卢·富里(Luo Fuli)加入小米后,小米在大型模型领域提供了第一张卡片报告。 4月30日,小米正式宣布了以推理为推理的首个大型模型“小米米莫”的开源,并协调了培训后,以全面提高理性能力。在公共审查数学推理(AIME 24-25)和代码竞争(LiveCodeBench V5)中,MIMO超过了OpenAi OpenAi Openai Openai open-Erence serprence serplrence模型QWQ-32B-Preview的封闭源源型模型,该模型仅使用7B参数量表。尽管DeepSeek-R1激发了在行业中创建增强措施(RL)研究的浪潮,但DeepSeek-R1-Distill-7b和Qwen2.5-32b已广泛使用了刺激性研究的模型。相同的RL训练数据,小米MIMO-7B显着领导了数学法规领域的强化研究。扩展全文
小米说,提高了MIMO识别的能力在训练前和训练后阶段中的数据和算法等许多级别的联合变化鼓励了这种情况。例如,在预训练中,核心是允许模型看到更多的结果模式。在训练后,有效且稳定的增强研究算法和框架中。
到去年年底,有报道称,小米创始人雷·朱尼(Luo Furi)的鼓励,雷·朱尼(Lei Jun)的年薪为1000万,并担任大小米AI实验室团队模型的领导者。她也被称为外界95后AI的“天才女孩”。
公共信息显示,Luo Funi在本科学位的北京师范大学研究计算机科学,并从北京大学的计算语言学大学毕业。从硕士学位毕业后,Luo Funi进入了Ali Damo学院进行人工智能研究G语言模型负责Ali Grass Academy的Alemind开源项目,并领导了多wika的多wika预划线模型模型模型预拆下模型模型模型预染色模型模型,并领导了多wika模型模型模型模型模型模型模型模型模型模型模型模型模型模型模型模型,并列出了多Wika Pree-Wika Pre-Wika Pree-Straining Synaining veco。
2022年,Luo Funi加入了Huanfang量,从事与该算法的研究和研究有关的深入研究方法,并最终作为一名深入的研究研究人员搬到了DeepSeek,参与了Moe Big Model DeepSeek-V2的开发。
对于小米,终端大型模型是它需要关注的方向。过去,2023年4月,小米组成了一个大型AI模型团队,重点是轻量级和本地扩展,这与互联网上许多平台公司的思想不同。
从行业的角度来看,所有品牌制造商都会加快在大型型号的布局上加快了手机边缘的AI实现。 IDC认为,中国市场中AI的一部分手机也将迅速增长,在2027年价值超过50%。新一代AI的手机将升级硬件和成本提高,以提高存储,屏幕和成像设备,这将使更多的智能手机屁股增加。回到Sohu看看更多