月之暗面发布多模态思考模型K1.5 新技术有效降低大模型训练成本
月之暗面发布新一代多模态思考模型k1.5,在竞赛数学、代码能力及视觉思考等测试中,k1.5模型性能已达到全球领先模型OpenAI o1正式版水平,月之暗面也成为OpenAI之外,全球第二家到达该水平的人工智能企业。
国内人工智能独角兽企业月之暗面(Kimi)于1月20日发布新一代多模态思考模型k1.5,在竞赛数学、代码能力及视觉思考等测试中,k1.5模型性能已达到全球领先模型OpenAI o1正式版水平,月之暗面也成为OpenAI之外,全球第二家到达该水平的人工智能企业。

在AIME2024数学竞赛和MATH500两个测试项目中, k1.5模型长链式推理的得分均超过OpenAI o1正式版。而在全球知名算法平台Codeforces的代码能力测试中,k1.5表现则与OpenAI o1正式版持平。

利用长短转化技术(long to short),以长链式思考技术改进短链式思考模型,在短链式推理性能测试中,k1.5模型在数学、代码等方面大幅超越GPT-4o、Claude Sonnet 3.5等全球领先模型,其中AIME 数学领先幅度达到550%。

新模型发布的同时,月之暗面还首次对外公布了多模态模型技术训练报告《Kimi k1.5:借助大语言模型实现强化学习的 Scaling》,涵盖强化学习训练、多模态数据配方及基础设施优化等技术细节。报告指出,长文本处理能力扩展和改进策略的优化方法是本次技术迭代的关键要素,通过建立一个简单而有效的强化框架,无需依赖蒙特卡洛树搜索、价值函数、过程奖励模型等更复杂的技术,用最少的Token(数据或文本基本单元)就能高效完成任务,使模型能在多个基准测试和模态表现中达到最优水平。该报告的发布,将助力人工智能企业提升多模态大模型训练效率,进一步降低训练成本,为人工智能技术的应用实践提供重要参考。

编辑:罗浩
声明:新华财经为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115











