Kimi发布新一代推理模型：中考高考考研全第一表现对标OpenAI o1-品论天涯网

国内人工智能公司月之暗面推出的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型，采用全新强化学习和思维链推理技术，通过模拟人脑的思考和反思过程，大幅提升解决数学难题的能力。Jwv品论天涯网

据了解，在多项数学基准能力测试中，k0-math的表现能对标OpenAIo1系列可公开使用的两个模型：o1-mini和o1-preview。Jwv品论天涯网

Jwv品论天涯网

根据官方公布的结果，在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中，k0-math初代模型成绩超过o1-mini和o1-preview模型，拿下第一。Jwv品论天涯网

Jwv品论天涯网

在业界最常使用的数学能力基准测试MATH中，k0-math模型得分93.8，超过o1-mini的90分和o1-preview的85.5分。Jwv品论天涯网

官方表示，k0-math这一成绩仅次于暂未开放使用的o1完全版94.8分。Jwv品论天涯网

据介绍，常规模型的设定目标是尽快提供问题的答案，但k0-math不同，k0-math模型在做题过程中会花更长的时间来推理，包括思考和规划思路，并且在必要时自行反思改进解题思路，提升答题的成功率。Jwv品论天涯网

Jwv品论天涯网

不过，月之暗面坦言，k0-math虽然擅长解答大部分很有难度的数学题，但是当前版本还无法解答LaTeX格式难以描述的几何图形类问题。Jwv品论天涯网

另外，k0-math还有一些局限性需要突破，包括对于过于简单的数学问题，例如1+1等于几，k0-math模型可能会过度思考，对于高考难题和IMO题目依然有一定概率做错、猜答案。Jwv品论天涯网

Jwv品论天涯网

月之暗面表示，这些局限性既是机遇，也是挑战，预计将在下一阶段的模型迭代中逐步得到改善。Jwv品论天涯网

Kimi发布新一代推理模型：中考高考考研全第一 表现对标OpenAI o1