快科技6月12日消息,一如前两天预告的那样,月之暗面刚刚正式发布了Kimi .2.7 Code大模型,是一款继续打磨AI编程的模型迭代产品。根据Kimi官方所说,根据内外部基准评估显示,Kimi K2.7 Code 相比 K2.6 模型显著提升了长上下文编程场景的指令遵循能力、长程编程任务的性能表现,并且大幅改善了在长程任务中的过度思考倾向,平均 token 消耗减少 30%。
在评估代码能力的内部外基准测试中,K2.7 Code 相比 K2.6 性能显著提升:Kimi Code Bench v2 提升 21.8%、Program-Bench 提升 11%、MLS Bench Lite 提升 31.5%。模型代码能力的进化带来了agentic 能力的提升。在评估 Agent 自主化执行能力的 Kimi Claw 24/7 Bench、MCP Atlas 和 MCP Mark Verified 基准测试中,性能提升 10% 左右。

国产大模型Kimi 2.7 Code发布:死磕AI编程 坦诚面对与GPT/Opus差距
如果说Kimi 2.7这次的发布稿与以往或者其他国产大模型相比有什么不同的话,那就是月之暗面没有非得找某个评测项目去超越当前的GPT-5.5或者Opus 4.8两款大模型,即便是他们内部的测试中Kimi 2.7 Code也跟后两者有差距。按照他们的测试结果量化的话,GPT-5.5、Opus 4.8如果在编程方面做到了70分的水平,Kimi 2.6就是50分左右,这次的Kimi 2.7 Code做到了60以上。
总之,在这次的发布稿中,还是看到了国内AI公司坦然、坦诚对比国内外AI大模型差距的态度,没必要非得找一两个项目证明自己超越了GPT-5.5、Opus 4.8之类的,很多公司发布大模型喜欢这样宣传真的没啥必要。Kimi 2.7 Code也只是K2系列的一次小版本迭代,今年的重头戏还是Kimi K3,按照之前官方所透露的信息,K3提升会很明显,希望到时候能战GPT-5.5、Opus 4.8了。
最后是Kimi 2.7 Code的可用性,今天开始开发者就能使用了,价格也跟K2.6一样,Code Plan计划也会默认升级到新模型。K2.6大模型也不会消失,官方表示非编程任务中还是推荐使用更全面的K2.6大模型。另外下周一还会推出高速版Kimi 2.7 Code,输出速度约为普通版的5-6倍,常规编程场景下(取输入长度中位数)输出速度约 180 Token/s,短上下文场景可达260 Token/s,而价格也就是2x。

国产大模型Kimi 2.7 Code发布:死磕AI编程 坦诚面对与GPT/Opus差距
【本文结束】出处:快科技
德阳吧
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。