DeepSeek时刻再次出现,Kimi K2 Thinking智能推理能力超过GPT-5
金十数据11月8日讯,智能推理的方面,在人类终极考试( HLE)这项超难基准上,Kimi K2 Thinking 取得44.9%的分数,超过了Grok4、GPT-5、Claude 4.5等先进模型。如果是 Kimi K2 Thinking Heavy,分数还可以进一步达到 51%。HuggingFace联合创始人Thomas Wolf置评Kimi K2 Thinking称,我们正在见证又一次DeepSeek时刻,开源软件再次超越闭源软件,今后是不是每隔几个月就会发生一次这种情况?