返回首页
分享:
微信扫码分享
2025-11-08
周六
11:07:09
Kimi K2 Thinking在评估推理、编码和代理能力的基准测评中创造了新记录
金十数据11月8日讯,据月之暗面官网称,Kimi K2 Thinking在评估推理、编码和代理能力的基准测评中创造了新的记录。K2 Thinking在HLE基准评测中取得44.9%的SOTA成绩,在BrowseComp测试中达到60.2%,在SWE-Bench Verified测试中达到71.3%,显示出作为最先进的思考代理模型的强大泛化能力。
JIN10.COM I 一个交易工具
金十数据