2025年7月11日晚,月之暗面宣布正式发布新一代基础模型Kimi K2,并同步开源。以下是该模型的相关介绍:模型参数:Kimi K2采用稀疏激活(MoE)架构,总参数达1万亿,激活参数为320亿。性能表现:在SWE Bench Verified(编程)、Tau2(智能体)、AceBench(工具调用)等多项基准测试中取得当前开源模型中的最佳成绩(SOTA)。在自主编程、工具调用和数学推理这三个能力维度上,超过了DeepSeek-V3-0324、Qwen-235B-A22B等模型,且在部分能力上紧逼Claude 4 Opus、OpenAI GPT-4.1等闭源模型。技术创新:训练过程中采用MuonClip优化器,有效解决大参数量模型的稳定训练问题,提升token利用效率。同时,结合大规模Agentic Tool Use数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。模型版本:开源了Kimi-K2-Base和Kimi-K2-Instruct两个版本,前者适合科研与自定义场景,后者可用于大多数问答与Agent任务。应用场景:具备复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的ToolCall结构。开发者可将其接入owl、Cline、RooCode等Agent/Coding框架,完成复杂任务或自动化编码。例如,它可以分析远程办公比例对薪资的影响,自动生成统计图表与回归模型解读;还能帮忙制定追星计划,完成演唱会所在城市的机酒与旅游规划等。API服务:Kimi K2 API已同步上线,兼容OpenAI与Anthropic的Chat接口,最长支持128K上下文窗口,费用为每百万输入tokens 4元,输出tokens 16元。用户也可在无问芯穹Infini - AI异构云平台以同样价格调用该模型。
|
|