找回密码
 立即注册
搜索

Kimi深夜整活,开源了首个万亿参数模型

[复制链接]
xinwen.mobi 发表于 2025-7-12 15:25:40 | 显示全部楼层 |阅读模式
2025年7月11日晚,月之暗面宣布正式发布新一代基础模型Kimi K2,并同步开源。以下是该模型的相关介绍:模型参数:Kimi K2采用稀疏激活(MoE)架构,总参数达1万亿,激活参数为320亿。性能表现:在SWE Bench Verified(编程)、Tau2(智能体)、AceBench(工具调用)等多项基准测试中取得当前开源模型中的最佳成绩(SOTA)。在自主编程、工具调用和数学推理这三个能力维度上,超过了DeepSeek-V3-0324、Qwen-235B-A22B等模型,且在部分能力上紧逼Claude 4 Opus、OpenAI GPT-4.1等闭源模型。技术创新:训练过程中采用MuonClip优化器,有效解决大参数量模型的稳定训练问题,提升token利用效率。同时,结合大规模Agentic Tool Use数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。模型版本:开源了Kimi-K2-Base和Kimi-K2-Instruct两个版本,前者适合科研与自定义场景,后者可用于大多数问答与Agent任务。应用场景:具备复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的ToolCall结构。开发者可将其接入owl、Cline、RooCode等Agent/Coding框架,完成复杂任务或自动化编码。例如,它可以分析远程办公比例对薪资的影响,自动生成统计图表与回归模型解读;还能帮忙制定追星计划,完成演唱会所在城市的机酒与旅游规划等。API服务:Kimi K2 API已同步上线,兼容OpenAI与Anthropic的Chat接口,最长支持128K上下文窗口,费用为每百万输入tokens 4元,输出tokens 16元。用户也可在无问芯穹Infini - AI异构云平台以同样价格调用该模型。
回复

使用道具 举报

QQ|周边二手车|手机版|标签|新闻魔笔科技XinWen.MoBi - 海量语音新闻! ( 粤ICP备2024355322号-1|粤公网安备44090202001230号 )

GMT+8, 2025-12-19 23:39 , Processed in 0.060249 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表