大模型生态 2026年4月21日 · Kimi
Kimi K2.6,把开源 coding agent 又往前推了一截
Moonshot 把 Kimi K2.6 的重点押在 coding、长程执行和 agent swarm 上,这不只是一次模型迭代,更像是在抢“开源代理工作流默认底座”的位置。它真正有意思的地方,不是单项分数多高,而是把长时间、多工具、多子任务协同这件事讲得越来越像工程能力。
共 6 篇
Moonshot 把 Kimi K2.6 的重点押在 coding、长程执行和 agent swarm 上,这不只是一次模型迭代,更像是在抢“开源代理工作流默认底座”的位置。它真正有意思的地方,不是单项分数多高,而是把长时间、多工具、多子任务协同这件事讲得越来越像工程能力。
Anthropic 宣布 Project Glasswing,用未公开的 Claude Mythos Preview 帮关键软件找漏洞,还拉来一批科技和金融公司一起做防守。真正值得注意的不是发布了一个新模型,而是它已经强到让 Anthropic 不敢直接全量放出来。
一条爆火帖子把 Gemma-4-31B 的“破解版”推上了桌面。真正值得看的,不只是模型被解限,而是开源模型、安全对齐和本地部署之间那条越来越松的边界。
Google 发布 Gemma 4,把“开源模型竞争”从单纯拼参数,往设备适配、代理工作流和商业可用许可上拉了一层。真正值得看的是,它开始认真争夺本地 AI 和开发者生态的入口。
一次看起来像是官网误放的页面缓存,把 Anthropic 还没正式发布的新模型 Mythos/Capybara 提前暴露了出来。真正值得注意的不是名字,而是它被定位在 Opus 之上,并且首先瞄准的是网络安全场景。
乐天开始提供日语特化 LLM「Rakuten AI 3.0」,并以 Apache 2.0 许可免费公开。它真正值得看的,不只是参数规模,而是日本本土模型生态终于开始从“会用海外模型”走向“要做自己的语言层能力”。