Claude Mythos 不开放,不是保守,是 AI 漏洞挖掘已经开始逼近现实边界
Anthropic 发布 Claude Mythos Preview 和 Project Glasswing,展示出足以发现长期潜伏漏洞、甚至生成高成功率 exploit 的能力,但选择暂不向公众开放。真正值得关注的不是模型又强了多少,而是高风险能力终于开始被当成治理问题,而不只是产品卖点。
chiphub.top
面向技术从业者与产业观察者。我们用结构化文章追踪模型发布、算力供给、芯片路线图与生态动态。
编辑部推荐的重点信息与深度解读
Anthropic 发布 Claude Mythos Preview 和 Project Glasswing,展示出足以发现长期潜伏漏洞、甚至生成高成功率 exploit 的能力,但选择暂不向公众开放。真正值得关注的不是模型又强了多少,而是高风险能力终于开始被当成治理问题,而不只是产品卖点。
Google 发布 Gemma 4,把“开源模型竞争”从单纯拼参数,往设备适配、代理工作流和商业可用许可上拉了一层。真正值得看的是,它开始认真争夺本地 AI 和开发者生态的入口。
LiteLLM 在 PyPI 上出现被投毒版本,恶意 `.pth` 文件会在 Python 启动时自动执行,目标不是单纯搞破坏,而是直接打开发者机器、云凭证和 Kubernetes 集群。这件事真正危险的地方,是 AI 开发工具链里“一个常用依赖”已经足够成为基础设施级入口。
按发布时间倒序
Moonshot 把 Kimi K2.6 的重点押在 coding、长程执行和 agent swarm 上,这不只是一次模型迭代,更像是在抢“开源代理工作流默认底座”的位置。它真正有意思的地方,不是单项分数多高,而是把长时间、多工具、多子任务协同这件事讲得越来越像工程能力。
一个爆火的 GitHub 项目,想解决的核心问题是 agent 开发里的失控感。它把提需求、做设计、拆计划、TDD、评审和收尾串成默认流程,让 AI 编程更像工程,而不只是补全。
Anthropic 发布 Claude Mythos Preview 和 Project Glasswing,展示出足以发现长期潜伏漏洞、甚至生成高成功率 exploit 的能力,但选择暂不向公众开放。真正值得关注的不是模型又强了多少,而是高风险能力终于开始被当成治理问题,而不只是产品卖点。
Nick Baumann 讲了一个很实用的经验,给 Codex 最好的工具往往不是直接塞原始系统访问,而是做一层 bespoke CLI,把噪音压掉,把输入输出变成稳定命令。重点不只是“能接入”,而是让 agent 真正能反复、可靠、低摩擦地调用。
Claude Managed Agents 进入公测,Anthropic 不再只提供模型和 API,而是把 agent harness、运行环境和生产基础设施一起打包。真正的变化不是又多了一个新功能,而是大模型厂商开始吞掉原本属于 agent 框架和平台层的地盘。
HappyHorse 1.0 以 150 亿参数统一单流架构亮相,在 Artificial Analysis 文本转视频和图转视频双榜登顶。带队的是前快手副总裁、Kling AI 技术负责人张迪,2025 年底加入淘天集团,蛰伏数月后交出的第一份公开答卷。
先预留订阅入口,后续接入邮件服务。