Claude Mythos 不开放,不是保守,是 AI 漏洞挖掘已经开始逼近现实边界
Anthropic 发布 Claude Mythos Preview 和 Project Glasswing,展示出足以发现长期潜伏漏洞、甚至生成高成功率 exploit 的能力,但选择暂不向公众开放。真正值得关注的不是模型又强了多少,而是高风险能力终于开始被当成治理问题,而不只是产品卖点。
共 12 篇
Anthropic 发布 Claude Mythos Preview 和 Project Glasswing,展示出足以发现长期潜伏漏洞、甚至生成高成功率 exploit 的能力,但选择暂不向公众开放。真正值得关注的不是模型又强了多少,而是高风险能力终于开始被当成治理问题,而不只是产品卖点。
HappyHorse 1.0 以 150 亿参数统一单流架构亮相,在 Artificial Analysis 文本转视频和图转视频双榜登顶。带队的是前快手副总裁、Kling AI 技术负责人张迪,2025 年底加入淘天集团,蛰伏数月后交出的第一份公开答卷。
苹果批准了能让 AMD 和 Nvidia 外接显卡在 Apple Silicon Mac 上运行的新驱动,但用途被卡得很死:只服务 AI 计算,不服务游戏和图形加速。这不是苹果回心转意,而是它开始承认 AI 工作负载对外部算力的真实需求。
OpenMed 把 mRNA 优化这件事从“高门槛生物工程”往“可复用的开源流水线”推了一步。更值得注意的不是单个指标,而是他们证明了跨物种、低成本、可复现实验这三件事可以同时成立。
Google AI Studio 上线 Gemini 3.1 Flash Live,重点不是又发了一个新模型,而是把实时语音与视觉 Agent 的延迟、指令遵循和多语言能力一起往可用区间推了一截。这类发布真正值得看的,不是 demo 漂不漂亮,而是它是否开始接近“能稳定上线”的门槛。
Cursor 发布 Composer 2,主打前沿级编程能力与更低输入成本,同时推出更快版本作为默认选项。比起一次常规模型更新,这更像是在重新定义 AI 编程工具里的性价比基线。
Google Labs 推出 Stitch,把自然语言、交互原型和品牌设计系统压进同一条工作流里。它不只是又一个 AI 画界面工具,更像是在抢“谁先接管产品定义到设计落地的第一公里”。
清华团队开源的 OpenMAIC,不只是把资料丢给模型再吐一份讲稿,而是把讲课、互动、白板、测验和导出课件串成了一个完整课堂。真正值得警惕的不是又多了一个 demo,而是 AI 教学产品里最贵的那层“编排能力”开始被开源公共化。
阿里成立 ATH 事业群后,钉钉团队随即发布企业级 AI 原生工作平台“悟空”。这件事最值得看的,不是发布会上的热闹口号,而是阿里开始把组织、平台、权限和 Skill 生态一起打包,去抢企业级 Agent 的操作系统位置。
这次 GTC 最值得看的,不是某一块新芯片,而是 NVIDIA 把芯片、网络、桌面系统、代理运行时、开源模型和行业方案重新打包成一整套默认选项。它想卖的已经不是 GPU,而是未来 AI 工厂的操作系统。
一条广泛传播的 X 帖子指出,360 新发布的 AI 助手安装包中疑似包含了 `*.myclaw.360.cn` 的 SSL 私钥。如果情况属实,这已经不是普通漏洞,而是把整条信任链主动送到了公开互联网上。
一条关于阿里测试 18 个 AI agents 的帖子,把 AI Coding 的真正短板说透了:让模型把代码“先写出来”已经不难,难的是在长周期维护里不持续引入回归和技术债。真正的问题不是首轮生成,而是后续谁来接住。