文章归档

共 29 篇

大模型生态 2026年4月21日 · Kimi

Kimi K2.6，把开源 coding agent 又往前推了一截

Moonshot 把 Kimi K2.6 的重点押在 coding、长程执行和 agent swarm 上，这不只是一次模型迭代，更像是在抢“开源代理工作流默认底座”的位置。它真正有意思的地方，不是单项分数多高，而是把长时间、多工具、多子任务协同这件事讲得越来越像工程能力。

#AI #Kimi #Agent #Coding

Agent 与接口 2026年4月15日 · GitHub

Superpowers 火成这样，不奇怪，它刚好踩中了 AI 编程最缺的那一块

一个爆火的 GitHub 项目，想解决的核心问题是 agent 开发里的失控感。它把提需求、做设计、拆计划、TDD、评审和收尾串成默认流程，让 AI 编程更像工程，而不只是补全。

#AI #Agent #Coding Agent #TDD

AI产品策略 2026年4月12日 · 智东西

Claude Mythos 不开放，不是保守，是 AI 漏洞挖掘已经开始逼近现实边界

Anthropic 发布 Claude Mythos Preview 和 Project Glasswing，展示出足以发现长期潜伏漏洞、甚至生成高成功率 exploit 的能力，但选择暂不向公众开放。真正值得关注的不是模型又强了多少，而是高风险能力终于开始被当成治理问题，而不只是产品卖点。

#AI #Anthropic #网络安全 #漏洞挖掘

Agent 与接口 2026年4月12日 · X

真正好用的 Codex 工具，不是把一切都接进来，而是先揉成 CLI

Nick Baumann 讲了一个很实用的经验，给 Codex 最好的工具往往不是直接塞原始系统访问，而是做一层 bespoke CLI，把噪音压掉，把输入输出变成稳定命令。重点不只是“能接入”，而是让 agent 真正能反复、可靠、低摩擦地调用。

#AI #Codex #Agent #CLI

Agent 与接口 2026年4月9日 · X / Claude

Claude 终于不只卖模型了，开始直接卖 Agent 运行层

Claude Managed Agents 进入公测，Anthropic 不再只提供模型和 API，而是把 agent harness、运行环境和生产基础设施一起打包。真正的变化不是又多了一个新功能，而是大模型厂商开始吞掉原本属于 agent 框架和平台层的地盘。

#AI #Claude #Agent #Anthropic

AI产品策略 2026年4月9日 · Happy Horse AI

快手 Kling 负责人转战阿里后，第一个作品就冲上了全球榜首

HappyHorse 1.0 以 150 亿参数统一单流架构亮相，在 Artificial Analysis 文本转视频和图转视频双榜登顶。带队的是前快手副总裁、Kling AI 技术负责人张迪，2025 年底加入淘天集团，蛰伏数月后交出的第一份公开答卷。

#AI #视频生成 #开源 #大模型

大模型生态 2026年4月8日 · X / Anthropic

Anthropic 把最强找洞模型先锁进了安全实验室

Anthropic 宣布 Project Glasswing，用未公开的 Claude Mythos Preview 帮关键软件找漏洞，还拉来一批科技和金融公司一起做防守。真正值得注意的不是发布了一个新模型，而是它已经强到让 Anthropic 不敢直接全量放出来。

#AI #Anthropic #Cybersecurity #Claude

AI产品策略 2026年4月7日 · Tom's Hardware

苹果突然放行 eGPU，但只给 AI，不给游戏

苹果批准了能让 AMD 和 Nvidia 外接显卡在 Apple Silicon Mac 上运行的新驱动，但用途被卡得很死：只服务 AI 计算，不服务游戏和图形加速。这不是苹果回心转意，而是它开始承认 AI 工作负载对外部算力的真实需求。

#AI #Apple #eGPU #GPU

大模型生态 2026年4月7日 · X

Gemma 4 被“越狱”刷屏，这事真正说明了什么

一条爆火帖子把 Gemma-4-31B 的“破解版”推上了桌面。真正值得看的，不只是模型被解限，而是开源模型、安全对齐和本地部署之间那条越来越松的边界。

#AI #Gemma #开源模型 #模型安全

大模型生态 2026年4月3日 · Google Blog

Google 把 Gemma 4 推到了一个更现实的位置：不是最强，而是最能落地的开源模型

Google 发布 Gemma 4，把“开源模型竞争”从单纯拼参数，往设备适配、代理工作流和商业可用许可上拉了一层。真正值得看的是，它开始认真争夺本地 AI 和开发者生态的入口。

#AI #Google #Gemma #Open Source

AI产品策略 2026年4月3日 · Hugging Face

用 165 美元训出跨 25 个物种的 mRNA 模型，这事真正打到的是生物 AI 的成本线

OpenMed 把 mRNA 优化这件事从“高门槛生物工程”往“可复用的开源流水线”推了一步。更值得注意的不是单个指标，而是他们证明了跨物种、低成本、可复现实验这三件事可以同时成立。

#AI #BioTech #Hugging Face #mRNA

Agent 与接口 2026年3月29日 · Cheng Lou on X

一段前端基础设施，为什么能让人觉得“像是从地狱里爬出来的成果”

Cheng Lou 抛出的不只是一个 TypeScript 文本测量算法，而是在试图把网页排版从 DOM 测量和 reflow 里抽出来。它未必会立刻改写前端开发，但确实戳中了下一代界面系统最底层的一根刺。

#前端 #UI Engineering #TypeScript #Layout

AI产品策略 2026年3月29日 · Google AI Studio on X

Google 把实时语音 Agent 往前推了一步：Gemini 3.1 Flash Live 上线

Google AI Studio 上线 Gemini 3.1 Flash Live，重点不是又发了一个新模型，而是把实时语音与视觉 Agent 的延迟、指令遵循和多语言能力一起往可用区间推了一截。这类发布真正值得看的，不是 demo 漂不漂亮，而是它是否开始接近“能稳定上线”的门槛。

#AI #Gemini #Voice Agent #Google AI Studio

大模型生态 2026年3月28日 · M1Astra / leaked Anthropic page cache

Claude Mythos 泄露，不只是 Anthropic 提前剧透了一张新模型海报

一次看起来像是官网误放的页面缓存，把 Anthropic 还没正式发布的新模型 Mythos/Capybara 提前暴露了出来。真正值得注意的不是名字，而是它被定位在 Opus 之上，并且首先瞄准的是网络安全场景。

#AI #Anthropic #Claude #Cybersecurity

Agent 与接口 2026年3月26日 · X / NVIDIA Research

NVIDIA 把“盲编程”推到台前：Agent 连跑 7 天，开始越过 GPU 专家

NVIDIA 最新的 AVO 研究，不只是把代码生成做得更强，而是把 Agent 直接抬成了“进化算子”。真正值得警惕的不是它赢了多少百分点，而是它开始能在几乎没人盯着的情况下，持续做出硬件级优化判断。

#AI #Agent #NVIDIA #GPU

Agent 与接口 2026年3月25日 · FutureSearch

LiteLLM 被投毒，不只是一个包出事，而是整条 AI 开发链条一起暴露

LiteLLM 在 PyPI 上出现被投毒版本，恶意 `.pth` 文件会在 Python 启动时自动执行，目标不是单纯搞破坏，而是直接打开发者机器、云凭证和 Kubernetes 集群。这件事真正危险的地方，是 AI 开发工具链里“一个常用依赖”已经足够成为基础设施级入口。

#AI #Python #Supply Chain Security #LiteLLM

AI算力 2026年3月23日 · SkyPilot Blog

当 Autoresearch 拿到 16 张 GPU，Agent 做研究这件事开始变味了

SkyPilot 团队把 Claude Code 接到 Karpathy 的 autoresearch 项目上，再给它 16 张 GPU 和一个 Kubernetes 集群。结果不只是实验跑得更快，而是 agent 的研究方法本身变了：从串行试错，变成并行搜索、分层验证，甚至学会了按 H100 和 H200 的差异来分配实验。

#AI #Agent #GPU #SkyPilot

AI产品策略 2026年3月22日 · Cursor

Cursor 想把“够强又够便宜”的编程模型，做成开发者默认选项

Cursor 发布 Composer 2，主打前沿级编程能力与更低输入成本，同时推出更快版本作为默认选项。比起一次常规模型更新，这更像是在重新定义 AI 编程工具里的性价比基线。

#Cursor #AI 编程 #模型定价

Agent 与接口 2026年3月22日 · X (Twitter)

Felix：一个每周赚几千美元的 OpenClaw AI 创业者

Nat Eliason 分享了他与 AI 员工 Felix 的合作历程——这个运行在 Mac Mini 上的 OpenClaw 在不到三周内赚了 1.4 万美元，并且正在向 100 万美元的年度目标迈进。

#AI Agent #OpenClaw #自动化

AI产品策略 2026年3月19日 · Google Labs / X

Google 把“vibe coding”推进到设计端，Stitch 这一步很像产品原型工具的重排

Google Labs 推出 Stitch，把自然语言、交互原型和品牌设计系统压进同一条工作流里。它不只是又一个 AI 画界面工具，更像是在抢“谁先接管产品定义到设计落地的第一公里”。

#AI #Google #设计工具 #原型设计

Agent 与接口 2026年3月18日 · X / Anthropic

Claude Code 把 Skill 这件事讲透了，但真正值钱的不是“会写 SKILL.md”

Anthropic 这篇关于 Claude Code Skills 的总结，最有价值的地方不是技巧清单本身，而是把 Skill 从“一个提示词文件”重新定义成了组织生产力的封装单位。真正拉开差距的，不是谁会写几段 markdown，而是谁能把知识、脚本、验证、数据接口和长期维护一起做成可复用资产。

#AI #Claude Code #Agent #开发工具

AI产品策略 2026年3月18日 · X / GitHub

OpenMAIC 把“做一节 AI 课”这件事，往产品化又推了一大步

清华团队开源的 OpenMAIC，不只是把资料丢给模型再吐一份讲稿，而是把讲课、互动、白板、测验和导出课件串成了一个完整课堂。真正值得警惕的不是又多了一个 demo，而是 AI 教学产品里最贵的那层“编排能力”开始被开源公共化。

#AI #教育科技 #Multi-Agent #Open Source

AI产品策略 2026年3月17日 · 微信公众号 / APPSO

阿里把“悟空”推到台前，真正想抢的是企业级 Agent 入口

阿里成立 ATH 事业群后，钉钉团队随即发布企业级 AI 原生工作平台“悟空”。这件事最值得看的，不是发布会上的热闹口号，而是阿里开始把组织、平台、权限和 Skill 生态一起打包，去抢企业级 Agent 的操作系统位置。

#AI #阿里巴巴 #钉钉 #Agent

AI产品策略 2026年3月17日 · NVIDIA

NVIDIA GTC 2026：黄仁勋不只是在发新卡，而是在推销整套 AI 基础设施秩序

这次 GTC 最值得看的，不是某一块新芯片，而是 NVIDIA 把芯片、网络、桌面系统、代理运行时、开源模型和行业方案重新打包成一整套默认选项。它想卖的已经不是 GPU，而是未来 AI 工厂的操作系统。

#NVIDIA #GTC 2026 #AI基础设施 #Agentic AI

大模型生态 2026年3月17日 · X / Impress Watch

乐天把“日本语大模型”这件事，往前推了一步

乐天开始提供日语特化 LLM「Rakuten AI 3.0」，并以 Apache 2.0 许可免费公开。它真正值得看的，不只是参数规模，而是日本本土模型生态终于开始从“会用海外模型”走向“要做自己的语言层能力”。

#AI #LLM #日本 #开源

AI产品策略 2026年3月16日 · X

360 把 AI 助手的私钥一起打包发了出去，这不是翻车，是安全常识失守

一条广泛传播的 X 帖子指出，360 新发布的 AI 助手安装包中疑似包含了 `*.myclaw.360.cn` 的 SSL 私钥。如果情况属实，这已经不是普通漏洞，而是把整条信任链主动送到了公开互联网上。

#360 #AI安全 #SSL #安全事件

AI产品策略 2026年3月16日 · X

AI 编程真正危险的地方，不是写不出来，而是八个月后没人敢接着改

一条关于阿里测试 18 个 AI agents 的帖子，把 AI Coding 的真正短板说透了：让模型把代码“先写出来”已经不难，难的是在长周期维护里不持续引入回归和技术债。真正的问题不是首轮生成，而是后续谁来接住。

#AI Coding #代码维护 #阿里巴巴 #工程效率

Agent 与接口 2026年3月16日 · chrlschn.dev

MCP 没死，死掉的只是那种把它当万能胶的幻觉

过去几个月，MCP 从“万物皆可协议化”的明星，迅速变成不少人口中的历史包袱。但真正过时的不是 MCP，而是把个人效率工具和团队级 agent 基础设施混为一谈的判断方式。

#MCP #Agent #CLI #开发工具

Agent 与接口 2026年3月16日 · X / 小互

WebMCP 真要跑起来，很多 AI Agent 的“看网页点按钮”都会变成过渡方案

真正拖慢 AI agent 的，很多时候不是模型能力，而是网页交互这层老接口。如果网站开始直接把能力暴露给 agent 调用，今天这套靠截图、点按钮和猜表单的玩法，大概率只是过渡形态。

#AI Agent #WebMCP #Chrome #MCP