标签：#AI

共 22 篇

AI算力 2026年7月4日 · Tom's Hardware

核微反应堆直接给 AI 电脑供电：Valar Atomics 在舞台上点亮 Nvidia DGX Spark

Valar Atomics 现场演示用微型核反应堆 Ward 250 驱动 Nvidia DGX Spark 台式机，同时宣布与 Nvidia 合作在犹他州建设 30MW 闭环 AI 工厂，主打无本地水消耗的冷却方案。

大模型生态 2026年4月21日 · Kimi

Kimi K2.6，把开源 coding agent 又往前推了一截

Moonshot 把 Kimi K2.6 的重点押在 coding、长程执行和 agent swarm 上，这不只是一次模型迭代，更像是在抢“开源代理工作流默认底座”的位置。它真正有意思的地方，不是单项分数多高，而是把长时间、多工具、多子任务协同这件事讲得越来越像工程能力。

#AI #Kimi #Agent #Coding

Agent 与接口 2026年4月15日 · GitHub

Superpowers 火成这样，不奇怪，它刚好踩中了 AI 编程最缺的那一块

一个爆火的 GitHub 项目，想解决的核心问题是 agent 开发里的失控感。它把提需求、做设计、拆计划、TDD、评审和收尾串成默认流程，让 AI 编程更像工程，而不只是补全。

#AI #Agent #Coding Agent #TDD

AI产品策略 2026年4月12日 · 智东西

Claude Mythos 不开放，不是保守，是 AI 漏洞挖掘已经开始逼近现实边界

Anthropic 发布 Claude Mythos Preview 和 Project Glasswing，展示出足以发现长期潜伏漏洞、甚至生成高成功率 exploit 的能力，但选择暂不向公众开放。真正值得关注的不是模型又强了多少，而是高风险能力终于开始被当成治理问题，而不只是产品卖点。

#AI #Anthropic #网络安全 #漏洞挖掘

Agent 与接口 2026年4月12日 · X

真正好用的 Codex 工具，不是把一切都接进来，而是先揉成 CLI

Nick Baumann 讲了一个很实用的经验，给 Codex 最好的工具往往不是直接塞原始系统访问，而是做一层 bespoke CLI，把噪音压掉，把输入输出变成稳定命令。重点不只是“能接入”，而是让 agent 真正能反复、可靠、低摩擦地调用。

#AI #Codex #Agent #CLI

Agent 与接口 2026年4月9日 · X / Claude

Claude 终于不只卖模型了，开始直接卖 Agent 运行层

Claude Managed Agents 进入公测，Anthropic 不再只提供模型和 API，而是把 agent harness、运行环境和生产基础设施一起打包。真正的变化不是又多了一个新功能，而是大模型厂商开始吞掉原本属于 agent 框架和平台层的地盘。

#AI #Claude #Agent #Anthropic

AI产品策略 2026年4月9日 · Happy Horse AI

快手 Kling 负责人转战阿里后，第一个作品就冲上了全球榜首

HappyHorse 1.0 以 150 亿参数统一单流架构亮相，在 Artificial Analysis 文本转视频和图转视频双榜登顶。带队的是前快手副总裁、Kling AI 技术负责人张迪，2025 年底加入淘天集团，蛰伏数月后交出的第一份公开答卷。

#AI #视频生成 #开源 #大模型

大模型生态 2026年4月8日 · X / Anthropic

Anthropic 把最强找洞模型先锁进了安全实验室

Anthropic 宣布 Project Glasswing，用未公开的 Claude Mythos Preview 帮关键软件找漏洞，还拉来一批科技和金融公司一起做防守。真正值得注意的不是发布了一个新模型，而是它已经强到让 Anthropic 不敢直接全量放出来。

#AI #Anthropic #Cybersecurity #Claude

AI产品策略 2026年4月7日 · Tom's Hardware

苹果突然放行 eGPU，但只给 AI，不给游戏

苹果批准了能让 AMD 和 Nvidia 外接显卡在 Apple Silicon Mac 上运行的新驱动，但用途被卡得很死：只服务 AI 计算，不服务游戏和图形加速。这不是苹果回心转意，而是它开始承认 AI 工作负载对外部算力的真实需求。

#AI #Apple #eGPU #GPU

大模型生态 2026年4月7日 · X

Gemma 4 被“越狱”刷屏，这事真正说明了什么

一条爆火帖子把 Gemma-4-31B 的“破解版”推上了桌面。真正值得看的，不只是模型被解限，而是开源模型、安全对齐和本地部署之间那条越来越松的边界。

#AI #Gemma #开源模型 #模型安全

大模型生态 2026年4月3日 · Google Blog

Google 把 Gemma 4 推到了一个更现实的位置：不是最强，而是最能落地的开源模型

Google 发布 Gemma 4，把“开源模型竞争”从单纯拼参数，往设备适配、代理工作流和商业可用许可上拉了一层。真正值得看的是，它开始认真争夺本地 AI 和开发者生态的入口。

#AI #Google #Gemma #Open Source

AI产品策略 2026年4月3日 · Hugging Face

用 165 美元训出跨 25 个物种的 mRNA 模型，这事真正打到的是生物 AI 的成本线

OpenMed 把 mRNA 优化这件事从“高门槛生物工程”往“可复用的开源流水线”推了一步。更值得注意的不是单个指标，而是他们证明了跨物种、低成本、可复现实验这三件事可以同时成立。

#AI #BioTech #Hugging Face #mRNA

AI产品策略 2026年3月29日 · Google AI Studio on X

Google 把实时语音 Agent 往前推了一步：Gemini 3.1 Flash Live 上线

Google AI Studio 上线 Gemini 3.1 Flash Live，重点不是又发了一个新模型，而是把实时语音与视觉 Agent 的延迟、指令遵循和多语言能力一起往可用区间推了一截。这类发布真正值得看的，不是 demo 漂不漂亮，而是它是否开始接近“能稳定上线”的门槛。

#AI #Gemini #Voice Agent #Google AI Studio

大模型生态 2026年3月28日 · M1Astra / leaked Anthropic page cache

Claude Mythos 泄露，不只是 Anthropic 提前剧透了一张新模型海报

一次看起来像是官网误放的页面缓存，把 Anthropic 还没正式发布的新模型 Mythos/Capybara 提前暴露了出来。真正值得注意的不是名字，而是它被定位在 Opus 之上，并且首先瞄准的是网络安全场景。

#AI #Anthropic #Claude #Cybersecurity

Agent 与接口 2026年3月26日 · X / NVIDIA Research

NVIDIA 把“盲编程”推到台前：Agent 连跑 7 天，开始越过 GPU 专家

NVIDIA 最新的 AVO 研究，不只是把代码生成做得更强，而是把 Agent 直接抬成了“进化算子”。真正值得警惕的不是它赢了多少百分点，而是它开始能在几乎没人盯着的情况下，持续做出硬件级优化判断。

#AI #Agent #NVIDIA #GPU

Agent 与接口 2026年3月25日 · FutureSearch

LiteLLM 被投毒，不只是一个包出事，而是整条 AI 开发链条一起暴露

LiteLLM 在 PyPI 上出现被投毒版本，恶意 `.pth` 文件会在 Python 启动时自动执行，目标不是单纯搞破坏，而是直接打开发者机器、云凭证和 Kubernetes 集群。这件事真正危险的地方，是 AI 开发工具链里“一个常用依赖”已经足够成为基础设施级入口。

#AI #Python #Supply Chain Security #LiteLLM

AI算力 2026年3月23日 · SkyPilot Blog

当 Autoresearch 拿到 16 张 GPU，Agent 做研究这件事开始变味了

SkyPilot 团队把 Claude Code 接到 Karpathy 的 autoresearch 项目上，再给它 16 张 GPU 和一个 Kubernetes 集群。结果不只是实验跑得更快，而是 agent 的研究方法本身变了：从串行试错，变成并行搜索、分层验证，甚至学会了按 H100 和 H200 的差异来分配实验。

#AI #Agent #GPU #SkyPilot

AI产品策略 2026年3月19日 · Google Labs / X

Google 把“vibe coding”推进到设计端，Stitch 这一步很像产品原型工具的重排

Google Labs 推出 Stitch，把自然语言、交互原型和品牌设计系统压进同一条工作流里。它不只是又一个 AI 画界面工具，更像是在抢“谁先接管产品定义到设计落地的第一公里”。

#AI #Google #设计工具 #原型设计

Agent 与接口 2026年3月18日 · X / Anthropic

Claude Code 把 Skill 这件事讲透了，但真正值钱的不是“会写 SKILL.md”

Anthropic 这篇关于 Claude Code Skills 的总结，最有价值的地方不是技巧清单本身，而是把 Skill 从“一个提示词文件”重新定义成了组织生产力的封装单位。真正拉开差距的，不是谁会写几段 markdown，而是谁能把知识、脚本、验证、数据接口和长期维护一起做成可复用资产。

#AI #Claude Code #Agent #开发工具

AI产品策略 2026年3月18日 · X / GitHub

OpenMAIC 把“做一节 AI 课”这件事，往产品化又推了一大步

清华团队开源的 OpenMAIC，不只是把资料丢给模型再吐一份讲稿，而是把讲课、互动、白板、测验和导出课件串成了一个完整课堂。真正值得警惕的不是又多了一个 demo，而是 AI 教学产品里最贵的那层“编排能力”开始被开源公共化。

#AI #教育科技 #Multi-Agent #Open Source

AI产品策略 2026年3月17日 · 微信公众号 / APPSO

阿里把“悟空”推到台前，真正想抢的是企业级 Agent 入口

阿里成立 ATH 事业群后，钉钉团队随即发布企业级 AI 原生工作平台“悟空”。这件事最值得看的，不是发布会上的热闹口号，而是阿里开始把组织、平台、权限和 Skill 生态一起打包，去抢企业级 Agent 的操作系统位置。

#AI #阿里巴巴 #钉钉 #Agent

大模型生态 2026年3月17日 · X / Impress Watch

乐天把“日本语大模型”这件事，往前推了一步

乐天开始提供日语特化 LLM「Rakuten AI 3.0」，并以 Apache 2.0 许可免费公开。它真正值得看的，不只是参数规模，而是日本本土模型生态终于开始从“会用海外模型”走向“要做自己的语言层能力”。

#AI #LLM #日本 #开源