Claude 直接在聊天里画交互式图表了

🧠 发布动态

Claude 直接在聊天里画交互式图表了。

不是截图，不是代码块 — 是可以点击、缩放、交互的图表和示意图，直接在对话窗口里渲染。所有套餐都能用，包括免费版。这意味着 Claude 从"帮你写分析"变成了"帮你做分析" — 数据探索的门槛又低了一截。现在就去试。(12,472 likes | 878 RTs) 详情 →

OpenAI Video API 接入 Sora 2：自定义角色、20 秒片段。

Sora 2 驱动的视频 API 重大升级 — 自定义角色和物体、16:9/9:16 双比例输出、最长 20 秒片段、视频续写。Sora 从"炫技 demo"正式变成了开发者可以集成的生产工具。做视频类产品的，API 文档值得今天就看。(303 likes | 34 RTs) 详情 →

Replit Agent 4 不只写代码了。 幻灯片、视频、电子表格 — Replit 从"学生用的在线 IDE"转型成全能知识工作 Agent。这个定位转变很激进，但逻辑清楚：代码 Agent 赛道太卷，不如把 Agent 能力铺到所有办公场景。详情 →

NVIDIA 丢出 Nemotron 3 Super：120B 参数，只激活 12B。 MoE 架构让这个"1200 亿参数模型"跑在原本连 700 亿稠密模型都带不动的硬件上。已上 HuggingFace 热榜。参数量越来越不能当面值看了 — 详见今天的模型小课堂。(126 likes | 2.8K downloads) 详情 →

Meta 开源森林冠层测绘模型 CHMv2。 基于 DINOv3 Sat-L 基础模型，与世界资源研究所合作开发，用于高分辨率全球森林冠层制图。基础模型 + 垂直场景的标准打法，这次用在了环境监测上。(143 likes | 20 RTs) 详情 →

💡 行业洞察

Karpathy 发明"智能停电"：一场 OAuth 故障让他的研究 Agent 全军覆没。

Karpathy 的自动研究实验室被 OAuth 中断一波带走，他造了个词："intelligence brownouts"（智能停电）— 当 frontier AI 打个嗝，整个地球的智商都跟着掉。这不是段子，是真实的架构风险：你的工作流对 AI 的依赖程度，有没有 failover 方案？现在就该像对待断电一样对待 AI 中断。(5,650 likes | 244 RTs) 详情 →

预测：亚马逊将在数周内禁止 AI 生成的代码变更。 一个大胆预测，理由是技术债和 bug 堆积的隐患。不管这个预测准不准，它反映了企业真实的焦虑 — AI 写代码快是快了，但谁来兜底代码质量？你的团队有 AI 代码审查的规矩吗？(2,379 likes | 239 RTs) 详情 →

Anthropic 的 Alex Albert：知识工作正在复刻去年 Agent 编程的轨迹。 去年是代码，今年是表格和幻灯片 — AI Agent 的下一个战场是所有知识工作。从写代码到做 PPT，路径已经很清晰了。(439 likes | 16 RTs) 详情 →

Ramp AI 指数：Anthropic 已成企业 AI 支出的默认选择。 这不是问卷调查，是真金白银的支出数据 — Ramp 的最新 AI 指数显示，企业端的钱正在从 OpenAI 流向 Anthropic。格局在变。(1,461 likes | 121 RTs) 详情 →

📝 技术实战

OpenAI 分享构建 Computer-Use Agent 的工程经验。

长时间运行的 Agent 工作流要落地，关键三件事：收紧执行循环、通过文件系统提供丰富上下文、在安全护栏下开放网络访问。做 Agent 架构的必读 — 都是踩坑踩出来的实战经验。(578 likes | 75 RTs) 详情 →

一个 26 亿美元公司的 CPO 怎么用 Claude Code 跑完整天工作。 从 CLAUDE.md 配置到 Skills vs MCP vs Hooks 的选择，再到为什么从 Cursor 切回终端 — 这是目前看到的最完整的 Claude Code 日常工作流拆解。(467 likes | 55 RTs) 详情 →

🔧 开发者工具

Claude 的 Excel 和 PowerPoint 插件现在可以跨应用共享上下文了。 之前 Excel 和 PPT 里的 Claude 各干各的，现在它们共享记忆了，还支持 Skills。对于整天泡在 Office 里的人来说，这是真正的工作流打通。(456 likes | 25 RTs) 详情 →

Responses API 一周年回顾：工具调用如何把"回复"变成了"行动"。 OpenAI 回顾了 Responses API 这一年 — 当模型能用工具时，API 返回的不再是文字而是动作。对理解当前 Agentic API 的能力边界是个好参考。(469 likes | 34 RTs) 详情 →

HuggingFace PRO 存储暴涨：1TB 私有 + 10TB 公开，月费 $9。 这个价格直接让 Hub 变成了 ML 模型和数据集的 S3 替代方案。维护开源模型的，算一下你现在的存储成本。(113 likes | 7 RTs) 详情 →

🔬 研究前沿

NVIDIA 公开 AI-Q 登顶两个 DeepResearch 基准的方法论。 详细的技术拆解，展示了如何系统性优化 Agentic 搜索和检索架构。做研究 Agent 的，这是目前最好的参考实现文档。(126 likes) 详情 →

AutoResearch-RL：自我评估的 RL Agent，自主发现新的神经网络架构。 一篇新论文提出了能持续自我评估、自主发现新架构的强化学习 Agent — AI 开始设计 AI 自己了。离完全自主的 AI 研究又近了一步。(351 likes | 51 RTs) 详情 →

🏗️ 值得一试

OneCLI：专为 AI Agent 设计的凭证保险箱。 Rust 写的，解决一个很实际的问题 — 自主 Agent 怎么安全地访问 API 密钥和凭证，而不是硬编码在代码里？如果你在做 Agent 系统，认真看看。(44 likes | 16 RTs) 详情 →

LogClaw：开源 AI SRE，从日志自动建工单。 AI 监控日志，检测到问题自动创建工单 — 把可观测性和事件响应之间的人工分诊环节干掉了。先在 staging 环境试试。(13 likes | 7 RTs) 详情 →

🎓 模型小课堂

混合专家模型（MoE）— 活跃参数 vs 总参数：NVIDIA 的 Nemotron 3 Super 号称 1200 亿参数，但每个 token 只激活 120 亿。怎么回事？MoE 架构把模型拆成很多"专家"子网络，每次推理只调用最相关的几个专家，其余的"休息"。所以一个"1200 亿参数模型"实际运行时的计算量可能只相当于 120 亿稠密模型。这就是为什么它能跑在原本带不动 700 亿稠密模型的硬件上 — 也是为什么光看参数量越来越不靠谱了。下次看到某个模型吹参数量，先问一句：稠密的还是 MoE 的？

⚡ 快讯

Anthropic Institute：Anthropic 成立新研究机构，专注 AI 政策与治理的公共对话。(3,861 likes | 444 RTs) 链接
Anthropic 悉尼办公室：亚太第四个据点（东京、班加罗尔、首尔之后），继续扩张。(2,197 likes | 165 RTs) 链接
DeepMind 伦敦总部命名 Platform 37：致敬 AlphaGo 著名的第 37 手。(1,438 likes | 129 RTs) 链接
Mistral 首届旗舰大会：5 月 28 日巴黎，聚焦企业 AI 转型。(268 likes | 47 RTs) 链接
Google AI 心脏健康筛查：AI 在澳大利亚偏远地区部署心脏健康筛查。链接
DeepMind 回顾 AlphaGo 十周年：从棋盘到科学发现的十年路。(87 likes | 13 RTs) 链接

🎯 今日精选

Karpathy 的"智能停电"揭示了一个我们还没准备好面对的现实：Karpathy 的自动研究 Agent 被一场 OAuth 故障全部击垮，他随手造的"智能停电"这个词可能比他意识到的更重要。我们已经悄悄越过了 AI 依赖的临界点 — 越来越多的真实工作流建立在 frontier AI 之上，但几乎没有人为 AI 中断准备了 failover 方案。电力中断有 UPS 和备用发电机，网络中断有 CDN 和多区域部署，但 AI 中断呢？大多数团队的答案是"等它恢复"。当整个研究实验室、代码审查流程、客服系统都依赖同一个 API 端点时，一次认证故障就能让一个团队的产出归零。这不是未来的问题，是今天的问题。(5,650 likes | 244 RTs) 详情 →

下期见 ✌️