NewsletterBlogGlossary
LAUNCHTECHNIQUETOOLINSIGHTRESEARCHBUILD

24 条资讯

Claude 直接在聊天里画交互式图表了

🧠 发布动态

Claude 直接在聊天里画交互式图表了。

不是截图,不是代码块 — 是可以点击、缩放、交互的图表和示意图,直接在对话窗口里渲染。所有套餐都能用,包括免费版。这意味着 Claude 从"帮你写分析"变成了"帮你做分析" — 数据探索的门槛又低了一截。现在就去试。(12,472 likes | 878 RTs) 详情 →

OpenAI Video API 接入 Sora 2:自定义角色、20 秒片段。

Sora 2 驱动的视频 API 重大升级 — 自定义角色和物体、16:9/9:16 双比例输出、最长 20 秒片段、视频续写。Sora 从"炫技 demo"正式变成了开发者可以集成的生产工具。做视频类产品的,API 文档值得今天就看。(303 likes | 34 RTs) 详情 →

Replit Agent 4 不只写代码了。 幻灯片、视频、电子表格 — Replit 从"学生用的在线 IDE"转型成全能知识工作 Agent。这个定位转变很激进,但逻辑清楚:代码 Agent 赛道太卷,不如把 Agent 能力铺到所有办公场景。 详情 →

NVIDIA 丢出 Nemotron 3 Super:120B 参数,只激活 12B。 MoE 架构让这个"1200 亿参数模型"跑在原本连 700 亿稠密模型都带不动的硬件上。已上 HuggingFace 热榜。参数量越来越不能当面值看了 — 详见今天的模型小课堂。(126 likes | 2.8K downloads) 详情 →

Meta 开源森林冠层测绘模型 CHMv2。 基于 DINOv3 Sat-L 基础模型,与世界资源研究所合作开发,用于高分辨率全球森林冠层制图。基础模型 + 垂直场景的标准打法,这次用在了环境监测上。(143 likes | 20 RTs) 详情 →


💡 行业洞察

Karpathy 发明"智能停电":一场 OAuth 故障让他的研究 Agent 全军覆没。

Karpathy 的自动研究实验室被 OAuth 中断一波带走,他造了个词:"intelligence brownouts"(智能停电)— 当 frontier AI 打个嗝,整个地球的智商都跟着掉。这不是段子,是真实的架构风险:你的工作流对 AI 的依赖程度,有没有 failover 方案?现在就该像对待断电一样对待 AI 中断。(5,650 likes | 244 RTs) 详情 →

预测:亚马逊将在数周内禁止 AI 生成的代码变更。 一个大胆预测,理由是技术债和 bug 堆积的隐患。不管这个预测准不准,它反映了企业真实的焦虑 — AI 写代码快是快了,但谁来兜底代码质量?你的团队有 AI 代码审查的规矩吗?(2,379 likes | 239 RTs) 详情 →

Anthropic 的 Alex Albert:知识工作正在复刻去年 Agent 编程的轨迹。 去年是代码,今年是表格和幻灯片 — AI Agent 的下一个战场是所有知识工作。从写代码到做 PPT,路径已经很清晰了。(439 likes | 16 RTs) 详情 →

Ramp AI 指数:Anthropic 已成企业 AI 支出的默认选择。 这不是问卷调查,是真金白银的支出数据 — Ramp 的最新 AI 指数显示,企业端的钱正在从 OpenAI 流向 Anthropic。格局在变。(1,461 likes | 121 RTs) 详情 →


📝 技术实战

OpenAI 分享构建 Computer-Use Agent 的工程经验。

长时间运行的 Agent 工作流要落地,关键三件事:收紧执行循环、通过文件系统提供丰富上下文、在安全护栏下开放网络访问。做 Agent 架构的必读 — 都是踩坑踩出来的实战经验。(578 likes | 75 RTs) 详情 →

一个 26 亿美元公司的 CPO 怎么用 Claude Code 跑完整天工作。 从 CLAUDE.md 配置到 Skills vs MCP vs Hooks 的选择,再到为什么从 Cursor 切回终端 — 这是目前看到的最完整的 Claude Code 日常工作流拆解。(467 likes | 55 RTs) 详情 →


🔧 开发者工具

Claude 的 Excel 和 PowerPoint 插件现在可以跨应用共享上下文了。 之前 Excel 和 PPT 里的 Claude 各干各的,现在它们共享记忆了,还支持 Skills。对于整天泡在 Office 里的人来说,这是真正的工作流打通。(456 likes | 25 RTs) 详情 →

Responses API 一周年回顾:工具调用如何把"回复"变成了"行动"。 OpenAI 回顾了 Responses API 这一年 — 当模型能用工具时,API 返回的不再是文字而是动作。对理解当前 Agentic API 的能力边界是个好参考。(469 likes | 34 RTs) 详情 →

HuggingFace PRO 存储暴涨:1TB 私有 + 10TB 公开,月费 $9。 这个价格直接让 Hub 变成了 ML 模型和数据集的 S3 替代方案。维护开源模型的,算一下你现在的存储成本。(113 likes | 7 RTs) 详情 →


🔬 研究前沿

NVIDIA 公开 AI-Q 登顶两个 DeepResearch 基准的方法论。 详细的技术拆解,展示了如何系统性优化 Agentic 搜索和检索架构。做研究 Agent 的,这是目前最好的参考实现文档。(126 likes) 详情 →

AutoResearch-RL:自我评估的 RL Agent,自主发现新的神经网络架构。 一篇新论文提出了能持续自我评估、自主发现新架构的强化学习 Agent — AI 开始设计 AI 自己了。离完全自主的 AI 研究又近了一步。(351 likes | 51 RTs) 详情 →


🏗️ 值得一试

OneCLI:专为 AI Agent 设计的凭证保险箱。 Rust 写的,解决一个很实际的问题 — 自主 Agent 怎么安全地访问 API 密钥和凭证,而不是硬编码在代码里?如果你在做 Agent 系统,认真看看。(44 likes | 16 RTs) 详情 →

LogClaw:开源 AI SRE,从日志自动建工单。 AI 监控日志,检测到问题自动创建工单 — 把可观测性和事件响应之间的人工分诊环节干掉了。先在 staging 环境试试。(13 likes | 7 RTs) 详情 →


🎓 模型小课堂

混合专家模型(MoE)— 活跃参数 vs 总参数:NVIDIA 的 Nemotron 3 Super 号称 1200 亿参数,但每个 token 只激活 120 亿。怎么回事?MoE 架构把模型拆成很多"专家"子网络,每次推理只调用最相关的几个专家,其余的"休息"。所以一个"1200 亿参数模型"实际运行时的计算量可能只相当于 120 亿稠密模型。这就是为什么它能跑在原本带不动 700 亿稠密模型的硬件上 — 也是为什么光看参数量越来越不靠谱了。下次看到某个模型吹参数量,先问一句:稠密的还是 MoE 的?


⚡ 快讯

  • Anthropic Institute:Anthropic 成立新研究机构,专注 AI 政策与治理的公共对话。(3,861 likes | 444 RTs) 链接
  • Anthropic 悉尼办公室:亚太第四个据点(东京、班加罗尔、首尔之后),继续扩张。(2,197 likes | 165 RTs) 链接
  • DeepMind 伦敦总部命名 Platform 37:致敬 AlphaGo 著名的第 37 手。(1,438 likes | 129 RTs) 链接
  • Mistral 首届旗舰大会:5 月 28 日巴黎,聚焦企业 AI 转型。(268 likes | 47 RTs) 链接
  • Google AI 心脏健康筛查:AI 在澳大利亚偏远地区部署心脏健康筛查。 链接
  • DeepMind 回顾 AlphaGo 十周年:从棋盘到科学发现的十年路。(87 likes | 13 RTs) 链接

🎯 今日精选

Karpathy 的"智能停电"揭示了一个我们还没准备好面对的现实:Karpathy 的自动研究 Agent 被一场 OAuth 故障全部击垮,他随手造的"智能停电"这个词可能比他意识到的更重要。我们已经悄悄越过了 AI 依赖的临界点 — 越来越多的真实工作流建立在 frontier AI 之上,但几乎没有人为 AI 中断准备了 failover 方案。电力中断有 UPS 和备用发电机,网络中断有 CDN 和多区域部署,但 AI 中断呢?大多数团队的答案是"等它恢复"。当整个研究实验室、代码审查流程、客服系统都依赖同一个 API 端点时,一次认证故障就能让一个团队的产出归零。这不是未来的问题,是今天的问题。(5,650 likes | 244 RTs) 详情 →


下期见 ✌️