2026

91 篇

2026年4月5日

八个 Hook，让 AI Agent 从「大概会执行」变成「必然执行」

CLAUDE.md 里的规则大概有 80% 的时候会被遵守。Hook 是 100%。经过六个月的实测，这八个 Hook 一次都没有被我从配置里删掉。

2026年4月5日

两个人，30亿人民币营收 - Medvi用AI真正建造了什么

纽约时报关于Medvi两人团队创造30亿人民币营收的报道，看起来像是AI从零建起了一门生意。深挖进去，真正的教训在于借助现成基础设施完成的漏斗压缩。

2026年4月1日

2026年的Claude Code：层级比工具更重要

我在同一周装了三个主流Claude Code扩展，生产力几乎没有变化。问题从来不在于选哪些工具。

2026年4月1日

Codex 配置为什么不生效：.codex/ 目录结构的坑

我改了 config.toml，在 AGENTS.md 里写了规则，但什么都没用。后来发现问题不在配置内容，而在文件放错了地方。

2026年4月1日

Codex搬进了Claude Code，这说明了一切

Anthropic发布Computer Use的同一天，OpenAI把Codex做成了Claude Code插件。我认为这是2026年最聪明的一次让步。

2026年3月26日

Claude Code Channels 改变了我离开终端后的工作方式

一个月前，构建期间我根本离不开笔记本电脑。四周内发布的三个功能解决了这个问题。

2026年3月26日

花十小时打磨的 Skill，永远胜过十分钟随手写的

我以为一个 SKILL.md 文件就够了。直到我看到 Anthropic 自己团队的结构方式，才推倒重来。

2026年3月26日

四种上下文决定AI是在帮你还是在浪费你的时间

我花了一个周末把100MB的PDF塞进智能体，结果表现反而更差了。把输入拆分成四类之后，问题一下子就看清楚了。

2026年3月19日

12 个免费 Skills，告别 AI 生成的廉价设计

我测试了几十个用于 AI 编程 agent 的设计 skill，大多数不到一周就被淘汰了。这 12 个是我至今仍在使用的。

2026年3月19日

2026年，真正有效的AI策略只有一个字：循环

我搭建了各种技能模块、配置了子代理和斜杠命令，结果一个通宵跑着的循环把所有这些设置都比了下去。

2026年3月19日

用 Claude Code 和 Codex 之前，先写好三个规格文件

我花了一年时间从 Claude Code 和 Codex 得到反复无常的结果。三个职责分明的规格文件解决了这个问题。

2026年3月19日

让AI代理写完代码之后，人类该做的是可视化

代理写代码只是开始。要理解PR并向同事解释架构，可视化工具必不可少。

2026年3月12日

让你跻身顶尖 0.01% 的 5 个 AI 工具配置

订阅 Claude Code 或 Codex 已让你超越大多数人，但这五项配置——智能体、团队协作、MCP、监控、自动化——才能让你真正进入顶尖 0.01%。

2026年3月12日

你应该了解的 31 个 AI 编程 Agent 术语，按五大支柱分类

我把每天使用 Claude Code 和 Codex 时反复遇到的术语全部整理分类。五个分组自然浮现，它们完整地描绘了这些工具所运行的整个体系。

2026年3月12日

Claude Code 29个工具 vs Codex 7个工具：设计理念截然相反

我深入研究了两款工具的SDK类型定义和系统提示词。29与7的差距并非功能数量的问题，而是对同一问题的两种根本性不同的回答：AI编程智能体应该如何与你的系统交互？

2026年3月12日

LLM 写了 57 万行 Rust 代码，编译通过，却比 SQLite 慢了 20171 倍

有人对一个完全由 LLM 生成的 SQLite Rust 重写版本做了性能基准测试。能跑通、能编译、看起来没问题的代码，和真正正确的代码之间，差距竟然达到五个数量级。

2026年3月12日

独立创始人、零员工、200万美元ARR：让这一切成真的Agent技术栈

过去两个月出现的四个项目揭示了一个趋势：AI Agent不仅能写代码，还能自主盈利、编排协作、运营整个公司。

2026年3月12日

在让 Claude Code 或 Codex 干活之前，先写好三个规格文件

使用 AI 智能体将近一年后，我发现结构化的规格文件比任何提示词技巧都更能解决结果不一致的问题。

2026年3月5日

Codex 如何用不同方式解决上下文压缩问题

我逆向分析了 Codex 与 Claude Code 处理上下文溢出的差异，答案涉及 AES 加密、会话交接模式以及 KV 缓存技巧，整个架构远比想象中复杂。

2026年3月4日

Shopify CEO亲手打造的搜索引擎，1秒复活Claude Code的700个会话

Shopify CEO Tobias开发的QMD搜索引擎接入Claude Code后，700个会话的记忆在1秒内全部恢复。

2026年3月3日

Claude Code团队重建工具3次后总结的4条设计原则

Anthropic的Claude Code团队花了一年时间增删和重新设计工具，发现减少工具反而让AI表现更好。以下是他们总结的四条原则。

2026年3月3日

Claude Code 子代理让主会话节省 25 倍 Token

AI 并没有变笨，是主会话超载了。用子代理保持上下文精简，让高质量对话持续超过一小时。

2026年3月3日

Claude Code 刚刚把所有人的周限额重置为零 — 到底发生了什么

Claude Code v2.1.59–v2.1.61 中 Auto Memory 与上下文压缩的竞态条件破坏了提示缓存并污染了会话。Anthropic 将所有用户的周限额重置作为补偿。

2026年3月3日

Claude Code 用户必装的两个工具 — Agentation 和 Readout

Agentation 通过 CSS 选择器为 AI 代理提供像素级视觉反馈。Readout 像回放视频一样重现 Claude Code 会话。两个工具解决了 AI 辅助前端开发中最大的两个痛点。

2026年3月3日

为什么 Stripe 运行数百个 Agent 后彻底放弃了 localhost——通宵跑了一遍，完全理解了

在一场 12 小时的黑客马拉松里只用 Agent 构建产品后，我切身体会到了 Stripe Minions 和 Ramp Inspect 为何选择云端隔离环境。

2026年2月26日

我翻了 300 条 Agent 失败日志，问题从来不在 Prompt

一个开源的 context engineering 技能集刚突破 GitHub 10k star。把它用到自己的 agent 架构上之后，我终于搞清楚 agent 为什么会失败。

2026年2月26日

free-router：我做了一个CLI工具，让氛围编程的成本降到0元

被人指出公开发布的成果太少后失眠了，凌晨3点开始写free-router。它能实时找到免费AI模型，一键连接到你的编程工具。

2026年2月25日

7 步流水线：验证 AI 代理编写的代码

当代理每天推送 3000 次提交，人工根本审查不过来。这里介绍如何构建一套由机器验证的流水线，捕捉人类遗漏的问题。

2026年2月25日

Agent 连续调用同一个失败的 API 五次——问题根本不在代码里

当 Agent 反复触发同一个失败的 API 调用，翻代码没有任何意义。Trace 才是调试 AI Agent 的新源代码。

2026年2月25日

我懒得写 CLAUDE.md，没想到这反而是对的

最新基准测试数据表明，AGENTS.md 和 CLAUDE.md 这类上下文文件实际上会拖累编程智能体的表现。有时候，懒惰才是最好的工程决策。

2026年2月25日

AI预期全部兑现，标普500反而暴跌38%？

解析Citrini Research的2028年宏观情景推演：AI越成功，经济越崩溃的悖论，以及Ghost GDP与Intelligence Displacement Spiral的内在逻辑。

2026年2月25日

Anthropic、OpenAI、Google 四项更新背后的隐藏共同点

三家公司几乎同时更新了编码代理。方向高度重合。真正的竞争焦点不是模型，而是吸收开发者工作流的速度。

2026年2月25日

2026年AI五大预测：智能体、芯片与历史性Exit

从SaaS末日到模型专用芯片，关于2026年AI走向的五个大胆预测：大概有50%的把握说对。

2026年2月20日

削减 90% Claude Code API 费用的 Cache 设计

Cache 在生产环境中断的那一小时，API 账单比前三天加起来还高。同一天，Anthropic 工程师发文解释了根本原因。

2026年2月20日

把提示词粘贴两遍，准确率就变了

Google Research 用7个模型验证过的最便宜的LLM性能提升方法。不需要额外训练，不需要提示词设计，复制粘贴就行。

2026年2月18日

任务成功率从 6.7% 到 68.3%：10 倍差距来自 Harness，而非模型

LangChain 的 Terminal Bench 结果与 hashline 格式实验揭示了什么。同一个模型排名被逆转，原因只有三个：提示词、工具和中间件。

2026年2月17日

Web的头号客户正从人类变成AI

从Cloudflare和Vercel的Markdown for Agents到Google的WebMCP, , 读写同步标准化，Agent-Native Web时代正式开启。

2026年2月17日

Anthropic 公布的 SKILL.md Body 编写规则 5 条

藏在 Anthropic 官方文档里的 SKILL.md body 编写原则 5 条。从 description 与 body 的职责分离到验证循环。

2026年2月17日

每月$220的ChatGPT Pro只要29,000韩元？只有韩国人能享受

通过KakaoTalk礼物购买ChatGPT Pro仅需29,000韩元的韩国专属优惠，以及Codex-5.3-Spark每秒1,000 token输出速度解析。

2026年2月17日

引入AI Agent之前，先把公司变成一个文件系统

Agent时代的真正竞争力不在于模型，而在于文件系统设计。本文讲述如何将企业数据统一到一个命名空间中。

2026年2月17日

Hugging Face联合创始人预测的软件5大转折点

Thomas Wolf提出的AI时代软件架构根本性变革。从依赖库时代的终结到AI专用语言的出现，赞同与质疑并存的深度解读。

2026年2月17日

OpenAI为何招揽OpenClaw开发者 - AI原生即时通讯时代开启

OpenClaw创始人Peter Steinberger加入OpenAI不只是人才争夺。AI正在重新定义聊天应用本身，这场全球变革的深度解析。

2026年2月12日

OpenAI 纯靠 Agent 写出百万行代码的秘密：Harness 工程五大原则

OpenAI Codex 团队仅用 AI Agent 构建了百万行代码库，本文解析他们总结的 Harness 工程五大核心原则。

2026年2月11日

将AI代理网页浏览Token成本降低100倍的隐藏工具

介绍Actionbook解决浏览器代理速度慢和Token成本高问题的革命性方法。基于手册的自动化实现10倍速度提升和100分之1的成本。

2026年2月10日

代币分层：AI 定价如何创造新的经济不平等

Opus 4.6 Fast 模式输出 $150。这不仅仅是定价问题, , 这是一个新经济分界线的开始，其中代币访问权限决定了竞争力。

2026年2月9日

Claude Code Agent Teams -- 从配置到快捷键全指南

Claude Code 多智能体团队功能实用指南：激活方式、键盘快捷键、终端兼容性、任务管理机制，以及当前已知的限制与注意事项。

2026年2月8日

AI落地与否，企业估值差出4倍 - 数据已经说明一切

Meritech Capital对100多家上市软件公司的分析揭示：AI执行企业与非AI企业之间存在巨大的估值鸿沟。

2026年2月8日

AI芯片版图刚刚被改写 - 2026年，智能体重塑了整个半导体格局

从Nvidia一家独大到多芯片组合战略，从训练为王到推理当道 - 智能体时代彻底改写了AI芯片的竞争版图。

2026年2月8日

AI飞轮悖论：OpenAI押注更多算力,市场却担忧产能过剩

当市场对GPU产能过剩发出警报时,OpenAI却宣称需要更多算力。AI行业的飞轮效应正在形成,但真正的瓶颈可能并不在算力本身。

2026年2月8日

OpenAI与Google的2026年宣言：AI低价竞争时代已经到来，现在是最佳入场时机

OpenAI和Google争相推出低价AI套餐，中国厂商引领价格战。本文解析为什么现在是拥抱AI的最佳时机。

2026年2月8日

AI创业公司必须每3个月重新寻找PMF

Lovable增长负责人Elena Verna解读AI时代的增长法则。漏斗优化仅贡献5%的增长，剩下95%来自新功能发布。

2026年2月8日

AI时代，靠「高价订阅」守住收入的策略已经失效了

a16z的水晶鞋效应和Bessemer的AI超新星报告揭示了真相 - AI初创公司为何把GPU成本当营销费烧，以及为什么价格壁垒比亏损更快地杀死企业。

2026年2月8日

AI Wrapper 时代已经结束。Claude Agent Wrapper 时代正式开启。

Anthropic 的 Tariq Shihipar 揭示了构建生产级 Agent 的核心要素 - 从 Bash 优先的工具设计到基于文件系统的上下文工程。

2026年2月8日

Claude Code 是开发者的工具，Cowork 是所有人的工具

Anthropic 发布 Cowork，一个能自主读取、编辑和创建本地文件的智能体。从 vibe coding 到 vibe working。

2026年2月8日

AI大战胜负已分 - Anthropic Opus 4.5证明'聚焦'才是制胜之道

Anthropic的Claude Opus 4.5不只是刷新了跑分。当竞争对手在多模态上分散资源时，全押文本、代码和智能体的聚焦策略才是真正的赢家。

2026年2月8日

ChatGPT是Android，Claude是iOS

ChatGPT和Claude争夺AI应用商店的同时，SaaS市值蒸发3000亿美元的真正原因，以及2008年移动战争带来的启示。

2026年2月8日

2026年AI关键词，可能就是「中国」

DeepSeek V4、中国模型渗透、历史性IPO、全球扩张 - 2026年第二周的数据指向一个明确的方向：中国。

2026年2月8日

Claude Code创始人实际上是怎么用Claude Code的

Boris Cherny的工作流在2小时内获得5千点赞。他的配置比你想象的更简单 - 并行会话、计划模式、CLAUDE.md和验证循环。

2026年2月8日

一位Claude Code重度用户的完整配置指南，颠覆了我的认知

Anthropic黑客松冠军公开了他用了10个月的Claude Code配置方案。从上下文窗口管理到Skill、Hook、子代理的角色分离，这份指南改变了我对AI编程工具的理解。

2026年2月8日

Claude Code Skills 配置：1人顶30人的工作

从营销、视频到UI设计和代码质量 - 六种Claude Code技能组合，让小团队也能运营全栈业务。

2026年2月8日

10万个Claude Code Skill中真正留下的4个

安装了数百个AI编程代理Skill后，每天真正在用的只有4个。分享我的周末筛选结果。

2026年2月8日

Claude Code的Task系统揭示了AI原生工程师的核心能力

Claude Code将Todo改名为Task。看似微小的变更，实则是为AI Swarm构建的全新系统的起点。

2026年2月8日

Claude HUD：让AI代理的黑箱变透明的插件

一个游戏风格的状态栏插件，实时展示Claude Code的上下文用量、活跃工具、子代理和Todo进度。

2026年2月8日

Claude in Excel是对「AI+X」创业公司的宣战

Anthropic的Claude in Excel揭示了AI增强型与AI原生之间的鸿沟 - 以及为什么大多数「AI+X」创业公司撑不过2026年。

2026年2月8日

Clawdbot 让 Mac Mini 卖断货的那个周末 - 以及 Kakao 该紧张的真正原因

Clawdbot 证明了在本地硬件上运行的 AI 代理可以取代即时通讯应用。这就是所有聊天平台都该警惕的原因。

2026年2月8日

Context7：用Skill和子代理，而不只是MCP

通过MCP直连Context7会把文档塞满主上下文。用Skill和子代理隔离查询，才能让长时间编码会话保持稳定。

2026年2月8日

个人智能体时代：每个应用都将变成API

为什么YC和OpenClaw的领导者都认为软件正在为智能体而重建 - 以及这对当下正在做产品的开发者意味着什么。

2026年2月8日

一切都在SKILL化：使用你服务的已经是AI了

当AI阅读文档的比例逼近50%、机器人流量是人类的3倍时，各大服务正在争相将核心知识打包成技能。这一切背后的驱动力是什么？

2026年2月8日

Karpathy的警醒：开发者必须掌握的全新抽象层

Andrej Karpathy坦言从未感到如此落后。他所说的AI智能体新抽象层，不掌握就可能被甩开10倍差距。

2026年2月8日

Meta 花 25 亿美元收购的 Manus，核心技术已开源

支撑 Manus 25 亿美元估值的文件记忆系统，现已作为免费 Claude Code 技能发布。每个 AI Agent 开发者都应该了解。

2026年2月8日

被 Meta 以 3 亿美元收购的 Manus，与 LangChain 联合公开了智能体开发的核心原则

Manus 在与 LangChain 的联合演讲中，分享了构建生产级 AI 智能体的实战经验 - 从上下文腐化到评估体系的全面反思。

2026年2月8日

Meta 36亿美元收购Manus背后的秘密：AI智能体失败的真正原因

Meta以约36亿美元收购了Manus。秘密不在于更大的模型，而在于上下文工程。以下是大多数AI智能体忽略的关键。

2026年2月8日

Meta收购Manus的启示 - 创业公司为什么再也不能只守本土市场

Meta以数十亿美元收购了中国AI创业公司Manus。这笔交易揭示了一个新现实：出海不是增长选项，而是AI时代每家创业公司的生存策略。

2026年2月8日

多智能体架构：盲目拆分只会适得其反

Anthropic研究表明多智能体系统可提升90%性能，但前提是选对架构。三个真实场景揭示子代理、技能、交接、路由四种模式各自的最佳适用场景。

2026年2月8日

设计多智能体系统时真正帮到我的一篇文章

编排模式、通信方式、内存管理、生产环境注意事项 - 设计多智能体系统时遇到的所有困惑，这篇文章几乎都解答了。

2026年2月8日

拆解 Oh-My-OpenCode：上下文工程的未来走向

Oh My OpenCode 不只是一个插件 - 它是多智能体编排、上下文隔离和代码级行为约束的工程化实践。深入源码后，我发现了比提示词技巧更深层的结构性创新。

2026年2月8日

从 Opencode 文档学习 AI 智能体设计的 7 大构建模块

Opencode 的开源文档堪称智能体架构入门教材。以下是每位开发者都应该理解的七个核心概念。

2026年2月8日

AI 首次接近人类推理水平 - Poetiq 突破 ARC-AGI-2 50% 大关

Poetiq 的递归元系统成为首个在 ARC-AGI-2 上突破 50% 的 AI，这是专为测试真正通用智能设计的基准测试。看一个 6 人团队如何以一半成本击败 Google。

2026年2月8日

AI通宵部署生产代码的时代

以辛普森角色拉尔夫·威格姆命名的Claude Code插件，正通过迭代循环、内存架构和停止钩子重新定义自主编程范式。

2026年2月8日

让LLM写代码来读取1000万Token？RLM的工作原理

更大的上下文窗口并不能让AI更聪明。RLM通过让LLM编写代码从海量文档中选择性读取所需内容，彻底颠覆了传统思路。

2026年2月8日

2026年1月，全球确立的AI智能体6大趋势

从持久循环到多智能体编排 - 一个月内在全球范围内得到验证的6个AI智能体模式。

2026年2月8日

一周内全球达成共识的 AI 智能体开发六大原则

2026 年伊始,上下文工程成为 AI 领域最热话题。如果你在做 AI 智能体却不知道这些原则,今年就会掉队。这是全球 AI 社区仅用一周时间达成的核心共识。

2026年2月8日

OpenClaw 创始人公开的 AI 编程 10 条原则

GitHub 史上最快获星项目的创建者 Peter Steinberger 分享与 AI 编程代理协作的 10 条实战原则。

2026年2月8日

垂直AI的幻象 - 2025年创业公司生存的本质

Menlo Ventures 2025企业AI报告揭示：我们熟知的SaaS成功法则已被彻底颠覆。每家创业公司都必须直面的三大市场变局。

2026年2月8日

氛围编程时代：创始人的角色正从「程序员」变为「总编辑」

2026年，创业的语法正在改写。比起自己写代码的能力，知道让AI做什么、怎么做的眼光才是新的竞争力。

2026年2月8日

为什么 Claude Code 放弃了 Todos 和斜杠命令

Anthropic 在两天内同时用 Tasks 替换了 TodoWrite,用 Skills 替换了斜杠命令。两个变化指向同一个方向 - 给模型松绑。

2026年2月8日

2026年AI时代，UI真的会消失吗？

Claude Code和AI虚拟形象应用已经证明：用户想要的不是复杂界面，而是结果。零UI时代正以超乎想象的速度到来。

2026年2月8日

为什么你的X信息流突然出现大量长文

X的算法开始优先推荐长文Articles而非短推文 - 原因何在，对2026年的内容创作者意味着什么。

2026年2月8日

小米AI逆袭揭示人才战的残酷真相

小米从DeepSeek挖来一位核心研究员,瞬间成为顶级AI模型开发者。这对行业真正护城河意味着什么。

2026年2月7日

我的 AI 智能体编程终端配置

如何用 Ghostty、Yazi、Fish 和 LazyGit 并行运行多个 AI 智能体 - 一套为智能体工作流打造的轻量终端技术栈。

2026年1月29日

你好，欢迎光临！

我的第一篇博客 - 用 Astro 搭建的内容营销小实验。