CLAUDE.md 里的规则大概有 80% 的时候会被遵守。Hook 是 100%。经过六个月的实测,这八个 Hook 一次都没有被我从配置里删掉。
纽约时报关于Medvi两人团队创造30亿人民币营收的报道,看起来像是AI从零建起了一门生意。深挖进去,真正的教训在于借助现成基础设施完成的漏斗压缩。
我在同一周装了三个主流Claude Code扩展,生产力几乎没有变化。问题从来不在于选哪些工具。
我改了 config.toml,在 AGENTS.md 里写了规则,但什么都没用。后来发现问题不在配置内容,而在文件放错了地方。
Anthropic发布Computer Use的同一天,OpenAI把Codex做成了Claude Code插件。我认为这是2026年最聪明的一次让步。
一个月前,构建期间我根本离不开笔记本电脑。四周内发布的三个功能解决了这个问题。
我以为一个 SKILL.md 文件就够了。直到我看到 Anthropic 自己团队的结构方式,才推倒重来。
我花了一个周末把100MB的PDF塞进智能体,结果表现反而更差了。把输入拆分成四类之后,问题一下子就看清楚了。
我测试了几十个用于 AI 编程 agent 的设计 skill,大多数不到一周就被淘汰了。这 12 个是我至今仍在使用的。
我搭建了各种技能模块、配置了子代理和斜杠命令,结果一个通宵跑着的循环把所有这些设置都比了下去。
我花了一年时间从 Claude Code 和 Codex 得到反复无常的结果。三个职责分明的规格文件解决了这个问题。
代理写代码只是开始。要理解PR并向同事解释架构,可视化工具必不可少。
订阅 Claude Code 或 Codex 已让你超越大多数人,但这五项配置——智能体、团队协作、MCP、监控、自动化——才能让你真正进入顶尖 0.01%。
我把每天使用 Claude Code 和 Codex 时反复遇到的术语全部整理分类。五个分组自然浮现,它们完整地描绘了这些工具所运行的整个体系。
我深入研究了两款工具的SDK类型定义和系统提示词。29与7的差距并非功能数量的问题,而是对同一问题的两种根本性不同的回答:AI编程智能体应该如何与你的系统交互?
有人对一个完全由 LLM 生成的 SQLite Rust 重写版本做了性能基准测试。能跑通、能编译、看起来没问题的代码,和真正正确的代码之间,差距竟然达到五个数量级。
过去两个月出现的四个项目揭示了一个趋势:AI Agent不仅能写代码,还能自主盈利、编排协作、运营整个公司。
使用 AI 智能体将近一年后,我发现结构化的规格文件比任何提示词技巧都更能解决结果不一致的问题。
我逆向分析了 Codex 与 Claude Code 处理上下文溢出的差异,答案涉及 AES 加密、会话交接模式以及 KV 缓存技巧,整个架构远比想象中复杂。
Shopify CEO Tobias开发的QMD搜索引擎接入Claude Code后,700个会话的记忆在1秒内全部恢复。
Anthropic的Claude Code团队花了一年时间增删和重新设计工具,发现减少工具反而让AI表现更好。以下是他们总结的四条原则。
AI 并没有变笨,是主会话超载了。用子代理保持上下文精简,让高质量对话持续超过一小时。
Claude Code v2.1.59–v2.1.61 中 Auto Memory 与上下文压缩的竞态条件破坏了提示缓存并污染了会话。Anthropic 将所有用户的周限额重置作为补偿。
Agentation 通过 CSS 选择器为 AI 代理提供像素级视觉反馈。Readout 像回放视频一样重现 Claude Code 会话。两个工具解决了 AI 辅助前端开发中最大的两个痛点。
在一场 12 小时的黑客马拉松里只用 Agent 构建产品后,我切身体会到了 Stripe Minions 和 Ramp Inspect 为何选择云端隔离环境。
一个开源的 context engineering 技能集刚突破 GitHub 10k star。把它用到自己的 agent 架构上之后,我终于搞清楚 agent 为什么会失败。
被人指出公开发布的成果太少后失眠了,凌晨3点开始写free-router。它能实时找到免费AI模型,一键连接到你的编程工具。
当代理每天推送 3000 次提交,人工根本审查不过来。这里介绍如何构建一套由机器验证的流水线,捕捉人类遗漏的问题。
当 Agent 反复触发同一个失败的 API 调用,翻代码没有任何意义。Trace 才是调试 AI Agent 的新源代码。
最新基准测试数据表明,AGENTS.md 和 CLAUDE.md 这类上下文文件实际上会拖累编程智能体的表现。有时候,懒惰才是最好的工程决策。
解析Citrini Research的2028年宏观情景推演:AI越成功,经济越崩溃的悖论,以及Ghost GDP与Intelligence Displacement Spiral的内在逻辑。
三家公司几乎同时更新了编码代理。方向高度重合。真正的竞争焦点不是模型,而是吸收开发者工作流的速度。
从SaaS末日到模型专用芯片,关于2026年AI走向的五个大胆预测:大概有50%的把握说对。
Cache 在生产环境中断的那一小时,API 账单比前三天加起来还高。同一天,Anthropic 工程师发文解释了根本原因。
Google Research 用7个模型验证过的最便宜的LLM性能提升方法。不需要额外训练,不需要提示词设计,复制粘贴就行。
LangChain 的 Terminal Bench 结果与 hashline 格式实验揭示了什么。同一个模型排名被逆转,原因只有三个:提示词、工具和中间件。
从Cloudflare和Vercel的Markdown for Agents到Google的WebMCP, , 读写同步标准化,Agent-Native Web时代正式开启。
藏在 Anthropic 官方文档里的 SKILL.md body 编写原则 5 条。从 description 与 body 的职责分离到验证循环。
通过KakaoTalk礼物购买ChatGPT Pro仅需29,000韩元的韩国专属优惠,以及Codex-5.3-Spark每秒1,000 token输出速度解析。
Agent时代的真正竞争力不在于模型,而在于文件系统设计。本文讲述如何将企业数据统一到一个命名空间中。
Thomas Wolf提出的AI时代软件架构根本性变革。从依赖库时代的终结到AI专用语言的出现,赞同与质疑并存的深度解读。
OpenClaw创始人Peter Steinberger加入OpenAI不只是人才争夺。AI正在重新定义聊天应用本身,这场全球变革的深度解析。
OpenAI Codex 团队仅用 AI Agent 构建了百万行代码库,本文解析他们总结的 Harness 工程五大核心原则。
介绍Actionbook解决浏览器代理速度慢和Token成本高问题的革命性方法。基于手册的自动化实现10倍速度提升和100分之1的成本。
Opus 4.6 Fast 模式输出 $150。这不仅仅是定价问题, , 这是一个新经济分界线的开始,其中代币访问权限决定了竞争力。
Claude Code 多智能体团队功能实用指南:激活方式、键盘快捷键、终端兼容性、任务管理机制,以及当前已知的限制与注意事项。
Meritech Capital对100多家上市软件公司的分析揭示:AI执行企业与非AI企业之间存在巨大的估值鸿沟。
从Nvidia一家独大到多芯片组合战略,从训练为王到推理当道 - 智能体时代彻底改写了AI芯片的竞争版图。
当市场对GPU产能过剩发出警报时,OpenAI却宣称需要更多算力。AI行业的飞轮效应正在形成,但真正的瓶颈可能并不在算力本身。
OpenAI和Google争相推出低价AI套餐,中国厂商引领价格战。本文解析为什么现在是拥抱AI的最佳时机。
Lovable增长负责人Elena Verna解读AI时代的增长法则。漏斗优化仅贡献5%的增长,剩下95%来自新功能发布。
a16z的水晶鞋效应和Bessemer的AI超新星报告揭示了真相 - AI初创公司为何把GPU成本当营销费烧,以及为什么价格壁垒比亏损更快地杀死企业。
Anthropic 的 Tariq Shihipar 揭示了构建生产级 Agent 的核心要素 - 从 Bash 优先的工具设计到基于文件系统的上下文工程。
Anthropic 发布 Cowork,一个能自主读取、编辑和创建本地文件的智能体。从 vibe coding 到 vibe working。
Anthropic的Claude Opus 4.5不只是刷新了跑分。当竞争对手在多模态上分散资源时,全押文本、代码和智能体的聚焦策略才是真正的赢家。
ChatGPT和Claude争夺AI应用商店的同时,SaaS市值蒸发3000亿美元的真正原因,以及2008年移动战争带来的启示。
DeepSeek V4、中国模型渗透、历史性IPO、全球扩张 - 2026年第二周的数据指向一个明确的方向:中国。
Boris Cherny的工作流在2小时内获得5千点赞。他的配置比你想象的更简单 - 并行会话、计划模式、CLAUDE.md和验证循环。
Anthropic黑客松冠军公开了他用了10个月的Claude Code配置方案。从上下文窗口管理到Skill、Hook、子代理的角色分离,这份指南改变了我对AI编程工具的理解。
从营销、视频到UI设计和代码质量 - 六种Claude Code技能组合,让小团队也能运营全栈业务。
安装了数百个AI编程代理Skill后,每天真正在用的只有4个。分享我的周末筛选结果。
Claude Code将Todo改名为Task。看似微小的变更,实则是为AI Swarm构建的全新系统的起点。
一个游戏风格的状态栏插件,实时展示Claude Code的上下文用量、活跃工具、子代理和Todo进度。
Anthropic的Claude in Excel揭示了AI增强型与AI原生之间的鸿沟 - 以及为什么大多数「AI+X」创业公司撑不过2026年。
Clawdbot 证明了在本地硬件上运行的 AI 代理可以取代即时通讯应用。这就是所有聊天平台都该警惕的原因。
通过MCP直连Context7会把文档塞满主上下文。用Skill和子代理隔离查询,才能让长时间编码会话保持稳定。
为什么YC和OpenClaw的领导者都认为软件正在为智能体而重建 - 以及这对当下正在做产品的开发者意味着什么。
当AI阅读文档的比例逼近50%、机器人流量是人类的3倍时,各大服务正在争相将核心知识打包成技能。这一切背后的驱动力是什么?
Andrej Karpathy坦言从未感到如此落后。他所说的AI智能体新抽象层,不掌握就可能被甩开10倍差距。
支撑 Manus 25 亿美元估值的文件记忆系统,现已作为免费 Claude Code 技能发布。每个 AI Agent 开发者都应该了解。
Manus 在与 LangChain 的联合演讲中,分享了构建生产级 AI 智能体的实战经验 - 从上下文腐化到评估体系的全面反思。
Meta以约36亿美元收购了Manus。秘密不在于更大的模型,而在于上下文工程。以下是大多数AI智能体忽略的关键。
Meta以数十亿美元收购了中国AI创业公司Manus。这笔交易揭示了一个新现实:出海不是增长选项,而是AI时代每家创业公司的生存策略。
Anthropic研究表明多智能体系统可提升90%性能,但前提是选对架构。三个真实场景揭示子代理、技能、交接、路由四种模式各自的最佳适用场景。
编排模式、通信方式、内存管理、生产环境注意事项 - 设计多智能体系统时遇到的所有困惑,这篇文章几乎都解答了。
Oh My OpenCode 不只是一个插件 - 它是多智能体编排、上下文隔离和代码级行为约束的工程化实践。深入源码后,我发现了比提示词技巧更深层的结构性创新。
Opencode 的开源文档堪称智能体架构入门教材。以下是每位开发者都应该理解的七个核心概念。
Poetiq 的递归元系统成为首个在 ARC-AGI-2 上突破 50% 的 AI,这是专为测试真正通用智能设计的基准测试。看一个 6 人团队如何以一半成本击败 Google。
以辛普森角色拉尔夫·威格姆命名的Claude Code插件,正通过迭代循环、内存架构和停止钩子重新定义自主编程范式。
更大的上下文窗口并不能让AI更聪明。RLM通过让LLM编写代码从海量文档中选择性读取所需内容,彻底颠覆了传统思路。
从持久循环到多智能体编排 - 一个月内在全球范围内得到验证的6个AI智能体模式。
2026 年伊始,上下文工程成为 AI 领域最热话题。如果你在做 AI 智能体却不知道这些原则,今年就会掉队。这是全球 AI 社区仅用一周时间达成的核心共识。
GitHub 史上最快获星项目的创建者 Peter Steinberger 分享与 AI 编程代理协作的 10 条实战原则。
Menlo Ventures 2025企业AI报告揭示:我们熟知的SaaS成功法则已被彻底颠覆。每家创业公司都必须直面的三大市场变局。
2026年,创业的语法正在改写。比起自己写代码的能力,知道让AI做什么、怎么做的眼光才是新的竞争力。
Anthropic 在两天内同时用 Tasks 替换了 TodoWrite,用 Skills 替换了斜杠命令。两个变化指向同一个方向 - 给模型松绑。
Claude Code和AI虚拟形象应用已经证明:用户想要的不是复杂界面,而是结果。零UI时代正以超乎想象的速度到来。
X的算法开始优先推荐长文Articles而非短推文 - 原因何在,对2026年的内容创作者意味着什么。
小米从DeepSeek挖来一位核心研究员,瞬间成为顶级AI模型开发者。这对行业真正护城河意味着什么。
如何用 Ghostty、Yazi、Fish 和 LazyGit 并行运行多个 AI 智能体 - 一套为智能体工作流打造的轻量终端技术栈。
我的第一篇博客 - 用 Astro 搭建的内容营销小实验。