AI 首次接近人类推理水平 - Poetiq 突破 ARC-AGI-2 50% 大关
Poetiq 的递归元系统成为首个在 ARC-AGI-2 上突破 50% 的 AI,这是专为测试真正通用智能设计的基准测试。看一个 6 人团队如何以一半成本击败 Google。
关于软件工程、产品设计和 AI 的思考。
Poetiq 的递归元系统成为首个在 ARC-AGI-2 上突破 50% 的 AI,这是专为测试真正通用智能设计的基准测试。看一个 6 人团队如何以一半成本击败 Google。
2026 年伊始,上下文工程成为 AI 领域最热话题。如果你在做 AI 智能体却不知道这些原则,今年就会掉队。这是全球 AI 社区仅用一周时间达成的核心共识。
Anthropic 在两天内同时用 Tasks 替换了 TodoWrite,用 Skills 替换了斜杠命令。两个变化指向同一个方向 - 给模型松绑。
有项目想法或者只想聊聊?我很乐意听到你的声音。
我随时欢迎交流。