AI 首次接近人類推理能力 - Poetiq 在 ARC-AGI-2 突破 50% 門檻
Poetiq 的遞迴元系統成為第一個在 ARC-AGI-2 超越 50% 的系統,這是專為測試真正通用智慧設計的基準測試。看六人團隊如何以一半成本超越 Google 的表現。
關於軟體工程、產品設計和 AI 的思考。
Poetiq 的遞迴元系統成為第一個在 ARC-AGI-2 超越 50% 的系統,這是專為測試真正通用智慧設計的基準測試。看六人團隊如何以一半成本超越 Google 的表現。
2026 年開始,Context Engineering 成為 AI 圈最熱門的話題。如果你正在開發 AI Agent 卻不知道這些原則,你會在 2026 年落後。
Anthropic 在兩天內將 TodoWrite 替換成 Tasks、將斜線指令替換成 Skills。兩項變更都指向同一個方向 - 解除模型的束縛。
有專案想法或者只想聊聊?我很樂意聽到你的聲音。
我隨時歡迎交流。