AI 首次接近人類推理能力 - Poetiq 突破 ARC-AGI-2 五成關口
Poetiq 的遞歸元系統成為首個在 ARC-AGI-2 上突破 50% 的系統,這是專為測試真正通用智能而設計的基準測試。一個 6 人團隊如何以一半成本跑贏 Google。
關於軟件工程、產品設計同 AI 嘅諗法。
Poetiq 的遞歸元系統成為首個在 ARC-AGI-2 上突破 50% 的系統,這是專為測試真正通用智能而設計的基準測試。一個 6 人團隊如何以一半成本跑贏 Google。
2026 年初,上下文工程成為 AI 界最熱門話題。如果你正在開發 AI 代理但不懂這些原則,你將在 2026 年落後於人。這是全球 AI 社群在短短一週內建立的精華總結。
Anthropic 用兩日時間將 TodoWrite 換成 Tasks,又將 Slash Commands 換成 Skills。兩個改動其實指向同一個方向 - 為模型鬆綁。
有專案諗法或者只係想傾偈?我好樂意聽到你嘅聲音。
隨時歡迎傾偈。