AIが初めて人間の推論に近づいた - PoetiqがARC-AGI-2で50%の壁を突破
Poetiqの再帰的メタシステムが、真の汎用知能を測定するベンチマークARC-AGI-2で初めて50%を超えた。6人のチームがGoogleの半分のコストで上回った理由を解説する。
ソフトウェアエンジニアリング、プロダクトデザイン、AIについての考察。
Poetiqの再帰的メタシステムが、真の汎用知能を測定するベンチマークARC-AGI-2で初めて50%を超えた。6人のチームがGoogleの半分のコストで上回った理由を解説する。
シンプソンズのラルフ・ウィガムにちなんだClaude Codeプラグインが、反復ループ、メモリアーキテクチャ、ストップフックで自律コーディングの新パラダイムを切り開いています。
コンテキストウィンドウを大きくしてもAIは賢くなりません。RLMはLLMにコードを書かせ、巨大な文書から必要な部分だけを選択的に読み取る新しいアプローチです。
2026年、Context Engineeringが最もホットな話題になった。Manus、Cursor、Claude Codeが実証した、これを知らなければ置いていかれる6つの原則を解説。
Menlo Venturesの2025年エンタープライズAIレポートが明かした、SaaS成功の方程式の崩壊。すべてのスタートアップが直視すべき3つの市場変化。
2026年、スタートアップの文法が書き換えられています。コードを書く能力よりも、AIに何をどう指示するかを知る力が新たな競争力です。
Anthropicは2日間でTodoWriteをTasksに、Slash CommandsをSkillsに置き換えた。どちらの変更も同じ方向を指している - モデルの制約を解く。
Claude CodeやAIアバターアプリが証明しています。ユーザーが求めているのは複雑なインターフェースではなく結果です。ゼロUI時代は想像以上に早く到来しつつあります。
プロジェクトのアイデアがある方、または単にお話ししたい方、ご連絡お待ちしています。
お気軽にご連絡ください。