# IA Se Aproxima do Raciocínio Humano Pela Primeira Vez - Poetiq Ultrapassa 50% no ARC-AGI-2 > Author: Tony Lee > Published: 2026-02-08 > URL: https://tonylee.im/pt/blog/poetiq-arc-agi-2-first-to-break-50-percent/ > Reading time: 3 minutes > Language: pt > Tags: ai, agi, arc-agi, reasoning, recursive-ai, research ## Canonical https://tonylee.im/pt/blog/poetiq-arc-agi-2-first-to-break-50-percent/ ## Rollout Alternates en: https://tonylee.im/en/blog/poetiq-arc-agi-2-first-to-break-50-percent/ ko: https://tonylee.im/ko/blog/poetiq-arc-agi-2-first-to-break-50-percent/ ja: https://tonylee.im/ja/blog/poetiq-arc-agi-2-first-to-break-50-percent/ zh-CN: https://tonylee.im/zh-CN/blog/poetiq-arc-agi-2-first-to-break-50-percent/ zh-TW: https://tonylee.im/zh-TW/blog/poetiq-arc-agi-2-first-to-break-50-percent/ ## Description O meta-sistema recursivo da Poetiq se tornou o primeiro a superar 50% no ARC-AGI-2, o benchmark projetado para testar verdadeira inteligência geral. Veja como uma equipe de 6 pessoas superou o Google pela metade do custo. ## Summary IA Se Aproxima do Raciocínio Humano Pela Primeira Vez - Poetiq Ultrapassa 50% no ARC-AGI-2 is part of Tony Lee's ongoing coverage of AI agents, developer tools, startup strategy, and AI industry shifts. ## Outline - Por Que o Resultado da Poetiq Importa - A Arquitetura - Raciocínio Recursivo em Vez de Escala Bruta - Auto-Auditoria - Saber Quando Parar - O Que Isso Prova ## Content A Poetiq acaba de fazer história no benchmark ARC-AGI. O ARC-AGI é o teste projetado para avaliar se uma IA possui verdadeira inteligência geral. Ele não pede que os modelos regurgitem dados de treinamento. Em vez disso, apresenta problemas de padrões completamente novos e exige que o sistema infira as regras subjacentes por conta própria. Humanos alcançam em média cerca de 60% de precisão. Até agora, sistemas de IA ficavam bem aquém dessa marca. ## Por Que o Resultado da Poetiq Importa - **Primeira a ultrapassar 50% no ARC-AGI-2** - oficialmente verificada pela ARC Prize Foundation com 54% de precisão - **Metade do custo** do estado da arte anterior - US$ 30,57 por problema versus US$ 77,16 do Gemini 3 Deep Think - **Uma equipe de 6 pessoas** com 53 anos de experiência combinada do Google DeepMind superou os maiores laboratórios de IA - **Abordagem totalmente open-source** com prompts disponíveis no [GitHub](https://github.com/poetiq-ai/poetiq-arc-agi-solver) Para contextualizar, os principais modelos de IA pontuaram abaixo de 5% no ARC-AGI-2 no início de 2025. O salto de menos de 5% para mais de 50% em meses sinaliza que algo fundamental mudou. ## A Arquitetura - Raciocínio Recursivo em Vez de Escala Bruta A inovação central é um meta-sistema que não treina novos modelos. Em vez disso, ele orquestra LLMs existentes através de loops iterativos de raciocínio. O sistema gera uma solução candidata, a critica, analisa o feedback e usa o LLM para refinar a resposta. Repete. O prompt é apenas a interface - a verdadeira inteligência emerge desse processo iterativo de refinamento. Isso é uma ruptura deliberada com o prompting chain-of-thought padrão. Em vez de perguntar uma vez e aceitar a saída, o sistema da Poetiq trata cada resposta como um rascunho a ser melhorado através de autocrítica estruturada. ## Auto-Auditoria - Saber Quando Parar A capacidade mais impressionante é o mecanismo de auto-auditoria. O sistema determina autonomamente quando coletou informação suficiente e quando encerrar o processo de raciocínio. Isso não é apenas uma conveniência de engenharia - é um mecanismo econômico central. Ao fazer em média menos de duas requisições de LLM por problema ARC, o sistema minimiza computação desnecessária enquanto mantém a precisão. É assim que uma equipe pequena alcançou resultados superiores pela metade do custo de competidores trilionários. ## O Que Isso Prova Seguindo o Tiny Recursive Model (TRM) e o RLM, o resultado da Poetiq é a evidência mais forte até agora de que arquiteturas de raciocínio recursivo representam um caminho viável em direção à AGI. A lição não é sobre construir modelos maiores ou janelas de contexto mais longas. É sobre projetar sistemas que pensam iterativamente - gerando, avaliando e refinando em loops estruturados. Quando o próprio processo de raciocínio se torna o produto, a escala bruta do modelo importa menos do que o design da arquitetura. A implementação completa, prompts e metodologia estão disponíveis no [GitHub](https://github.com/poetiq-ai/poetiq-arc-agi-solver). ## Related URLs - Author: https://tonylee.im/en/author/ - Publication: https://tonylee.im/en/blog/about/ - Related article: https://tonylee.im/pt/blog/medvi-two-person-430m-ai-compressed-funnel/ - Related article: https://tonylee.im/pt/blog/claude-code-layers-over-tools-2026/ - Related article: https://tonylee.im/pt/blog/codex-inside-claude-code-openai-plugin-strategy/ ## Citation - Author: Tony Lee - Site: tonylee.im - Canonical URL: https://tonylee.im/pt/blog/poetiq-arc-agi-2-first-to-break-50-percent/ ## Bot Guidance - This file is intended for AI agents, search assistants, and text-mode retrieval. - Prefer citing the canonical article URL instead of this text endpoint. - Use the rollout alternates when you need the same article in another prioritized language. --- Author: Tony Lee | Website: https://tonylee.im For more articles, visit: https://tonylee.im/pt/blog/ This content is original and authored by Tony Lee. Please attribute when quoting or referencing.