frouter: criei um CLI que encontra APIs de IA gratuitas para fazer vibe coding a custo zero
Não conseguia dormir depois que me apontaram que eu publicava pouco demais. Às 3h da manhã comecei a programar o frouter, uma ferramenta que detecta modelos de IA gratuitos em tempo real e os conecta às suas ferramentas de código com uma única tecla.
Duas pessoas que eu queria conhecer há tempos apareceram por acaso no jantar de ontem à noite. Em algum momento da conversa, uma delas apontou que eu tinha publicado bem menos projetos do que esperava. Doeu, principalmente porque era verdade.
Voltei pra casa sem conseguir tirar aquilo da cabeça. Às 3h da manhã eu estava escrevendo código. De manhã o frouter (free router) já estava rodando: uma ferramenta CLI que localiza APIs de IA gratuitas ativas e as conecta direto ao seu ambiente de vibe coding.
A barreira do custo é mais alta que a barreira técnica
Continuo ouvindo a mesma coisa das pessoas ao meu redor: “Quero experimentar vibe coding, mas o custo das APIs me trava.” Para estudantes de desenvolvimento, até 20 dólares por mês é dinheiro de verdade. A ironia é que capacidade gratuita já existe em volume considerável. O NVIDIA NIM oferece cerca de 100 modelos como API gratuita. O OpenRouter permite filtrar especificamente os modelos com custo de prompt zero. Combine qualquer um deles com uma ferramenta open source como o OpenCode e seu gasto total é literalmente zero.
O problema é que ninguém tinha conectado essas peças em um único fluxo de trabalho.
O realmente difícil é encontrar um modelo gratuito rápido agora mesmo
Algumas pessoas sabem que modelos gratuitos existem. A pergunta mais difícil é qual deles responde rápido neste exato instante. Eu constatei que o mesmo modelo pode responder em 200 ms de manhã e levar 5 segundos à tarde. Essa variabilidade acaba com qualquer sessão de código séria.
O frouter resolve isso enviando um ping para cada modelo a cada 2 segundos. Ele roda 20 conexões simultâneas, exibe o status completo em um painel TUI e aplica backoff progressivo nos modelos que falham cinco vezes seguidas. Cada modelo também mostra seu tier SWE-bench (S+ a C), então você não escolhe só o mais rápido, mas o mais capaz entre os gratuitos.
Configuração com uma tecla, sem mexer em JSON
Vejo um padrão que se repete: alguém encontra um modelo gratuito, abre o arquivo de configuração da ferramenta de código, se perde no schema e desiste. O frouter escreve a configuração pra você no momento em que você aperta Enter. Ele gera automaticamente os ajustes do provedor e o ID do modelo para OpenCode ou OpenClaw, faz backup da configuração existente com timestamp e armazena as chaves de API com permissões 0600.
Para usuários do oh-my-opencode, ele também troca automaticamente os modelos NIM pelo gêmeo no OpenRouter. Em modo script, --best imprime o ID do modelo mais rápido na stdout.
Uma linha pra instalar, quatro teclas pra aprender
npx frouter-cli
É isso. O TUI abre na hora. W/X ajusta o intervalo de ping entre 1 e 30 segundos. P abre o gerenciador de chaves de API e o toggle de provedores. ? mostra todos os atalhos. Se preferir instalação global, npm i -g frouter-cli também funciona.
Código e documentação em tonylee.im/frouter e no GitHub.
O que eu ainda não tenho certeza
Não testei o frouter o suficiente com mais de três provedores ativos ao mesmo tempo. A lógica de backoff pode ser agressiva demais com modelos que têm cold starts intermitentes em vez de quedas reais. E o mapeamento de tiers SWE-bench foi curado manualmente a partir de benchmarks públicos, então vai desatualizar conforme novas versões de modelos saírem. Pretendo corrigir tudo isso abertamente conforme as pessoas começarem a usar.
Como nota à parte, neste fim de semana participo do hackathon Ralphton organizado pelo Team Attention, equipe do Goobong Jeong. Seremos 13 construindo juntos e eu gostaria de levar algo útil para os outros participantes.
O que dá pra fazer de graça é bem mais amplo do que a maioria imagina. A barreira nunca foi capacidade. Era só a fiação que estava desconectada.
Assine a newsletter
Receba atualizações sobre meus projetos mais recentes, artigos e experimentos com IA e desenvolvimento web.