Construo sistemas de IA que não desmoronam em produção.
A maioria dos projetos de IA parecem ótimos em demos. Colapsam quando os usuários reais chegam. Ajudo CTOs, fundadores e equipes de engenharia a projetar e entregar sistemas de IA que realmente aguentam — com a arquitetura, confiabilidade e documentação para comprovar.
Alguma dessas situações soa familiar?
Esses não são casos extremos. São o resultado padrão quando projetos de IA pulam a arquitetura e vão direto para a implementação.
"Funcionou perfeitamente na demo."
Seu sistema LLM se saiu bem em condições controladas. O tráfego real de produção, inputs bagunçados de usuários reais e casos extremos inesperados expuseram o abismo entre protótipo e produto.
"Nosso RAG continua retornando respostas erradas."
Retrieval-Augmented Generation não é plug-and-play. Estratégia de chunking, escolha do modelo de embedding, re-ranking e gerenciamento de janela de contexto exigem decisões arquiteturais deliberadas.
"Temos IA no roadmap, mas ninguém para assumir."
Sua equipe de engenharia é competente, mas ninguém entregou um sistema LLM em produção antes. Você precisa de orientação sênior sem o custo e o tempo de uma contratação full-time.
"Nossa automação quebra toda vez que algo muda."
Workflows de agentes e pipelines de automação construídos sem tratamento de erros adequado, observabilidade e lógica de fallback falham silenciosamente — e a confiança da equipe vai embora junto.
"Alucinações estão destruindo nossa credibilidade."
Outputs de LLM sem constraints em fluxos voltados ao cliente são um problema de confiança. Grounding, validação de saídas e loops de feedback não são opcionais — são requisitos arquiteturais.
"Estamos escalando e o sistema está cedendo."
O que funciona para 100 requisições por dia quebra em 10.000. Limites de tokens, latência, custos e rate limits precisam ser projetados — não descobertos em produção.
Arquitetura estratégica de IA para sistemas que precisam funcionar.
Arquitetura e Design de RAG
Design completo do pipeline de recuperação: ingestão de dados, estratégia de chunking, seleção de vector store, otimização de embeddings, re-ranking e contenção de alucinações.
Design de Sistemas LLM
Prompt engineering no nível arquitetural, seleção de modelos, gerenciamento de contexto, validação de saídas e padrões de confiabilidade para deployments LLM em produção.
Arquitetura de Workflows com Agentes
Orquestração multi-agente, padrões de uso de ferramentas, design de human-in-the-loop e sistemas de recuperação de erros que não exigem supervisão constante.
Decisões de Infraestrutura de IA
Trade-offs de infraestrutura: modelos self-hosted vs. API, estratégias de cache, otimização de custos, orçamentos de latência e configuração de monitoramento.
Reviews de Arquitetura
Revisão estruturada da sua implementação de IA existente — encontrando modos de falha, dívida arquitetural e bloqueios de escalabilidade antes de chegarem à produção.
Advisory Técnico & Liderança Fracionada
Orientação estratégica contínua para equipes de engenharia e liderança: decisões de arquitetura, avaliação de fornecedores, upskilling de equipe e ownership do roadmap de IA.
Como podemos trabalhar juntos.
Todo projeto começa entendendo o problema real — não o sintoma relatado. Escopo, prazo e entregáveis são definidos antes de qualquer trabalho começar.
Assessment de Arquitetura de IA
Uma análise estruturada do seu sistema de IA atual ou planejado. Identifico lacunas arquiteturais, riscos de confiabilidade e bloqueios de escalabilidade — e entrego um relatório escrito com recomendações priorizadas que você pode agir imediatamente.
- →Revisão de codebase e arquitetura
- →Relatório escrito com findings priorizados
- →Recomendações de decisões arquiteturais
- →Uma sessão de follow-up para apresentar os findings
Construção de Sistema de IA para Produção
Arquitetura e implementação hands-on de um sistema de IA para produção: pipeline RAG, integração LLM, workflow de agentes ou infraestrutura de automação. Construo, documento e entrego funcionando.
- →Design de arquitetura e implementação
- →Integração com sua stack existente
- →Setup de tratamento de erros e observabilidade
- →Documentação completa e handover
Arquiteto de IA Fracionado
Orientação estratégica e técnica contínua embarcada na sua equipe. Assumo as decisões de arquitetura de IA, reviso implementações, aconselho sobre modelos e fornecedores, e sirvo como a voz técnica sênior que sua equipe precisa para entregar com confiança.
- →Revisões semanais de arquitetura e orientação
- →Disponibilidade async para decisões técnicas
- →Sessões trimestrais de roadmap de arquitetura
- →Office hours e design reviews de equipe
Resgate de Projeto de IA
Seu projeto de IA está travado, quebrado ou prestes a ir ao ar com problemas conhecidos. Entro, diagnostico o que deu errado e construo o caminho à frente — seja corrigindo o que existe ou re-arquitetando as partes críticas.
- →Análise de causa raiz e diagnóstico escrito
- →Recomendações imediatas de estabilização
- →Roadmap de remediação priorizado
- →Remediação hands-on opcional
Por que a maioria dos projetos de IA falha em produção.
Depois de dois anos construindo e revisando implementações de IA em dezenas de empresas, os padrões de falha são consistentes. Nenhum deles é misterioso.
Decisões de arquitetura tomadas pelas pessoas erradas na hora errada.
A arquitetura de sistemas LLM é decidida por desenvolvedores sob pressão de sprint, não por alguém com experiência em produção. Quando os problemas aparecem, a arquitetura já está incorporada.
Recuperação não é tratada como um problema de engenharia.
A maioria das implementações RAG usa chunking padrão, embeddings padrão e sem re-ranking. O resultado é um sistema que retorna respostas erradas com confiança. Corrigir isso depois é caro.
Sem observabilidade, sem loops de feedback.
Equipes deployam features LLM sem forma de medir se estão funcionando. Sem logging, pipelines de avaliação e mecanismos de feedback do usuário, você não pode melhorar o que não consegue ver.
Prompt engineering tratado como input mágico, não como superfície de design.
Um bom prompt é uma especificação de sistema. Quando prompts são escritos ad-hoc e não mantidos como código, derivam, quebram com atualizações do modelo e se tornam impossíveis de debugar sistematicamente.
Sem plano para quando o LLM errar.
Sistemas de IA em produção precisam de degradação graciosa, validação de saídas e lógica de fallback. Sistemas construídos sem esses padrões falham de forma barulhenta ou — pior — silenciosamente, de formas que os usuários percebem antes de você.
Leitura relacionada: Escrevi uma análise detalhada desse padrão (em inglês): Por que Projetos de IA Falham Após a Demo.
Estruturado. Documentado. Direto.
Construo sistemas de IA para ambientes de produção há tempo suficiente para saber onde a maioria dos projetos quebra — e raramente é a tecnologia. É escopo pouco claro, documentação ausente e ausência de definição de pronto.
Diagnóstico
Antes de escrever uma linha de código ou uma recomendação, preciso entender o que está realmente quebrado. Isso significa acesso ao codebase, logs do sistema e uma conversa honesta sobre o que foi tentado e o que falhou.
Arquitetura
Defino o que estamos construindo, o que está explicitamente fora do escopo e como é o "pronto". As decisões de arquitetura são documentadas antes de começar a implementação. Sem scope creep.
Build
Implementação com os estados de erro, casos extremos e observabilidade que ambientes de produção exigem. Trabalho em blocos focados — não em threads de Slack contínuas.
Entrega
Tudo que construo é documentado como parte do entregável: decisões de arquitetura, guias de integração, runbooks. O objetivo é um sistema que funciona sem mim. Se precisar de mim novamente, é para o próximo problema.
Trabalho 100% remoto, baseado em São Paulo (UTC-3). Me comunico através de atualizações escritas estruturadas, não disponibilidade constante. Você sempre vai saber no que estou trabalhando e quando estará pronto.
Ler: Como Eu Trabalho →Sistemas de IA em produção, não slides de apresentação.
Não tenho estudos de caso com resultados projetados. Esses são os resultados reais de sistemas que foram ao ar, que rodaram com tráfego real e que ainda estão rodando.
Trabalhos selecionados
1º Lugar — ByteDance Global Coze AI Challenge
Construí "Auty", um agente de IA para suporte ao autismo, vencendo uma competição global. O sistema ainda roda seis meses depois.
Ver caso →Chatbot RAG com Redução de 40% em Tickets
Projetei e construí um chatbot RAG em produção para uma loja WooCommerce que reduziu o volume de tickets em 40% lidando com consultas reais de clientes em escala.
Ver caso →Pipeline Autônomo de Inteligência SEO
Construí um pipeline de IA end-to-end conectando Google Search Console, uma camada de análise LLM e publicação automatizada no WordPress — rodando sem intervenção manual.
Ver caso →“Paulo tem habilidades excepcionais para organizar e comunicar demandas em situações que parecem absolutamente caóticas. Ele tem muito conhecimento técnico e é capaz de se comunicar de forma eficiente tanto com pessoas técnicas quanto leigas.”
“Paulo é um ótimo sysadmin. Todos os sites e blogs de que o Paulo cuidou nunca caíram, mesmo durante picos de tráfego com milhares de visitas. O principal motivo para mantê-lo não era apenas sua competência técnica, mas o fato de ele ser uma das pessoas mais confiáveis que já conheci na vida.”
Empresas com quem trabalhei








Reconhecimentos
- ▸1º Lugar — ByteDance Global Coze AI Challenge (2024)
- ▸Livro técnico publicado — 4,6★ na Amazon (ainda editado)
- ▸17.000+ seguidores desenvolvedores no Dev.to
Palestras & Ensino
- ▸Campus Party Brasil — Palestrante (2009, 2010, 2011, 2012)
- ▸Sebrae Empreendedor — Palestrante, Belém (2010)
- ▸Senac Franca — Instrutor (2009)
- ▸Apadi — Instrução em WordPress (2010–2013)
- ▸ComSchool — Instrução em WordPress (2014–2016)
Perguntas comuns.
O que é um consultor de arquitetura de IA?
+
Como isso é diferente de contratar uma agência de IA?
+
O que um arquiteto de IA fracionado realmente faz?
+
Minha equipe já tem experiência com LLMs. Por que precisaria disso?
+
O que cobre uma revisão de arquitetura RAG?
+
Você trabalha com equipes fora do Brasil?
+
Quanto tempo leva um assessment de arquitetura de IA?
+
E se nosso projeto de IA já está quebrado?
+
Seu projeto de IA merece arquitetura de nível produção.
Se você está construindo sistemas de IA que precisam funcionar de forma confiável — com tráfego real, usuários reais, com consequências reais em caso de falha — posso te ajudar a chegar lá. Comece com uma conversa curta sobre onde você está e o que está tentando resolver.
Sem decks de apresentação. Sem call de discovery com equipe de vendas. Você fala comigo.