Pare de Gastar Tokens em LLM com HTML do WordPress: ParseLess para CLI

No mês passado, eu precisava que Claude Code automatizasse a refatoração de posts com ~3.000 palavras para um cliente. Tarefa simples: ler um post, analisar concorrentes, fazer pequenas reescritas, talvez sugerir dois novos H2s.

O cliente iniciou a automação. Claude Code retornou com a reescrita e um aviso: 19.800 tokens de entrada usados.

O problema é: em termos de conteúdo, o parsing do post era cerca de 975 tokens.

Eu sabia que a conta era ruim. Não sabia que era tão ruim assim.

Onde os tokens do Claude Code estavam sendo gastos

Se você já abriu uma página WordPress no DevTools, você já sabe onde. O HTML para um único post em um tema típico é um bolo em camadas de wrappers <div>, menus de navegação, widgets na barra lateral, scaffolding do Elementor, markup de blocos do Gutenberg, JSON-LD schema.org, e scripts de banner de cookies. Se você está usando page builders de terceiros e tem devs ruins do seu lado, você provavelmente tem um caso severo do que gosto de chamar de "div Matrioska" - divs dentro de divs dentro de divs dentro de… divs.

O texto que você realmente escreveu, a parte que o LLM precisa, está em algum lugar no meio, cercado por uma parede de ruído estrutural.

Quando você envia isso para Claude Code, Cursor, Antigravity, N8N, ou qualquer CLI que alimenta seu conteúdo em um LLM, o modelo devotamente parsing tudo. Cada <div class="elementor-row">. Cada link de navegação. Cada coluna de rodapé com o obrigatório heading "Quick Links".

Depois ele joga 95% disso fora e lê seu texto.

O CLI recebe todo o código para usar apenas alguns parágrafos.

Uma redução de 25x de tokens com um parâmetro de query

ParseLess é um plugin WordPress que acabei de lançar que resolve isso da forma menos inteligente possível: quando um bot de IA ou ferramenta CLI pede uma página, o plugin serve Markdown ao invés de HTML.

Adicione ?format=md a qualquer URL de post em um site rodando o plugin:

curl https://yoursite.com/my-post/?format=md | claude "summarize this"

Você recebe o post como Markdown limpo. Headings, parágrafos, listas, tabelas, blocos de código com a linguagem preservada, imagens e links. Sem HTML de widgets. Sem scaffolding de page builder. Sem tema. Sem plugins extras.

Eu rodei as mesmas três páginas através do Claude Code, OpenAI Codex e Gemini CLI para ter certeza de que a economia era real e não um quirk de um tokenizador:

Página	Tamanho HTML	Tamanho Markdown	Redução
Guia SEO Elementor	~102 KB / ~25.500 tokens	5.4 KB / ~1.350 tokens	94.7% (19x)
Guia PageSpeed WP-AutoInsight	~101 KB / ~25.300 tokens	4.0 KB / ~1.000 tokens	96.0% (25x)
Post padrão "hello world"	~108 KB / ~27.000 tokens	3.6 KB / ~900 tokens	96.7% (30x)

Três CLIs diferentes, mesmos resultados. Pelo menos 95% dos tokens são gastos em ler seus sites. É uma enorme economia para agências SEO e escritores de conteúdo.

Page builders pioram isso: páginas Elementor acima enviam aproximadamente 100KB de HTML para cerca de 1.000 tokens de conteúdo real. Temas leves fazem um pouco melhor, mas a proporção ainda é péssima.

O que o plugin muda em um fluxo de trabalho

Revisão de conteúdo em massa. O cliente costumava conseguir caber talvez quatro ou cinco posts em uma janela de contexto do Claude Code antes de atingir o limite. Com ParseLess, ele pode enviar dezenas de uma vez e pedir coisas como verificações de consistência em todo o arquivo: ele está usando "freelancer" e "consultor" intercambiavelmente, seus CTAs estão alinhados, quais posts se contradizem em um tópico?

Escrita com referência cruzada. Rascunhando um novo post e quer linkar para trabalho antigo relevante? Envie uma lista curada de URLs passadas para Claude Code através do ParseLess, peça a ele para encontrar os três posts existentes mais relevantes e onde no novo rascunho linká-los. O arquivo inteiro cabe.

Trabalho com clientes. Quando um cliente me pede para auditar sua estratégia de conteúdo, posso ingerir todo seu site em um Claude Project sem ver o medidor de tokens girar. A auditoria acaba sendo sobre o conteúdo, não sobre quanto do blog eu consegui ler.

Como funciona

O plugin se conecta ao template_redirect. Quando uma solicitação chega, ele verifica duas coisas: é um User-Agent de bot de IA (GPTBot, ClaudeBot, PerplexityBot, e uma dúzia de outros), ou a URL inclui ?format=md? Se qualquer uma for verdadeira, ParseLess executa o conteúdo do post através do filtro the_content (o mesmo que WordPress usa para renderização normal, então shortcodes de page builder e blocos são processados corretamente), depois converte o HTML resultante em Markdown.

O resultado é cacheado como um transient. Na próxima vez que um bot ou CLI acessa o mesmo post, você recebe uma única leitura de transient. A conversão só é executada uma vez por post até que seja editado.

Visitantes humanos e crawlers de busca regulares como Googlebot nunca são tocados. Eles recebem o site HTML completo, exatamente como antes. Nada sobre o site visível muda. Então você consegue menos tokens e mantém todo o juice SEO e AEO.

A ergonomia do CLI

?format=md funciona com qualquer coisa que possa buscar uma URL. Alguns padrões que uso:

# Enviar um único post para Claude
curl -s https://yoursite.com/post-slug/?format=md | claude "rewrite the intro to be punchier"

# Enviar através de jq se você habilitou frontmatter YAML
curl -s https://yoursite.com/post-slug/?format=md

# Múltiplos posts ao mesmo tempo para referência cruzada
for slug in post-a post-b post-c; do
  curl -s "https://yoursite.com/$slug/?format=md"
  echo "---"
done | claude "find contradictions between these posts"

Se você quer metadados junto com o conteúdo, há uma configuração opcional de frontmatter YAML que antecede título, URL, autor, data, categorias, tags e excerpt para cada resposta Markdown. Útil se seu prompt depende de saber quando o post foi escrito ou em qual categoria foi arquivado.

Encontrando seu próprio conteúdo programaticamente

Se você está criando scripts contra seu próprio arquivo, ParseLess 0.5.0 adicionou um sitemap em /botfood-sitemap.xml que lista cada post público com sua URL Markdown. É anunciado em robots.txt então crawlers de IA podem encontrá-lo, mas também é útil se você quer que uma ferramenta CLI ingira seu site completo sem manter manualmente uma lista de URLs.

# Puxar cada URL do sitemap de IA e enviar cada post para Claude
curl -s https://yoursite.com/botfood-sitemap.xml \
  | grep -oE 'https?://[^<]+' \
  | xargs -I {} curl -s "{}?format=md"

Útil quando você adicionou novos posts desde a última vez que executou uma operação em massa, e não quer lembrar quais são.

O que eu ainda gostaria de consertar

O plugin está na versão 0.5.0. Funciona, mas algumas coisas estão na minha lista.

Blocos de código preservam a linguagem para blocos de código padrão do Gutenberg e a maioria dos syntax highlighters populares, mas alguns plugins de nicho usam seu próprio markup e não virão de forma limpa. Se você encontrar um, o filtro é o lugar certo para corrigi-lo.

Não há rate limiting no endpoint ?format=md. O cache transient torna isso na maioria das vezes bem, mas se você está em um VPS pequeno e preocupado com alguém scriptando uma captura em massa do seu arquivo, isso é uma preocupação razoável. Provavelmente adicionarei um throttle opcional em uma versão futura.

Tente em seus próprios posts

ParseLess é GPL, livre, e está no diretório oficial do WordPress. Instale, ative, e pronto. Nenhuma configuração necessária para o caso de uso CLI, mas sim, o plugin tem uma página de Configurações para que você possa ajustar tudo conforme suas necessidades.

Se você construir algo útil em cima disso, ou encontrar um caso extremo onde a saída Markdown não está bem certa, me avise. Estou iterando ativamente, e casos extremos são mais fáceis de consertar quando alguém me conta sobre eles.

Se sua equipe está movendo fluxos de trabalho de conteúdo para LLMs e você está cansado de pagar por HTML que você não precisa, isso também é um problema que ajudo empresas a resolver.

Agora vá verificar quantos tokens seu próprio site está custando a você.