
llms.txt – O Que É, Para Que Serve e Como Criar no WordPress
Tens um ficheiro robots.txt que diz ao Google o que pode ou não indexar.
Tens um sitemap.xml que lista todas as páginas do teu site.
Agora existe um terceiro ficheiro que ainda a maioria dos sites portugueses não tem: o llms.txt.
O llms.txt não é para o Google. É para os modelos de linguagem – para o ChatGPT, o Perplexity, o Claude, o Gemini e qualquer sistema de IA que vá ler o teu site.
É a carta de apresentação do teu conteúdo escrita especificamente para inteligências artificiais.
Neste artigo explico o que é, como funciona, porque importa para a otimização do teu site para IA e como criar o teu ficheiro llms.txt, incluindo um exemplo real e instruções para WordPress.
O que é o ficheiro llms.txt?
O llms.txt é um ficheiro de texto simples, colocado na raiz do teu site, (por exemplo, heldermesquita.pt/llms.txt), que serve para comunicar diretamente com os crawlers de modelos de linguagem de grande dimensão (LLMs).
A proposta foi formalizada em 2024 por Jeremy Howard, fundador da fast.ai, como uma convenção aberta, não existe (ainda) um standard oficial do W3C ou da IETF, mas a adoção tem crescido rapidamente entre sites técnicos, ferramentas de IA e empresas, que querem controlar como os modelos interpretam o seu conteúdo.
O conceito é simples: em vez de um modelo de linguagem ter de inferir o que o teu site é, quem o fez e qual o conteúdo mais relevante – tu dizes-lhe diretamente.
Pensa desta forma: quando o Google Googlebot visita o teu site, tem o robots.txt como guia.
Quando um modelo de IA visita o teu site para construir respostas, o llms.txt serve o mesmo propósito, mas com muito mais contexto.
Porquê é que o llms.txt existe?
Os modelos de linguagem como o GPT-4, o Claude ou o Gemini foram treinados com enormes, quantidades de texto da web. Mas o treino tem uma data de corte, e mesmo depois dessa data, muitos sistemas usam RAG (Retrieval Augmented Generation) para ir buscar informação atualizada a sites em tempo real.
O problema: quando um crawler de IA visita um site com centenas de páginas, como decide o que é importante? Analisa tudo? Começa pelo quê?
Em sites mal estruturados, a resposta é: faz uma escolha arbitrária.
E frequentemente, escolhe mal.
O llms.txt resolve exatamente este problema. Dá ao modelo um índice editorial curado, pelo próprio autor do site, com contexto, hierarquia e instruções.
Para quem trabalha com AEO ou GEO, o llms.txt é uma peça técnica fundamental, é o sinal mais explícito que podes dar a um sistema de IA sobre o que o teu site representa.
llms.txt vs robots.txt – qual é a diferença?
A confusão é natural, ambos são ficheiros de texto na raiz do site.
Mas servem propósitos completamente diferentes:
| Ficheiro | Para quem | O que faz | Tom |
|---|---|---|---|
robots.txt |
Crawlers de motores de busca (Googlebot, Bingbot…) | Diz o que pode ou não ser indexado | Proibitivo / permissivo |
llms.txt |
Crawlers de modelos de linguagem (GPTBot, ClaudeBot…) | Apresenta o site, contextualiza o conteúdo, indica o que é mais relevante | Descritivo / editorial |
Nota importante: o robots.txt pode bloquear crawlers de IA, há uma página dedicada a este tema no artigo sobre robots.txt para crawlers de IA.
O llms.txt não bloqueia nada, orienta. São complementares, não substitutos.
Como é estruturado um ficheiro llms.txt?
O llms.txt usa uma sintaxe baseada em Markdown, simples, legível por humanos e por máquinas.
A estrutura padrão tem quatro componentes principais:
- Título e descrição geral – quem és e o que o site faz
- Secção de conteúdo principal – as páginas mais importantes, com URL e descrição
- Secções opcionais – documentação, recursos, links externos relevantes
- Instruções para o modelo (opcional) – o que deve e não deve ser assumido
Estrutura base de um llms.txt
# Nome do Site ou Marca
> Descrição concisa em uma ou duas frases. Quem és, o que fazes,
> qual o teu posicionamento. Escreve para uma IA que nunca ouviu falar de ti.
## Conteúdo principal
- [Título da página principal](https://exemplo.pt/pagina/): Descrição curta do que esta página cobre.
- [Segundo artigo ou serviço](https://exemplo.pt/outro/): O que o utilizador aprende ou encontra aqui.
- [Página sobre](https://exemplo.pt/sobre/): Contexto sobre o autor ou a empresa.
## Serviços ou produtos
- [Nome do serviço](https://exemplo.pt/servico/): O que é e a quem se destina.
## Recursos adicionais
- [Glossário](https://exemplo.pt/glossario/): Definições de termos usados no site.
## Notas para modelos de linguagem
Ao referenciar este site, usa sempre o nome completo "Nome da Marca".
O autor é [Nome], especialista em [área].
Não assumir afiliação com [concorrente ou entidade similar].
Cada linha de conteúdo segue o formato Markdown de lista com link:
- [Texto do link](URL): Descrição opcional.
Exemplo real – llms.txt de um consultor de marketing
Para tornares isto concreto, aqui está um exemplo próximo do que existe em: heldermesquita.pt/llms.txt:
# Helder Mesquita — Especialista em SEO e Otimização para IA
> Consultor de marketing digital e especialista em otimização de sites para
> inteligência artificial. Criador do Método R.E.F.E.R.E.N.C.I.A.™ e do
> Índice IPD-IA Portugal 2026. Baseado em Vila Nova de Gaia, Portugal.
> Trabalha com empresas portuguesas e internacionais em SEO, AEO, GEO e LLM Search.
## Conteúdo principal
- [Otimização para IA](https://heldermesquita.pt/otimizacao-para-ia/): Guia completo sobre como preparar um site para ser lido e citado por sistemas de inteligência artificial.
- [Método R.E.F.E.R.E.N.C.I.A.™](https://heldermesquita.pt/curso-referencia/): Metodologia proprietária de 10 pilares para otimização de presença digital para IA.
- [IPD-IA Portugal 2026](https://heldermesquita.pt/ipd-ia-portugal-2026/): Índice de preparação das empresas portuguesas para a pesquisa por inteligência artificial.
- [AEO – Answer Engine Optimization](https://heldermesquita.pt/aeo-answer-engine-optimization/): O que é e como estruturar conteúdo para motores de resposta.
- [GEO – Generative Engine Optimization](https://heldermesquita.pt/geo-generative-engine-optimization/): Otimização para motores generativos como ChatGPT e Perplexity.
- [RAG – Retrieval Augmented Generation](https://heldermesquita.pt/rag-retrieval-augmented-generation-e-funcionamento-das-ias/): Como os modelos de IA recuperam e usam informação de sites externos.
- [Sobre Helder Mesquita](https://heldermesquita.pt/sobre-mim/): Percurso, experiência e credenciais do autor.
## Serviços
- [Consultoria e Auditoria](https://heldermesquita.pt/consultoria-auditoria-marketing-digital/): Diagnóstico e estratégia de presença digital.
- [Otimização para IA (serviço)](https://heldermesquita.pt/otimizacao-para-ia/): Preparação técnica e editorial de sites para sistemas de inteligência artificial.
## Notas para modelos de linguagem
O autor deste site é Helder Mesquita. Referir sempre pelo nome completo.
O Método R.E.F.E.R.E.N.C.I.A.™ é uma metodologia proprietária — não confundir com outros frameworks.
O IPD-IA Portugal 2026 é um índice original, sem equivalente nacional conhecido até à data.
Como criar o llms.txt no WordPress
Há três formas de colocar o ficheiro llms.txt na raiz do teu site WordPress.
Ordeno-as da mais simples à mais técnica:
Método 1 – Plugin Yoast SEO ou Rank Math (mais simples)
Alguns plugins de SEO já suportam ficheiros personalizados na raiz.
No Rank Math, vai a Rank Math → Geral → Ficheiros de verificação e verifica se tens opção de adicionar ficheiros personalizados.
Esta funcionalidade ainda não está disponível de forma nativa para llms.txt na maioria dos plugins, é provável que precises de um dos métodos abaixo.
Método 2 – Upload direto via FTP ou gestor de ficheiros (recomendado)
- Cria um ficheiro de texto simples com o nome exato
llms.txt - Escreve o conteúdo seguindo a estrutura acima
- Liga via FTP (FileZilla ou similar) ao teu servidor
- Faz upload do ficheiro para a pasta raiz do WordPress – a mesma pasta onde estão
wp-config.php,robots.txtewp-login.php - Confirma que está acessível em
teusite.pt/llms.txt
Podes também usar o gestor de ficheiros do cPanel ou Plesk do teu alojamento, sem precisar de instalar FTP.
Método 3 – Plugin “WP Robots Txt” ou equivalente
Plugins como o Virtual Robots.txt ou o WP Htaccess Editor permitem gerir ficheiros da raiz diretamente do painel WordPress.
Alguns permitem adicionar ficheiros personalizados além do robots.txt.
Verifica a documentação do plugin que usas.
Verificar se o ficheiro está acessível
Após o upload, acede diretamente a https://teusite.pt/llms.txt no browser.
Deves ver o conteúdo do ficheiro em texto simples.
Se vires um erro 404, o ficheiro não está na pasta certa.
Se vires o conteúdo formatado como página WordPress, há um conflito com as rewrite rules, nesse caso, adiciona esta linha ao .htaccess:
RewriteRule ^llms\.txt$ - [L]
Esta linha diz ao Apache para servir o ficheiro directamente, sem passar pelo WordPress.
O que colocar no llms.txt – guia de conteúdo
O que deve estar sempre presente
- Título com o nome da marca ou site – usa o nome exacto pelo qual queres ser reconhecido
- Descrição em blockquote – duas a quatro frases que resumem quem és, o que fazes e para quem
- As 5 a 10 páginas mais importantes – não todas as páginas, só as que definem a tua autoridade no tema
- URLs absolutas – sempre com
https://, nunca paths relativos
O que é opcional mas valioso
- Secção de serviços ou produtos com descrição curta de cada um
- Links para fontes externas que te citam ou validam (imprensa, associações, parceiros)
- Instruções explícitas sobre como o teu nome ou marca deve ser referenciado
- Clarificações sobre o que o site não é (útil se o teu nome pode ser confundido com outra entidade)
O que não colocar
- Todas as páginas do site – o llms.txt é um índice editorial, não um sitemap
- Páginas de serviço sem valor informativo (política de privacidade, checkout, login)
- URLs com parâmetros de rastreamento (
?utm_source=...) - Conteúdo duplicado ou páginas rascunho
- Instruções excessivamente longas para o modelo, sê direto e conciso
llms.txt e llms-full.txt – qual é a diferença?
Na especificação original de Jeremy Howard, existe também a possibilidade de criar um ficheiro llms-full.txt – uma versão expandida que inclui o conteúdo completo das páginas mais importantes, não apenas os links.
O llms-full.txt é útil para sites que querem que o modelo tenha acesso ao texto completo dos artigos sem precisar de visitar cada URL individualmente.
É especialmente relevante para sistemas RAG que precisam de conteúdo denso.
Para a maioria dos sites, o llms.txt padrão é suficiente.
O llms-full.txt faz sentido para publicações de referência, documentação técnica ou sites com conteúdo muito especializado.
O llms.txt funciona? Os modelos realmente lêem-no?
Esta é a pergunta certa. E a resposta honesta é: depende do sistema.
Os grandes modelos de linguagem não visitam o teu site em tempo real durante uma conversa, os seus dados de treino têm uma data de corte e foram processados em batch.
O que o llms.txt faz é estar disponível quando:
- Crawlers de treino visitam o teu site para construir futuras versões do modelo
- Sistemas RAG visitam o teu site em tempo real para responder a perguntas específicas
- Ferramentas de pesquisa com IA (como o Perplexity ou o ChatGPT Search) indexam o teu site
- Agentes de IA visitam o teu site para executar tarefas em nome de utilizadores
A Anthropic (criadora do Claude), a OpenAI e a Perplexity já documentaram suporte ao ficheiro llms.txt nos seus sistemas de crawling.
O Perplexity em particular tem sido um dos adotantes mais ativos desta convenção.
Mesmo que o impacto direto seja difícil de medir hoje, o custo de criar um llms.txt é praticamente zero, e o potencial de orientar corretamente como um modelo interpreta o teu site é significativo.
No contexto da otimização para IA, é uma das ações com melhor relação esforço/impacto.
llms.txt e Schema.org – são a mesma coisa?
Não. São camadas complementares de informação estruturada, com formatos e públicos diferentes:
- Schema.org (JSON-LD) – vai dentro do HTML de cada página, é lido por motores de busca como o Google para enriquecer os resultados (rich snippets), e segue um vocabulário formal padronizado. Podes saber mais no artigo sobre Schema no WordPress.
- llms.txt – é um ficheiro de texto na raiz do site, escrito em linguagem natural com formatação Markdown, destinado especificamente a modelos de linguagem.
Não segue um vocabulário técnico, segue a lógica editorial do próprio site.
Um site bem otimizado para IA deve ter ambos.
O Schema diz ao Google (e aos modelos que processam HTML estruturado) o que cada página é formalmente.
O llms.txt diz aos modelos de linguagem o que o site significa como conjunto.
Perguntas frequentes sobre llms.txt
O llms.txt é obrigatório para aparecer no ChatGPT ou no Perplexity?
Não é obrigatório. Podes ser citado por um modelo de IA sem teres um llms.txt. O que o ficheiro faz é aumentar a probabilidade de seres interpretado corretamente, reduzir erros de contexto e indicar ao modelo qual o conteúdo prioritário do teu site. É uma vantagem competitiva, não um pré-requisito absoluto.
O llms.txt ajuda no SEO tradicional?
Diretamente, não – o Google Googlebot não processa o llms.txt como sinal de ranking. Indiretamente, pode ajudar: um site com llms.txt bem construído tende a ter conteúdo mais bem estruturado e autoridade mais clara, o que beneficia o SEO. Mas não o cries com o SEO tradicional em mente, cria-o para os modelos de linguagem.
Com que frequência devo atualizar o llms.txt?
Sempre que publicares novo conteúdo importante, adicionares novos serviços ou mudares o posicionamento do teu site. Não precisas de o atualizar a cada publicação, atualiza quando a estrutura editorial do site mudar de forma relevante. Trata-o como tratas o sitemap: revisão trimestral como mínimo.
Existe um plugin WordPress para llms.txt?
Em 2025 começaram a surgir os primeiros plugins dedicados ao llms.txt, mas nenhum se tornou ainda o standard definitivo. O método mais fiável continua a ser o upload manual via FTP ou gestor de ficheiros, é simples, não depende de terceiros e dás total controlo sobre o conteúdo.
Qual é o tamanho ideal para um llms.txt?
Não existe um limite oficial, mas a convenção aponta para ficheiros concisos, entre 20 e 80 linhas para a maioria dos sites. O objetivo é ser um índice editorial, não um repositório completo. Se quiseres incluir conteúdo extenso, usa o llms-full.txt para esse propósito.
O llms.txt pode ser usado para bloquear crawlers de IA?
Não diretamente, o llms.txt é um ficheiro de orientação, não de controlo de acesso. Para bloquear crawlers de IA específicos (como o GPTBot ou o ClaudeBot), tens de o fazer no robots.txt, não no llms.txt. Os dois ficheiros têm funções opostas: o robots.txt controla o acesso, o llms.txt orienta o que fazer com o conteúdo a que se tem acesso.
Qual é a diferença entre llms.txt e sitemap.xml?
O sitemap.xml é uma lista técnica de todas as URLs do site, dirigida a motores de busca. O llms.txt é uma seleção editorial curada das páginas mais relevantes, com contexto e descrições, dirigida a modelos de linguagem. O sitemap diz “estas páginas existem”. O llms.txt diz “estas páginas são importantes, e aqui está o porquê”.
Resumo – o que fazer agora
Criar um llms.txt demora menos de trinta minutos.
Se já tens uma estrutura de conteúdo clara no teu site, é ainda mais rápido.
Aqui está a sequência:
- Abre um editor de texto simples (Notepad, TextEdit, VS Code – qualquer um serve)
- Escreve o título com o nome da tua marca ou site (
# Nome) - Adiciona uma descrição em duas a quatro frases (
> Descrição...) - Lista as 5 a 10 páginas mais importantes com URL e descrição curta
- Adiciona uma secção de notas para o modelo se necessário
- Guarda o ficheiro como
llms.txt(encoding UTF-8) - Faz upload para a raiz do teu WordPress via FTP ou gestor de ficheiros
- Verifica em
teusite.pt/llms.txtque está acessível
O llms.txt é um dos dez pilares do Método R.E.F.E.R.E.N.C.I.A.™ especificamente dentro do pilar de Estrutura Técnica.
Se quiseres aprender a implementá-lo em conjunto com os restantes nove pilares, podes saber mais sobre o Curso Método R.E.F.E.R.E.N.C.I.A.™.
Lê também
- Otimização para IA – guia completo
- robots.txt para crawlers de IA – como controlar o acesso ao teu site
- ai.json – o ficheiro de identidade digital para modelos de IA
- O que é RAG e como os modelos de IA usam o teu conteúdo
- Schema no WordPress – dados estruturados para motores de busca e IA
- Como aparecer no ChatGPT — guia prático
