Cómo escribir los primeros 200 tokens para que los motores de IA citen tu artículo
El primer 30% de un artículo genera el 44% de las citas de IA. Guía práctica para un inicio que ChatGPT, Claude y Perplexity citan.
Al final de esta guía, escribirás los primeros 200 tokens de cualquier artículo en una forma que ChatGPT, Claude, Perplexity y Google AI Overviews puedan citar al pie de la letra. Ese bloque hace la mayor parte del trabajo: un análisis de Ahrefs sobre 1,4 millones de prompts encontró que el 44,2% de las citas de los LLM viene del primer 30% de un artículo, frente al 24,7% del último tercio. Si quieres que ChatGPT te cite, la decisión se toma en el inicio.
Un token equivale a unas 0,75 palabras en inglés. 200 tokens son unas 150 palabras, aproximadamente los dos primeros párrafos de un post. Esa ventana es lo que los motores de IA escanean primero durante el retrieval, y lo que extraen cuando la página tiene rango suficiente para ser citada.
Lo que necesitas antes de empezar
- Un tema concreto y una target query (por ejemplo, cómo conseguir que ChatGPT me cite), no un tema genérico.
- Una fuente autorizada con un dato o un número citable. Una es el mínimo, tres es mejor.
- La plantilla entidad-categoría-diferenciador de la investigación GEO (Paso 1).
- Un slug que refleje literalmente el tema, no de forma ingeniosa. Las páginas con URLs descriptivas se citan el 89,78% de las veces que aparecen en los resultados, frente al 81,11% de las URLs vagas.
Paso 1: Nombra el tema en forma entidad-categoría-diferenciador
Abre la primera frase con la forma [Tema] es una [categoría] que [diferenciador]. Es el patrón Definition Lead estudiado en el paper GEO de Princeton aceptado en KDD 2024. Funciona porque los LLM recuperan frases que responden a la pregunta literal qué es X, y esta plantilla la responde en una sola cláusula.
Ejemplo, para este artículo: un Definition Lead es una plantilla de primera frase que nombra el tema, su categoría y su diferenciador para que los motores de IA puedan citar una línea autónoma. La frase se sostiene sola. Una cita extraída conserva el significado sin el párrafo que la rodea.
Paso 2: Mete una estadística con su fuente en los dos primeros párrafos
El experimento GEO de Princeton probó seis modificaciones de contenido sobre 10.000 consultas. Añadir estadísticas mejoró la visibilidad de cita en un 41% en páginas con rango más bajo. Añadir citas externas movió la misma métrica un 115%. Añadir más palabras sin datos no hizo nada. El keyword stuffing rindió un 10% por debajo de la baseline.
Regla práctica: un número real, con la fuente enlazada inline, dentro de las primeras 150 palabras. No investigaciones recientes muestran, sino una cifra específica, un año, un nombre de fuente y un enlace. Un LLM extrae una frase concreta y te cita. Las afirmaciones difusas se ignoran.
Paso 3: Sigue el inicio con un párrafo que nombre quién, cuándo, y el resultado
El segundo párrafo responde a las tres preguntas que el LLM usa para rankear tu página: a quién aplica, cuándo es relevante, qué obtiene el lector. Tres frases bastan. Ese párrafo suele ser el fragmento que ChatGPT Search cita cuando te incluye, porque lleva alcance y contexto en un bloque.
Evita el relleno tipo en el mundo acelerado de hoy. Evita la autopromoción tipo nuestro equipo lleva años. Ambos se descartan en el retrieval porque ninguno lleva un dato extraíble.
Paso 4: Alinea título y URL con una sub-query real
ChatGPT Search descompone los prompts en sub-consultas (el paso fan-out), luego recupera páginas cuyo título, URL y primer párrafo coinciden con una de esas sub-consultas. El título debe contener la target query al pie de la letra cuando la frase suene natural. La URL debe repetir la noun phrase principal.
Contra-ejemplo: una URL ingeniosa como /blog/words-that-win para un artículo sobre cómo conseguir que ChatGPT me cite entierra la señal. /blog/how-to-get-cited-by-chatgpt gana el retrieval. El delta medido por Ahrefs entre URLs descriptivas y URLs vagas ronda los 9 puntos porcentuales de citation rate.
Paso 5: Añade señales estructurales para el extractor
Tras los dos primeros párrafos, coloca un H2 que empiece con una pregunta o una noun phrase directa, no con una metáfora. Debajo: párrafos cortos, una lista, una tabla si el tema lo merece. La IA no parsea tu metáfora, parsea tu estructura. El schema Article y BlogPosting añade una señal que Fabrice Canel de Microsoft confirmó públicamente que ayuda a los LLM a entender el contenido en SMX Munich en marzo de 2025.
Cómo verificar que funciona
- Lee solo las primeras 150 palabras. Se sostienen como respuesta a la target query sin el resto del artículo? Si no, el inicio falla en el retrieval.
- Cuenta las frases citables. Una frase citable lleva un dato, es autónoma y está por debajo de 25 palabras. Apunta a tres en los primeros 200 tokens.
- Prueba el prompt real. Lanza la target query en ChatGPT (con búsqueda activa), Perplexity y Claude. Si tu URL aparece dentro de las dos primeras semanas desde la publicación, el inicio está haciendo su trabajo.
- Revisa el slug. La URL debe ser legible sin visitar la página. Si un humano no adivina de qué va el artículo desde la URL, una IA tampoco.
Errores frecuentes y correcciones
El inicio estilo Medium. Una apertura narrativa tipo era un martes de 2024 cuando entendimos que el mundo había cambiado funciona para lectores humanos. Los motores de IA no pueden extraer un dato de ahí. Corrección: sustituye la primera línea por el Definition Lead, deja la narración para el tercer párrafo.
El inicio tipo folleto corporativo. Una primera línea sobre el autor (en Studio ayudamos a las empresas a navegar) tiene señal casi nula. Corrección: la primera frase va sobre el tema, no sobre el autor.
La estadística sin enlace. Un número desnudo parece una afirmación, no un dato. Corrección: enlace inline a la fuente primaria en el punto de la afirmación, nunca en una nota al pie.
El volcado de keywords al inicio. El paper GEO de Princeton lo midió: el keyword stuffing rindió un 10% por debajo de la baseline. Corrección: una aparición natural de la target query en el primer párrafo, luego escribe para un humano.
Un slug demasiado ingenioso. /blog/the-first-impression pierde contra /blog/first-200-tokens-ai-citation. Corrección: renombra el archivo y emite un 301 si la URL ya está publicada.
Para profundizar
El inicio es la palanca más fuerte, no la única. La frescura importa: el contenido citado por IA es en promedio de 393 a 458 días más reciente que los resultados top de Google para la misma consulta, y las páginas no actualizadas en 90 días pierden citas tres veces más rápido. La autoridad del dominio importa: los sitios con más de 32.000 referring domains tienen 3,5 veces más probabilidad de ser citados que los sitios con menos de 200. Ninguna sustituye un inicio sólido, pero ambas lo amplifican. Para el playbook completo, ve las 12 best practices GEO que realmente mueven los citation rates en 2026 y la definición de GEO frente a SEO.
Studio
Empieza un proyecto.
Un partner único para empresas, sector público, startups y SaaS. Producción más rápida, tecnología moderna, costes reducidos. Un equipo, una factura.