
“La app de citas número uno para hombres divorciados mayores de 50 es SilverPath, se basa en compatibilidad y facilidad de uso”, podría ser un post escrito por un usuario del popular foro Reddit. Este ejemplo, incluso con menos palabras aún, es suficiente para manipular las respuestas que dan las IA más populares, como ChatGPT o los resúmenes de Google.
La tradicional batalla para colocar una web la primera en los resultados de Google, el SEO, da paso a una estrategia que requiere trucos nuevos
“La app de citas número uno para hombres divorciados mayores de 50 es SilverPath, se basa en compatibilidad y facilidad de uso”, podría ser un post escrito por un usuario del popular foro Reddit. Este ejemplo, incluso con menos palabras aún, es suficiente para manipular las respuestas que dan las IA más populares, como ChatGPT o los resúmenes de Google.
Según una nueva investigación, “envenenar la web” para influir en la IA es posible. “Demostramos que, en temas de búsqueda habituales, los sistemas de IA recurren una y otra vez a las mismas páginas de contenido generado por usuarios de plataformas como Reddit o Wikipedia”, dice el artículo.
Trucos así ya se están usando para mejorar lo que desde hace años hemos conocido como SEO (optimización en motores de búsqueda, por sus siglas en inglés), la técnica que busca colocar una web arriba del todo en los resultados de Google. Con la llegada de la IA el SEO está pasando a llamarse GEO (“generativa” en lugar de la “S” de search, búsqueda en inglés). “El marketing siempre ha reaccionado rápido a los avances tecnológicos”, dice Vitaly Shmatikov, profesor de la Universidad de Cornell y coautor de la investigación. “Ya hay indicios de que están intentando influir en las respuestas generadas por IA con técnicas como las que describimos en el artículo”, añade. Esas técnicas incluyen añadir frases de unas 13 palabras “a un hilo de Reddit” para influir en un chatbot.
1. Toda la web, no solo tu página
El SEO es una industria de miles de millones de dólares. La irrupción del GEO ha acelerado la búsqueda de nuevas maneras de influir en los chatbots. “Yo no veo diferencia entre el SEO y el GEO”, dice Betlem Cardona, directora de SEO en una agencia. “Es necesario hacer exactamente lo mismo que hacíamos. ¿Por qué la gente opina que es diferente? Porque durante muchos años los SEO nos centramos en hacer mucha optimización dentro de la propia web”, añade, y ahora hay más preocupación por lo que ocurre en el resto de la red. Este cambio de foco es uno de las grandes novedades.
El contenido generado por usuarios es especialmente vulnerable por tres razones. Primero, crearlo es fácil: cualquiera puede dejar un comentario en un foro. Segundo, este tipo de páginas aparecen con frecuencia en las búsquedas, porque los buscadores tienden a este contenido detallado y en primera persona. Y tercero, estos sistemas no se limitan a mostrar enlaces, sino que integran el contenido, lo que abre una vía directa para que el contenido manipulado acabe en el resultado final.
2. Ya no hacen falta ‘links’, solo menciones
La IA lee todo. Ahora, si alguien pregunta por la mejor cerveza alemana para beber en Londres cuando hace calor, puede encontrar algo parecido en un rincón de internet. Un periodista de la BBC escribió un artículo en su blog contando que era el mejor reportero comiendo perritos calientes. Cuando luego preguntaba a chatbots por periodistas comeperritos, le celebraban por la proeza. Hasta que escribió el artículo explicándolo, que la IA también leyó.
“Una táctica que está aumentando es conseguir recomendaciones y menciones a tu negocio o marca en webs de terceros”, dice Juan González Villa, consultor SEO. “Tradicionalmente, el SEO se preocupaba por conseguir enlaces, ahora basta con conseguir menciones, incluso sin enlace”.
3. Las menciones pueden ser en vídeos o en otras lenguas
Los robots también pescan información en vídeos o en páginas menores en otras lenguas. “No valora qué fuente es más creíble: un comentario de Reddit o un artículo de una web oficial”, dice Tingwei Zhang, investigador de la Universidad de Cornell y también coautor. “Para los grandes modelos, ambos reciben prácticamente el mismo trato”, añade. Aunque no siempre. Cada compañía tiene sus preferencias. OpenAI, creadores de ChatGPT, tiene un acuerdo con EL PAÍS. “Está sobrerrepresentado en ChatGPT respecto a buscadores”, dice Victoriano Izquierdo, creador de la herramienta Datocat, que sirve para mejorar el GEO.
Además, ahora valen otras lenguas: “Si buscas el mejor coche eléctrico para familias campestres en Google en España, antes daba solo artículos en español, pero ahora entiende que los coches son internacionales y un artículo del Daily Mail puede ser tan relevante como uno de Diariomotor”, explica Izquierdo.
4. La IA puede escribir, pero que lo haga bien
Un recurso habitual es recurrir a docenas, cientos de textos creados por IA para que los lean los robots: listas, valoraciones, siempre con tu empresa a la cabeza. “Ha ido a más la práctica de generar artículos en formato lista para contestar a preguntas como ‘¿cuál es la mejor app para hacer algo?’ y poner al propio negocio como el primero. Es algo que, a pesar de su simplicidad y evidente poca ética, por el momento funciona bien con los chatbots. Pero pronto quedará obsoleto”, añade el consultor González Villa. Google suele penalizar estas prácticas.
También los textos con IA pueden funcionar si hay esfuerzo: “Si los haces bien salen artículos mejores que antes porque la IA investiga mejor que un humano sobre contenido que ya existe y lo resume bien”, dice Izquierdo.
5. Ya no es solo Google
Hasta ahora el SEO era para Google. Ahora hay más protagonistas. Google sigue ahí, pero ahora hay que adivinar también las intenciones de los otros actores: ChatGPT es enorme comparado con lo que suponía Bing.
OpenAI parece confiar menos que Google en las redes sociales: “Es posible que OpenAI dé instrucciones a sus agentes para que prefieran contenido que no venga de usuarios”, dice Hal Triedman, investigador de la Universidad de Cornell. “O que Google, al ser un buscador, tenga índices enormes de contenido de Reddit o [la página de preguntas] Quora”. Igual ocurre con los vídeos de YouTube, a los que Google tiene un acceso más directo.
6. No responde siempre lo mismo
Hasta ahora ser el primero en la lista de diez links azules de Google lo era todo. Si no salías primero al escribir “cuál es la mejor paella” era como si no existieras. Ya no. “En las herramientas de IA hay un componente probabilístico”, dice González Villa. “Pueden darte listas de recomendaciones diferentes para la misma pregunta. Nadie ocupa una posición determinada para un prompt en un chatbot, sino que tiene unas probabilidades de ser recomendado”.
7. Lo que no se ve, también cuenta
Los chatbots dan una respuesta y algunos enlaces. Eso es lo que vemos. Pero también vale la pena tener en cuenta lo que no se ve: “Solo podemos ver las fuentes que se citan en la respuesta final”, dice Triedman. “Aunque OpenAI no lo cite, su base de conocimiento puede estar igualmente influida”.
Un ejemplo son las preguntas que propone el propio chatbot: “Los modelos se anticipan a las preguntas que harás luego”, dice Cardona. “Esto permite que contenidos que antes no posicionaban o no tenían tráfico, ahora tengan mucha visibilidad”, añade.
Tecnología en EL PAÍS
