El pasado mes de septiembre de 2025, Encyclopædia Britannica y Merriam-Webster presentaron una demanda contra Perplexity AI ante el Tribunal de Distrito Sur de Nueva York. La acusación es contundente: infracción masiva de derechos de autor y uso indebido de marcas registradas. Este litigio representa uno de los enfrentamientos más significativos hasta la fecha entre editores tradicionales de contenido de calidad y empresas emergentes de inteligencia artificial generativa.

El modelo de negocio bajo escrutinio
Perplexity AI se ha posicionado como un “motor de respuestas” que, según sus propias palabras, utiliza inteligencia artificial avanzada para buscar en internet en tiempo real y proporcionar respuestas concisas y conversacionales. La empresa, valorada en 20.000 millones de dólares tras su última ronda de financiación, ha captado aproximadamente 1.500 millones en inversiones y cuenta con alrededor de 22 millones de usuarios activos.
Sin embargo, la demanda revela un aspecto problemático de su funcionamiento. Según los demandantes, Perplexity accede a contenido protegido por derechos de autor mediante un software denominado “PerplexityBot”, que rastrea y extrae sistemáticamente artículos de las páginas web de Britannica y Merriam-Webster. Este contenido alimenta posteriormente su sistema de generación aumentada por recuperación (RAG, por sus siglas en inglés), que produce respuestas basadas en material ajeno sin autorización ni compensación.
Tres niveles de infracción
La demanda identifica tres momentos distintos en los que se produciría la vulneración de derechos de autor. Primero, durante la fase de recopilación de datos, cuando Perplexity utiliza rastreadores web para copiar contenido de las plataformas de los demandantes. Segundo, en la fase de entrada de datos, al incorporar artículos protegidos como material de contexto para su modelo de IA. Tercero, en la fase de salida, cuando genera respuestas que reproducen de forma literal o parafraseada el contenido original.
Los ejemplos aportados en la demanda resultan ilustrativos. Cuando un usuario consultó a Perplexity sobre la definición de “plagiarize” según Merriam-Webster, el sistema reprodujo exactamente la definición del diccionario impreso registrado. En otro caso, ante una pregunta sobre los druidas limitada expresamente a contenido de Britannica, Perplexity generó una respuesta que reproducía sustancialmente el artículo original, incluyendo posteriormente párrafos literales cuando se le solicitaron “pasajes exactos”.
El problema de las alucinaciones y omisiones
Más allá de la infracción de derechos de autor, la demanda señala una segunda dimensión del conflicto: el uso indebido de marcas comerciales. Perplexity ocasionalmente genera contenido falso o “alucinaciones” y lo atribuye a Britannica o Merriam-Webster mediante el uso de sus marcas registradas. Asimismo, reproduce artículos de forma incompleta sin indicar que ha omitido secciones, lo que crea una falsa impresión de exhaustividad.
Esta práctica resulta especialmente dañina para empresas cuyo valor reside precisamente en la fiabilidad y exactitud de su información. Britannica ha invertido más de 250 años en construir una reputación de contenido verificado y rigurosamente investigado. Merriam-Webster, por su parte, lleva más de 180 años como referencia en información lingüística. La asociación de sus marcas con contenido impreciso o inventado diluye ese valor acumulado.
Las respuestas insuficientes de Perplexity
Frente a críticas previas sobre su conducta, Perplexity ha esgrimido tres argumentos principales. Primero, que cita sus fuentes y genera tráfico de referencia hacia los sitios originales. Sin embargo, los demandantes sostienen que este tráfico es insignificante y que, de hecho, el objetivo declarado de Perplexity es eliminar la necesidad de que los usuarios visiten los sitios web fuente.
Segundo, la empresa ha lanzado un “Programa de Editores” que ofrece compartir ingresos con aquellos creadores de contenido cuyo material sea referenciado en las respuestas. No obstante, esta iniciativa representa un intento de imponer retroactivamente términos de licencia a propietarios de contenido cuyo material ya ha sido copiado sin autorización.
Tercero, Perplexity alega que su uso constituye “uso legítimo” bajo la legislación de derechos de autor estadounidense. La demanda rechaza este argumento, señalando que el uso tiene finalidad comercial, copia obras completas y crea sustitutos directos del contenido original, causando daño sustancial al mercado publicitario y de suscripciones de los demandantes.
Un problema sistémico más amplio
Este caso no es aislado. Perplexity ya enfrenta otra demanda de Dow Jones y NYP Holdings por infracciones similares. Además, diversos informes independientes han documentado que la empresa utiliza rastreadores no declarados que evaden los archivos robots.txt y otras medidas técnicas que los propietarios de sitios web emplean para impedir el acceso automatizado a su contenido.
Investigadores de Cloudflare identificaron en agosto de 2025 que Perplexity emplea agentes de usuario ocultos diseñados para hacerse pasar por navegadores convencionales cuando sus rastreadores declarados son bloqueados. Esta conducta contrasta con otras empresas de IA como OpenAI, que según el mismo informe sigue mejores prácticas en materia de rastreo web.
Las consecuencias a largo plazo
Más allá del desenlace judicial específico, esta demanda plantea cuestiones fundamentales sobre el ecosistema de información digital. Si empresas de IA pueden apropiarse libremente de contenido de calidad sin compensar a sus creadores, se erosionan los incentivos económicos necesarios para producir ese contenido. Britannica registró más de mil millones de sesiones en su sitio web durante 2024, financiadas mediante publicidad y suscripciones. Si los usuarios obtienen el contenido a través de intermediarios como Perplexity sin generar esos ingresos, la capacidad de mantener equipos de investigadores, escritores y editores se ve comprometida.La demanda solicita medidas cautelares para impedir que Perplexity continúe con las prácticas denunciadas, además de daños económicos, restitución de beneficios y costas procesales. El resultado de este litigio, que habrá de ponerse en relación con otros casos como el de Anthropic, podría establecer precedentes importantes sobre los límites del uso de contenido protegido en sistemas de inteligencia artificial generativa, un debate que apenas comienza y que determinará en buena medida el futuro de la información digital de calidad.
SUBSTACK