El Capítulo de Derechos de Autor del Código de Buenas Prácticas para modelos de IA de la UE: un puente entre la innovación y la Propiedad Intelectual

Introducción

En el marco del recién estrenado reglamento de inteligencia artificial de la Unión Europea, y tras un intenso proceso de elaboración que involucró a cerca de mil partes interesadas —incluyendo proveedores de IA, estados miembros y diversos observadores—, la Comisión Europea ha recibido la versión final del “código de buenas prácticas de inteligencia artificial de uso general“. Este documento, cuyo objetivo es guiar a la industria en el cumplimiento de las nuevas obligaciones legales antes de su plena entrada en vigor, y que ahora deberá ser revisado por la Oficina Europea de Inteligencia Artificial, constituye una pieza clave en la arquitectura regulatoria de la IA.

La proliferación de modelos de inteligencia artificial (IA) de propósito general ha supuesto un cambio de paradigma en numerosos sectores, pero también ha generado una tensión con los derechos de autor. En el centro del debate se encuentra la utilización masiva de datos y obras protegidas para el entrenamiento de estos sistemas, situación que la UE pretende paliar, a través de su reglamento de IA (AI Act), estableciendo obligaciones específicas para los proveedores de dichos modelos.

El marco normativo de referencia: El Reglamento de IA y la Directiva sobre Derechos de Autor

Para comprender el alcance del código, debemos situarlo en su contexto normativo. El punto de partida es el artículo 53(1), punto (c), del reglamento de IA, que exige a los proveedores de modelos de IA de propósito general “establecer una política para cumplir con la legislación de la Unión en materia de derechos de autor“.

Esta obligación se conecta directamente con la directiva (UE) 2019/790 sobre los derechos de autor en el mercado único digital. Concretamente, con su artículo 4, que regula la excepción para la minería de textos y datos (TDM). Dicha excepción permite la reproducción y extracción de obras para fines de TDM bajo dos condiciones: que se haya tenido “acceso lícito” (requisito que también aparece en la sentencia estadounidense del caso Anthropic) y que los titulares de derechos no hayan “reservado expresamente” sus derechos de manera apropiada. Es precisamente la implementación de esta reserva de derechos, u “opt-out”, el nudo gordiano que el código pretende desatar.

Análisis de los compromisos del Código

El código se articula en torno a un compromiso principal: desarrollar una política de derechos de autor, que se materializa a través de cinco medidas específicas.

1. Formalización de una Política Interna y Acceso a Contenidos (Medidas 1.1 y 1.2)

La primera medida exige a los adherentes al código redactar, mantener y aplicar una política de derechos de autor formalizada en un único documento y asignar responsabilidades claras dentro de su organización. Se trata de una medida de buena gobernanza corporativa, esencial para garantizar una gestión de riesgos adecuada.

La medida 1.2 aborda el requisito del “acceso lícito“. Para ello, los proveedores se comprometen a dos acciones clave al realizar rastreos web (web crawling):

  • No eludir medidas tecnológicas de protección: Esto significa respetar muros de pago (paywalls) o sistemas de suscripción, cerrando la puerta al uso de contenido de acceso restringido sin autorización.
  • Excluir sitios web infractores: Se comprometen a no rastrear sitios web que hayan sido reconocidos por tribunales o autoridades públicas de la UE como infractores persistentes de derechos de autor a escala comercial. Resulta de gran interés práctico el anuncio de que se publicará “una lista dinámica de hipervínculos” a estos sitios en una web de la UE, lo que facilitará enormemente su implementación.

2. El desafío del “Opt-Out”: identificación de reservas de derechos (Medida 1.3)

Esta medida es, sin duda, el corazón técnico y jurídico del código, pues aborda cómo cumplir con la reserva de derechos del artículo 4(3) de la directiva. Los proveedores se comprometen a utilizar tecnologías de lectura automática para identificar dichas reservas. La solución propuesta se basa en dos pilares:

  • El protocolo robots.txt: Se establece el uso del “robot exclusion protocol” como estándar de facto para que los rastreadores web lean y sigan las instrucciones de exclusión. Aunque robots.txt no fue diseñado originalmente para la reserva de derechos de autor, su adopción es una solución pragmática y de implementación inmediata.
  • Futuros estándares: El código mira hacia el futuro, reconociendo la necesidad de desarrollar “otros protocolos apropiados legibles por máquina” a través de un diálogo inclusivo entre titulares de derechos, proveedores de IA y otras partes interesadas. Esto denota una conciencia de las limitaciones del sistema actual y un compromiso con su mejora.

Adicionalmente, la medida contiene una salvaguarda importante para los editores de contenidos que también operan motores de búsqueda, al alentar que el respeto a una reserva de derechos para TDM “no conduzca directamente a efectos adversos en la indexación del contenido” en sus buscadores.

3. La mitigación de riesgos en los “Outputs” (Medida 1.4)

El código no solo se preocupa por los datos de entrada (inputs), sino también por los resultados (outputs) generados por los modelos (recordemos el caso Getty Images). La medida 1.4 busca mitigar el riesgo de que se generen contenidos que infrinjan derechos de autor. Para ello, se proponen dos vías de acción:

  • Implementar “salvaguardias técnicas apropiadas y proporcionadas” para evitar que los modelos reproduzcan de manera infractora el contenido protegido con el que fueron entrenados. La generalidad de esta formulación (“apropiadas y proporcionadas”) deja un amplio margen de interpretación y será, previsiblemente, un campo de intenso desarrollo técnico y debate jurídico.
  • Prohibir los usos infractores en las políticas de uso aceptable o términos y condiciones del servicio.

4. Mecanismos de transparencia y reclamación (Medida 1.5)

Finalmente, el código establece medidas de carácter procedimental. La medida 1.5 obliga a los signatarios a designar un “punto de contacto” para la comunicación con los titulares de derechos y a establecer un mecanismo electrónico para que estos puedan presentar reclamaciones “suficientemente precisas y adecuadamente fundamentadas“. Este canal de comunicación es vital para resolver conflictos de manera ágil, aunque se subraya que no afecta a las acciones y recursos legales disponibles para la defensa de los derechos de autor.

Conclusiones

El capítulo de derechos de autor del código de buenas prácticas representa un esfuerzo loable y pragmático por traducir las complejas obligaciones del reglamento de IA a un conjunto de acciones concretas y verificables, ofreciendo una hoja de ruta clara a los proveedores y fomentando la transparencia. Destaca por medidas operativas como el respeto a los paywalls, la exclusión de sitios infractores y el uso de robots.txt, reconociendo la imperfección de las soluciones actuales y apostando por la colaboración para futuros estándares. Persisten ambigüedades en la definición de “salvaguardias técnicas apropiadas” para controlar los outputs.

Este código es un primer paso esencial hacia la coexistencia entre la IA generativa y la propiedad intelectual, constituyendo una base sólida para un ecosistema digital armonioso. Su éxito dependerá de la buena fe de los signatarios, la evolución técnica y la interpretación judicial del equilibrio de intereses.”