Synthetic Media Licensing: monetizar la voz y la imagen en la era de la IA generativa

En mayo de 2024, Scarlett Johansson denunció públicamente que OpenAI había lanzado una voz para ChatGPT «inquietantemente similar» a la suya, después de que ella hubiese rechazado expresamente la propuesta de Sam Altman de licenciar su voz para el asistente. OpenAI retiró la voz «Sky» en cuestión de días, pero el incidente desencadenó una pregunta que hoy sigue preocupando a la industria del entretenimiento global: ¿cómo se estructura jurídicamente la cesión —voluntaria y remunerada— de la voz, el rostro y la identidad digital de una persona para su uso por sistemas de inteligencia artificial generativa?

Mientras el debate público se ha centrado en los deepfakes como amenaza —un enfoque que hemos analizado en publicaciones anteriores de LAW21—, la realidad del mercado está configurando un espacio radicalmente distinto: un mercado emergente de licencias de medios sintéticos (synthetic media licensing) en el que actores licencian su voz para asistentes virtuales, músicos autorizan la creación de samples sintéticos de su estilo vocal, y modelos ceden su imagen digital para campañas generadas por IA. El conflicto Johansson-OpenAI no es, por tanto, solo una historia de apropiación indebida; es el negativo fotográfico de una oportunidad económica sin precedentes que exige marcos contractuales sofisticados y una comprensión precisa de los derechos en juego.

I. El contexto: de la amenaza a la oportunidad

En agosto de 2024, SAG-AFTRA y la plataforma Narrativ anunciaron un acuerdo que permitía a los miembros del sindicato licenciar de forma segura réplicas digitales de su voz para anuncios de audio. En junio de ese mismo año, SAG-AFTRA lanzó el Dynamic AI Audio Commercials Waiver, un instrumento contractual específico que exige el consentimiento informado del intérprete para la creación de su réplica vocal digital y un consentimiento adicional para cada uso publicitario concreto. En mayo de 2025, los nuevos Commercials Contracts ratificados por los miembros del sindicato incorporaron las protecciones contractuales más robustas logradas hasta la fecha en materia de IA. Y en julio de 2025, el Interactive Media Agreement introdujo requisitos de consentimiento y divulgación para el uso de réplicas digitales en videojuegos, incluyendo la facultad de suspender el consentimiento durante una huelga.

En la industria musical, la dinámica es paralela. En noviembre de 2025, Universal Music Group y la plataforma de IA musical Udio anunciaron el lanzamiento de un servicio por suscripción previsto para 2026, basado en modelos entrenados exclusivamente con música autorizada y licenciada del catálogo de Universal, con participación estrictamente voluntaria (opt-in) de los artistas. Spotify ha formalizado acuerdos de licencia de IA con Sony, Universal y Warner, entre otros. Esta tendencia confirma lo que anticipábamos en nuestro análisis sobre las meta-licencias y el consorcio CREA Trust AI: la emergencia de un mercado estructurado de licencias que transforma la relación entre creadores y tecnología de un esquema defensivo a uno transaccional.

II. Marco jurídico: la protección de la voz y la imagen como activos licenciables

El modelo europeo: derechos fundamentales como límite y como base

En el ordenamiento jurídico español, la protección de la voz y la imagen de una persona se articula a través de una arquitectura normativa de múltiples niveles. El artículo 18.1 de la Constitución Española consagra el derecho fundamental a la propia imagen, desarrollado por la Ley Orgánica 1/1982, de 5 de mayo, de protección civil del derecho al honor, a la intimidad personal y familiar y a la propia imagen. Esta norma establece que el consentimiento para la explotación de la imagen es revocable en cualquier momento (artículo 2.1), lo que constituye un rasgo estructural del sistema español que lo diferencia sustancialmente del modelo anglosajón.

La naturaleza de derecho fundamental de la propia imagen en el sistema constitucional español tiene consecuencias directas sobre la estructuración de contratos de synthetic media licensing. En primer lugar, opera como un límite material a la autonomía de la voluntad: ningún contrato puede suponer una renuncia general y no condicionada al derecho a la propia imagen, por tratarse de un derecho irrenunciable conforme al artículo 1.3 de la LO 1/1982. En segundo lugar, la revocabilidad del consentimiento —aunque sujeta a la indemnización de los daños y perjuicios causados, incluyendo las expectativas justificadas— introduce un elemento de inestabilidad contractual que debe ser gestionado mediante cláusulas específicas de compensación y transición.

El Reglamento General de Protección de Datos (RGPD) añade una capa adicional de complejidad. La voz y los rasgos faciales constituyen datos biométricos a efectos del artículo 9 del RGPD cuando se procesan con medios técnicos específicos que permiten la identificación unívoca de una persona, como es precisamente el caso de los sistemas de clonación vocal y generación de imagen por IA. Su tratamiento requiere, por tanto, una base de legitimación reforzada —típicamente el consentimiento explícito del interesado—, que es igualmente revocable y que debe cumplir los requisitos de especificidad, granularidad e información previa que exige la normativa de protección de datos.

A nivel sectorial, el nuevo Real Decreto que moderniza la relación laboral especial de los artistas en España ha introducido un principio revolucionario: la exclusión por defecto de la IA generativa del objeto natural del contrato artístico. Esto significa que, salvo pacto expreso por escrito, el uso de sistemas de IA generativa para replicar o sintetizar la voz, imagen o interpretación de un artista queda fuera del ámbito de la prestación contractual. Las cláusulas que autoricen estos usos deberán especificar, como mínimo, el alcance temporal y territorial, los tipos de uso autorizados, los sistemas de IA específicos, una remuneración diferenciada y los derechos de revocación. Se trata de un régimen que, en la práctica, configura la licencia de medios sintéticos como un acto jurídico autónomo e independiente del contrato artístico principal.

El modelo estadounidense: right of publicity y la fragmentación regulatoria

El sistema estadounidense aborda la protección de la voz y la imagen desde una perspectiva conceptualmente distinta. No existe un derecho fundamental a la propia imagen en la Constitución federal; la protección se articula fundamentalmente a través del right of publicity, un derecho de origen jurisprudencial y desarrollo estatal que reconoce a toda persona el control exclusivo sobre el uso comercial de su nombre, imagen, voz y otros atributos identificativos de su personalidad.

La jurisprudencia estadounidense en esta materia es abundante y directamente relevante para el synthetic media licensing. El caso Midler v. Ford Motor Co. (1988) estableció que la imitación deliberada de una voz distintiva para fines comerciales constituye una apropiación indebida, incluso cuando no se utiliza la grabación original. El caso Waits v. Frito-Lay (1992) confirmó esta doctrina y reconoció daños punitivos. Estos precedentes son los que habrían sustentado una eventual demanda de Scarlett Johansson contra OpenAI: investigadores de la Universidad Estatal de Arizona determinaron, mediante modelos de análisis de similitud vocal, que la voz de Johansson era más similar a «Sky» que la del 98% de las actrices analizadas.

La fragmentación regulatoria estatal ha sido, históricamente, el talón de Aquiles de este sistema. Sin embargo, desde 2024 se ha producido una convergencia legislativa sin precedentes. La ELVIS Act de Tennessee (marzo de 2024) se convirtió en la primera ley estatal en extender expresamente las protecciones del right of publicity a las clonaciones vocales generadas por IA, estableciendo tanto responsabilidad penal como remedios civiles. California adoptó la AB 2602, en vigor desde el 1 de enero de 2025, que prohíbe la ejecución de cláusulas contractuales que autoricen el uso de réplicas digitales de un intérprete salvo que la cláusula incluya una descripción razonablemente específica de los usos previstos y el individuo haya estado representado por un abogado o un sindicato. Nueva York aprobó legislación equivalente con el Bill S7676B.

El desarrollo más significativo en el ámbito federal es la NO FAKES Act (Nurture Originals, Foster Art, and Keep Entertainment Safe Act), reintroducida en abril de 2025 con apoyo bipartidista y respaldo de una coalición que incluye a SAG-AFTRA, las grandes discográficas, y —significativamente— a Google, OpenAI y Amazon. La ley crearía el primer derecho federal de propiedad intelectual sobre la voz y la imagen de una persona en el contexto de réplicas digitales, con una duración que se extiende hasta 70 años tras la muerte del titular y un sistema de notice-and-takedown inspirado en la DMCA. En abril de 2025, más de 400 artistas, entre ellos la propia Scarlett Johansson, firmaron una carta de apoyo a la legislación.

III. Análisis de un contrato de synthetic media licensing

La práctica contractual emergente en este sector revela una estructura que, si bien se nutre de elementos de la licencia de propiedad intelectual clásica, presenta características propias que responden a la naturaleza singular del objeto licenciado y a los riesgos específicos de la tecnología de IA generativa.

Elementos esenciales

Identificación precisa del activo licenciado. El contrato debe definir con precisión qué se licencia: ¿la voz grabada del artista, el modelo vocal entrenado a partir de sus grabaciones, una síntesis que reproduce sus características vocales sin utilizar grabaciones originales, o una combinación de estos elementos? Esta distinción tiene consecuencias jurídicas directas: la licencia de grabaciones originales implica derechos de propiedad intelectual (derechos del artista intérprete o ejecutante conforme al Texto Refundido de la Ley de Propiedad Intelectual); la licencia de un modelo vocal sintético implica derechos de imagen y, potencialmente, protección de datos; la licencia de un estilo vocal genérico plantea problemas de delimitación más complejos, especialmente en jurisdicciones donde el estilo como tal no goza de protección autónoma.

Alcance de los usos autorizados. La experiencia del sector demuestra que las cláusulas genéricas —del tipo «en cualquier medio y formato, ahora conocido o por desarrollar, en todo el universo y a perpetuidad»— son precisamente las que la nueva legislación busca invalidar. La AB 2602 de California fue diseñada específicamente para combatir este tipo de disposiciones. El contrato debe especificar: los medios concretos (publicidad, entretenimiento, asistentes virtuales, doblaje, videojuegos), los territorios, la duración, los idiomas (si se trata de voz), los contextos de uso (¿puede la réplica digital expresar opiniones políticas? ¿Puede aparecer en contenido para adultos? ¿Puede interactuar en tiempo real con usuarios?) y las plataformas de distribución.

Prohibición de entrenamiento derivado. Un elemento que se ha consolidado como cláusula estándar en la industria es el Synthetic Voice/AI Rider: una adenda contractual que prohíbe expresamente al licenciatario utilizar las grabaciones del artista para entrenar modelos de IA o generar clones vocales sintéticos más allá del alcance específico de la licencia. Sin esta cláusula, existe el riesgo de que el material licenciado se convierta en un recurso de entrenamiento que permita al licenciatario generar contenido indefinidamente sin necesidad de recurrir al artista original.

Estructura de compensación. Los modelos de remuneración que están apareciendo combinan típicamente tres componentes: un upfront fee o pago inicial por la creación y entrenamiento del modelo sintético; royalties vinculados al uso efectivo de la réplica digital (por impresión publicitaria, por interacción en el caso de asistentes virtuales, o por obra generada); y pagos por renovación o extensión del ámbito de uso. El nuevo Real Decreto español de artistas establece la obligación de separación contable de las remuneraciones por uso de IA respecto de otros conceptos salariales, lo que facilitará el control y la fiscalización.

Derechos de auditoría y supervisión. Los contratos más sofisticados incluyen derechos de auditoría que permiten al licenciante verificar cómo se está utilizando su réplica digital, con qué frecuencia, en qué contextos y si el material generado se ajusta a los parámetros de calidad y dignidad acordados. SAG-AFTRA ha logrado incorporar en sus convenios la obligación de que las réplicas digitales sean destruidas o retiradas una vez expirado el contrato, impidiendo su reutilización posterior.

Revocabilidad y cláusulas de salida. Este es el punto de mayor tensión entre el modelo europeo y el estadounidense. En el sistema español, como hemos señalado, el consentimiento para el uso de la propia imagen es revocable por mandato legal, si bien con la obligación de indemnizar los daños. Un contrato bien diseñado debe anticipar esta eventualidad mediante: períodos de preaviso razonables que permitan la transición, fórmulas de cálculo de la indemnización por revocación anticipada, obligaciones de eliminación del modelo sintético y de todo el contenido generado, y disposiciones sobre qué ocurre con el material ya distribuido en circuitos comerciales. La NO FAKES Act estadounidense, por su parte, contempla períodos de licencia de hasta diez años, renovables, lo que plantea interrogantes sobre la capacidad real de un artista para recuperar el control de su identidad digital una vez cedida.

IV. Tensiones estructurales: derechos fundamentales, libertad contractual y poder de negociación

La estructuración de licencias de medios sintéticos no es un mero ejercicio de ingeniería contractual; opera en un campo de fuerzas donde confluyen tensiones jurídicas de primer orden.

La primera y más evidente es la tensión entre la libertad contractual y la protección constitucional de la imagen. El artículo 1.255 del Código Civil español consagra la autonomía de la voluntad como principio rector de las relaciones contractuales, pero este principio cede ante los límites que imponen la ley, la moral y el orden público. Los derechos de la personalidad —entre los que se cuenta el derecho a la propia imagen— constituyen precisamente uno de esos límites. Esto significa que, a diferencia de lo que ocurre con una licencia de patente o de marca, la licencia de imagen sintética opera siempre bajo la sombra de la revocabilidad y de la protección constitucional reforzada del licenciante. Para el adquirente de la licencia, esto genera una incertidumbre jurídica que debe ser compensada mediante mecanismos contractuales de estabilización, como las cláusulas de indemnización por revocación anticipada o los lock-in periods con compensación decreciente.

La segunda tensión proviene de la asimetría de poder negociador. No es lo mismo Scarlett Johansson rechazando una oferta de OpenAI que un actor secundario o un artista emergente enfrentándose a un contrato estándar de una plataforma tecnológica. La AB 2602 de California aborda esta cuestión directamente al exigir representación letrada o sindical para que una cláusula de réplica digital sea ejecutable. La NO FAKES Act permite que un «representante autorizado» licencie la réplica digital de una persona sin el conocimiento de esta, lo que ha sido criticado por especialistas como la profesora Jennifer Rothman por el riesgo de pérdida de control, especialmente para artistas jóvenes que hayan firmado acuerdos de gestión de carrera excesivamente amplios.

La tercera tensión afecta a la dimensión temporal y tecnológica. Un modelo de IA entrenado con la voz de un artista a los 30 años puede generar contenido indistinguible de su voz durante décadas, incluso después de que el artista haya envejecido, cambiado de opinión o fallecido. La cuestión de los derechos post mortem cobra aquí una relevancia inédita: la NO FAKES Act contempla una protección de hasta 70 años tras la muerte, mientras que la legislación española de protección de la imagen no establece un plazo post mortem equivalente. La AB 1836 de California, por su parte, amplía la protección de personas fallecidas a las réplicas digitales de su voz o imagen, exigiendo el consentimiento de los herederos.

V. Recomendaciones prácticas

Para artistas e intérpretes

La primera recomendación, y la más urgente, es realizar una auditoría de todos los contratos vigentes para identificar cláusulas que puedan autorizar, directa o indirectamente, el uso de su imagen o voz para la creación de réplicas digitales. Muchos contratos firmados antes de 2023 contienen cláusulas genéricas de cesión de imagen que, dependiendo de la jurisdicción, podrían interpretarse como una autorización implícita para usos de IA. La segunda recomendación es no negociar individualmente con plataformas tecnológicas sin asesoramiento especializado. La complejidad técnica y jurídica de estas licencias requiere profesionales que comprendan tanto el marco regulatorio aplicable como la realidad tecnológica de los sistemas de IA generativa. Finalmente, los artistas deben considerar activamente la monetización proactiva de su identidad digital como un activo independiente, estableciendo políticas claras de licencia antes de que terceros utilicen su voz o imagen sin autorización.

Para managers y representantes

Los representantes de artistas deben actualizar sus plantillas contractuales para incluir cláusulas específicas de IA en todos los acuerdos con productoras, sellos discográficos y plataformas. Es fundamental diferenciar entre la cesión para una producción concreta y la cesión para el entrenamiento de modelos, que son actos jurídicos de naturaleza y alcance radicalmente distintos. Asimismo, deben establecer protocolos internos para evaluar las solicitudes de licencia de medios sintéticos, considerando no solo la compensación económica inmediata sino también el impacto reputacional a largo plazo y el riesgo de dilución de la identidad artística del representado.

Para estudios, productoras y empresas tecnológicas

Las empresas que deseen utilizar réplicas digitales de artistas deben asumir que el entorno regulatorio se está endureciendo de forma acelerada y coordinada a ambos lados del Atlántico. La inversión en estructuras contractuales robustas no es un coste sino una medida de mitigación de riesgos legales potencialmente muy superiores. Las cláusulas de consentimiento deben ser específicas, informadas y documentadas. Los datos biométricos deben tratarse con las garantías del RGPD (en Europa) y de la normativa estatal aplicable (en Estados Unidos). Y la gobernanza del uso de réplicas digitales debe integrarse en los programas de compliance corporativo, con especial atención a la trazabilidad del contenido generado, los mecanismos de control de calidad y los procedimientos de respuesta ante incidentes de uso indebido.

VI. Perspectiva: hacia un mercado regulado de identidad digital

El mercado de licencias de medios sintéticos se encuentra en un momento de cristalización. Los marcos normativos —desde el Real Decreto español de artistas hasta la NO FAKES Act estadounidense, pasando por las obligaciones de transparencia del artículo 50 del Reglamento Europeo de IA aplicables desde agosto de 2026— están convergiendo hacia un modelo en el que la identidad digital de una persona se configura como un activo patrimonial autónomo, susceptible de explotación económica pero sujeto a protecciones reforzadas que reflejan su conexión con derechos fundamentales.

Las infraestructuras técnicas de trazabilidad, como el estándar C2PA y los sistemas de watermarking que analizamos en nuestro artículo sobre el consorcio CREA Trust AI, proporcionan ya las herramientas necesarias para verificar el cumplimiento de las licencias y detectar usos no autorizados. Los acuerdos de SAG-AFTRA con plataformas como Narrativ y las licencias de IA musical de Universal con Udio demuestran que el mercado puede operar de forma ordenada cuando las reglas son claras.

Lo que queda por definir es si este nuevo mercado conseguirá equilibrar genuinamente los intereses de todas las partes —creadores, intermediarios, plataformas tecnológicas y consumidores— o si reproducirá las asimetrías de poder que han caracterizado históricamente a las industrias creativas. La respuesta dependerá, en gran medida, de la calidad del asesoramiento jurídico que reciban los artistas y de la capacidad de los profesionales del Derecho para diseñar instrumentos contractuales que protejan eficazmente los derechos de sus clientes en un entorno tecnológico que evoluciona más rápido que la regulación que intenta gobernarlo.