La irrupción de la inteligencia artificial generativa ha trastocado las bases tradicionales del derecho de autor. Modelos como ChatGPT, Midjourney o Copilot aprenden a crear a partir de millones de obras humanas, muchas de ellas protegidas por derechos de autor. En este escenario, la noción de fair use o uso legítimo se presenta como un escudo legal polémico: ¿puede una empresa escudarse en el uso justo para alimentar una IA que no solo aprende de creaciones humanas, sino que además compite con ellas?
Este artículo examina el impacto del uso de obras protegidas en el entrenamiento de sistemas de IA, los conflictos legales y éticos emergentes, y cómo la doctrina del fair use, nacida para equilibrar derechos y libertades creativas, enfrenta uno de sus mayores desafíos históricos. La creatividad automatizada pone a prueba los límites jurídicos establecidos, generando nuevas preguntas sobre autoría, consentimiento, transparencia y el futuro mismo de la protección intelectual.
Uno de los principales puntos de fricción radica en el modo en que los modelos de IA han sido entrenados. Empresas tecnológicas han reconocido que sus algoritmos necesitan grandes volúmenes de datos para aprender, y buena parte de estos datos provienen de obras protegidas por derechos de autor, obtenidas sin permiso de sus creadores.
La falta de consentimiento explícito es uno de los principales argumentos de los titulares de derechos. Libros, artículos, ilustraciones y fotografías se recopilaron mediante scraping desde la web, a menudo sin el conocimiento ni autorización de sus autores. Esta práctica, aunque frecuente, socava los principios básicos de respeto al derecho exclusivo de reproducción.
Además, las compañías de IA han sido poco transparentes sobre qué obras específicas se utilizaron. Esta opacidad impide a los creadores verificar si sus trabajos formaron parte del corpus de entrenamiento. Como se evidenció en el caso The New York Times v. OpenAI, la imposibilidad de rastrear el uso concreto de los artículos periodísticos complica cualquier reclamo legal individual, fortaleciendo el argumento de los desarrolladores de IA pero debilitando los derechos de los autores.
El uso del fair use como defensa se ha convertido en una estrategia común. Sin embargo, esta doctrina exige un análisis caso por caso, considerando si la obra fue transformada, si el uso fue comercial o educativo, cuánto se usó, y si afecta al mercado original. Aplicar estos criterios a sistemas de IA resulta complejo, pues no hay claridad sobre cómo transformar millones de obras se traduce en un uso justo.
La ley de derechos de autor de EE.UU., en su Sección 107, establece cuatro factores para determinar si un uso constituye fair use. Su aplicación al entrenamiento de IA ha generado un intenso debate jurídico.
Otro punto crítico es la autoría de las obras generadas por IA. ¿Puede una creación sin intervención humana significativa ser objeto de protección por derechos de autor? La respuesta, en la mayoría de jurisdicciones, es negativa.
Tanto en EE.UU. como en España, Reino Unido o Colombia, se ha establecido que para que una obra sea protegible, debe haber creatividad humana. La Oficina de Derechos de Autor de EE.UU. ha reiterado que los resultados generados por IA solo pueden ser registrados si existe una intervención humana suficiente y demostrable.
Esto ha generado un nuevo debate: ¿cuánto control o intervención humana es suficiente? Un simple prompt (“escribe un poema sobre el mar”) no basta. Pero si el usuario selecciona, edita, combina y estructura los resultados con intención creativa, podría alcanzarse el umbral de originalidad.
Casos como Zarya of the Dawn (inicialmente registrado, pero luego anulado al saberse que las imágenes fueron generadas por Midjourney) y Edmond de Belamy (una obra de arte vendida por Christie's que no obtuvo protección legal) muestran que el criterio de autoría humana sigue siendo el estándar.
El panorama legal global es heterogéneo. Mientras EE.UU. mantiene la doctrina del fair use, en Europa se estudian mecanismos específicos para regular el uso de obras en entrenamiento de IA. La Directiva de Derechos de Autor en el Mercado Único Digital ya introduce excepciones para minería de datos, aunque con condiciones claras de respeto a los derechos de los autores.
En el Reino Unido, el debate sobre si permitir entrenamiento de IA sin consentimiento generó rechazo por parte de asociaciones de creadores, logrando frenar una propuesta de ley. Colombia, por su parte, ha negado el registro de obras generadas exclusivamente por IA, reforzando el criterio de autoría humana.
Las empresas tecnológicas también han comenzado a adaptarse. Algunas, como IBM, afirman no utilizar datos protegidos sin permiso. Otras, como OpenAI, han entablado negociaciones con medios y editoriales para obtener licencias. El camino hacia un modelo de IA ético y legalmente sostenible parece implicar acuerdos comerciales, transparencia y herramientas de monitoreo para los creadores.
El desarrollo de la inteligencia artificial generativa ha sacudido los cimientos del derecho de autor. La doctrina del fair use, diseñada para garantizar un equilibrio entre acceso y protección, enfrenta su prueba más compleja en un entorno donde las máquinas absorben, reinterpretan y replican sin restricciones claras.
Los casos judiciales recientes revelan una tendencia hacia el escepticismo frente a la aplicación del fair use al entrenamiento masivo con obras protegidas. Al mismo tiempo, la falta de una autoría humana significativa impide proteger muchas creaciones generadas por IA, dejando una zona gris jurídica sin precedentes.
Los próximos años exigirán reformas legales, marcos internacionales coherentes y acuerdos entre industria y titulares de derechos. La innovación tecnológica no puede ni debe avanzar sin respeto por la creatividad humana. Encontrar ese equilibrio no solo es un desafío legal, sino una necesidad cultural y ética para el futuro de la expresión artística.
Electronic Frontier Foundation. (2023). AI and Copyright. Recuperado de https://www.eff.org/issues/ai-and-copyright
European Parliament. (2024). Artificial Intelligence Act (EU AI Act). Recuperado de https://artificialintelligenceact.eu/
Harvard Law Review. (2023). Fair Use and Artificial Intelligence. Harvard Law Review, 136(4). Recuperado de https://harvardlawreview.org
New York Times. (2023). The New York Times sues OpenAI and Microsoft over use of copyrighted work. Recuperado de https://www.nytimes.com/2023/12/27/business/media/new-york-times-openai-lawsuit.html
Stanford University. (2023). Copyright and AI: Understanding Fair Use in the Age of Generative Models. Recuperado de https://law.stanford.edu
U.S. Copyright Office. (2023). Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence. Recuperado de https://www.copyright.gov/ai/
U.S. Copyright Office. (2023). Artificial Intelligence and Copyright – Policy Statement. Recuperado de https://www.copyright.gov/policy/artificial-intelligence/
UK Intellectual Property Office. (2023). Artificial Intelligence and Intellectual Property: A report on AI-generated works. Recuperado de https://www.gov.uk/government/publications/artificial-intelligence-and-ip
United States District Court for the District of Delaware. (2021). Thomson Reuters Enterprise Centre GmbH v. ROSS Intelligence Inc., No. 1:20-cv-00613. Recuperado de https://casetext.com/case/thomson-reuters-enterprise-centre-gmbh-v-ross-intelligence-inc
United States District Court for the Northern District of California. (2024). Andersen v. Stability AI, No. 3:23-cv-00201.
United States District Court for the Northern District of California. (2024). Concord Music Group v. Anthropic, No. 3:23-cv-05583.