NYT vs. OpenAI: IA y copyright

La inteligencia artificial generativa no apareció en un vacío. Sus capacidades actuales se construyen sobre enormes volúmenes de información producida, organizada y publicada por personas, medios, editoriales, programadores, investigadores y empresas. Esa realidad, que durante años permaneció en un terreno técnico poco visible para el público general, hoy se ha convertido en una de las discusiones jurídicas y comerciales más relevantes de la economía digital.

El caso iniciado por The New York Times contra OpenAI y Microsoft concentra esa tensión. El medio sostiene que millones de sus artículos habrían sido utilizados sin autorización para entrenar modelos de lenguaje, y que esos sistemas podrían generar respuestas capaces de resumir, imitar o sustituir parte del valor informativo de sus contenidos. Esa línea argumental aparece también en el documento base revisado, que identifica como puntos centrales la copia masiva, la falta de licenciamiento previo, la posible sustitución de mercado y la tensión con la defensa de fair use o uso justo.

La discusión, sin embargo, no se agota en determinar si hubo o no infracción. Lo que está en juego es más amplio: el lugar que ocupará la propiedad intelectual en la arquitectura futura de la inteligencia artificial. Desde esta perspectiva, este caso debe leerse como una advertencia estratégica para empresas, medios, inversionistas y titulares de activos intangibles: la innovación no puede sostenerse sobre zonas grises indefinidas cuando el valor económico proviene, precisamente, de contenido protegido, curado y comercialmente explotable.

La disputa no es solo sobre copia: es sobre captura de valor

En apariencia, el conflicto gira en torno a una pregunta técnica: si una empresa de IA puede utilizar contenido protegido para entrenar sus modelos sin autorización. Pero el verdadero núcleo del caso es económico. The New York Times no solo reclama que sus obras habrían sido copiadas; sostiene que ese uso permitió construir productos capaces de competir con sus propios servicios informativos.

Esa diferencia es fundamental. En el derecho de autor, no toda utilización no autorizada produce el mismo impacto. Una cosa es emplear una obra como referencia incidental, y otra muy distinta es incorporar masivamente archivos periodísticos para entrenar un sistema comercial que luego puede ofrecer al usuario respuestas, resúmenes o reformulaciones cercanas al contenido original. La pregunta deja de ser únicamente “¿se copió?” y pasa a ser “¿quién se beneficia económicamente de esa copia?”.

En abril de 2025, un tribunal federal del Distrito Sur de Nueva York permitió que avanzaran reclamaciones relevantes dentro del caso, aunque también desestimó algunas pretensiones específicas. La decisión no resolvió el fondo del litigio, pero confirmó que la controversia merece un análisis judicial más profundo, especialmente respecto de ciertas reclamaciones de infracción directa y contributiva.

Para los medios, este avance procesal es importante porque valida la discusión sobre el valor jurídico de sus archivos. Para las empresas tecnológicas, representa una señal de riesgo: el entrenamiento de modelos de IA ya no puede analizarse solo como una operación técnica, sino como una actividad con posibles efectos patrimoniales, regulatorios y reputacionales.

El uso justo frente a la inteligencia artificial: una defensa bajo presión

OpenAI ha sostenido públicamente que el entrenamiento de IA se encuentra protegido por principios de uso justo y ha defendido una visión amplia sobre el acceso al conocimiento para desarrollar sistemas de inteligencia artificial. En su propia comunicación sobre el litigio, la compañía afirma que ha apoyado el periodismo, el uso justo y una visión abierta de la circulación del conocimiento, además de cuestionar algunas actuaciones procesales del Times durante la fase de descubrimiento.

El problema es que el uso justo no opera como una autorización automática. En el sistema estadounidense, su análisis depende de factores como el propósito del uso, la naturaleza de la obra, la cantidad utilizada y el efecto sobre el mercado potencial de la obra original. En el contexto de IA generativa, esos factores se vuelven especialmente complejos: los modelos necesitan grandes cantidades de datos, pero esa necesidad técnica no elimina por sí misma los derechos de quienes produjeron el contenido.

La pregunta más delicada es si el uso es realmente transformador. Una empresa de IA puede sostener que no reproduce un periódico, sino que crea un sistema nuevo capaz de procesar lenguaje. Pero el titular de derechos puede responder que el resultado comercial depende de haber absorbido contenidos protegidos, y que el sistema puede disminuir el tráfico, las suscripciones o las oportunidades de licenciamiento del medio.

La jurisprudencia reciente no ofrece una respuesta uniforme. En el caso Thomson Reuters vs. Ross Intelligence, un juez federal concluyó que la copia de contenido de Westlaw para construir una plataforma legal competidora no estaba amparada por el uso justo, una decisión relevante porque abordó el uso de contenido protegido en un contexto tecnológico competitivo. En cambio, en el litigio contra Anthropic, un juez consideró que el entrenamiento con libros adquiridos legalmente podía ser transformador, pero distinguió esa conclusión de la adquisición y almacenamiento de copias pirateadas, que no quedó protegido bajo el mismo razonamiento.

Estas decisiones revelan una línea de fondo: los tribunales no están resolviendo la IA como una categoría abstracta. Están analizando procedencia del contenido, finalidad comercial, efecto competitivo, licitud de la fuente y daño potencial al mercado.

El contenido periodístico como activo estratégico

Uno de los efectos más relevantes del caso NYT vs. OpenAI es que ha cambiado la conversación sobre los archivos periodísticos. Durante años, muchos contenidos digitales fueron vistos como material disponible en la web, accesible para buscadores, agregadores, plataformas y sistemas automatizados. La IA generativa obliga a revisar esa lectura.

El contenido periodístico de calidad no es una acumulación casual de datos. Implica investigación, edición, criterio, verificación, reputación y una inversión sostenida en talento humano. Aunque los hechos no se protegen como tales, la forma de seleccionarlos, narrarlos, estructurarlos y contextualizarlos sí puede contener expresión protegible. Ese matiz resulta central en el caso del Times: el litigio no solo defiende palabras, sino una cadena de valor editorial.

El mercado ya está respondiendo por vías distintas al litigio. En 2025, The New York Times alcanzó un acuerdo multianual de licenciamiento con Amazon para que ciertos contenidos del Times, The Athletic y NYT Cooking puedan utilizarse en experiencias de Amazon, incluidos resúmenes y extractos, así como para entrenamiento de modelos. La existencia de este tipo de acuerdos refuerza una idea clave: si el contenido tiene valor suficiente para ser licenciado, también tiene valor suficiente para ser protegido.

Este punto es decisivo para empresas e inversionistas. Los activos intangibles ya no se limitan a marcas, patentes o software. También incluyen bases de datos, archivos editoriales, repositorios técnicos, manuales, investigaciones, reportes, fotografías, contenidos audiovisuales y materiales formativos. En una economía donde la IA necesita datos de calidad, la gestión jurídica de esos activos se vuelve una dimensión de competitividad.

El riesgo empresarial: usar IA sin gobernanza de propiedad intelectual

Para las empresas que adoptan herramientas de IA, el caso también ofrece una advertencia práctica. No basta con preguntar qué puede hacer una herramienta; también debe preguntarse con qué fue entrenada, bajo qué condicionesprocesa información y qué riesgos se generan al introducir datos propios o de terceros.

El informe sobre inteligencia artificial de la Oficina de Derechos de Autor de Estados Unidos ha abordado, en distintas partes, temas como réplicas digitales, protección de outputs y entrenamiento de IA generativa. En mayo de 2025, esa oficina publicó una versión preliminar de la Parte 3 de su informe, dedicada al entrenamiento de IA generativa, en respuesta a consultas del Congreso y de distintos sectores interesados. Aunque estos informes no sustituyen la decisión de los tribunales, muestran que la discusión ya no pertenece únicamente al ámbito académico o tecnológico: forma parte de la agenda institucional de la propiedad intelectual.

Desde una perspectiva corporativa, esto implica que las empresas deben avanzar hacia políticas claras de gobernanza de IA. Esa gobernanza debería incluir, al menos, criterios sobre uso de herramientas externas, protección de información confidencial, revisión de términos contractuales, trazabilidad de datos, licencias sobre contenidos utilizados y control de outputs que puedan infringir derechos de terceros.

Para medios, agencias, estudios jurídicos, consultoras, universidades y empresas creativas, el desafío es doble. Por un lado, deben proteger sus propios contenidos frente a usos no autorizados. Por otro, deben evitar incorporar en sus procesos materiales generados o entrenados bajo condiciones que puedan generar exposición legal.

Puntos finales

El futuro de la inteligencia artificial no se resolverá únicamente en laboratorios, servidores o interfaces conversacionales. También se definirá en contratos, licencias, tribunales, políticas internas y estrategias de propiedad intelectual.

El caso The New York Times vs. OpenAI marca un punto de inflexión porque obliga a reconocer que el contenido tiene una vida económica más allá de su publicación inicial. Un artículo, una base de datos, una investigación o un archivo editorial pueden convertirse en insumos de sistemas capaces de generar nuevos productos, capturar audiencias y alterar modelos de negocio completos.

La pregunta relevante para empresas y titulares de derechos ya no es si la IA cambiará el mercado. Eso ya está ocurriendo. La pregunta es si cada organización está preparada para identificar, proteger y negociar el valor de sus activos intangibles antes de que otros lo hagan por ella.

Bibliografía

The New York Times Company. (2023). Complaint: The New York Times Company v. Microsoft Corporation, OpenAI, Inc., et al. United States District Court, Southern District of New York.

United States District Court, Southern District of New York. (2025). Opinion and order on defendants’ motions to dismiss in The New York Times Company v. Microsoft Corporation, OpenAI, Inc., et al.

U.S. Copyright Office. (2025). Copyright and Artificial Intelligence, Part 3: Generative AI Training — Pre-publication Version. United States Copyright Office.

U.S. Copyright Office. (2025). Copyright and Artificial Intelligence: Reports and policy materials. United States Copyright Office.

Reuters. (2025). New York Times partners with Amazon for first AI licensing deal. Reuters.

Reuters. (2025). Thomson Reuters wins AI copyright “fair use” ruling against one-time competitor. Reuters.

Bartz v. Anthropic. (2025). Order on summary judgment regarding fair use and AI training. United States District Court, Northern District of California.

Authors Guild. (2025). Mixed decision in Anthropic AI case. The Authors Guild.

The Guardian. (2025). Anthropic did not breach copyright when training AI on books without permission, court rules. The Guardian.

Debevoise & Plimpton. (2025). Anthropic and Meta decisions on fair use. Debevoise & Plimpton Insights.

Servicios

Regresar

Servicios:

NYT vs. OpenAI: la disputa que puede redefinir la relación entre contenido, tecnología y propiedad intelectual