3.000 dólares por libro: la empresa de inteligencia artificial Anthropic paga 1.500 millones de dólares a autores en una disputa por derechos de autor

Konrad Wolfenstein

Hace 9 meses

3.000 dólares por libro: la empresa de inteligencia artificial Anthropic paga 1.500 millones de dólares a autores en una disputa por derechos de autor – Imagen: Xpert.Digital

Anthropic y el acuerdo de mil millones de dólares: un cambio de paradigma en la legislación sobre derechos de autor de la IA

¿Qué significa el caso Anthropic para la industria de la IA?

¿Por qué la empresa de inteligencia artificial Anthropic acordó un acuerdo de 1.500 millones de dólares con los autores, a pesar de que entrenar modelos de IA con obras protegidas por derechos de autor podría ser legal? Esta pregunta preocupa actualmente a toda la industria tecnológica, ya que el caso podría marcar un punto de inflexión en el conflicto entre los desarrolladores de IA y los titulares de los derechos de autor.

El caso es particularmente notable porque Anthropic, proveedor del chatbot Claude, no fue demandado por usar libros protegidos por derechos de autor para entrenar a su IA, sino por la forma en que se obtuvieron estos datos. El tribunal estadounidense determinó que, si bien entrenar una IA con textos protegidos por derechos de autor podría, en ciertas circunstancias, estar amparado por la doctrina estadounidense de uso legítimo, la descarga de contenido de fuentes ilegales no lo estaba. Fundamentalmente, Anthropic era consciente, demostrablemente, del origen ilegal de los datos.

Relacionado con esto:

Antrópico y la IA Claude: El ascenso al gigante de la IA: evaluación, competencia y visiones éticas

¿Cómo surgió este acuerdo histórico?

¿Cuáles fueron las acusaciones específicas contra Anthropic? Los autores acusaron a la empresa de descargar aproximadamente 500.000 libros y textos sin permiso de dos bases de datos en línea que infringían derechos de autor. Estos datos se utilizaron posteriormente para entrenar al chatbot de IA Claude, considerado uno de los principales competidores de ChatGPT de OpenAI.

El acuerdo estipula que Anthropic pagará aproximadamente 3.000 dólares en compensación por cada obra afectada, lo que equivale aproximadamente a 2.500 euros. Esta suma es cuatro veces la indemnización mínima legal por daños y perjuicios establecida por la ley estadounidense de derechos de autor. Además, Anthropic debe destruir los documentos pirateados y todas las copias, pero conserva los derechos sobre los libros adquiridos y escaneados legalmente.

¿Por qué Anthropic aceptó este acuerdo? La empresa quería evitar una demanda que podría haber resultado en multas de hasta 150.000 dólares por libro. Con 500.000 obras afectadas, esto habría supuesto un pago potencial de hasta 75.000 millones de dólares, una suma exorbitante incluso para una empresa que recientemente había recaudado 13.000 millones de dólares.

¿Cuáles son las diferencias entre la situación jurídica en EE.UU. y en Alemania?

¿Cómo se juzgaría un caso similar en Alemania? A diferencia del derecho estadounidense, la legislación alemana sobre derechos de autor no reconoce una doctrina de uso legítimo que permita una evaluación flexible caso por caso. En cambio, existen limitaciones y excepciones específicas definidas con precisión para fines particulares, lo que restringe los derechos de los titulares de derechos de autor.

Con la implementación de la Directiva de la UE sobre Derechos de Autor, Alemania creó el artículo 44b de la Ley de Derechos de Autor, que regula la minería de textos y datos (TDM). Esta disposición permite el análisis automatizado de grandes conjuntos de datos, ya sean texto o imágenes, para extraer información. El entrenamiento de la IA generalmente se rige por esta regulación.

¿Qué restricciones se aplican a los proveedores comerciales? La licencia TDM tiene una desventaja crucial: los titulares de derechos de autor pueden oponerse al uso de sus obras para TDM comercial. Esta reserva de uso debe constar en formato legible por máquina, por ejemplo, en los metadatos o en las condiciones de servicio de un sitio web.

La Directiva DSM de la UE distingue entre dos tipos de minería de textos y datos: el artículo 3 permite la minería de textos y datos con fines de investigación científica por parte de instituciones de investigación e instituciones de patrimonio cultural, siempre que tengan acceso legítimo a las obras. Esta excepción es obligatoria y no puede excluirse mediante cláusulas contractuales. El artículo 4, por otro lado, permite la minería de textos y datos en general para cualquier fin, incluidos los comerciales, pero con la importante restricción de un procedimiento de exclusión voluntaria.

¿Qué aspectos técnicos influyen en la evaluación jurídica?

¿Por qué es tan importante el funcionamiento técnico del entrenamiento de IA para la evaluación legal? Un estudio reciente de la Iniciativa de Derechos de Autor, realizado por el profesor Tim W. Dornis y el profesor Sebastian Stober, arroja luz sobre la caja negra del entrenamiento de IA. Los investigadores concluyen que, técnicamente hablando, el entrenamiento de modelos generativos de IA no es una minería de textos y datos clásica, sino más bien una forma de infracción de derechos de autor.

¿Qué sucede técnicamente al entrenar modelos de IA? El proceso consta de varios pasos relacionados con los derechos de autor: primero, se recopilan sistemáticamente los datos, lo que ya constituye una reproducción según la ley de derechos de autor. Luego, los datos recopilados se almacenan en servidores y se preparan para el entrenamiento. Finalmente, el modelo de IA analiza los datos y extrae patrones, estilos e información.

Un punto particularmente crítico es la denominada memorización: los datos de entrenamiento son memorizados parcial o totalmente por los modelos generativos actuales y, por lo tanto, pueden ser regenerados y replicados por los usuarios finales con las indicaciones adecuadas. Esto va mucho más allá del mero análisis, que es el enfoque de la minería de textos y datos clásica.

¿Cómo se posiciona Claude en la competencia con ChatGPT?

¿Qué impacto tiene la disputa de derechos de autor en la posición de mercado de Anthropic? A pesar de los problemas legales, Claude se ha consolidado como un serio competidor de ChatGPT. Según análisis de mercado actuales, Anthropic posee actualmente el 32 % de la cuota de mercado de Modelos de Lenguaje de Gran Tamaño (LLM) en empresas, mientras que OpenAI ocupa el segundo lugar con el 25 %.

La posición de Anthropic es particularmente sólida en el campo de la programación: con una cuota de mercado del 42 %, la empresa es, con diferencia, el mayor proveedor, más del doble de fuerte que OpenAI, con un 21 %. Claude debe este dominio principalmente a su impresionante ventana de contexto de 200 000 tokens, que permite procesar informes empresariales completos en una sola pasada.

¿Cuáles son las fortalezas específicas de Claude en comparación con ChatGPT? Claude es frecuentemente elogiado por su estilo de comunicación más humano y su comprensión matizada de conceptos complejos. El enfoque de Anthropic en el desarrollo ético de la IA y la seguridad lo ha consolidado como un proveedor de confianza para empresas que priorizan las prácticas responsables en aplicaciones sensibles.

Anthropic se basa en la IA Constitucional, un método que integra directrices éticas directamente en los modelos. Esto ayuda a prevenir gastos perjudiciales o sesgados y genera un alto nivel de confianza en los usuarios. Si bien OpenAI también participa activamente en la seguridad de la IA, el compromiso explícito de Anthropic con el desarrollo de modelos de IA éticamente sólidos le otorga una ventaja significativa.

¿Qué otras demandas están afectando a la industria de la IA?

¿Es el caso de Anthropic solo la punta del iceberg? De hecho, hay más de 40 demandas pendientes en EE. UU. contra proveedores de tecnología de IA por infracción de derechos de autor. OpenAI, por ejemplo, fue demandada por el New York Times, y tras este acuerdo se están tramitando más demandas contra Anthropic, incluidas las de editoriales musicales y la plataforma en línea Reddit.

Apple también se ha convertido recientemente en blanco de demandas por derechos de autor: autores han demandado a la empresa tecnológica, alegando que utilizó ilegalmente sus libros protegidos por derechos de autor para entrenar sus sistemas de inteligencia artificial. Los demandantes acusan a Apple de copiar las obras protegidas sin permiso, atribución ni compensación.

En Alemania, GEMA se convirtió en la primera entidad de gestión colectiva a nivel mundial en demandar a OpenAI por el uso sin licencia de obras musicales protegidas por derechos de autor. GEMA acusa a OpenAI de reproducir letras de canciones protegidas por derechos de autor de autores alemanes sin haber obtenido licencias ni compensado a los autores.

¿Cómo está evolucionando la cuestión del opt-out?

¿Qué implica el procedimiento de exclusión voluntaria en la práctica para los titulares de derechos? Según la legislación alemana, los autores y titulares de derechos pueden declarar una reserva de uso legible por máquina para excluir sus obras del uso de TDM. Sony Music Group, por ejemplo, ha publicado una "Declaración de Exclusión Voluntaria del Entrenamiento de IA" para proteger su contenido del uso no autorizado de IA.

Sin embargo, la implementación práctica del mecanismo de exclusión voluntaria es compleja: aún no se ha aclarado definitivamente cómo debe declararse dicha reserva de forma técnica y legalmente efectiva, ni cómo deben gestionarla los desarrolladores de IA. Existe la preocupación de que un mecanismo de exclusión voluntaria ampliamente utilizado pueda restringir significativamente los datos de entrenamiento de los modelos de IA en Europa.

Las empresas de IA deben respetar estas restricciones de uso y no pueden eludirlas. Para incluir una obra en el corpus de datos de entrenamiento a pesar de estas restricciones, el desarrollador debe negociar la licencia con el titular de los derechos. Esto da lugar a un nuevo mercado de licencias, que, sin embargo, aún no está consolidado.

Una nueva dimensión de la transformación digital con 'IA Gestionada' (Inteligencia Artificial) - Plataforma y solución B2B | Xpert Consulting

Una nueva dimensión de la transformación digital con 'IA Gestionada' (Inteligencia Artificial) – Plataforma y solución B2B | Xpert Consulting - Imagen: Xpert.Digital

Aquí aprenderá cómo su empresa puede implementar soluciones de IA personalizadas de forma rápida, segura y sin grandes barreras de entrada.

Una plataforma de IA gestionada es su solución integral y sin preocupaciones para la inteligencia artificial. En lugar de lidiar con tecnología compleja, infraestructura costosa y largos procesos de desarrollo, recibirá una solución lista para usar y adaptada a sus necesidades de un socio especializado, a menudo en tan solo unos días.

Las principales ventajas de un vistazo:

⚡ Implementación rápida: De la idea a la aplicación lista para usar en días, no meses. Ofrecemos soluciones prácticas que generan valor añadido inmediato.

🔒 Máxima seguridad de datos: Tus datos confidenciales permanecen contigo. Garantizamos un procesamiento seguro y conforme a la normativa sin compartirlos con terceros.

💸 Sin riesgo financiero: Solo pagas por resultados. Se eliminan por completo las altas inversiones iniciales en hardware, software y personal.

🎯 Concéntrese en su negocio principal: Concéntrese en lo que mejor sabe hacer. Nos encargamos de toda la implementación técnica, la operación y el mantenimiento de su solución de IA.

📈 A prueba de futuro y escalable: Tu IA crece contigo. Garantizamos la optimización y la escalabilidad continuas, y adaptamos los modelos con flexibilidad a las nuevas necesidades.

Más información aquí:

La solución de IA gestionada - Servicios de IA industrial: la clave para la competitividad en los sectores de servicios, industria e ingeniería mecánica

Mercado de licencias para datos de IA: ¿Oportunidad para los editores o riesgo para las empresas emergentes?

¿Qué papel desempeña la regulación de la IA de la UE?

¿Cómo afecta el nuevo Reglamento de IA de la UE a los derechos de autor? Si bien el Reglamento de IA no contiene nuevas disposiciones sobre excepciones a los derechos de autor, aclara que el uso de contenido protegido por derechos de autor requiere la autorización del titular de los derechos, salvo que se aplique una limitación.

Todos los proveedores de modelos de IA de propósito general deben cumplir con requisitos de documentación exhaustivos. Esto incluye una descripción detallada de los datos utilizados para el entrenamiento, incluyendo el tipo y el origen de los datos, así como los métodos de procesamiento. En particular, deben garantizar la identificación y el cumplimiento de las reservas legales previstas en la Directiva DSM.

La Oficina de Inteligencia Artificial supervisa el cumplimiento de estas disposiciones, pero no examina las infracciones de derechos de autor obra por obra. Al referirse a la Directiva DSM, el Reglamento de IA aclara que el legislador asume la aplicabilidad de la excepción de minería de textos y datos al entrenamiento de modelos de IA generativos.

Relacionado con esto:

Claude Gov, antrópico: Un emocionante desarrollo de IA para la seguridad nacional de EE. UU

¿En qué se diferencian los usos científicos y comerciales?

¿Qué normativas especiales se aplican a la investigación científica? En una sentencia histórica, el Tribunal Regional de Hamburgo dictaminó que las organizaciones de investigación pueden, bajo ciertas condiciones, utilizar obras protegidas por derechos de autor para entrenar inteligencia artificial. El caso se refería al uso de una imagen protegida por derechos de autor por parte de una organización de investigación que había creado un amplio conjunto de datos de imagen y texto para entrenar modelos generativos de IA.

El tribunal dictaminó que la creación de un conjunto de datos de entrenamiento de IA puede ampararse en la libertad de investigación, incluso si las empresas comerciales utilizan posteriormente los datos obtenidos de esta manera. El factor crucial es que la creación inicial del conjunto de datos tenga como objetivo la adquisición de conocimiento. El concepto de investigación científica se interpreta de forma amplia en este contexto.

El artículo 60d de la Ley de Derechos de Autor (UrhG) permite la extracción de textos y datos científicos por parte de instituciones de investigación, como universidades, para fines de investigación científica no comercial. Para ello, no se requiere el consentimiento de los titulares de los derechos de autor. Esto contrasta con el uso comercial, donde se aplica un procedimiento de exclusión voluntaria.

¿Qué diferencias internacionales existen?

¿Cómo abordan otros países la cuestión de los derechos de autor de la IA? Japón se considera especialmente favorable a la innovación y ya modificó su ley de derechos de autor en 2018. El artículo 30-4 de la Ley de Derechos de Autor japonesa introduce una excepción flexible para los usos que no contribuyen al disfrute de la obra. Esto suele interpretarse como que también puede incluir el entrenamiento de modelos de IA, siempre que el objetivo sea el análisis de datos y no el consumo de la obra en sí.

El Reino Unido ha seguido su propio camino desde el Brexit. Se celebraron consultas sobre las exenciones de derechos de autor para los desarrolladores de IA, en particular para la gestión de la demanda (TDM). Sin embargo, las propuestas suscitaron importantes inquietudes en las industrias creativas, lo que dejó incierto el futuro.

China modificó su ley de derechos de autor en 2020 y, en general, está reforzando la protección de la propiedad intelectual. Si bien aún se están desarrollando regulaciones específicas para el entrenamiento de IA, el país reconoce la importancia estratégica de la IA y se espera que busque soluciones pragmáticas.

¿Qué significa este caso para otras empresas de IA?

¿Qué lecciones pueden aprender otras empresas de IA del caso Anthropic? La comparación muestra que el origen de los datos de entrenamiento es crucial. Si bien el entrenamiento con datos adquiridos legalmente puede estar amparado por las limitaciones de uso legítimo o TDM, el uso de datos obtenidos ilegalmente puede conllevar multas cuantiosas.

Las empresas de IA han firmado cada vez más acuerdos de licencia con titulares de derechos de autor para acceder a contenido. OpenAI, por ejemplo, ha cerrado acuerdos con diversas empresas de medios de comunicación, y otros proveedores están siguiendo su ejemplo. El ensayo de Anthropic podría acelerar esta tendencia y consolidar el mercado de licencias.

Para los proveedores de modelos y sistemas de IA, es crucial utilizar proveedores confiables para generar datos de entrenamiento, ya que estos respetan la propiedad intelectual de terceros al crear los datos. Incluso sin conocimiento de la infracción de derechos de autor, pueden surgir consecuencias legales.

¿Cómo evolucionará el mercado de datos de entrenamiento de IA?

¿Está surgiendo un nuevo mercado de licencias para datos de entrenamiento de IA? El caso Anthropic y demandas similares sugieren que podría estar desarrollándose un mercado estructurado para licenciar contenido para entrenamiento de IA. Editores, autores y otros titulares de derechos reconocen cada vez más el valor de su contenido para el desarrollo de la IA.

Al mismo tiempo, las empresas de IA se enfrentan al reto de adquirir datos de entrenamiento de alta calidad y que cumplan con la normativa. Los costes de estas licencias pueden ser considerables, especialmente para empresas pequeñas que carecen de los recursos de Anthropic u OpenAI.

El desarrollo de proveedores de datos especializados que crean y licencian conjuntos de datos de entrenamiento que cumplen con la legislación es una consecuencia lógica de esta tendencia. Estos proveedores podrían actuar como intermediarios entre los titulares de derechos y los desarrolladores de IA, garantizando el cumplimiento de todos los requisitos legales.

¿Qué impacto tendrá esto en la innovación y la competencia?

¿Frena el marco legal más estricto la innovación en el desarrollo de la IA? Esta pregunta es objeto de amplio debate. Quienes defienden normas estrictas sobre derechos de autor argumentan que los creadores y titulares de derechos deberían recibir una compensación adecuada por el uso de sus obras. Sin embargo, la gran cantidad de datos de entrenamiento necesarios y los costes de licencia asociados podrían conducir a una concentración del mercado en manos de unos pocos grandes proveedores.

Las empresas más pequeñas y las startups podrían no poder costear las licencias necesarias, lo que limitaría su capacidad para desarrollar modelos de IA competitivos. Paradójicamente, esto podría conducir a una menor innovación y competencia, ya que solo empresas bien financiadas como Anthropic, OpenAI o Google pueden obtener los recursos necesarios.

Por otro lado, la necesidad de pagar licencias podría dar lugar a métodos de entrenamiento más eficientes. Los desarrolladores de IA podrían invertir más en técnicas que requieran menos datos o utilizar datos sintéticos para reducir su dependencia del contenido con licencia.

¿Cómo se posicionan los titulares de derechos y los profesionales creativos?

¿Qué estrategias están siguiendo los autores, editores y otros titulares de derechos? La Iniciativa de Derechos de Autor y organizaciones similares exigen una mayor consideración de los derechos de autor en el entrenamiento de IA. Argumentan que constituye un robo de propiedad intelectual a gran escala cuando las empresas de IA utilizan obras protegidas por derechos de autor sin consentimiento ni compensación.

Muchos titulares de derechos de autor recurren cada vez más a mecanismos de exclusión voluntaria para proteger sus obras del uso no deseado de la IA. Al mismo tiempo, exploran maneras de beneficiarse del desarrollo de la IA mediante acuerdos de licencia. Esto genera una compleja combinación de disputas legales y oportunidades de negocio.

La demanda de GEMA contra OpenAI demuestra que las sociedades de gestión colectiva también desempeñan un papel activo en esta disputa. Como colectivos, podrían representar los intereses de sus miembros y negociar licencias con empresas de IA.

¿Cuáles son las perspectivas a largo plazo?

¿Cómo podría evolucionar el panorama legal en los próximos años? El caso Anthropic podría ser solo el comienzo de una oleada de acuerdos y sentencias judiciales que redefinan las normas para el entrenamiento de IA. En EE. UU., nuevos casos podrían aclarar la doctrina del uso legítimo en relación con la IA, mientras que en Europa se sigue perfeccionando la aplicación práctica de las limitaciones del TDM.

El Reglamento de IA de la UE probablemente aportará más claridad sobre los requisitos de documentación y el cumplimiento de los derechos de autor. Esto podría dar lugar a una armonización de las prácticas dentro de la UE, pero también a diferencias con respecto a otras jurisdicciones.

El desarrollo tecnológico será un factor clave: si en el futuro los modelos de IA pueden entrenarse eficazmente con menos datos o con datos sintéticos, se podrían mitigar los problemas de derechos de autor. Al mismo tiempo, se podrían desarrollar nuevas técnicas para detectar y compensar el uso de contenido protegido por derechos de autor.

El caso Anthropic marca un punto de inflexión significativo en el desarrollo de la industria de la IA. Demuestra que el marco legal para el entrenamiento de modelos de IA aún no está completamente claro y que tanto las empresas de IA como los titulares de derechos deben encontrar nuevas maneras de conciliar sus intereses. El acuerdo de 1.500 millones de dólares podría marcar el comienzo de una nueva era en la que el uso de contenido protegido por derechos de autor para el entrenamiento de IA se realice de forma más justa y transparente.

Seguridad de datos UE/DE | Integración de una plataforma de IA independiente y de múltiples fuentes de datos para todas las necesidades empresariales

Plataformas de IA independientes como alternativa estratégica para las empresas europeas - Imagen: Xpert.Digital

AI Game Changer: La plataforma de IA más flexible: soluciones a medida que reducen costes, mejoran sus decisiones y aumentan la eficiencia

Plataforma de IA independiente: integra todas las fuentes de datos relevantes de la empresa

Integración rápida de IA: soluciones de IA personalizadas para empresas en horas o días, en lugar de meses
Infraestructura flexible: basada en la nube o alojada en su propio centro de datos (Alemania, Europa, libre elección de ubicación)

Máxima seguridad de los datos: su uso en despachos de abogados es una prueba irrefutable
Implementación en una amplia variedad de fuentes de datos empresariales
Elección de modelos de IA propios o diferentes (DE, UE, EE. UU., CN)

Más información aquí:

Plataformas de IA independientes vs. hiperescaladores: ¿cuál es la solución más adecuada?

Estamos aquí para usted - Consultoría - Planificación - Implementación - Gestión de proyectos

☑️ Apoyo a las PYMES en estrategia, consultoría, planificación e implementación

☑️ Creación o realineamiento de la estrategia de IA

☑️ Desarrollo de negocios pioneros

Konrad Wolfenstein

Estaré encantado de servir como su asesor personal.

Puedes contactarme rellenando el formulario de contacto que aparece a continuación o simplemente llamándome al +49 7348 4088 965 .

Espero con ilusión nuestro proyecto conjunto.

Escríbeme

➡️ Solicitud de videollamada 👩👱

Xpert.Digital - Konrad Wolfenstein

Xpert.Digital es un centro industrial centrado en la digitalización, la ingeniería mecánica, la logística/intralogística y la energía fotovoltaica.

Con nuestra solución de Desarrollo de Negocio 360° apoyamos a empresas de renombre desde el nuevo negocio hasta la posventa.

Inteligencia de mercado, smarketing, automatización de marketing, desarrollo de contenidos, PR, campañas de mailing, redes sociales personalizadas y lead nurturing son parte de nuestras herramientas digitales.

Puede encontrar más información en: www.xpert.digital - www.xpert.solar - www.xpert.plus

Mantenerse en contacto