
3.000 dólares por libro: la empresa de inteligencia artificial Anthropic paga 1.500 millones de dólares a autores en una disputa por derechos de autor – Imagen: Xpert.Digital
Anthropic y el acuerdo de mil millones de dólares: un cambio de paradigma en la IA
¿Qué significa el caso Anthropic para la industria de la IA?
¿Por qué la empresa de inteligencia artificial Anthropic aceptó pagar 1.500 millones de dólares a los autores, a pesar de que entrenar modelos de IA con obras protegidas por derechos de autor podría ser legal? Esta pregunta preocupa actualmente a toda la industria tecnológica, ya que el caso podría marcar un punto de inflexión en el conflicto entre los desarrolladores de IA y los titulares de los derechos.
El caso es particularmente notable porque Anthropic, proveedor del chatbot Claude, no fue demandado por usar libros protegidos por derechos de autor para entrenar a su IA, sino por la forma en que obtuvo estos datos. El tribunal estadounidense determinó que, si bien entrenar una IA con textos protegidos por derechos de autor podía, en ciertas circunstancias, estar amparado por el principio estadounidense de uso legítimo, descargar el contenido de fuentes ilegales no lo estaba. El punto crucial fue que Anthropic demostró conocer el origen ilegal de los datos.
Adecuado para:
¿Cómo surgió este acuerdo histórico?
¿Cuáles fueron las acusaciones específicas contra Anthropic? Los autores acusaron a la empresa de descargar sin permiso alrededor de 500.000 libros y textos de dos bases de datos en línea que infringían derechos de autor. Estos datos se utilizaron para entrenar al chatbot de IA Claude, considerado uno de los principales competidores de ChatGPT de OpenAI.
El acuerdo estipula que Anthropic pagará aproximadamente 3.000 dólares en compensación por cada obra afectada (aproximadamente 2.500 euros). Esta cantidad es cuatro veces la indemnización mínima legal por daños y perjuicios establecida por la ley estadounidense de derechos de autor. Además, Anthropic debe destruir los documentos pirateados y todas las copias, pero conserva los derechos sobre los libros adquiridos y escaneados legalmente.
¿Por qué Anthropic aceptó este acuerdo? La empresa quería evitar una demanda que podría haber resultado en multas de hasta 150.000 dólares por libro. Con 500.000 libros afectados, esto habría resultado en un posible pago de hasta 75.000 millones de dólares, una suma potencialmente mortal incluso para una empresa que recientemente recaudó 13.000 millones de dólares.
¿Cuál es la diferencia entre la situación jurídica en EE.UU. y Alemania?
¿Cómo se evaluaría un caso similar en Alemania? A diferencia del derecho estadounidense, la legislación alemana sobre derechos de autor no cuenta con una doctrina de uso legítimo que permita una evaluación flexible caso por caso. En cambio, se definen claramente limitaciones específicas para fines específicos que restringen los derechos de los autores.
Con la implementación de la Directiva de la UE sobre Derechos de Autor, Alemania creó el artículo 44b de la Ley de Derechos de Autor (UrhG), que regula la minería de textos y datos (TDM). Esta disposición permite el análisis automatizado de grandes cantidades de datos, ya sean textos o imágenes, para extraer información de ellos. El entrenamiento de una IA generalmente se rige por esta regulación.
Pero ¿qué restricciones se aplican a los proveedores comerciales? El permiso TDM tiene una condición crucial: los titulares de derechos pueden oponerse al uso de sus obras para TDM comercial. Esta reserva de uso debe constar en un formato legible por máquina, por ejemplo, en los metadatos o en las condiciones de uso de un sitio web.
La Directiva DSM de la UE distingue entre dos tipos de minería de textos y datos: el artículo 3 permite la minería de textos y datos con fines de investigación científica por parte de instituciones de investigación e instituciones de patrimonio cultural, siempre que tengan acceso legítimo a las obras. Esta excepción es obligatoria y no puede excluirse mediante cláusulas contractuales. El artículo 4, por otro lado, permite la minería de textos y datos en general para cualquier fin, incluidos los comerciales, pero con la importante restricción del procedimiento de exclusión voluntaria.
¿Qué aspectos técnicos juegan un papel en la evaluación jurídica?
¿Por qué es tan importante el funcionamiento técnico del entrenamiento de IA para la evaluación legal? Un estudio reciente de la Iniciativa de Derechos de Autor, realizado por los profesores Tim W. Dornis y Sebastian Stober, arroja luz sobre la caja negra del entrenamiento de IA. Los investigadores concluyen que, técnicamente hablando, el entrenamiento de modelos generativos de IA no es una minería de textos y datos clásica, sino una forma de infracción de derechos de autor.
¿Qué sucede técnicamente durante el entrenamiento de los modelos de IA? El proceso consta de varios pasos sujetos a la legislación sobre derechos de autor: Primero, se recopilan los datos sistemáticamente, lo que ya constituye una duplicación según la legislación sobre derechos de autor. Luego, los datos recopilados se almacenan en servidores y se preparan para el entrenamiento. Finalmente, el modelo de IA analiza los datos y extrae patrones, estilos e información.
Un punto particularmente crítico es la denominada memorización: los datos de entrenamiento se memorizan total o parcialmente mediante los modelos generativos actuales y, por lo tanto, pueden regenerarse y replicarse con las indicaciones adecuadas de los usuarios finales. Esto va mucho más allá del análisis puro, que es el enfoque de la minería de textos y datos tradicional.
¿Cómo se posiciona Claude en la competencia con ChatGPT?
¿Qué impacto tiene la disputa de derechos de autor en la posición de mercado de Anthropic? A pesar de los problemas legales, Claude se ha consolidado como un serio competidor de ChatGPT. Según análisis de mercado actuales, Anthropic posee actualmente el 32 % de la cuota de mercado de modelos lingüísticos de gran tamaño para empresas, mientras que OpenAI ocupa el segundo lugar con el 25 %.
La posición de Anthropic es particularmente sólida en el sector de la programación: con una cuota de mercado del 42 %, la empresa es, con diferencia, el mayor proveedor en este sector, más del doble del 21 % de OpenAI. Claude debe este dominio principalmente a su impresionante ventana de contexto de 200 000 tokens, que permite procesar informes empresariales completos en una sola pasada.
¿Cuáles son las fortalezas específicas de Claude en comparación con ChatGPT? Claude suele ser elogiado por su comunicación más humana y su comprensión matizada de conceptos complejos. Su enfoque en el desarrollo ético de la IA y la seguridad ha consolidado a Anthropic como un proveedor de confianza para empresas que priorizan el comportamiento responsable en aplicaciones sensibles.
Anthropic se basa en la IA Constitucional, un proceso que integra directrices éticas directamente en sus modelos. Esto ayuda a prevenir resultados perjudiciales o sesgados y genera un alto nivel de confianza con los usuarios. Si bien OpenAI también trabaja en la seguridad de la IA, el compromiso explícito de Anthropic con el desarrollo de modelos de IA con orientación ética le otorga una ventaja notable.
¿Qué otras demandas están afectando a la industria de la IA?
¿Es el caso de Anthropic solo la punta del iceberg? De hecho, hay más de 40 demandas pendientes contra proveedores de tecnología de IA en EE. UU. por infracción de derechos de autor. OpenAI, por ejemplo, fue demandada por el New York Times, y tras este acuerdo hay otras demandas pendientes contra Anthropic, incluso de editoriales musicales y la plataforma en línea Reddit.
Apple también se ha convertido recientemente en blanco de demandas por derechos de autor: autores han demandado a la empresa tecnológica por usar presuntamente ilegalmente sus libros protegidos por derechos de autor para entrenar sus sistemas de inteligencia artificial. Los demandantes acusan a Apple de copiar las obras protegidas por derechos de autor sin consentimiento, atribución ni compensación.
En Alemania, GEMA es la primera entidad de gestión colectiva a nivel mundial en demandar a OpenAI por el uso sin licencia de obras musicales protegidas. GEMA acusa a OpenAI de reproducir letras de canciones protegidas de autores alemanes sin obtener licencias ni indemnizar a los autores.
¿Cómo está evolucionando la cuestión del opt-out?
¿Qué implica el procedimiento de exclusión voluntaria en la práctica para los titulares de derechos? Según la legislación alemana, los autores y titulares de derechos pueden declarar una restricción de uso legible por máquina para excluir sus obras del uso de TDM. Por ejemplo, Sony Music Group ha publicado una "Declaración de Exclusión Voluntaria del Entrenamiento de IA" para proteger su contenido del uso no autorizado de IA.
Sin embargo, la implementación práctica del mecanismo de exclusión voluntaria es compleja: aún no se ha aclarado de forma concluyente cómo debe declararse técnica y legalmente efectiva dicha reserva, ni cómo deben gestionarla los desarrolladores de IA. Existe la preocupación de que un mecanismo de exclusión voluntaria ampliamente utilizado pueda restringir significativamente los datos de entrenamiento de los modelos de IA en Europa.
Las empresas de IA deben respetar estas restricciones de uso y no pueden eludirlas. Para que una obra forme parte del corpus de datos de entrenamiento a pesar de las restricciones, el desarrollador debe negociar la licencia con el titular de los derechos. Esto creará un nuevo mercado de licencias, que, sin embargo, aún no está consolidado.
Una nueva dimensión de la transformación digital con IA Gestionada (Inteligencia Artificial) - Plataforma y Solución B2B | Xpert Consulting
Una nueva dimensión de transformación digital con IA Gestionada (Inteligencia Artificial) – Plataforma y Solución B2B | Xpert Consulting - Imagen: Xpert.Digital
Aquí aprenderá cómo su empresa puede implementar soluciones de IA personalizadas de forma rápida, segura y sin grandes barreras de entrada.
Una Plataforma de IA Gestionada es su paquete integral y sin preocupaciones para la inteligencia artificial. En lugar de lidiar con tecnología compleja, infraestructura costosa y largos procesos de desarrollo, recibirá una solución integral adaptada a sus necesidades de un socio especializado, a menudo en cuestión de días.
Los beneficios clave de un vistazo:
⚡ Implementación rápida: De la idea a la aplicación operativa en días, no meses. Ofrecemos soluciones prácticas que generan valor inmediato.
🔒 Máxima seguridad de datos: Tus datos confidenciales permanecen contigo. Garantizamos un procesamiento seguro y conforme a la normativa sin compartirlos con terceros.
💸 Sin riesgo financiero: Solo pagas por los resultados. Se eliminan por completo las altas inversiones iniciales en hardware, software y personal.
🎯 Concéntrese en su negocio principal: Concéntrese en lo que mejor sabe hacer. Nos encargamos de toda la implementación técnica, la operación y el mantenimiento de su solución de IA.
📈 Escalable y a prueba de futuro: Su IA crece con usted. Garantizamos la optimización y la escalabilidad continuas, y adaptamos los modelos con flexibilidad a las nuevas necesidades.
Más sobre esto aquí:
Mercado de licencias para datos de IA: ¿oportunidad para los editores o riesgo para las empresas emergentes?
¿Qué papel desempeña el Reglamento sobre IA de la UE?
¿Cómo afecta el nuevo Reglamento de IA de la UE a la legislación sobre derechos de autor? Si bien el Reglamento de IA no contiene nuevas disposiciones sobre excepciones a la legislación sobre derechos de autor, sí aclara que el uso de contenido protegido por derechos de autor requiere la autorización del titular de los derechos, salvo que se aplique una limitación.
Todos los proveedores de modelos de IA de propósito general deben cumplir con requisitos de documentación exhaustivos. Esto incluye una descripción detallada de los datos utilizados para el entrenamiento, incluyendo el tipo y el origen de los datos, así como los métodos de procesamiento. En particular, deben garantizar la identificación y el cumplimiento de las reservas legales previstas en la Directiva DSM.
La Oficina de Inteligencia Artificial supervisa el cumplimiento de estas disposiciones, pero no examina las infracciones de derechos de autor individualmente. Al referirse a la Directiva DSM, el Reglamento de IA aclara que el legislador asume que la excepción de minería de textos y datos se aplica al entrenamiento de modelos de IA generativos.
Adecuado para:
¿En qué se diferencian el uso científico y el comercial?
¿Qué normativas especiales se aplican a la investigación científica? En una sentencia pionera, el Tribunal Regional de Hamburgo dictaminó que las organizaciones de investigación pueden, bajo ciertas condiciones, utilizar obras protegidas por derechos de autor para entrenar inteligencia artificial. El caso se refería al uso de una imagen protegida por derechos de autor por parte de una organización de investigación que había creado un completo conjunto de datos de imagen y texto para entrenar modelos generativos de IA.
El tribunal dictaminó que la creación de un conjunto de datos de entrenamiento de IA puede ampararse en la libertad de investigación, incluso si empresas comerciales utilizan posteriormente los datos obtenidos de esta manera. La cuestión crucial es que la creación inicial del conjunto de datos sirve para obtener conocimiento. El término «investigación científica» se interpreta de forma amplia en este contexto.
El artículo 60d de la Ley Alemana de Derechos de Autor (UrhG) permite la extracción de textos y datos científicos por parte de instituciones de investigación, como universidades, para fines de investigación científica no comercial. No se requiere el consentimiento de los titulares de los derechos. Esto contrasta con el uso comercial, en el que se aplica el procedimiento de exclusión voluntaria.
¿Qué diferencias internacionales existen?
¿Cómo abordan otros países la cuestión de los derechos de autor de la IA? Japón se considera especialmente favorable a la innovación y ya modificó su ley de derechos de autor en 2018. El artículo 30-4 de la Ley de Derechos de Autor japonesa introduce una excepción flexible para usos que no sean para el disfrute de la obra. Esto suele interpretarse como que incluye el entrenamiento de modelos de IA, siempre que el objetivo sea el análisis de datos y no el consumo de la obra en sí.
El Reino Unido ha tomado su propio camino tras el Brexit. Se celebraron consultas sobre las excepciones de derechos de autor para los desarrolladores de IA, en particular para la gestión de la identidad digital (TDM). Sin embargo, las propuestas suscitaron importantes inquietudes en las industrias creativas, por lo que el futuro sigue siendo incierto.
China modificó su Ley de Derechos de Autor en 2020, reforzando en general la protección de la propiedad intelectual. Si bien aún se están desarrollando regulaciones específicas para el entrenamiento en IA, el país reconoce la importancia estratégica de la IA y se espera que busque soluciones pragmáticas.
¿Qué significa este caso para otras empresas de IA?
¿Qué lecciones pueden aprender otras empresas de IA del caso Anthropic? La comparación muestra que la procedencia de los datos de entrenamiento es crucial. Si bien el entrenamiento con datos adquiridos legalmente puede estar amparado por las barreras del uso legítimo o la gestión de la demanda (TDM), el uso de datos obtenidos ilegalmente puede acarrear multas considerables.
Las empresas de IA han firmado cada vez más acuerdos de licencia con titulares de derechos de autor para acceder a contenido. OpenAI, por ejemplo, ha firmado acuerdos con diversas empresas de medios, y otros proveedores están siguiendo su ejemplo. El acuerdo con Anthropic podría acelerar este desarrollo y consolidar el mercado de licencias.
Es crucial que los proveedores de modelos y sistemas de IA utilicen proveedores confiables al generar datos de entrenamiento, que respeten los derechos de propiedad intelectual de terceros al crearlos. Incluso sin conocimiento de infracción de derechos de autor, podrían surgir consecuencias legales.
¿Cómo evolucionará el mercado de datos de entrenamiento de IA?
¿Está surgiendo un nuevo mercado de licencias para datos de entrenamiento de IA? El caso Anthropic y demandas similares sugieren que podría estar surgiendo un mercado estructurado para licenciar contenido para entrenamiento de IA. Editores, autores y otros titulares de derechos reconocen cada vez más el valor de su contenido para el desarrollo de la IA.
Al mismo tiempo, las empresas de IA se enfrentan al reto de adquirir datos de entrenamiento de alta calidad y legalmente sólidos. Los costes de estas licencias pueden ser considerables, especialmente para empresas pequeñas que carecen de los recursos de Anthropic u OpenAI.
La aparición de proveedores de datos especializados que crean y licencian conjuntos de datos de entrenamiento que cumplen con la legislación es una consecuencia lógica de este desarrollo. Estos proveedores podrían actuar como intermediarios entre los titulares de derechos y los desarrolladores de IA, garantizando el cumplimiento de todos los requisitos legales.
¿Qué impacto tiene esto en la innovación y la competencia?
¿Frena la situación legal más restrictiva la innovación en el desarrollo de la IA? Esta pregunta es controvertida. Quienes defienden normas estrictas sobre derechos de autor argumentan que los creadores y los titulares de derechos deberían recibir una compensación justa por el uso de sus obras. Sin embargo, la gran cantidad de datos de entrenamiento necesarios y los costes de licencia asociados podrían conducir a una concentración del mercado en unos pocos grandes proveedores.
Las empresas más pequeñas y las startups no podrían costear las licencias necesarias, lo que limitaría su capacidad para desarrollar modelos de IA competitivos. Paradójicamente, esto podría conducir a una menor innovación y competencia, ya que solo empresas con una sólida financiación como Anthropic, OpenAI o Google pueden proporcionar los recursos necesarios.
Por otro lado, la necesidad de pagar licencias podría generar métodos de entrenamiento más eficientes. Los desarrolladores de IA podrían invertir más en técnicas que requieran menos datos o utilizar datos sintéticos para reducir su dependencia del contenido con licencia.
¿Cómo se posicionan los titulares de derechos y los creativos?
¿Qué estrategias están siguiendo los autores, editores y otros titulares de derechos? La Iniciativa de Derechos de Autor y organizaciones similares exigen una mayor consideración de los derechos de autor en el entrenamiento de IA. Argumentan que el uso de obras protegidas por derechos de autor por parte de las empresas de IA sin consentimiento ni compensación constituye un robo de propiedad intelectual a gran escala.
Muchos titulares de derechos recurren cada vez más a mecanismos de exclusión voluntaria para proteger sus obras del uso no deseado de la IA. Al mismo tiempo, exploran maneras de beneficiarse del desarrollo de la IA mediante acuerdos de licencia. Esto genera una compleja combinación de disputas legales y oportunidades de negocio.
La demanda de GEMA contra OpenAI demuestra que las sociedades de gestión colectiva también desempeñan un papel activo en esta disputa. Como colectivos, podrían aunar los intereses de sus miembros y negociar licencias con empresas de IA.
¿Cuáles son las perspectivas a largo plazo?
¿Cómo podría evolucionar la situación legal en los próximos años? El caso Anthropic podría ser solo el comienzo de una oleada de acuerdos y sentencias judiciales que redefinan las normas para el entrenamiento de IA. En EE. UU., nuevos casos podrían aclarar la doctrina del uso legítimo en relación con la IA, mientras que en Europa se está perfeccionando la aplicación práctica de las limitaciones del TDM.
Es probable que el Reglamento de IA de la UE aclare mejor los requisitos de documentación y el cumplimiento de los derechos de autor. Esto podría dar lugar a una armonización de las prácticas dentro de la UE, pero también a diferencias con otras jurisdicciones.
El desarrollo tecnológico será un factor importante: si en el futuro los modelos de IA pueden entrenarse eficazmente con menos datos o con datos sintéticos, se podría mitigar el problema de los derechos de autor. Al mismo tiempo, se podrían desarrollar nuevas técnicas para detectar y compensar el uso de contenido protegido por derechos de autor.
El caso Anthropic marca un punto de inflexión importante en el desarrollo de la industria de la IA. Demuestra que el marco legal para el entrenamiento de modelos de IA aún no está completamente definido y que tanto las empresas de IA como los titulares de derechos deben encontrar nuevas maneras de armonizar sus intereses. El acuerdo de 1.500 millones de dólares podría marcar el inicio de una nueva era en la que el uso de contenido protegido por derechos de autor para el entrenamiento de IA se realice de forma más justa y transparente.
Seguridad de datos UE/DE | Integración de una plataforma de IA independiente y de múltiples fuentes de datos para todas las necesidades empresariales
Plataformas de IA independientes como alternativa estratégica para las empresas europeas - Imagen: Xpert.Digital
Ki-Gamechanger: las soluciones fabricadas en colas de plataforma de IA más flexibles que reducen los costos, mejoran sus decisiones y aumentan la eficiencia
Plataforma de IA independiente: integra todas las fuentes de datos de la compañía relevantes
- Integración rápida de IA: soluciones de IA hechas a medida para empresas en horas o días en lugar de meses
- Infraestructura flexible: basada en la nube o alojamiento en su propio centro de datos (Alemania, Europa, libre elección de ubicación)
- Seguridad de datos más alta: el uso en la firma de abogados es la evidencia segura
- Usar en una amplia variedad de fuentes de datos de la empresa
- Elección de sus propios modelos de IA (DE, UE, EE. UU., CN)
Más sobre esto aquí:
Estamos a su disposición - asesoramiento - planificación - implementación - gestión de proyectos
☑️ Apoyo a las PYMES en estrategia, consultoría, planificación e implementación.
☑️ Creación o realineación de la estrategia de IA
☑️ Desarrollo empresarial pionero
Estaré encantado de servirle como su asesor personal.
Puedes contactarme completando el formulario de contacto a continuación o simplemente llámame al +49 89 89 674 804 (Múnich) .
Estoy deseando que llegue nuestro proyecto conjunto.
Xpert.Digital - Konrad Wolfenstein
Xpert.Digital es un centro industrial centrado en la digitalización, la ingeniería mecánica, la logística/intralogística y la fotovoltaica.
Con nuestra solución de desarrollo empresarial de 360°, apoyamos a empresas reconocidas desde nuevos negocios hasta posventa.
Inteligencia de mercado, smarketing, automatización de marketing, desarrollo de contenidos, relaciones públicas, campañas de correo, redes sociales personalizadas y desarrollo de leads son parte de nuestras herramientas digitales.
Puede obtener más información en: www.xpert.digital - www.xpert.solar - www.xpert.plus