Reddit demanda a Anthropic por usar comentarios para entrenar su IA

Reddit demanda a Anthropic por usar comentarios para entrenar su IA - Imagen ilustrativa del artículo Reddit demanda a Anthropic por usar comentarios para entrenar su IA

Reddit ha demandado a la empresa de inteligencia artificial (IA) Anthropic, acusándola de "raspar" ilegalmente comentarios de usuarios para entrenar a su chatbot Claude. La demanda, presentada en San Francisco, alega que Anthropic accedió a la plataforma de Reddit más de 100.000 veces desde julio de 2024, incluso después de haber afirmado que había bloqueado sus bots.

Según Reddit, Anthropic utilizó bots automatizados para acceder al contenido, a pesar de haber sido advertidos de no hacerlo. La empresa afirma que Anthropic "entrenó intencionalmente con los datos personales de los usuarios de Reddit sin solicitar su consentimiento". Reddit argumenta que esta "explotación comercial" del contenido de la plataforma podría valer miles de millones de dólares.

Anthropic, fundada por ex ejecutivos de OpenAI, respondió a las acusaciones diciendo que no está de acuerdo con las reclamaciones de Reddit y que se defenderá enérgicamente. La empresa se describe a sí misma como un "caballero blanco" en la industria de la IA, pero Reddit alega que su conducta demuestra lo contrario.

¿Por qué Reddit está tan preocupado?

Reddit ha estado buscando activamente formas de monetizar su contenido, que consiste principalmente en conversaciones generadas por usuarios. La empresa ya ha firmado acuerdos de licencia con Google, OpenAI y otras empresas que pagan para entrenar sus sistemas de IA con los comentarios públicos de los usuarios de Reddit. Estos acuerdos, según Reddit, permiten proteger la privacidad de los usuarios y evitar el spam.

Ben Lee, jefe del departamento legal de Reddit, ha declarado que las empresas de IA no deberían poder extraer información y contenido de las personas sin limitaciones claras sobre cómo pueden utilizar esos datos. También enfatizó que las conversaciones en Reddit son únicas y valiosas, ya que representan la "humanidad" en un mundo cada vez más influenciado por la IA.

El valor del contenido generado por usuarios

  • Representa una fuente invaluable de datos para el entrenamiento de modelos de lenguaje.
  • Refleja opiniones y tendencias actuales.
  • Es auténtico y generado por personas reales.

La demanda contra Anthropic pone de relieve la creciente preocupación por el uso de datos generados por usuarios para entrenar sistemas de IA, y plantea interrogantes sobre los derechos de autor, la privacidad y la compensación justa.