Las empresas que conceden licencias para conjuntos de datos de IA crean un grupo comercial
Siete vendedores de licencias de contenidos musicales, imágenes, vídeos y otros conjuntos de datos para su uso en el entrenamiento de sistemas de inteligencia artificialhan formado el primer grupo comercial del sector, segúnanunciaron el miércoles.
La Alianza de Proveedores de Conjuntos de Datos (DPA) abogará por un "aprovisionamiento ético de datos" en el entrenamiento de sistemas de inteligencia artificial, incluidos los derechos de las personas representadas en los conjuntos de datos y la protección de los derechos de propiedad intelectual de los propietarios de contenidos, señalaron las empresas en un comunicado.
Entre los miembros fundadores figuran la empresa estadounidense de conjuntos de datos musicales Rightsify, el servicio de licencias de imágenes vAIsual, el proveedor japonés de fotografías de archivo Pixta y el mercado de datos con sede en Alemania Datarade.
La aparición en los últimos años de tecnologías de IA generativa capaces de imitar la creatividad humana ha provocado la protesta de los creadores de contenidos y una serie de demandas por derechos de autor (link) contra empresas tecnológicas como Google GOOG, Meta
META y el fabricante de ChatGPT OpenAI, respaldado por Microsoft
MSFT.
Los desarrolladores han estado entrenando modelos alimentándolos con ingentes cantidades de contenidos, muchos de ellos extraídos gratuitamente de Internet sin el consentimiento de quienes crearon las obras o poseen los derechos sobre ellas.
Las empresas tecnológicas, que afirman que el uso es legal, también están pagando discretamente por el acceso a colecciones privadas (link) de contenidos, tanto para satisfacer necesidades de determinados tipos de datos como para protegerse de riesgos legales y normativos.
La perspectiva de que la demanda de datos bajo licencia crezca si los propietarios de los derechos de autor se imponen en sus luchas legales ha provocado la aparición de una industria incipiente de empresas que empaquetan contenidos y venden el acceso a ellos para su uso por sistemas de IA.
Como resultado, se han formado grupos para establecer normas éticas para ese comercio, como Fairly Trained, una organización sin ánimo de lucro fundada este año que certifica modelos que no han utilizado materiales protegidos por derechos de autor sin licencia.
La DPA se centra en el contenido de esas transacciones, exigiendo, por ejemplo, que sus miembros se comprometan a no vender datos de texto obtenidos rastreando la web o audio que incluya voces de personas sin su consentimiento explícito.
Alex Bestall, Consejero Delegado de Rightsify y su filial de licencias GCX, que dirigió la fundación del grupo, explicó que se prestará especial atención a impulsar leyes como la NO FAKES Act, un proyecto de ley estadounidense presentado el año pasado para imponer sanciones por generar réplicas digitales no autorizadas de la voz o la imagen de personas.
"La defensa de los derechos será una parte importante porque todo el mundo se ha posicionado sobre la IA y los derechos de autor, pero muchas de estas batallas aún no se han resuelto y tardarán un tiempo en hacerlo", dijo Bestall.
La DPA también presionará para que se establezcan más requisitos de transparencia de los datos de formación, como los de la Ley de IA de la Unión Europea (link) y un proyecto de ley similar presentado en abril en Estados Unidos, la Generative AI Copyright Disclosure Act (Ley de divulgación de los derechos de autor de la IA generativa), añadió .
El grupo tiene previsto publicar en julio un libro blanco en el que expondrá su postura.