Viola Sora els drets d'autor? L'opacitat d'OpenAI inquieta als experts

La nova eina per a generar vídeos realistes gairebé no ha donat detalls tècnics que puguin ser contrastats per part de la comunitat acadèmica

Una noia passeja pels carrers de Tòquio en un vídeo generat per la IA de Sora.

Una noia passeja pels carrers de Tòquio en un vídeo generat per la IA de Sora. / OPENAI

Carles Planas Bou

Divendres passat, OpenAI va tornar a donar la campanada en presentar Sora, una nova eina que se serveix de la intel·ligència artificial (IA) per a generar vídeos realistes a partir de les peticions escrites dels usuaris. L'anunci es va viralitzar gairebé a l'instant, despertant entre premsa i gran públic una onada de fascinació sobre les capacitats d'aquesta tecnologia similar a la que es va produir abans amb ChatGPT i el generador d'imatges DALL-E. No obstant això, molts experts també han plantejat dubtes cada vegada més recurrents: Amb quines dades s'ha entrenat aquest model? Viola els drets d'autor?

Sora vol ser un producte, però de moment només hem vist publicitat. L'anunci promocional d'OpenAI mostra imatges en moviment que haurien estat creades per aquesta IA a partir de prompts de text, un aparent assoliment amb un nivell de precisió i coherència mai vist fins ara. Els resultats són realment sorprenents, si bé imperfectes. Així i tot, Sora és un misteri. De moment, la companyia ha limitat el seu accés a un reduït grup d'artistes i a un equip intern que "avalua les àrees crítiques a la recerca de danys o riscos".

OpenAI està venent Sora com un avanç científic, però gairebé no ha donat detalls tècnics que puguin ser revisats i contrastats per part de la comunitat acadèmica. "Això no és un avanç per a la societat, sinó per a OpenAI i els seus interessos", adverteix Albert Sabater Coll, director del Observatori d'Ètica en IA de Catalunya. En la web de la companyia no s'explica quines dades usa i només indica que "s'inspira en grans models lingüístics que adquireixen capacitats generalistes entrenant-se amb dades a escala d'internet". Es tracta de continguts protegits pel 'copyright'?

Quines dades usa?

La falta d'informació no permet resoldre els dubtes ètics i legals que planteja aquesta pregunta. Tot apunta al fet que Sora s'entrena, en part, amb dades de Shutterstock, una biblioteca d'imatges, vídeos i música amb el qual OpenAI treballa des de 2021. Ambdues van acordar l'any passat estendre la seva aliança fins a 2029.

No obstant això, el model podria accedir a altres continguts com a fotografies compartides en Reddit, vídeos de Youtube o videojocs sense el consentiment dels artistes, com ha advertit la científica informàtica Margaret Mitchell. Altres experts assenyalen que els vídeos creats amb Sora s'assemblen als de Midjourney, un generador d'imatges ja denunciat per violació dels drets d'autor. "És de suposar que els artistes estan sent realment fotuts", ha assenyalat Gary Marcus, professor emèrit de la Universitat de Nova York i expert en IA.

El vaixell almirall d'OpenAI, ChatGPT, ha rebut múltiples denúncies per possibles violacions de la privacitat i dels drets d'autor, entre elles d'autors com John Grisham o de mitjans com The New York Times. Amb Sora podria passar el mateix. "Gremis i indústries com Hollywood entraran de ple en la lluita pels seus drets per a frenar aquesta competència deslleial", creu Sabater. La pròpia OpenAI ha assenyalat als legisladors que "seria impossible entrenar els models actuals de IA sense material amb drets d'autor".

Falta de transparència

El nom d'OpenAI predica l'obertura, però la seva falta de transparència és ja una cosa habitual. En els seus inicis, la prolífica 'start-up' encapçalada per Sam Altman va prometre informar el públic de tots els seus desenvolupaments interns, però l'any passat va canviar les seves polítiques per a passar a operar a porta tancada com els gegants tecnològics que criticava. Amb GPT-4, l'última generació del seu model de llenguatge, van posar fi a la pràctica de revelar els detalls tècnics del seu IA, encegant als investigadors externs.

OpenAI continua definint-se com una organització sense ànim de lucre centrada és "garantir que la IA beneficiï a tota la humanitat". No obstant això, després del llançament de ChatGPT està buscant un model d'ingressos que li permeti mantenir la seva activitat. Només el funcionament dels seus servidors informàtics costaria més d'un milió de dòlars al dia.

Estratègia comercial

Periodistes tecnològics crítics amb el sector han advertit que OpenAI cerca repetir amb Sora l'estratègia que va catapultar ChatGPT. "Tot el soroll va convertir a Sam Altman en una celebritat, embarcant-se en una gira mundial en la qual alertava dels greus perills de la tecnologia que estava desenvolupant amb finalitats comercials", denúncia Brian Merchant.

Aquest bombo ha servit "per a confondre al gran públic sobre les capacitats reals" de la IA generativa, segons Sabater, però també s'ha traduït en enormes inversions en les companyies que la desenvolupen comercialment. Prova d'això són els més de 10.000 milions de dòlars que Microsoft va posar en OpenAI. Aquest divendres, The New York Times va informar que la companyia ha tancat un acord que la valora en 80.000 milions, triplicant el seu valor en menys de 10 mesos.

Aquesta realitat porta a diversos experts a advertir que Sora no és un instrument de creació equiparable a una calculadora o a una càmera fotogràfica. "Les eines del capitalisme de plataformes serveixen a un sol amo, que no és l'art, l'artista o l'audiència. En aquest cas, és la junta d'inversors d'OpenAI", ha escrit Marta Peirano, periodista especialitzada en tecnologia i poder.