Una imatge val més que mil paraules, assegura la popular dita. Però, i si tenim la possibilitat de crear imatges que poden arribar a semblar reals en tan sols uns segons? Això és possible gràcies a la intel·ligència artificial (IA). La tecnologia és capaç de generar imatges del no-res, que poden provocar dubtes davant de fets que, en un primer moment, semblen evidents. Aquestes fotografies són totalment fictícies i la intel·ligència artificial té la capacitat de crear-ne més d’un centenar en menys d’un minut.

Un quadre de Girona pintat a l’estil de Vincent van Gogh, o introduir elements difícilment explicables al riu Onyar (com elefants, micos o vaixells), o traslladar la Catedral al costat del mar, o a l’interior d’una selva remota. Són algunes de les imatges que el programador informàtic gironí Rafel Martín ha generat a través de la intel·ligència artificial i algunes de les quals es reprodueixen en aquest reportatge. «Ara es pot inventar qualsevol imatge amb qualsevol persona o personatge i en qualsevol situació, i la imatge és tan real que la gent s’ho pot creure», alerta Rafel Martín. «Imaginem que utilitzem el rostre d’un conegut nostre, fem una imatge poc ètica i la publiquem a les xarxes. Tothom pot arribar a creure que és cert», explica el programador informàtic.

Per lluitar contra la possible desinformació que poden provocar aquestes imatges generades per la tecnologia, l’informàtic demana «sentit comú». «Cal revisar sempre la font i si veiem que no és fiable, com a mínim, dubtar de la veracitat de la imatge», exposa.

La tecnologia també és un dels mètodes per comprovar si les imatges són reals o han estat creades amb una IA. A través d’una «contraintel·ligència», explica l’informàtic gironí, es pot esbrinar automàticament l’origen de les imatges i, per tant, també es pot contrastar la seva la seva veracitat.

Com funciona la IA?

Un dels aspectes claus per entendre com funciona la intel·ligència artificial és comprendre que la IA no emmagatzema dades, sinó que «aprèn», explica Rafel Martín. El sistema «no guarda ni un sol valor, entén com funciona allò que li estem ensenyant», afirma.

La IA aprèn a través d’una «xarxa neuronal», que té diferents capes. «Dins d’aquesta xarxa neuronal hi ha la capa d’entrada, on li donem els valors que nosaltres volem. A partir d’aquí va de neurona en neurona passant per les diferents capes fins arribar a la capa de sortida, on ens dona un valor final», relata el programador. En un primer moment hi ha errors, com per exemple la importància que pot donar-li la intel·ligència artificial a una de les neurones en el procés. Per millorar els resultats és necessari tornar a inserir totes les dades múltiples vegades, cada cop que es porta a terme aquest procés és «una època». Tanmateix, la IA no guarda aquestes dades, aprèn a interpretar-les.

Per comprendre com és Girona i crear imatges a través de punts emblemàtics de la ciutat, Rafel Martín va utilitzar 1.600 èpoques i la intel·ligència artificial va trigar al voltant de dues hores per «entendre què és Girona», detalla el programador. Les imatges que crea el sistema són totalment fictícies, per tant, els edificis que apareixen no són exactament com els de la ciutat, sinó que «es manté l’essència». «El sistema entén que una de les parts més emblemàtiques és el pont o la catedral. Moltes vegades no és exactament la Catedral de Girona, però tu entens que ho és per les seves característiques», detalla.

Perquè la intel·ligència artificial aprengui a través de les imatges cal retallar-les i redimensionar-les a una mida concreta de manera que el sistema pugui aprendre correctament. A més, cal oferir al sistema diferents perspectives «perquè en pugui detectar els detalls», explica l’informàtic.

A partir de llavors, el que cal és utilitzar unes paraules clau per demanar a la intel·ligència artificial que és el que vols que generi. Rafel Martín afirma que si volem aconseguir bons resultats no només és important dir què volem dins de les imatges, és a dir els elements que integraran la fotografia, també cal detallar l’estil, que pot ser des de realista a un estil artístic, entre molts d’altres.

Les funcionalitats de la IA

Des de crear imatges amb una funcionalitat recreativa, realitzar simulacions per a projectes o fer imatges decoratives, són algunes de les moltes funcions que pot tenir la intel·ligència artificial. Tot i això, el seu abast va molt més enllà. El programador gironí explica que també es poden fer prediccions «molt ajustades» com podria ser de l’evolució del preu de la llum. La IA també pot crear textos des de zero o fer un resum d’un escrit molt extens, tanmateix, afirma que en aquestes funcionalitats encara hi ha algunes mancances i es pot dir que «no és 100% fiable».

Una de les controvèrsies que genera la creació d’imatges amb aquesta tecnologia és la faceta artística, ja que és capaç de crear fotografies que semblen una pintura, amb una gran varietat d’estils, en tan sols uns segons.

L’informàtic, però, considera que «l’artista sempre hauria de ser-hi, aquestes imatges fantàstiques no deixen d’estar fetes gràcies a ells i als seus estils perquè la intel·ligència artificial ho ha après».

Explica que, per exemple, quan es tracta d’humans, tot i que ensenyis a la IA amb milers d’imatges d’una persona, aquesta «acostuma a fer-nos més macos del que som». Ell exemplifica que de vegades això no ho volem. «Si tu fas una foto dels teus fills vols que aquesta sigui fidel a realitat, que no canviï res», exposa. «Hi ha punts que pot ajudar i hi ha punts que no ha de tocar», afegeix.

D’altra banda, el programador creu que la intel·ligència artificial més que una pedra en el camí dels artistes pot ser una ajuda molt interessant, com una font d’inspiració per a les seves obres: «Pot ajudar a la creativitat dels artistes, pensar coses que no havien imaginat».

Una evolució «molt ràpida»

Moltes d’aquestes intel·ligències artificials són obertes a tothom i permeten a qualsevol persona poder ingressar paràmetres per crear imatges. Alhora, algunes d’aquestes IA són en codi obert, és a dir que el codi de font d’aquest software està a disposició de tot el món de manera gratuïta i es pot reutilitzar o adaptar a diversos contextos. Això suposa que les millores en aquest tipus de tecnologia son «molt ràpides», detalla Rafel Martín, ja que qualsevol persona amb els coneixements necessaris pot introduir canvis i millores.

«Fa pocs mesos va aparèixer DALL-E, un generador d’imatges creat per l’empresa privada OpenAI. A partir d’aquest, la comunitat de codi lliure es va ajuntar per crear el DALL-E MINI. Fa menys d’un mes que va explotar Stable Diffusion, i en poc més d’un mes ja tenim Stable Diffusion v2», explica el programador informàtic gironí.

La nova versió de Stable Diffusion ofereix canvis tècnics i la possibilitat de crear imatges fins a quatre vegades més gran que la seva predecessora, diu l’informàtic. «Es pot provar en línia, amb una mica de paciència i gratis», explica. En només uns segons, les imatges poden ser increïbles.