L'any 2002, Billy Beane, director tècnic dels Oakland Athletics, un equip de beisbol nord-americà, va haver d'afrontar un doble problema: la marxa de les seves principals estrelles a altres clubs més poderosos i un escàs pressupost per recompondre la plantilla. Lluny de resignar-se, Beane va contractar com ajudant Paul DePodesta, un jove llicenciat en Econòmiques per Harvard que havia desenvolupat un sistema d'anàlisi de dades que permetia saber quins jugadors tenien un enorme potencial per muntar un equip guanyador. El sistema analitzava el que cadascun podia aportar al conjunt, encara que fossin desconeguts o estiguessin devaluats econòmicament.

El resultat d'aquell experiment el descriu, amb algunes llicències sobre la història real, la pel·lícula Moneyball, protagonitzada per Brad Pitt: els Oakland Athletics van acabar funcionant com un rellotge suís gràcies al mètode de DePodesta (caracteritzat com Peter Brand en la pel·lícula) i van establir un rècord a la MLB (20 victòries consecutives), portant-los a guanyar aquell any la lliga regular de la divisió oest, encara que van caure en els play-off de postemporada.

Aquell episodi, que recullen el professor de la Universitat d'Oxford Viktor Mayer-Schönberger i l'editor de dades de The Economist, Kenneth Cukier, en el seu llibre Big Data: A revolution that will transform how we live, work, and think (en castellà, publicat per Turner Editorial: Big Data: La revolución de los datos masivos), és potser la demostració més palpable, encara que en una fase encara embrionària, del poder de l'anàlisi de grans volums de dades per crear models predictius, una tendència en el sector de la tecnologia de la informació que creix de manera vertiginosa, portant amb ella inqüestionables avantatges, però també un preocupant costat fosc.

Un exemple senzill de l'ús del Big Data el tenim avui dia, per exemple, a Amazon, que és capaç de relacionar la seva mastodòntica base de dades per extreure'n patrons conductuals i, després d'una compra, suggerir-nos altres llibres o productes relacionats amb allò que hem adquirit, no només pel nostre historial, sinó pel comportament previ d'altres milers d'usuaris.

Un altre exemple el tenim en l'anàlisi informàtica de dades públiques i pròpies que l'equip d'Obama va fer en les passades eleccions presidencials dels Estats Units, unint estadística i intel·ligència artificial per obtenir patrons de conducta i aconseguir traslladar un missatge personalitzat a cada ciutadà, que recollís exactament allò que volia escoltar, atenent als seus problemes i preocupacions.

O el cas, per posar un altre exemple entre milers, de la filial de T-Mobile als Estats Units, que per reduir la portabilitat, va analitzar els milions de dades que posseïa sobre l'activitat dels seus clients i va extreure'n models de comportament que l'alertaven de quan un usuari estava a punt d'anar-se'n a una altra companyia i poder anticipar-se a la seva decisió. T-Mobile va aconseguir reduir un 50% el nombre de portabilidades.

Portat a gran escala, el poder del Big Data és enorme. Analitzant patrons de conducta de milions de persones i creuant dades de milers i milers de fonts, és possible des de millorar la coordinació després d'una catàstrofe fins a fins i tot engegar mètodes de reducció de la delinqüència o el terrorisme, basant-se en patrons que anteriorment van desembocar en robatoris o episodis de violència.

Però com deia, el Big Data porta amb ell l'altra cara de la moneda, una zona fosca que posa sobre la taula riscos d'igual pes que les virtuts que pot aportar, fonamentalment en dues qüestions.

Una, d'arrel més antropològica, centrada en el perill del que Ievgueni Morozov denomina la "renúncia al perquè": ja no necessitem comprendre per què succeeix alguna cosa, no necessitem saber per què una persona es comporta com un delinqüent o terrorista, sinó simplement, amb les correlacions de dades, incidir en la conducta preventiva per evitar a temps que cometi algun acte de delinqüència; connectar el comportament dels terroristes d'avui amb els de demà per incidir en la localització d'un sospitós (o futur sospitós, a l'estil de Minority Report).

El problema de la prevalença del quan i el com sobre el perquè és que es renuncia a atacar les causes: una acció preventiva sobre delinqüència en un barri allunyarà els sospitosos a altres zones o dificultarà més la seva acció, però no s'atacarà el problema d'arrel. Els delinqüents seguiran igual de frustrats i mai es comprendrà si la delinqüència ha sorgit per estigmatització primerenca, desintegració familiar, consum de drogues o altres causes. Aquest tipus de solució porta, segons sosté Mark Andrejevic en el seu llibre Infloglut, a una ceguesa que els governs democràtics no poden permetre's, perquè impossibilita qualsevol reforma política seriosa.

I l'altre problema és el de la privacitat, tant en l'obtenció d'aquestes dades, com en l'emmagatzematge i venda posterior. Per poder interpretar milions de dades, primer cal posseir-les i la verdadera lluita de les empreses dedicades a obtenir dades estarà a aconseguir el major volum de dades de cadascun de nosaltres; arribar on els altres encara no han arribat.

I com més dades s'acumulen de nosaltres, més possibilitats existeixen de ser venuts o robats o que algú en faci mal ús. Les relevacions de Snowden, en cas de ser certes, posen de manera evident sobre la taula l'abast del risc: la ruptura absoluta de l'equilibri entre seguretat i privacitat. Si no es delimita aquest risc, el Big Data pot convertir-se en poc temps en un verdader Gran Germà, en un modernitzat Big Brother orwel·lià. Això, si no ha començat a ser-ho ja.