Una nova eina informàtica analitza el llenguatge utilitzat pels usuaris de les xarxes socials aplicant tècniques d'anàlisi lingüística computacional i permet determinar l'edat i sexe de l'autor i detectar perfils falsos, amenaces de seguretat o possibles casos de pederàstia. Desenvolupada per investigadors de la Universitat Politècnica de València (UPV) i l'empresa Autoritas Consulting, també és valuosa perquè les empreses puguin conèixer la dinàmica i segmentació del mercat i enfocar així les seves accions de màrqueting.

Paolo Rosso, del Centre d'Investigació Pattern Recognition and Human Language Technology de la UPV, va afirmar que la informació sobre sexe i edat dels usuaris de les xarxes socials "no sempre és accessible ni està explícita".

Per això, permet desxifrar aquesta informació, aplicant per a això tècniques d'anàlisi lingüística per ordinador.

Per inferir la informació desitjada, l'eina analitza el llenguatge utilitzat pels usuaris de les xarxes, aplicant per a això la teoria de grafs i diferents algoritmes. Analitza temps verbals emprats, categories gramaticals més repetides, estructura del discurs, tipologia d'expressions utilitzades i el pes de les emocions.

A partir d'aquestes dades, és possible saber si darrere d'un text anònim es troba un home o una dona, i si és adolescent, jove o adult "Tenim un text, d'aquí extraiem les categories gramaticals i construïm un graf. Aquest s'enriqueix amb les emocions expressades, la polaritat de les paraules, els tipus de verb i els tipus de substantiu", va explicar Paolo Rosso.

L'eina, inclosa dins de l'aplicació Cosmos d'Autoritas i, en la qual els investigadors treballen des de l'any 2013, ja ha estat utilitzada fins i tot en casos d'investigació policial sobre amenaces de bomba. La policia vigila a les xarxes expressions o "paraules disparadores" com a bomba o pistola, entre d'altres, encara que en ocasions són utilitzades de manera col·loquial i no suposen una amenaça real. També s'intenta detectar l'idioma natiu de l'autor del missatge a les xarxes socials, ja que encara que ho escrigui en anglès pot ser de qualsevol nacionalitat. En aquests casos, segons Francisco Rangel, director tecnològic de Autoritas Consulting, va assegurar que "interessa fer un seguiment d'aquests comptes, per veure de què parlen, veure quin perfil tenen, perquè pot ajudar també a captar perfils falsos".

Respecte al temps verbal que s'usa en les xarxes socials, Rangel va explicar que mentre els joves tenen tendència a parlar en temps passat, amb records dels dies anteriors, els més adults "parlen més de projectes de futur". En el camp de les emocions, les dones tendeixen a expressar més emocions negatives i usar més verbs relatius a l'emoció que els homes, que utilitzen formes verbals més relacionades amb la comunicació.

Per detectar un perfil fals, aquella persona que s'intenta passar pel que no és, es poden aplicar uns indicadors que et permeten inferir que aquesta persona no és un adolescent, sinó que ronda la trentena d'anys.

Normalment s'utilitza el nom d'un home, ja que és "rar que es faci passar per una dona", i les estructures del llenguatge són "molt homogènies, neutres, o en alguns casos molt extremes que no es correspon amb el perfil que està intentant donar".