Un avançat cercador de text manuscrit i d'indexació ha permès indexar la col·lecció de registres Trésor des Chartes, coneguda com Chancery, i posar a l'abast de qualsevol historiador per al seu estudi més de 60.000 pàgines sobre l'Europa medieval.

Fins ara, els especialistes només havien pogut transcriure manualment unes 500 pàgines d'aquesta col·lecció, considerada la font més valuosa per entendre la història de França i dels països relacionats amb ella, que està en l'arrel del que avui es coneix com Europa.

Investigadors del Pattern Recognition and Human Language Techonology de la Universitat Politècnica de València (PRHLT-UPV) han desenvolupat innovadors mètodes probabilístics d'indexació i cerca d'informació textual en imatges de text manuscrit, amb el qual han pogut indexar al complet la col·lecció Chancery.

El desenvolupament d'aquest sistema i l'assoliment d'indexar amb ell aquesta col·lecció és el resultat d'una estreta col·laboració de dos anys entre tres dels participants del projecte multidisciplinari HIMANIS: l'IRHT (Institut de Recherche et d'Histoire donis Textes), l'empresa francesa de processament d'imatges text A2iA i l'equip de processament de text manuscrit del centre PRHLT de la UPV.

Segons explica Enrique Vidal, investigador principal del projecte per part del Centre PRHLT-UPV, «gran part de la història primerenca vigent de França i d'Europa està fins a cert punt basada en aquesta petitíssima mostra de Chancery».