Actualitat Diària

Neix la spin-off Transkriptorium sorgida de la Universitat Politècnica de València

Actualitat Diària

Avui s’ha constituït formalment la spin-off Transkriptorium, l’empresa derivada sorgida de la Universitat Politècnica de València. Transkriptorium neix amb l’objectiu d’explotar tecnologia de transcripció i indexació de la informació continguda en imatges digitalitzades de documents manuscrits.

La tecnologia desenvolupada està basada en mètodes estadístics i consisteix a obtenir un mapa de probabilitats d’una imatge determinada. Amb les tècniques d’intel·ligència artificial i aprenentatge automàtic (machine learning), Transkriptorium ha aconseguit accedir als continguts de milers de pàgines antigues manuscrites.

Equip promotor

L’equip promotor de la spin-off està format per Joan Andreu Sánchez Peiró i Enrique Vidal, professors del Departament de Sistemes Informàtics i Computació i membres del Centre Tecnològic de Reconeixement de Patrons i Llenguatge Humà (PRHLT, per les seves sigles en anglès).

Igualment, formen part de Transkriptorium Vicente Bosch, tècnic superior també del PRHLT; Alejandro Héctor Toselli, investigador científic associat de la Northeastern University (Boston, els EUA) i Verónica Romero, professora de la Universitat de València. Finalment, el consultor privat Luis Antonio Morró s’incorpora a la iniciativa com CEO de l’empresa.

Una clara oportunitat econòmica

Per a Joan Andreu Sánchez, “la tecnologia desenvolupada supera qualsevol solució actual basada en el treball humà expert sobre el text. El desenvolupament i la comercialització d’aquests processos en diversos àmbits (administratius, culturals, econòmics, legals, etc.) és una clara oportunitat econòmica. No existeixen més de 3 o 4 empreses a tot el món que es dediquin comercialment a això”.

Sánchez ha explicat que “són més de 20 anys de treball els que han propiciat la tecnologia que ara es transfereix a aquesta spin-off. Són infinitat de casos d’ús, treballant amb institucions tant públiques com privades. Tot això ens ha donat l’experiència necessària”.

Quilòmetres de documents manuscrits per explorar

Per part seva, Enrique Vidal ha destacat l’enorme mercat potencial que suposen els arxius i biblioteques de tot el món. “S’especula que, actualment, hi ha més text manuscrit que text automàtic, per tot el que s’ha acumulat al llarg de la història. I tot això està pendent de ser llegit i explorat.”

En aquest sentit, Sánchez ha apuntat al fet que “es compten per quilòmetres la quantitat de documents manuscrits que queden per transcriure i indexar. Per posar un exemple, si la Biblioteca Nacional alineés els documents que atresora se superarien els 100 km de paper.”

Projectes europeus, antecedents de Transkriptorium

Durant dècades, els investigadors de PRHLT han afinat la tecnologia gràcies als projectes europeus concedits al seu equip. Un antecedent és Himanis que, en 2017, va permetre indexar la col·lecció de registres del Trèsor donis Chartes, el Tresor de les Cartes, antics arxius de la Corona de França, denominats també Chancery. La col·lecció conté més de 70.000 pàgines de registres d’actes de la cancelleria real francesa dels segles XIII i XIV.

En 2019, va arribar el projecte Caravel·la, desenvolupat durant els últims dos anys i que ha permès accedir als continguts de més de 130.000 imatges de l’Arxiu General d’Índies i l’Arxiu Històric Provincial de Cadis. Gràcies a aquests projectes, ha sortit a la llum informació que constitueix un tresor arqueològic de primera magnitud, a causa de la gran riquesa històrica i cultural del seu contingut.

UPV, un ecosistema de 24 empreses derivades

Amb aquesta, són ja 17 les spin-offs participades per la Universitat Politècnica de València i altres 7 més constituïdes com a empreses no participades. Per a la institució valenciana, les spin-offs són el mecanisme més complet i eficaç de transferència de tecnologia, ja que conjuminen no sols uns resultats de recerca explotables, sinó també el talent i la capacitat dels seus creadors.