PEC: mbac-ic-a[at]mailcert.beniculturali.it   e-mail: ic-a[at]beniculturali.it   tel: (+39) 06 5196.0286

Istituto Centrale per gli Archivi - ICAR

Strumenti per il web semantico: il thesaurus unico del Portale “Ti racconto la storia”

PREMESSA

Nel settembre 2018 l’ICAR ha pubblicato sul portale Ti racconto la storia una biblioteca digitale di 65 videointerviste, suddivise in tre collezioni e dedicate ad argomenti di interesse storico per l’Italia contemporanea: 1. Guerra e Resistenza a Savigliano, 2. L’ombra del potere. I gabinetti e gli uffici legislativi dei ministri, 3. Per una storia orale dell’ex Ospedale psichiatrico di Santa Maria della Pietà di Roma. Nel prossimo futuro l’Istituto inserirà tre nuove collezioni riguardanti le trasmissioni di Radio Onda Rossa, la storia e la cultura dei sordi in Italia, la Seconda guerra mondiale e la resistenza a Roma.
La consultazione dei materiali all’interno del portale è facilitata da due strumenti di ricerca: annotazioni, vale a dire indici che descrivono i contenuti dei singoli oggetti digitali; thesauri, ossia vocabolari controllati che raccolgono e ordinano le annotazioni secondo relazioni semantiche di tipo gerarchico e associativo. Ciascuna annotazione è ancorata a un preciso segmento temporale delle interviste e può essere recuperata sia attraverso la ricerca full-text del portale, sia navigando all’interno dei thesauri. Ogni collezione ha un thesaurus di riferimento che ne raccoglie gli indici.
Tali strumenti di ricerca sono stati creati in tempi e modi diversi dagli enti che – in convenzione con la Direzione Generale Archivi e l’ICAR – si sono occupati di produrre i materiali audiovisivi delle collezioni. Ciò, pur permettendo a ciascun ente di occuparsi in prima battuta della descrizione dei materiali, ha portato a una disomogeneità delle annotazioni da un punto di vista formale e dei thesauri da uno strutturale. La ricerca coordinata dei contenuti tra le collezioni risulta quindi impraticabile.
Alla luce di tali ragioni sono nate due esigenze: a) rendere omogenee le annotazioni sul piano terminologico, b) progettare e implementare un thesaurus unico che racchiuda i thesauri minori e che possa essere facilmente integrato in caso di nuove pubblicazioni all’interno del portale.

Nel corso di uno stage svolto nei mesi giugno- ottobre 2019 presso l’ICAR in base alla Convenzione per l'avvio di tirocini curricolari stipulata dall'ICAR con l’Università Ca’ Foscari di Venezia, Filipo Spanu (Master in Digital Humanities, Università Ca' Foscari di Venezia) ha avviato uno studio di fattibilità finalizzato alla progettazione di un thesaurus unico che permetta la consultazione dei materiali audiovisivi conservati nel Portale. 
Di seguito sono esposti i metodi e i risultati del lavoro svolto.

Thesauri come strumenti di ricerca nel Web Semantico
Prima di parlare della progettazione del thesaurus unico è necessario fare una breve premessa sulla natura di tali strumenti e sul loro utilizzo all’interno del Web Semantico.
Essi rientrano in quelli che sono definiti sistemi per l’organizzazione della conoscenza (Knowledge Organization Systems). Tale definizione è utilizzata per riferirsi ad un’ampia gamma di entità (es. soggettari, thesauri, tassonomie, ontologie) caratterizzate da diverse strutture, funzioni e applicazioni tecnologiche. Ciò che hanno in comune è il fatto di fornire un’organizzazione di un’informazione con il fine di rendere questa più facilmente gestibile e accessibile. In particolare i thesauri (i cui maggiori standard di rifermento sono ISO 25964 del 2013 e SKOS del 2004) sono dei vocabolari controllati che ordinano – attraverso relazioni semantiche di tipo gerarchico e associativo – un insieme di concetti ai quali sono associati dei termini secondo lo stesso rapporto che in linguistica vi è tra un significato e il rispettivo significante. Nati inizialmente come strumenti linguistici, i thesauri a partire dagli anni ’60 del secolo scorso sono stati utilizzati come strumenti di instradamento alla ricerca (informational retrieval), descrivendo con i propri concetti i contenuti di una determinata fonte documentaria. Oggi i thesauri sono molto utilizzati per la descrizione e la consultazione di risorse disponibili in rete.
Uno standard diffuso per la rappresentazione di questi strumenti in un linguaggio “comprensibile” ai computer è il già citato SKOS (Simple Knowledge Organization System) basato su RDF (Resource Description Framework). L’uso di tale standard per la rappresentazione dei thesauri è molto importante all’interno del Web Semantico, in quanto permette di associare ad ogni concetto del vocabolario un URI identificabile e rintracciabile. Ciò fa sì che uno stesso concetto possa essere utilizzato per descrivere fonti documentarie conservate in differenti database on-line, rendendo questi interoperabili.
I thesauri presenti nel portale “Ti racconto la storia” sono scritti in SKOS e caricati su Fedora  Commons, il digital asset management che gestisce la biblioteca digitale.

 

 

 



Ultimo aggiornamento: 07/11/2020