Centro di Coordinamento degli Enti Territoriali Forum per la Società dell'Informazione Barra del titolo
 
Piano 2000
Documento 1999
 
Gruppo di lavoro
Segnalazioni stampa
Statistiche
 
   
 
  Mappa del sito

      Curiosità Novità  
   
 Piano 2000 - Attività per il 2000 - I metadati
 
  Barra lateraleCompetenze e referentiForma organizzativaObiettiviAttivitàBudget 2000Consuntivo 1999

 

I metadati sono "dati sui dati", ovvero informazioni, generalmente strutturate in campi prefissati, relative a "documenti primari" sia testuali che fattuali.

Per "documento primario" qui intendiamo riferirci ad un oggetto organizzato e strutturato sia che consista in un testo scritto (un libro, ma anche una legge, una norma, una deliberazione, …) sia che abbia forma di un archivio (elettronico o meno) contenente informazioni di qualunque natura.

I metadati sono le informazioni che descrivono, in modo più o meno dettagliato, la forma ed il contenuto dell'oggetto cui si riferiscono. La funzione dei metadati è permettere (o comunque facilitare) il raggiungimento dei seguenti obiettivi:

  • Ricerca, ovvero saper individuare l'esistenza di un documento primario.

  • Localizzazione, ovvero poter rintracciare una particolare versione del documento primario.

  • Selezione, ovvero analisi, valutazione e filtro di una serie di documenti primari senza dover accedere al loro contenuto.

  • Interoperabilità, ovvero poter eseguire una ricerca in ambiti disciplinari diversi grazie a una serie di equivalenze fra termini che descrivono l'oggetto (vedi oltre descrittori e thesaurus).

  • Gestione delle risorse informative, ovvero poter gestire le raccolte di documenti primari grazie a strumenti come banche dati o cataloghi.

  • Validità, ovvero ottenere informazioni sulla effettiva disponibilità del documento primario.

I metadati, per certi versi, somigliano molto alle schede catalografiche in uso nelle biblioteche, perché sono veri e propri "metadati" rispetto ai "dati" costituiti dai libri e dai periodici cui si riferiscono, come dimostra bene Riccardo Ridi nell'articolo Metadata e metatag: l'indicizzazione a metà strada fra l'autore e il lettore, pubblicato il 29 settembre 1999 sul sito web di AIB e da cui sono estratte alcune parti di questa pagina, anche se sembra tentare di ricondurre tutto il problema a quanto di competenza "naturale" dei soli bibliotecari. In realtà il dominio dell'"informazione pubblica" è un sovrainsieme di quanto espresso attraverso libri e pubblicazioni sia per la parte più squisitamente normativa e giuridica (comprese le deliberazioni dei Consigli e delle Giunte degli Enti Territoriali) sia per le informazioni ed i dati specifici delle procedure e degli archivi di riferimento (dal Piano Regolatore all'Anagrafe).

Peraltro i metadati non si presentano esclusivamente in formato elettronico (per es. le schede catalografiche di cui sopra o comunque cataloghi a stampa) e non si riferiscono esclusivamente a documenti primari elettronici.

Continuando l'analogia con le biblioteche, nel ciclo produttivo "canonico" per la gestione delle informazioni, sono presenti più attori: l'autore, che produce i dati; l'indicizzatore che estrae i metadati e li organizza; il lettore, che interroga i metadati e individua quelli che fanno per lui. Le biblioteche (cioè i bibliotecari ed i biblioteconomi) hanno una grande tradizione in questo campo, tanto che la teoria migliore viene di lì.

Nell'ambito dei documenti primari elettronici (area di lavoro più degli informatici), e specialmente di quelli disponibili in rete, l'importanza dei metadati è stata trascurata. Essi sono invece ancora più indispensabili nello spazio virtuale che nelle tradizionali biblioteche, dove un utente privato del catalogo potrebbe comunque sempre scandagliare "a vista" gli scaffali, perché l'archivio, che può essere percepito con i propri sensi, sta fisicamente localizzato in un posto solo.

Le risorse informative disponibili in Internet sono della natura più varia: testi, immagini statiche e in movimento, suoni, software, archivi fattuali ecc. La maggior parte degli strumenti per la ricerca di informazioni (motori di ricerca locali o di rete) sono invece di tipo testuale, anche se cominciano a svilupparsene alcuni basati su "campionamenti" di immagini o suoni da rintracciare senza alcuna intermediazione verbale.

I metadati saranno quindi delle stringhe di testo strutturate secondo un determinato schema e associate in qualche modo ai documenti più o meno multimediali disponibili in rete.

Molti dei progetti relativi ai metadati attualmente in corso tentano soprattutto di escogitare il metodo per associare i dati ai relativi metadati e di stabilire lo schema da seguire nella loro creazione. Poca attenzione, invece, è messa sugli aspetti del controllo terminologico dei termini da utilizzare, malgrado l'esistenza di esperienze nel settore assai significative: dal thesaurus del Senato (TESEO) al dizionario utilizzato nel sistema di Information Retrieval della Suprema Corte di Cassazione (ITALGIURE Find).

OCLC (nel progetto Dublin core) tenta di definire uno standard che permetta la descrizione di ogni risorsa disponibile in rete da parte degli autori e degli editori stessi, in modo da garantire un livello per quanto minimo di autocatalogazione per ciascun documento e la premessa necessaria per eventuali successive indicizzazioni più sofisticate da parte di automi o di catalogatori umani professionali.

La gestione dei metadati guidata da thesauri o elenchi strutturati di termini (descrittori) serve sia a facilitare gli autori che a guidare i lettori nella ricerca. Ma in una qualunque struttura organizzativa (per esempio una Pubblica Amministrazione) questo è possibile solo se:

  • la gestione non è aggiuntiva rispetto al ciclo produttivo normale dell'informazione

  • il sistema di classificazione non ha pretese universali (stile Classificazione Decimale universale) ma è sufficientemente semplice e flessibile per adattarsi nel tempo

  • gli strumenti informatici non sofistichino troppo approccio al problema, cosa che rischia di spostare l'attenzione degli autori dai contenuti del "documento primario" che sta costruendo a riflessioni metafisiche sull'essenza del dato

  • gli strumenti di ricerca (per quanto sofisticati) tengano conto del periodo di training che tutti gli utenti devono fare (se possono).

Varrebbe la pena di sperimentare un sistema di produzione di testi di delibere (o di normative) che guidi l'utente/autore nella costruzione sia del testo in sé che della sua descrizione e che garantisca, con opportuni schemi predefiniti (XML et similia), la capacità dei web di interpretare ed offrire ai motori di ricerca informazioni (pointers) effettivamente utili.

Si conferma però anche l'importanza di progettare motori di ricerca adeguati alla complessità del problema (per esempio Normeinrete, che è in corso di sviluppo) soprattutto per le capacità e le garanzie di ranking dei documenti.

I progetti in corso sono molti e c'è il rischio che nessuno di essi, nel tentativo di prevalere, riesca a produrre uno standard diffuso ed accettato. Anche se, per fortuna, la peculiare natura dei metadati li predispone a incastrarsi fra loro in autoreferenziali e vertiginose strutture in cascata. Ad esempio, due importanti progetti che non dovrebbero entrare in contrasto col Dublin Core sono quelli relativi al Resource Description Framework (RDF) e al Warwick Framework.

Il Resource Description Framework (RDF), a cui sta lavorando il principale organismo di autogoverno della Rete, ovvero il World Wide Web Consortium, stabilirà - a livello informatico - il modo di descrivere qualsiasi tipo di documento disponibile in Internet mediante XML (un sottoinsieme di SGML), in modo da poter veicolare qualsiasi tipo di standard descrittivo delle risorse. Il Warwick Framework è invece una estensione del Dublin Core che consente di incorniciare al suo interno tanto un set di metadati ridotto come quello del Dublin Core quanto set più complessi predisposti per ambiti più specialistici.

Ulteriori informazioni sono reperibili alla pagina METADATI, STUDI E RICERCHE. PAGINE INFORMATIVE, che propone molti link e documenti reperibili in rete, e nell'articolo di Riccardo Ridi, Metadata e metatag: l'indicizzazione a metà strada fra l'autore e il lettore, pubblicato il 29 settembre 1999 sul sito web di AIB, citato prima.

(pagina aggiornata al 31/03/2000)

 
   
   
 
Cornice di chiusura