trimestrale
- ISSN 1121-0095, ISSN elettronico
1594-2201 n. 1-2, anno 25, gennaio-giugno 2007
Organizzazione della conoscenzaCome mi vuoi, libero o controllato?
Claudio
Gnoli
Università di Pavia. Dipartimento di
Matematica. Biblioteca
Negli ultimi due anni, numerosi
sono stati gli eventi pubblici nei cui titoli compaiono termini nuovi
quali "collaborative indexing", "social tagging", "folksonomies" e
simili. Dapprima limitati a circoli di appassionati sviluppatori di
siti web e architetti dell'informazione, questi temi sono poi
gradualmente stati recepiti anche in contesti più tradizionali:
all'importante congresso annuale dell'American Society for Information
Science and Technology, svoltosi ad Austin lo scorso novembre, il workshop dello Special Interest Group on Classification Research aveva per titolo Social classification: panacea or pandora?;
questa espressione è una buona sintesi delle speranze e insieme
dei dubbi che i nuovi software per l'indicizzazione cooperativa stanno
suscitando.
L'idea di base è che il contenuto di un insieme di risorse
informative, disponibili sul Web, venga indicizzato mediante le
etichette (tag) che i loro
stessi fruitori liberamente scelgono di assegnarvi. Un po' come se in
biblioteca, restituendo un libro preso a prestito, il lettore
consegnasse anche un'intestazione di soggetto che secondo lui ne
rappresenta il contenuto, e questa venisse allora inserita nel
catalogo. Si tratta dunque di un sistema di organizzazione della
conoscenza, anche se fino ad ora decisamente insolito. La sua
diffusione è resa possibile dalle recenti tecnologie che
facilitano agli utenti la scrittura direttamente sul Web, senza passare
attraverso gli ostici comandi FTP usualmente necessari per aggiornare
un file in rete: la stessa idea è alla base dei blog, i diari online ai quali i lettori possono aggiungere i loro commenti, e dei wiki, i sistemi per la scrittura collettiva che hanno permesso la creazione di quella nuova meraviglia della Rete che è la Wikipedia.
Nel nostro caso, il lettore che accede a un documento sul Web, per
esempio un'immagine di Piazza del Campo a Siena, oltre a visionarlo
può decidere di contrassegnarlo con delle parole che la sua
mente associa a quel contenuto, come Siena o piazza, ma anche palio o luoghi incantevoli.
Come spesso succede, all'inizio queste diavolerie sono state usate
più che altro dai loro stessi creatori: molti dei siti
indicizzati in modo collaborativo trattano proprio di architettura
dell'informazione, così come molti nuovi sistemi di
classificazione vengono sperimentati su bibliografie di
biblioteconomia, che altre comunità di lettori troverebbero
noiosissime... Questo tipo di strumento, infatti, presuppone che il
lettore abbia tempo e voglia di cimentarsi anche con l'indicizzazione,
e ovviamente i più motivati saranno gli stessi appassionati
della sperimentazione del sistema.
Oggi però non mancano esempi notevoli di applicazione del social tagging:
uno di essi è Flickr, un sito molto noto in tutto il mondo sul
quale chiunque può liberamente depositare le proprie fotografie
e contrassegnarle con qualche tag;
dopodiché, oltre a visualizzarle, i visitatori possono a loro
volta contribuire a indicizzarle. Qualche decina di foto scattate
durante il secondo incontro ISKO [International Society for Knowledge
Organization] Italia all'Università di Milano Bicocca (un altro
caso di autoreferenzialità...) si possono trovare su Flickr, per
iniziativa di Bonaria Biancu e Susanna Dal Porto, attraverso i tagisko, iskoi, iskoi06, iskoi2 e bicocca. Naturalmente, il tagbicocca
potrebbe portare anche ad altre immagini che abbiano a che fare in
qualche modo con l'Università di Milano Bicocca, e magari anche
ad immagini di una catapecchia rimasta in piedi sull'Appennino
marchigiano.
Questi esempi cominciano a suggerirci quali siano i pro e i contro del social tagging.
Tra i primi c'è il fatto che chiunque può contribuire
all'indicizzazione, cosicché i lettori si sentono coinvolti nel
mantenimento delle risorse, a cui possono partecipare con una
tecnologia "democratica". Emanuele Quintarelli, uno dei primissimi in
Italia ad accorgersi del potenziale innovativo di questi sistemi,
intitola perciò Folksonomies: power to the people un suo articolo introduttivo che ha riscosso parecchio successo. Alla stessa idea fa riferimento il neologismo folksonomy, contrazione di folk e taxonomy,
ossia "tassonomia popolare". Questo sviluppo dal basso del sistema
piace anche a coloro che contestano i sistemi standard per
l'organizzazione della conoscenza (come la Classificazione Decimale di
Dewey o i Library of Congress Subject Headings) in quanto veicoli di
imposizione delle strutture del pensiero dominanti –
inevitabilmente quelle dell'Occidente contemporaneo, filoamericano,
maschilista e così via (si vedano il libro di Hope Olson, The power to name. Kluwer, 2002, e il lavoro di Francesca Severino,
insignito dell'EADI [European Association of Development Research and
Training Institutes] prize, sulla definizione del termine development nei tesauri internazionali).
Anche gli svantaggi, però, sono chiari. I tag
associati a ciascun documento si accumulano formando delle "nubi" che
non hanno alcuna sistematicità. È vero che in molti casi
il loro insieme può complessivamente dare un'idea del contenuto
che tutti insieme descrivono. Ma è vero anche che altri
documenti analoghi potrebbero essere stati etichettati in tutt'altro
modo. Questo significa che cercando il tagbicocca otterremo sì molti documenti che in qualche modo hanno a che fare con la parola bicocca, ma ce ne sfuggiranno anche molti altri indicizzati con etichette diverse, quali università o unimib. In altre parole, la nube di tag non è un vocabolario controllato.
La funzione dei vocabolari controllati, come i soggettari e i tesauri,
è proprio raccogliere i concetti sotto intestazioni standard,
alle quali i termini non preferiti rinviino, permettendo così di
effettuare ricerche precise ed esaustive. Gli indicizzatori
professionisti che usano sistemi standard rischieranno forse qualche
accusa di bigottismo reazionario, ma almeno producono un'informazione
attendibile e completa. A parere di alcuni il controllo del vocabolario
rimane uno strumento indispensabile, ed è forse per questo che
il coordinatore del Gruppo di ricerca sull'indicizzazione per soggetto
dell'AIB dichiara egli stesso di non riuscire neppure ad articolare la
parola folksonomy, con il suo arduo aggregato di consonanti, tanto ne sente geneticamente estraneo il significato!
Il problema del controllo del vocabolario, d'altronde, nasce ogni volta
che si prova a delegare l'indicizzazione agli autori stessi, dai quali
non si può pretendere né la competenza né il tempo
per applicare con cura dei sistemi di organizzazione raffinati.
È quello che è già successo negli anni scorsi con
l'introduzione dei metadati per descrivere il contenuto delle pagine
web, e poi dell'autoarchiviazione di articoli negli archivi aperti, al
momento della quale viene richiesto all'autore di classificare
sommariamente il proprio scritto. Ed è quello che succede
già da parecchi decenni con le parole-chiave assegnate dagli
autori. Non c'è da stupirsi che, in tutti questi casi, gli
indici risultanti siano poco strutturati e coerenti; sono comunque
meglio del niente che è la reale alternativa, quando abbiamo a
che fare con basi-dati di decine di migliaia di documenti in continuo
accrescimento: chi infatti potrebbe pagare degli indicizzatori
professionisti capaci di applicare ad esse un vocabolario controllato?
Se rinunciate al fai-da-te e chiamate uno specialista, il lavoro di cui
avete bisogno riuscirà senz'altro meglio, ma in compenso dovrete
pagarlo.
Nel caso delle tassonomie popolari, l'indicizzazione è affidata,
oltre che agli autori, anche ai lettori stessi, ed è questa la
loro novità. Tradizionalmente, invece, l'indicizzatore è
un terzo, un intermediario fra autore e lettore; e, come ha osservato
Riccardo Ridi (Metadata e metatag: l'indicizzatore a metà strada fra l'autore e il lettore,
congresso The digital library, Bologna 1999), la sua terzietà
offre sia il valore aggiunto della competenza che quello della
neutralità, almeno per quanto riguarda le motivazioni che lo
muovono, allo stesso modo di un giudice che media tra accusa e difesa.
Quando invece è l'autore a inserire i metadati, egli potrebbe
alterarli a proprio vantaggio, come succede nelle descrizioni di quarta
di copertina che esagerano l'attualità e la completezza del tema
trattato nel libro in vendita, o nei siti commerciali delle aziende che
millantano di essere le uniche nel territorio X ad offrire Y. La
questione di chi sia a compiere l'indicizzazione assume allora anche un
aspetto deontologico. Dietro i sedicenti democratici non potrebbero
nascondersi dei populisti? Il dibattito infuria, raggiungendo anche il
gruppo di discussione dei bibliotecari italiani (Google e folksonomy, settembre 2006).
Nel frattempo, anche gli stessi sostenitori dell'indicizzazione
cooperativa si rendono conto del problema di cui soffrono i propri
strumenti: dalle loro discussioni infatti emerge regolarmente la
questione della qualità degli indici, e in diversi suggeriscono
di contemperare l'alimentazione dal basso con qualche forma minimale di
coordinamento e gestione dei linguaggi. Così la Wikipedia si è dotata di una redazione centrale con maggiori poteri, e il progetto Facetag di Emanuele Quintarelli, Andrea Resmini e Luca Rosati propone di convogliare i tag entro faccette che ne strutturino meglio la semantica...
Le puntate precedenti di questa rubrica sono state pubblicate sugli ultimi due fascicoli di "AIDAinformazioni":