- Scopo e campo di applicazione
La norma descrive le procedure raccomandate per l'analisi dei documenti, la determinazione del loro contenuto e la scelta dei termini d'indicizzazione appropriati, senza occuparsi degli aspetti pratici di alcun tipo particolare di sistema d'indicizzazione sia pre-coordinato che post-coordinato. Descrive anche le tecniche generali per l'analisi dei documenti applicabili a tutti i casi di indicizzazione.
Le tecniche descritte dalla norma sono adottabili nell'ambito dell'indicizzazione 'umana' e non automatica.
La norma si propone come guida per gli indicizzatori nelle fasi dell'analisi e dell'identificazione dei concetti, ma può anche essere utile per analizzare le richieste degli utenti ai fini del recupero dell'informazione, o essere di aiuto ai compilatori di riassunti analitici.
Scopo della norma è promuovere procedure normalizzate nell'ambito di una organizzazione o fra diversi organismi, soprattutto quelli che scambiano notizie bibliografiche.
- Riferimenti
Altre norme correlate sono:
ISO 2788: Orientamenti per la creazione e lo sviluppo di thesauri monolingue;
ISO 5964: Orientamenti per la creazione e lo sviluppo di thesauri multilingue.
- Definizioni
La norma fornisce proprie definizioni per alcuni dei termini usati:
- documento
- qualsiasi unità, a stampa o no, che sia riconducibile ad un'operazione di catalogazione o di indicizzazione
- concetto
- un'unità di pensiero
- soggetto
- ogni concetto o combinazione di concetti che rappresentino un tema all'interno di un documento
- termine di indicizzazione
- la rappresentazione di un concetto sotto forma di un termine derivato dal linguaggio naturale o di un simbolo di classificazione
- termine preferenziale (preferito) o descrittore
- un termine usato coerentemente nell'indicizzazione per rappresentare un dato concetto
- termine non preferenziale (preferito) o non descrittore
- sinonimo o quasi-sinonimo di un termine preferenziale, che non viene assegnato ai documenti ma costituisce un punto di acesso da cui l'utente viene indirizzato al termine preferenziale
- indice
- una lista alfabetica o sistematica di soggetti che localizzi ciascun soggetto all'interno di un documento o di una raccolta di documenti
- indicizzazione
- l'azione di descrivere o identificare un documento nei termini del suo contenuto concettuale.
- Processi e scopo dell'indicizzazione
Nel corso del processo di indicizzazione i concetti sono estratti dai documenti mediante un procedimento di analisi intellettuale, quindi sono tradotti nelle voci.
L'indicizzazione è composta delle tre fasi seguenti:
- esame del documento e individuazione del suo contenuto concettuale;
- identificazione dei concetti principali presenti in un soggetto;
- traduzione nei termini di un linguaggio di indicizzazione.
- Analisi del documento
Con particolare riferimento per i documenti a stampa, le principali fonti per l'esame del documento e l'accertamento del contenuto sono:
- titolo e sottotitolo,
- riassunto analitico, se presente,
- indice o sommario,
- introduzione, frasi iniziali dei capitoli e dei paragrafi, conclusione,
- illustrazioni, diagrammi, tavole con relative didascalie,
- parole o gruppi di parole sottolineate o stampate con caratteri speciali.
E' assolutamente sconsigliato indicizzare valendosi solo del titolo.
- Identificazione dei concetti
Dovrebbe avvenire seguendo un approccio sistematico, con l'ausilio di liste di controllo dei fattori riconosciuti importanti nel campo disciplinare coperto dall'indice.
Le domande sottoelencate illustrano i criteri generali che tale lista di controllo dovrebbe stabilire:
- L'attività trattata dal documento è esercitata su di un soggetto particolare?
- Il soggetto contiene un concetto che indica attività (per es. un'azione, un'operazione, un processo, ecc.)?
- L'oggetto subisce l'attività identificata?
- Il documento tratta dell'agente di questa azione?
- Si riferisce a mezzi particolari per compiere l'azione (per esempio strumenti, tecniche o metodi speciali)?
- E' identificata una variabile dipendente o indipendente?
- Il soggetto è stato considerato da un particolare punto di vista normalmente non associato a quel campo di studio?
Altre domande possono essere identificate all'interno di ogni particolare disciplina.
La scelta dei concetti da selezionare e tradurre in termini di indicizzazione dipende dagli scopi previsti, dall'unità materiale che si sta indicizzando, ecc. Le due carattestiche influenzate da questi fattori sono
- l'esaustività, che si riferisce alla quantità di elementi che vengono rappresentati dai termini assegnati dall'indicizzatore al documento. Nella selezione dei concetti, l'indicizzatore dovrebbe sempre valutare la potenzialità di ogni elemento (concetto) per l'espressione del soggetto del documento e per il suo recupero, nel contesto del sistema informativo, della comunità di utenti, delle finalità dell'indice, senza porsi limiti arbitrari al numero di termini assegnabili al documento;
- la specificità, che riguarda l'esattezza con cui un particore concetto è specificato dal linguaggio d'indicizzazione. I concetti dovrebbero essere identificati il più specificamente possibile, fatta eccezione per i casi in cui l'eccessiva specificità possa influenzare negativamente le prestazioni del sistema d'indicizzazione.
- Scelta dei termini di indicizzazione
Giunto alla fase della traduzione dei concetti nei termini del linguaggio d'indicizzazione, l'indicizzatore dovrebbe:
- tradurre con termini preferiti i concetti già presenti nel linguaggio
- utilizzare strumenti di consultazione come dizionari ed enciclopedie disciplinari autorevoli, thesauri e tavole di classificazione per controllare i termini esprimenti concetti nuovi.
- Controllo di qualità e coerenza dell'indicizzazione
Qualità e omogeneità dell'indicizzazione dipendono da fattori come:
- l'esperienza e la competenza dell'indicizzatore
- la qualità degli strumenti d'indicizzazione.
In una situazione ideale, termini assegnati e livello di esaustività raggiunto dovrebbero essere coerenti indipendentemente dall'indicizzatore, e rimanere tendenzialmente stabili nel tempo. L'indicizzatore dovrebbe essere dotato di imparzialità, oggettività, di una conoscenza adeguata dell'area coperta dai documenti e delle lingue in cui i documenti sono scritti. Sarebbe bene anche che avesse momenti di contatto diretto con gli utenti per verificare sul campo l'efficacia delle loro indicizzazioni.
Il linguaggio dovrebbe essere flessibile, ammettere con facilità termini nuovi o variazioni terminologiche, essere in grado di rispondere alle nuove esigenze degli utenti, avere una politica di aggiornamento frequente.
La qualità dell'indicizzazione dovrebbe essere controllata analizzando i risultati del recupero, per esempio calcolando il rapporto fra richiamo e precisione.