06 gennaio 2010

Navigare negli archivi digitali e automatizzare il tagging

Sto leggendo un affascinante articolo di Alia Sheikh sul nuovo blog della BBC, Research and Development. Alia si occupa di navigazione "collaborativa" negli archivi sonori, cercando di elaborare alcuni concetti utili per la classificazione automatica dei contenuti. Il problema della digitalizzazione della nastroteca di un broadcaster riguarda, scrive la ricercatrice della BBC, non tanto l'aspetto della conservazione dei dati, quanto la successiva reperibilità del contenuto. Si tratta insomma di conoscere *prima* quanto stiamo riversando nell'archivio digitale per salvare insieme alle informazioni audio i "metadati" descrittivi che serviranno a guidare il fruitore dell'archivio. Se queste informazioni sono disponibili perché l'archivio analogico è classificato con criterio bene. Se i nastri sono "anonimi", invece che si fa?
Alia sviluppa il suo discorso a partire da alcune ricerche presentate in occasione dei "Mashed", gli incontri tecnologici del progetto Backstage della stessa BBC. Backstage è il nome dell'iniziativa che apre gli archivi della Beeb alla creatività di programmatori e utenti che vogliano sperimentare nuove forme di contenuto. Qualcosa che qui non vedremo MAI.
Due i concetti che intendo trasferirvi qui, prima di una vostra eventuale lettura dell'articolo di Alia. Il primo è il concetto di podcasting "enhanced", potenziato, reso possibile dall'uso di formati per metadati come ID3v2, la seconda versione di ID3, il linguaggio ormai universale per il tagging dei file .mp3. Con questi formati avanzati è possibile classificare un podcast in maniera molto più precisa, per esempio suddividendo il contenuto in capitoli e associando a ogni capitolo informazioni di testo e persino fotografie che verranno incluse nel file .mp3 (per essere visualizzati da un player compatibile).
Il secondo concetto è ancora più affascinante perché riguarda la possibilità di analizzare un contenuto e classificarlo con strumenti automatici. Alia mostra un esempio di un software della BBC che converte l'audio del file .mp3 in informazione grafica, con barre di diverso colore che permettono di "visualizzare" la struttura del contenuto sonoro. Il parlato sarà costituito da un pattern irregolare di barre di sottile colore, la musica e il canto avranno un andamento cromatico molto più regolare. Alia si sofferma su questi argomenti in un secondo post Navigating Audio, an Experimental Spiral, illustrato da un filmato purtroppo non accessibile da indirizzi IP stranieri. In compenso si può scaricare un white paper molto tecnico ma non per questo meno affascinante.
Affiancando le informazioni estratte automaticamente ai metadati tradizionali creati per esempio dagli archivisti, si possono costruire archivi digitali molto più facili da gestire e esplorare. Sempre che si vogliano costruire gli archivi, nevvero...
Potete sperimentare anche voi questi tool di conversione suono-grafico grazie al sito della BBC fortunatamente ancora attivo. L'indirizzo è http://mprr.kw.bbc.co.uk/cgi-bin/vis/avn (per accedere dovrete inserire "hackday" come userid e password). Potrete caricare un file audio non più grande di 50 megabyte e vi si aprirà un player con finestra di navigazione grafica:


Come potete vedere il clip che ho utilizzato come esempio (un programma di Radio3 dedicato all'Olocausto in Italia) risulta leggibile nelle sue fasi di scansione. Gli interventi del conduttore sono quelli in verde pistacchio tenue, le interviste che seguono sono più irregolari e seguono il timbro della voce dell'intervistato, mentre gli stacchi musicali sono regolari e uniformi e alcuni sono di colore violetto.

Nessun commento: