domenica 13 marzo 2011

i metadati delle immagini

Si sente dire spesso che "un'immagine vale più di 1000 parole". È vero. Ma è anche vero che un'immagine può porre dei quesiti a cui solo delle parole possono dare una risposta: in che anno è stata scattata la foto? chi è la persona ritratta? in che luogo si trovava?
Anni fa, poteva capitare di trovare alcune di queste informazioni scritte sul retro di una stampa, sul telaietto di una diapositiva, o su un portanegativi.

Oggi, in piena era digitale, queste informazioni sono solitamente contenute nei file che codificano le immagini: sono i metadati, informazioni strutturate che descrivono le immagini digitali.

Il grande vantaggio dei metadati è che possono essere manipolati da applicazioni informatiche, ad esempio per mostrare delle informazioni non immediatamente deducibili dall'osservazione delle foto, o per fare delle operazioni di ricerca all'interno di archivi di immagini.

Tuttavia, affinchè diversi software possano utilizzare i metadati delle immagini, è essenziale che questi siano strutturati e codificati in accordo a degli standard universalmente accettati.

Conformarsi ad uno standard significa fornire l'informazione in una forma che possa facilmente essere letta dalle persone e processata dalle macchine. Solo in questo modo si garantisce l'interoperabilità delle applicazioni nell'ambito dell'intero workflow fotografico.

Di standard ne esistono diversi.

EXIF è probabilmente quello più noto. Apparso nel 1995, è divenuto rapidamente uno standard di fatto.
Copre un vasto insieme di proprietà:
  • informazioni sulla struttura dei dati che codificano l'immagine (dimensioni, orientamento, numero di bit per pixel, ecc.);
  • impostazioni della fotocamera (tempo di esposizione, diaframma, ISO, lunghezza focale, modello e marca della fotocamera, ecc.);
  • data, ora e coordinate geografiche;
  • autore, copyright, descrizione, ecc.
In generale, le proprietà EXIF sono ricavabili automaticamente nel momento in cui l'immagine viene creata. Per tale motivo, la totalità delle fotocamere e degli scanner supportano lo standard EXIF, sia pure con con qualche differenza tra i vari produttori.
I metadati EXIF possono essere inglobati all'interno dei file JPEG e TIFF, ma non dei RAW.

IPTC IIM è stato sviluppato a partire nel 1991, quindi ben prima di EXIF, dall'International Press Communication Council (IPTC) per facilitare lo scambio di contenuti tra le agenzie di stampa e i giornali.
È uno standard focalizzato prevalentemente su proprietà ad alto livello, come localizzazione geografica (stato, regione, città), diritti, parole chiave, ecc..  Anche se non è generalmente supportato da fotocamere e scanner, molti software sono in grado di leggere e scrivere i cosiddetti IPTC header, che contengono i metadati IPTC IIM. Gli IPTC header possono essere codificati all'interno di immagini in formato JPEG o TIFF. I formati RAW non consentono invece di inglobare i metadati IPTC IIM.
Con lo sviluppo di XMP, Adobe ha progressivamente mappato le proprietà IPTC IIM su vari namespace XMP:

  • dc: Dublin Core
  • photoshop: Adobe Photoshop
  • xmpRights: Adobe Rights Management
  • Iptc4xmpCore: IPTC Core
  • Iptc4xmpExtensions: IPTC Extensions
  • Iptc4xmpIIM: IPTC IIM

XMP (Extensible Metadata Platform) è uno standard aperto, creato da Adobe nel 2001 e progressivamente adottato da molte applicazioni dell'industria dei media digitali. Non è infatti circoscritto alle sole immagini, ma è applicabile anche ai contenuti video, audio e testuali.
XMP definisce inoltre la sintassi per codificare i propri metadati all'interno dei principali formati di file.
I metadati XMP sono raggruppati in un certo numero di namespace, molti dei quali includono dei metadati già definiti nell'ambito di altri standard:
  • i namespace XMP EXIF e XMP TIFF contengono i metadati definiti dallo standard EXIF;
  • il namespace XMP IPTC Core contiene un subset dei metadati IPTC IIM;
  • il namespace XMP Basic contiene diversi metadati relativi alle date (di creazione, di digitalizzazione, di ultima modifica, ecc.), ai rating, ai tool utilizzati per creare o modificare l'immagine, ecc.
  • il namespace XMP DC contiene i 15 metadati definiti dallo standard Dublin Core (titolo, descrizione, parole chiave, data, diritti, autori, ecc.);
  • il namespace XMP Rights contiene un insieme di metadati che specificano i diritti concessi sull'immagine;
  • il namespace XMP Media Management contiene un insieme di informazioni utili a collegare tra loro le varie versioni e rendition di un'immagine nell'ambito di una piattaforma di Digital Asset Management;
  • il namespace XMP Photoshop contiene l'insieme di metadati originariamente definiti nell'ambito di Photoshop e codificati in un apposito header all'interno dei file JPEG e TIFF;
  • il namespace IPTC Extensions introduce una serie metadati propri dell'oggetto raffigurato nella foto, più che della foto stessa. Ad esempio, nel caso di una foto della Gioconda, la proprietà "Artwork or Object Creator" conterrà "Leonardo da Vinci", mentre la proprietà dc:creator conterrà l'autore della foto.
  • il namespace IPTC contiene le rimanenti proprietà IPTC IIM.
  • il namespace PLUS contiene diversi metadati relativi ai diritti (es. riferimenti a liberatorie rilasciate dalle persone ritratte). PLUS è infatti un'iniziativa no profit mirata a facilitare l'interscambio e la gestione dei diritti sulle immagini.
Succede che diverse proprietà XMP siano dei duplicati di altre proprietà presenti negli header EXIF, IPTC IIM e Photoshop. Di norma, le applicazioni che gestiscono i metadati mantengono allineati tali proprietà con quelle presenti in XMP, al fine di garantire la compatibilità all'indietro verso applicazioni che non supportano ancora XMP.

DISC (Digital Imaging Submission Criteria) è uno standard creato da IDEAlliance, un'ampia community di operatori delle creative industries.  DISC definisce un insieme di requisiti sulle immagini affinchè i produttori possano garantire il livello qualitativo richiesto per la pubblicazione in giornali, libri e riviste.
DISC copre vari aspetti relativi alla produzione di immagini, come il formato, la risoluzione, il DPI, il livello di compressione, lo spazio di colore, ecc..
DISC identifica un insieme di metadati che dovrà essere associato ad un'immagine affinchè questa possa essere inviata ai publisher.
Tutti i metadati DISC possono essere mappati su metadati XMP già esistenti. Pertanto DISC utilizza XMP per l'embedding dei metadati nei file.

Mpeg-7 è uno standard sviluppato dal Moving Picture Experts Group (famoso per aver creato vari standard di compressione audio/video) e dedicato alla descrizione dei contenuti multimediali. Formalmente denominato "ISO/IEC 15938 Multimedia Content Description Interface", lo standard Mpeg-7 definisce sia proprietà a basso livello, ricavabili  medianti operazioni di signal processing, che proprietà più ad alto livello, legate alla semantica del contenuto o al riconoscimento di parti che lo compongono (forme, facce, texture, ecc.).
Mpeg-7 è uno standard completo, ma anche molto complesso, e la sua adozione da parte dell'industria dei contenuti è ancora piuttosto limitata. Copre non solo le immagini, ma anche il video e l'audio. Molti metadati Mpeg-7, in particolare quelli ad alto livello (Mpeg-7 part 5, Multimedia Description Schemes) possono essere mappati su XMP. Le proprietà a basso livello potrebbero essere incluse in apposite estensioni XMP, tuttavia al momento non sono a conoscenza dell'esistenza di namespace Mpeg-7 per XMP.

NISO Technical Metadata for Digital Still Images (formalmente ANSI/NISO Z39.87 2006) è uno standard creato dalla National Information Standards Organization (NISO). Include essenzialmente proprietà a basso livello delle immagini. Non copre gli aspetti elativi ai diritti di proprietà intellettuale.
Il corrispondente schema XML è denominato MIX ed è mantenuto dalla Library of Congress.

MAG (Metadati Amministrativi e Gestionali) ...

METS (Metdata Encoding and Transmission Standard) ...

MARC 21 (MAchine-Readable Cataloging) ...

MODS (Metadata Object Description Schema) ...

Riferimenti:

Nessun commento:

Posta un commento