Métadonnées : explications de texte

métadonnées, en-tête

Les métadonnées ont envahi les clichés pris avec un appareil photo numérique (APN). Elles sont omniprésentes et fortement utilisées par de nombreux logiciels. Mais que sont-elles et à quoi servent-elles ? Beaucoup s’y perdent, s’interrogent. D’ailleurs, le sujet est tellement vaste que de nombreux éléments ne seront pas ici évoqués.

Notre but est de tenter de vous apporter quelques indications, afin de mieux comprendre et utiliser les métadonnées au quotidien. Car ces informations, souvent techniques, incluses dans les images ont une réelle utilité dans le quotidien d’un photographe, qu’il soit simple amateur ou professionnel.

Métadonnées, quelques généralités

Pour commencer, une explication de texte

En anglais, on parlera de metadata et en français de métadonnée. Le préfixe méta est d’origine grecque et signifie « tout ce qui suit, ce qui change, ce qui participe de ». Avec le temps, il a pris aussi un sens voisin, « ce qui dépasse, englobe ». Littéralement, une métadonnée est une donnée englobant une donnée… Le concept n’est pas aussi complexe que l’on pourrait penser.

Dans le cas d’une image prise par avec un APN, la donnée est la photo et les métadonnées sont des informations sur la photo.

Afin de pouvoir exploiter correctement une image, surtout quand on en a beaucoup, on doit pouvoir la trouver facilement et disposer d’informations sur elle. Savoir ce qu’elle représente, qui en est l’auteur, comment le contacter, etc. C’est le rôle des métadonnées. Et elles sont multiples. Cela ira de la marque et du modèle de l’appareil photo à l’endroit où le cliché a été pris (les coordonnées GPS) et bien d’autres informations. Elles ont été organisées en catégories et ont été standardisées, du moins sur le fond, sinon sur la forme. Il s’agit des EXIF, des données IPTC et balises XMP.

Universel ?

Non, malheureusement, pour plusieurs raisons :

  • Tous les fichiers « images » ne sont pas en mesure d’intégrer des données EXIF, IPTC et XML. C’est le cas pour le JPEG2000 ou le PNG (du moins avant la version 1.5.0). Le JPEG ou le TIFF le peuvent sans problème. Les RAW également. Les métadonnées étant intégrées au conteneur, au même titre que les données brutes du capteur, la petite image JPEG pour l’aperçu et autres informations.
  • Si une partie des métadonnées est standardisée, une autre est beaucoup plus libre, avec comme conséquence, une incompatibilité entre les logiciels qui les lisent.

Les métadonnées sont devenues tellement utiles pour les systèmes d’exploitation (Windows, macOS, iOS, Android, Linux et autres) et autres logiciels qu’elles ont envahi d’autres types de fichiers, qu’ils soient audio, vidéo, feuilles de calcul, etc.

Les EXIF

Le terme EXIF est un acronyme dont la signification est EXchangeable Image file Format. Il s’agit d’un groupe particulier de métadonnées, bien défini, concernant un cliché numérique. Les métadonnées EXIF n’ont pas vocation à être modifiées. Il est néanmoins possible de le faire, en fonction des intérêts personnels (par exemple, si on a besoin de modifier l’heure de la prise de vue du cliché si le boîtier était mal réglé…). Mais cela n’est pas recommandé.

Ces informations sont ajoutées et stockées dans la photo, à côté de l’image proprement dite. En pratique, chaque donnée est composée d’un identifiant et d’une valeur, écrits dans une codification quasiment illisible pour le commun des mortels. Si cela a comme avantage d’occuper peu d’espace dans le fichier, il faut un logiciel dédié (une visionneuse EXIF) pour interpréter et rendre compréhensible. Heureusement, les logiciels incluant cette visionneuse sont nombreux, à l’instar de Aperçu, le logiciel standard (et gratuit) pour macOS. L’équivalent sous Linux et Windows fait de même.

L'image et les exif
La visionneuse des Exif, version Aperçu (macOS)

 

On y trouve quoi ?

Les Exif comportent des données relatives à l’appareil photo, comme le numéro de série, l’objectif employé (marque, modèle, focale). Mais aussi des valeurs liées à la prise de vue, comme l’ouverture, le temps de pose (la vitesse), la date et l’heure, le mode et la correction d’exposition, la balance des blancs, l’usage du flash ou encore la distance. J’en oublie. Ce sont toutes les informations qui vont caractériser les clichés.

Elles sont organisées en un ensemble de sections presque toutes normalisées. Sauf la partie consacrée aux informations propres au fabricant ou à l’éditeur du logiciel. Ces derniers peuvent y mettre ce que bon leur semble, à l’instar de Fujifilm qui y fait figurer la simulation de film et l’extension de dynamique.

Évidemment, cela ne facilite guère le travail des développeurs de logiciels, lesquels ont parfois bien des problèmes pour en décoder le contenu et le présenter intelligemment.

Ces EXIF ont été établis par le Japan Electronic Industry Development Association (JEIDA) qui continue à faire évoluer les spécifications.

À quoi servent les EXIF ?

Il existe principalement deux utilisations aux EXIF :

  • faciliter la gestion des photos grâce aux outils de filtrage et de tri des visionneuses et autres catalogueurs qui en tiennent compte.
  • améliorer sa pratique photo par confrontation de l’image et des paramètres techniques de prise de vue.
Les filtres Lightroom basé sur les EXIF, ou comment trier et retrouver des clichés
les filtres Lightroom basés sur les EXIF, ou comment trier et retrouver des clichés

 

Les IPTC

Il s’agit de la deuxième catégorie de métadonnées. L’IPTC (International Press and Telecommunications Council) est à l’origine une organisation créée en 1965, visant à développer et promouvoir des standards d’échange de données pour la presse. Le but originel était de faciliter la recherche de photos, en standardisant la manière d’écrire et de référencer les descriptions des clichés et des auteurs.

Ce groupe de métadonnées a hérité du nom de l’organisme inventeur. Du temps de l’argentique, ces données étaient écrites sur des fiches, toutes mises dans des classeurs ou autres tiroirs. Avec l’avènement du numérique, ces données ont été intégrées directement aux fichiers.

Un ensemble normalisé

Les IPTC sont des données normalisées au nombre de 33. Officiellement. Il arrive en effet qu’elles soient plus nombreuses, certains logiciels en ajoutant. Elles sont importantes, car elles décrivent une image, permettent de connaître son auteur et lui donnent le maximum de chances d’émerger lors de recherches par mots-clés. Ces métadonnées permettent donc de décrire chaque photo précisément et de manière exhaustive.

En y ajoutant au minimum un titre et une légende, elles permettent de se souvenir du contexte de la prise de vue. Ce qui est utile des années plus tard, afin d’éviter qu’une photo de guerre prise en Afghanistan soit utilisée pour illustrer un article consacré au Mali. Par contre, cela nécessite une implication très importante de la part du photographe et/ou des collaborateurs face à cette de tâche de catalogage ! Patience et méthodologie sont nécessaires.

Elles sont divisées en deux groupes, les IPTC Core et les IPTC Extension. Les données IPTC Core indiquent qui est le photographe et décrivent la photo. Certains champs sont également réservés pour des données « administratives » et les droits de diffusion. L’autre groupe, les IPTC Extension, apporte un surcroit descriptif sur ce qui est photographié (modèle, objet…).

Les IPTC sont écrites directement dans les fichiers TIFF et JPEG. Pour les RAW, elles sont placées dans le conteneur. Attention, contrairement aux EXIF, ces données ne sont pas visibles pour tous les logiciels traitant les images. Souvent, il faut utiliser un logiciel avancé, de type DxO, Adobe LR, Capture One et autres.

33 champs à remplir ?

Évidemment, en tant que photographe amateur, vous n’êtes pas obligé de remplir les 33 champs. Même les agences traitant les photos ne le font que rarement. Néanmoins, certaines données pouvant se révéler utiles par la suite, notre conseil sera donc d’en remplir certains. Surtout si vous diffusez vos photos sur Internet. Ces champs, que l’ont pourrait qualifier d’obligatoires, ou du moins nécessaires, sont les suivants :

  • Auteur (By-line) : indique le nom de l’auteur de la photo (vous en théorie)
  • Date de création (Date created) : la date de prise de vue de la photo, généralement remplie automatiquement par votre appareil photo (n’oubliez pas de régler correctement ces données dans votre boîtier)
  • Ville (City) : la ville où a été prise la photo. Si vous remplissez ce champ, il est alors conseillé de remplir au moins les 2 champs qui suivent, à savoir la région et le pays
  • Titre (headline) : le titre donné à la photo. Ce champ est très utile si vous faites une série ou un reportage, car vous pouvez taguer toute les photos avec le même titre, ce qui faciliter les recherches.
  • Copyright : Il y a 3 champs servant à indiquer l’état du copyright et les conditions d’utilisation d’un cliché.
quelques champs « indispensables »
quelques champs « indispensables »

 

Les IPTC peuvent être remplis à tout moment, soit manuellement dans votre logiciel, soit au moment de l’importation des photos dans le logiciel de catalogage, soit directement au travers de votre boîtier.

Les mots-clés

Les mots-clés méritent une attention particulière. Le champ « mots-clés » est un outil indispensable pour gérer une base de données image. Il s’agit de données enregistrées dans la base de données du logiciel de catalogage et qui sont incluses dans les EXIF et IPTC au moment de l’enregistrement de l’image. Une opération pas toujours automatique selon les logiciels !

Les mots-clés posent un problème important, car il n’y a pas de réelle standardisation en la matière. Chaque éditeur gère à sa façon et personne ne tient compte de ce qu’a fait son voisin (sauf exception). Ainsi, DxO ne verra pas les mots-clés inscrits avec Adobe Lightroom ou CaptureOne ou ACDSee (ou autres). Et vice-versa. Ce qui est particulièrement pénible au vu de leur utilité.

Utile ?

Oui. Les mots-clés sont des métadonnées à ne pas négliger parce qu’il s’agit des termes décrivant le contenu d’une photo. On peut affecter plusieurs mots-clés à la même image et mélanger des noms de villes, de pays, une méthode de prise de vues, une façon particulière de post-traiter, un ou des évènements et même des noms de personnes. Il n’y a guère de limites, hormis votre imagination et le nombre de caractères maximal (2000). Plus la base photographique est d’importance, plus il faut apporter un soin particulier à ces opérations.

L’ajout de mots-clés peut se faire à tout moment de la vie de la photo, y compris lors de l’importation dans votre logiciel de catalogage. D’ailleurs, mettre au moins un mot-clé lors de cette phase doit être une bonne pratique. Par exemple, si vous allez faire des photos au château de Hautefort, vous pouvez indiquer comme mots-clés « Château de Hautefort » et « Périgord ». Voire même « château » si vous avez un parent regroupant tous les chateaux que vous avez photographiés

Organisées, hiérarchisées

Le photographe va constituer des listes ordonnées, qui vont du général vers le particulier. Par exemple :

Animaux au premier niveau

Chat, chien, serpent au deuxième niveau

et pour le mot-clé chien, en troisième niveau, on pourra mettre berger allemand, berger belge, beauceron, saint-bernard, chihuahua, etc.

 

Évidemment, cela pose rapidement un problème de vouloir tout énumérer, classifier. Et cela n’a pas grand intérêt, à moins d’être un photographe professionnel spécialisé. Il s’agit donc de trouver le niveau de précision suffisant par rapport à sa ou ses pratiques photo. Par exemple, si vous aimez comme moi voyager, vous pouvez vous constituer une arborescence qui partira de « monde » vers les continents, les pays, puis les régions et enfin les lieux. Dans ce cas, « Monde » est le parent initial avant la hiérarchie continent et au dessous. Vous pouvez évidemment appeler ce parent initial autrement  

métadonnées : hiérarchie de mot-clés
une hiérarchie de mots-clés

 

Un travail en amont

Cela présuppose de mener un vrai travail de réflexion… sur papier, avec gomme et crayon. En n’oubliant pas de se donner le temps de la réflexion. Il est important que votre liste de mots-clés reflète le mieux possible vos photos. Tout en évitant quelques pièges classiques, comme mot au singulier/mot au pluriel (toujours au singulier), les doublons, les homonymes et les synonymes ou encore l’utilisation de plusieurs langues.

N’hésitez pas à utiliser des termes génériques également. Parfois il vaut mieux utiliser des concepts tels que joie, tristesse en lieu et place d’un vocabulaire décrivant ce qui est effectivement représenté dans l’image. Les mots-clés peuvent être hiérarchisés, mais la plupart du temps, cette dépendance hiérarchique n’existe que visuellement. L’affectation d’un mot-clé situé à un niveau inférieur d’une hiérarchie ne provoque pas automatiquement l’affectation des mots-clés correspondants des niveaux supérieurs. Sauf paramétrage particulier de votre logiciel.

Une indexation détaillée et pertinente suppose un travail long et fastidieux. Raison pour laquelle la plupart du temps, on n’indexe au départ que certaines valeurs. Surtout celles que l’on peut saisir par lot (genre pays, ville, le cas échéant le nom d’une personnalité, etc.). Par la suite, on sélectionnera certaines images que l’on renseignera en détail. Tout dépendra des objectifs visés. La seule « vraie » contrainte qu’il convient de s’imposer est de trouver sa classification (thématiques et choix des mots-clés) et, surtout, de l’appliquer de manière régulière.

Une précision à destination des professionnels sur les IPTC. Ces derniers comportent une codification numérique et hiérarchisée avec un thésaurus prédéfini à respecter.

Trouver des thésaurus tout faits

Un thésaurus est une liste ordonnée, parfois hiérarchisée, du vocabulaire normalisé employé pour décrire un ou plusieurs thèmes. Il est issu du travail de réflexion précédemment cité. Le but étant toujours d’indexer des informations pour en faciliter la recherche selon des critères précis, cette tâche peut s’avérer complexe. Heureusement, il existe des ensembles de mots-clés, des thésaurus préparés par d’autres et qui sont mis à disposition sur le Web. Ces thésaurus peuvent être des sources d’inspiration, mais rien ne vous empêche de les adopter s’ils vous conviennent.

  • Le blog Aube Nature propose des thésaurus liés à la photo de nature. Petit plus, ils sont en français. Un merci à l’auteur, Cédric G.
  • Sur GitHub, on trouve également des thésaurus collaboratifs, en anglais et en français. Vous y trouverez aussi un thésaurus IPTC !
  • Sur Photo-Keyword, les thésaurus sont en anglais. Mais rien ne vous empêche de les traduire s’ils vous semblent utiles.
  • Sur fyve.net, vous trouverez des thésaurus sur les pratiques photo, les pays du monde, la France ou encore Paris.

Pour les importer, il faut trouver la partie du menu (ou la boîte de dialogue / de paramétrage) qui gère les métadonnées. C’est souvent là qu’on trouvera comment importer ces listes de mots-clés.

Les métadonnées XMP de développement

Les logiciels comme Capture One, DxO, Lightroom ou ACDSee (liste non exhaustive)  travaillent de manière non destructive, n’intervenant pas sur l’image directement. Au contraire des logiciels de type Photoshop qui modifient l’image elle-même. C’est uniquement lors de l’exportation d’une photo en TIFF, JPEG, PNG ou autre, qu’une version « définitive » du cliché va exister réellement, en tenant compte de vos traitements. En pratique, pour chaque image, le logiciel va écrire dans un fichier au format XML (Extensible Markup Language) tout votre traitement. Ce fichier sera conservé soit dans le même dossier que le fichier de votre cliché soit inclus dans le DNG contenant le RAW (si le conteneur DNG est utilisé).

Le XML est un langage de structuration de données, utilisé notamment pour la gestion et l’échange d’informations sur Internet. L’extension d’un fichier de ce type est .xml et il est lisible facilement au travers d’un éditeur de texte, type Notepad ou SimpleText.

métadonnées XMP
extrait d’un fichier XMP décrivant le développement d’un fichier RAW sous LR

 

Il s’agit là d’une catégorie bien particulière de métadonnées sur laquelle on ne peut agir directement. Mais pourtant, c’est bien grâce au travail effectué lors de l’utilisation de votre logiciel de développement RAW que vos images vont « exister ». Ces métadonnées sont précieuses et doivent être conservées.

Le fichier XMP est écrit dans un langage plus ou moins compréhensible. Il n’empêche qu’il n’existe aucune compatibilité entre les différents logiciels de post-traitement. DxO ne sait pas lire un fichier en provenance d’ACDSee ou Capture One. Et inversement. Les moteurs de développement RAW sont propres à chaque éditeur et incompatibles entre eux. On peut donc avoir autant de fichiers XMP par cliché que de logiciels utilisés.

Pour terminer…

Les métadonnées, c’est bien et c’est nécessaire… pour vous et/ou vos ayants droit. Mais à trop les renseigner, des problèmes de protection de certaines informations peuvent apparaitre. Lors de la diffusion à des tiers, vous risquez en effet de partager involontairement des informations non souhaitées. Il faut savoir quelles métadonnées sont contenues dans un fichier avant de le communiquer. Effacer les informations des images peut être aussi important que de les y intégrer. Comme les données GPS exactes de la prise de vue d’un paysage ou des indications personnelles sur les personnes présentes sur le cliché…

  • CYv
    29 septembre 2021 at 11 h 53 min

    Merci pour cet article. Cela représente du travail, bravo.

  • Dominique G
    1 octobre 2021 at 8 h 12 min

    Bonjour

    Je suis d’accord aussi que c’est un sujet important et bien développé ici.
    J’en profite pour féliciter l’équipe pour la nouvelle mise en page du site, que je trouve plus claire.

    • F.
      1 octobre 2021 at 8 h 24 min

      Merci. Je suis très content que ce sujet vous intéresse. Cela fait plaisir et montre que nous allons dans la bonne direction.

      Concernant la clarté, la lisibilité du site, nous essayons d’y tendre. Reste que cela n’est pas toujours facile, il faut composer avec quelques contraintes. Si la nouvelle mise en page est plus claire que la précédente, alors tant mieux.

  • Françoise
    9 octobre 2021 at 5 h 56 min

    Merci pour cet article. Il a le mérite d’éclaircir ce terme. qui jusqu’à présent était pour moi assez obscur.
    Donc effectivement, si j’ai bien compris il ne faut pas les inclure lors de l’export de nos photos

    • F.
      9 octobre 2021 at 6 h 18 min

      Oui… et non. Tout va dépendre de la destination de l’image… et de ce que vous souhaitez divulguer.
      exemple 1 : le copyright, votre nom d’auteur, le boitier utilisé sont des données qui peuvent être utiles.
      exemple 2 : votre adresse personnelle, les coordonnées GPS du lieu de la prise de vue, etc. peuvent être des données que vous ne souhaitez pas partager.

      Ce qu’il y a de bien, c’est que vous êtes en mesure de décider. Gardez en tête que les métadonnées sont des données très utiles pour vous en premier.

  • Clofoto
    12 octobre 2021 at 21 h 19 min

    Article intéressant et synthétique. [fin supprimée]