Jo'burg

Directive Copyright et Photographie : Identifier les images pour les rémunérer

Les GAFAM n’ont pas attendu la Directive Européenne pour mettre au service de certains ayants-droits des technologies d’identification de contenus multimédia puis de rémunération. Mais les contenus “simplement” photographiques n’ont pas encore droit à cette faveur.

 

Le Content ID de Youtube a pour mission de rejeter les vidéos des Youtubeurs lorsqu’un contenu protégé y est identifié. Ce service repose sur un programme de reconnaissance qui compare les nouvelles vidéos à mettre en ligne à des sons et vidéos déposés dans une base de données par des ayants droits.

Bien que ce service n’ait pas été conçu pour identifier des images fixes, rien n’empêche techniquement la création d’un Content-ID de la photographie.

Voici d’ailleurs les 3 principales techniques d’identification — déjà existantes et opérationnelles — sur lesquelles peut reposer un tel système.

 

-1- Identifier une image par ses métadonnées: basique mais fragile

Au début des années 1990, le schéma IPTC-IIM (modèle d’échange d’informations) d’origine a été développé pour organiser, systématiser et unifier la façon dont les informations relatives au cliché, les métadonnées, étaient stockées et transportées avec des images dans un format compatible à tous les logiciels.

Le schéma IPTC est rapidement devenu le standard de tous les logiciels de post-production (Photoshop, Lightroom, Capture 1, Photo Mechanic etc.) utilisés par les créateurs et les producteurs de contenus photographiques professionnels.

De ce fait, aujourd’hui, les photographes professionnels renseignent systématiquement les champs IPTC de copyright, description, source, date, lieux, mots-clés, etc. Ces métadonnées ont valeur d’information et d’identification pour les photographies.

Les agences photographiques fournissent des images aux éditeurs avec l’intégralité de ces métadonnées, parfois enrichies du type de licence. De facto, elles constituent le premier niveau d’identification des photographies.

Malheureusement les métadonnées sont effaçables. Les éditeurs de presse les suppriment, hormis une minorité d’entre eux, les plateformes de partage aussi. (Lire notre rapport sur l’état des métadonnées dans la presse).

credit or copyright metadata study on news web sites métadonnées de credit ou copyright sur les sites de presse

Comment les réseaux sociaux gèrent les métadonnées

 

-2- Identifier une image par similarité: peu fiable et coûteux

Il existe un deuxième niveau d’identification qui est celui de la similarité: par algorithme, une description des éléments distinctifs de l’image à identifier est comparée avec celles fournies dans une base de référence (la base des ayants droit).

C’est une technologie qui fonctionne bien avec les images très distinctives. Pour les autres, les résultats génèrent souvent une masse d’images proches, ce qui nécessite une vérification humaine dispendieuse.

 

-3- Identifier une image par watermark: sûr et efficace

Le troisième niveau d’identification est celui du watermark. Un filigrane, un marquage, un code dispersé et dissimulé dans les pixels, invisible, permet de certifier l’identité d’une image même entièrement dépouillée de ses métadonnées.

Pour être utile, le watermark inséré avant publication de l’image doit faire partie de ceux capables de résister aux manipulations courantes sur le web; compression, recadrage, inversement horizontal, etc.

 

Le futur: associer bonnes pratiques et bonnes techniques

Le premier niveau d’identification des images — grâce aux métadonnées — est une pratique d’ores et déjà adoptée par l’immense majorité des créateurs et producteurs d’images fixes.

Le troisième niveau d’identification qu’est le watermark permet de sécuriser le lien entre l’image et ses métadonnées d’origine lorsque celles-ci ont été effacées.

La conjugaison des niveaux 1 et 3 constitue un système d’identification fiable, économe en énergie, qui fait de plus en plus ses preuves sur le marché des news wire comme sur celui des grandes compagnies.

C’est vers cette solution que des projets comme celui du New York Times (The News Provenance Project) ou d’Adobe (CAI) s’acheminent, après avoir un temps évoqué le recours à une blockchain finalement mis de côté car trop vorace en énergie.

Reste à faire appliquer les lois existantes rendant illégale la suppression des métadonnées. Elles constituent des informations indispensables, qui ont une valeur, coûteuses à produire et qui permettent de vérifier la source et la paternité d’une image.

La conservation et l’affichage des métadonnées n’entraînent pas de coût supplémentaire alors que leur suppression est une catastrophe pour une information démocratique et un terreau idéal pour la multiplication des fake news.

Certains éditeurs conservent et affichent les métadonnées — c’est à terme leur intérêt bien compris pour la monétisation de leurs contenus — et certaines plateformes aussi — notamment Google Images — qui commencent à afficher les métadonnées des contenus qui en disposent.

Reste aussi à ce que plateformes et éditeurs aient l’obligation d’ouvrir leurs banques de données aux organismes collecteurs des ayant droits afin que puissent être identifiés les contenus partagés.