DigInPix, la bibliothèque d’entités visuelles développée par l’INA

Posté par Lea

diginpix logo
diginpix logo

C’était en Juin, il commençait déjà à faire chaud. On s’est engouffrés dans le métro parisien direction Art et Métier pour assister à “Futur en Seine”, le premier festival consacré au numérique et aux nouvelles technologies. Parmi toutes les innovations, l’une a particulièrement retenu notre attention : DigInPix, un site d’identification d’entités visuelles de l’INA qui croit fortement au crowdsourcing.

Métro odeur

C’est ainsi qu’on a rencontré Pierre Letessier, chercheur et doctorant dans le domaine de la vision par ordinateur à l’Institut National de l’Audiovisuel. Si un chercheur comme Pierre travaille à l’INA, c’est parce que cet organisme public n’est pas seulement chargé d’archiver les productions audiovisuelles. L’INA possède également un centre de formation et de recherche dont le dessein est de transmettre et d’inventer les savoirs dans les domaines de l’audiovisuel, des médias et du numérique. Pour nous aider à en savoir plus, Pierre Letessier a accepté de répondre à une interview exclusive.


Démo Diginpix par Ina_Communication

 

Bonjour Pierre Letessier, vous êtes chercheur au sein de l’INA. En quoi consiste votre métier ?

 

Pierre Letessier : En tant que chercheur je me renseigne sur le processus de documentation et je propose des outils pour améliorer le futur. Les métiers de l’Ina évoluent avec ses activités, et de nouveaux outils sont parfois indispensables. Je fais beaucoup de veille. En recherche, il faut savoir identifier les technologies pour les intégrer ou les améliorer si nécessaire..

Il faut aussi savoir échanger et écouter les besoins pour adapter nos prototypes, et tendre vers des outils utilisables.

photo (1)
Pierre Letessier – Chercheur à l’INA

 

Comment avez-vous eu l’idée de DigInPix ?

P.L. : L’idée première était de montrer le travail de l’INA en général et prouver qu’il pouvait aussi s’inscrire dans le futur en créant des choses innovantes. Un prototype accessible au grand-public nous permet à la fois de faire des démos, comme à Futur en Seine ou ICMR 2015 à Shanghai, et aussi de laisser les gens prendre le temps de l’utiliser sans contrôle de notre part.

DigInPix a été lancé il y a 6 mois, c’est encore au stade premier même si cette technologie demande à être mise à jour continuellement.

Aujourd’hui, nous souhaitons, avec Daniel Teruggi responsable du département INA-Expert, que ce projet suscite de l’intérêt mais aussi des collaborations industrielles et scientifiques. C’est aussi une façon de faire savoir aux marques que nous avons des outils permettant de localiser leur logos dans les fonds de l’Ina. On vient souvent nous voir pour accéder au « patrimoine audiovisuel » d’une marque. C’est l’une des raisons de la création de DigInPix.

 

 

DT

Daniel Teruggi – Responsable du département INA-Expert

 

 

Pouvez-vous nous en dire plus sur le dictionnaire de logo intégré au projet DigInPix ?

 

P.L. : Notre dictionnaire de logo contient aujourd’hui 25 000 logos différents, avec de 10 à 300 images par logo, pour un total de 600 000 images en tout. La liste a été faite à la main à partir de listes pré-existantes sur Wikipédia et autres. J’ai aussi développé un logiciel qui permet “d’aspirer” des images représentatives depuis Google Images à partir des noms des entités.

Pour le reste, nous fonctionnons avec un algorithme qui marche plutôt bien. Cependant pour des marques peu connues, il est difficile de trouver automatiquement des images représentatives sur Google Images. Il est aussi important de suivre une marque dans le temps et son évolution visuelle.

La question que l’on doit se poser pour l’avenir, c’est comment avoir un dictionnaire propre ?
Surtout que nous souhaitons enrichir DigInPix avec des oeuvres d’art, des bâtiments, des visages  ou des voix. Nous espérons pouvoir développer une interface qui fera appel au crowdsourcing afin de gérer nos dictionnaires, et de l’associer à des bases du Linked Open Data.

 

fes2
Pierre Letessier lors de sa présentation à « Futur en Seine »

 

Au niveau juridique, comment le droit de propriété s’exerce-t-il sur les identités visuelles ?

 

P.L. : DigInPix n’est pas un site à vocation commerciale, mais bien de démonstration scientifique, on est donc assez tranquilles sur la question du droit. Les vidéos sont couvertes par les droits d’exploitation de l’Ina. Pour les images du dictionnaire des logos, nous ne faisons qu’utiliser les images proposées par Google Images, et nous proposons à l’utilisateur un lien vers le site d’origine. Après si une marque ne veut pas apparaître sur notre site, il suffit qu’elle nous le fasse savoir et nous retirons les photos.

La législation est encore très floue sur ces aspects, ces usages sont apparus assez récemment, et le droit ne s’y est pas encore adapté.

 

Comment voulez-vous faire évoluer le projet ?

P.L. : Tout d’abord en continuant à améliorer notre algorithme, et surtout nos bases de connaissances. Nous envisageons aussi de nouvelles méthodes de travail, qui permettrait de faire cohabiter le travail des documentalistes de l’Ina, des internautes et aussi bien sûr des résultats de nos algos. C’est encore assez compliqué au niveau juridique. Cependant, le crowdsourcing est le futur et permettrait de nous aider. Comme le fait la BBC quand celle-ci propose aux internautes d’apposer des tags sur les émissions de radios non documentées.

Nous avons aussi développé un player web html5, Amalia.js, qui permet d’afficher les détections de DigInPix mais aussi de dessiner sur la vidéo ou encore de synchroniser du texte. Il est open-source, et on espère qu’il va être largement utilisé et amélioré.

 

En tant que professionnel et chercheur, quel regard portez vous sur les nouvelles technologies et leur utilisation ?

 

P.L. : Lorsque l’on est chercheur, vie privée et vie professionnelle sont parfois mélangées. Je ne cesse de réfléchir à mon sujet de recherche une fois rentré à la maison. Je m’intéresse en particulier beaucoup au rôle de la machine dans notre vie de tous les jours et dans les usages métiers de l’INA. Il est probable qu’un jour, les ordinateurs pourront remplacer l’homme dans la plupart des domaines, mais pour encore de très nombreuses années, le plus efficace pour obtenir de bons résultats sera de faire travailler l’homme et la machine ensemble. Les machines sont capables de travailler très vite, mais elles  manquent de données pour exploiter leur pleine puissance. A l’inverse, l’humain est capable de maitriser des concepts, et de s’adapter à différentes situations. L’association des deux pourra nous permettre d’annoter encore plus de vidéos, avec encore plus de mots-clés, et de répondre, plus rapidement, à davantage de requêtes utilisateurs.

Recevez nos conseils chaque mois en remplissant le
formulaire d’inscription à notre newsletter.

S'inscrire à notre newsletter

INSCRIVEZ-VOUS A NOTRE NEWSLETTER

Copyright CREADS 2008-2022