ACTUALITÉS

ChatGPT, Midjourney… et si nous démystifiions l’IA ?

Août 30, 2023

Portrait of Alfred Hitchcock working in the office of the Commission Supérieure Technique de l’Image et du Son.
À gauche : quatre étapes intermédiaires. à droite l’image finale (visiblement, Stable Diffusion nous considère assez désordonnés !)

Qui n’a pas vu passer ces images, générées par « l’intelligence artificielle » (IA), qui rejoignent désormais les chatons sur les réseaux sociaux ? A l’autre extrémité du spectre artistique, certaines de ces créations co-créées par les algorithmes sont parvenues à gagner des concours, comme ce fut le cas en 2022 à la Colorado State Fair et plus récemment lors du prestigieux Sony World Photography Awards 2023. Qui n’a pas encore testé ChatGPT, cet agent conversationnel qui semble avoir réponse à tout. Et qu’on le veuille ou non, ces IA s’installent dans notre quotidien : lorsque nous faisons une recherche vocale, lorsque nous trions nos photos selon les visages, ou lorsque nous suivons les recommandations de notre service de SVOD.

Pour nous, professionnels de l’image animée et du son à l’image, cela soulève de nombreuses questions tant les applications semblent nombreuses, et concernent toute la chaîne de valeurs. Les plus anxieux et les plus enthousiastes évoquent volontiers un changement de paradigme. C’est pourquoi nous vous proposons de découvrir à travers une suite d’articles, plusieurs utilisations réussies de l’IA dans des processus de création et de fabrication.

Mais avant d’entrer dans ces applications, nous voulions comprendre, au moins un peu, comment cela fonctionne… Nous nous sommes rapprochés de Louis Laborelli, ingénieur de recherche en IA depuis plus de vingt ans à l’INA, afin de vulgariser certains concepts du fonctionnement d’une intelligence artificielle : après une courte définition, nous expliquerons l’apprentissage profond et, plus précisément, ferons une ouverture sur la génération d’images.

Quelques définitions

L’Observatoire Européen de l’Audiovisuel, dans sa publication L’Intelligence artificielle dans le secteur audiovisuel” de 2020 nous propose deux définitions complémentaires de l’IA :

  • L’intelligence artificielle est l’« intelligence » dont font preuve les machines ou tout autre logiciel ou technologie lorsqu’ils effectuent une tâche.
  • L’IA est un domaine de recherche en informatique qui tente de comprendre l’essence de l’intelligence et de créer des machines intelligentes qui raisonnent et répondent en simulant l’intelligence humaine.

En tant qu’outil, il s’agit donc de logiciels dont le comportement tend à imiter l’intelligence humaine, en se basant sur des algorithmes plus ou moins complexes. Dans le domaine du jeu vidéo, on utilise ce terme pour le comportement de simples agents automates, comme ceux qui sont utilisés depuis des décennies pour piloter les déplacements d’objets selon la position d’un joueur. Cela peut être bien plus complexe comme les Deep Fakes, ces vidéos où le visage d’une personne a été remplacé par celui d’une autre, comme celui de Tom Cruise.

Nous connaissons un développement accéléré de l’IA depuis les années 2010 sous l’effet de plusieurs facteurs :

  • l’accroissement des capacités de calcul, notamment via les GPU ;
  • la capacité de stockage et d’accès à d’immenses quantités de données ;
  • l’apparition de réseaux d’apprentissage profond (RNP), qui sont des réseaux de neurones artificiels (RNA) composés de plusieurs couches de traitement.

Dans cette première partie de l’étude sur l’IA, retrouvez :

Les bases du fonctionnement d’un réseau de neurones

  • Apprentissage automatique
  • Apprentissage profond, ou deep learning en anglais
  • Réseau convolutif

La génération d’image

  • Réseaux Antagoniste Génératifs (GAN selon le sigle anglais)
  • Diffusion

Enjeux

  • Enjeux industriels et environnementaux
  • Enjeux légaux
  • Enjeux éthiques
  • Enjeux socio-économiques

Retrouvez l’intégralité de l’article écrit par Frédéric Fermon (CST) et Louis Laborelli (INA), dans la Lettre n°184.

Articles récents