Rencontre autour de l'IA à la Femis par Antoine Martin
Les 2 et 3 avril derniers ont eu lieu un important cycle de conférences autour de l’intelligence artificielle (IA) à La Fémis, ayant pour thématique centrale : « L’intelligence artificielle : quels impacts sur la création et les métiers du cinéma et de l’audiovisuel ? ». Cela fait écho à la table ronde organisée un mois plus tôt au Micro Salon ainsi qu'à la Cinémathèque Française où l’on se demandait déjà si l’IA allait carrément « remplacer les cinéastes ? ». Parmi les intervenants à la Fémis, Nicolas Becker (sound designer et musicien), Nicolas Obin (chercheur à l'Ircam), Lexx Lester (producteur de musique et développeur de Bronze AI), Erwan Kerzanet (ingénieur du son) et Pierre Lanchantin (développeur) ont notamment abordé leur expérience de l’IA dans les processus de création sonore.
______
Le sujet est omniprésent ; il s’invite dans les dîners de famille, sur les plateaux télé, et jusqu’aux plus hautes strates de la société puisque le Parlement européen a adopté le 13 mars 2024 une loi historique sur l’intelligence artificielle, baptisée « AI Act ». Les mots d’ordre de ce texte : ambition et innovation, mais aussi transparence et confiance. C’est la première loi contraignante au monde sur l’intelligence artificielle, dont le but est d’encadrer les usages de l’IA et de garantir le respect des droits fondamentaux des citoyens européens. Le co-rapporteur Dragos Tudorache a déclaré « L'IA nous poussera à repenser le contrat social au cœur de nos démocraties, nos modèles éducatifs, nos marchés du travail et la manière dont nous menons les guerres. Nous devons maintenant nous concentrer sur la mise en pratique de cette législation. ». Sacré programme…
Aujourd’hui, tous les corps de métier, et en majorité ceux des services et du numérique, sont amenés à voir leurs pratiques bouleversées par l’arrivée de l’IA et de ses vastes potentialités d’automatisation. Les métiers de la création ne seront pas épargnés puisque l’IA, et en en particulier l’IA générative (IAG), progresse à une vitesse exponentielle, promettant d'accélérer considérablement les flux de travail.
Le cycle de conférences à La Fémis a vu défiler divers acteurs et actrices du monde du cinéma - techniciens, auteurs, réalisateurs, chercheurs et juristes - pour discuter en profondeur de ces évolutions technologiques et de leur impact potentiel sur notre industrie cinématographique. Voici un bref résumé de ces deux jours d'échanges.
L’IA, qu’est ce que c’est ?
L'intelligence artificielle est tout simplement la capacité qu'ont les machines à imiter le comportement humain. Imaginez un cerveau humain, avec ses milliards de neurones interconnectés. Et bien les scientifiques ont créé des réseaux de neurones artificiels, qui sont des programmes informatiques conçus pour traiter des informations de manière similaire à notre cerveau. Ces réseaux sont entraînés à partir de vastes ensembles de données (data set) afin d'apprendre à effectuer des tâches spécifiques, comme reconnaître des images, traduire des langues ou même écrire un film.
Ce paragraphe explicatif a été rédigé en un clic par le modèle de langage ChatGPT, et je dois avouer que je n’aurais pas fait beaucoup mieux… Mais je vous le promet, c’est bien moi qui reprend la plume à partir de maintenant.
Comme l’a rappelé Antonio Somaini, professeur à l’Université Sorbonne Nouvelle, on distingue deux types d’intelligence artificielle. D’un côté l’IA analytique, qui correspond à un vaste système de détection, de reconnaissance et de classification permettant d’automatiser un grand nombre de tâches opérationnelles, comme par exemple : faire de la comptabilité, de la gestion des risques, de l’aide aux diagnostiques médicaux, mais aussi du contrôle et de la surveillance de masse. L’IA générative peut de son côté synthétiser à partir d’une instruction donnée (un prompt) du texte (ChatGPT) des images (Dall-E, Midjourney), des sons (ElevenLabs, AudioBox, Suno) ou encore des vidéos (Sora).
Durant ces derniers mois, les technologies d’IAG ont progressé à une vitesse fulgurante. Les vidéos générées artificiellement il y a quelques mois étaient tout simplement abominables, et elles sont aujourd’hui confondantes de réalisme. Les modèles sont de plus en plus capables de produire des textes, des images et des sons indiscernables de s’ils avaient été conçu par un être humain. L’IA modifie donc en profondeur la manière dont les images et les sons sont captés, générés, modifiés et reçus.
Comment s’en servir ?
Le rapport du CNC autour de l’IA datant de mars 2024 relève trois principaux cas d’usage de l’IA pour la filière cinématographique : stimuler la créativité, gagner en efficacité et ouvrir de nouvelles possibilités. On observe que l’IA est d’ores et déjà très présente aux différentes étapes de la conception d’un film, dès son développement jusqu’à sa post-production.
Marianne Carpentier, directrice de l’innovation et des technologies chez Newen, nous explique comment l’IA permet d’améliorer les flux de travail sur les tournages de séries TF1 Séries, en éditant automatiquement les feuilles de services pour toute l’équipe et en mettant à jour en temps réel les scénarios des comédien·es en cas de modification inopinée. Elle soulève également le fait que l’IA permette de mieux vendre un projet à des producteurs potentiels, en réalisant facilement des mood boards ou des bandes-annonces à partir de prompts.
Rodolphe Chabrier, superviseur VFX et co-fondateur de Mac Guff, et Olivier Osotimehin, superviseur CG chez FixStudio, indiquent que l’IA permet d’améliorer drastiquement la productivité et de réduire les coûts dans le domaine des effets numériques. Retoucher, voire remplacer complètement le visage d’un·e comédien·ne (deepfake) n’a jamais été aussi peu coûteux, tout comme modéliser des cascades ou des décors.
Quant à moi, Antoine Martin, responsable recherche et développement chez Poly Son, je dresse un tour d’horizon des possibilités offertes par l’IA dans la post-production son, que ce soit pour faire du clonage vocal, de la restauration sonore, de la génération de musique, du sound design, du doublage ou encore du bruitage automatique… Attention, le futur que je souhaite n’est évidemment pas un monde où des IA fabriqueraient les films à notre place, mais il est important de faire un état des lieux de l’avancée de ces technologies car c’est toute notre filière qui risque d’être impactée par ces outils permettant d’effectuer des tâches de plus en plus complexes, toujours plus rapidement et pour des coûts dérisoires !
Quels seront les impacts sur la filière ?
En plus d’un risque évident pour nos emplois, le CNC évalue plusieurs impacts à long terme liés à l’évolution de ces technologies : impact environnemental, perte des savoir-faire traditionnels, uniformisation et appauvrissement culturel.
Pour le volet son, étaient invité Nicolas Becker (sound designer et musicien), Erwan Kerzanet (ingénieur du son) ainsi que les chercheurs Nicolas Obin (Ircam) et Pierre Lanchantin, spécialistes de la voix de synthèse et Lexx Lester (producteur de musique) qui a développé un outil de composition musicale basé sur l'IA et utilisé par Nicolas Becker pour l'exposition sur Basquiat à la Philharmonie de Paris. Erwan Kerzanet et Nicolas Obin ont collaboré sur le film Annette pour étudier la faisabilité du morphing de la voix de Marion Cotilllard. Nicolas Becker et Erwan Kerzanet travailllent ensemble sur le nouveau film de Philippe Parreno pour lequel la voix occupe une place centrale. « L’IA n’est pas une fin, c’est un outil d’expérimentation comme un autre ! Quand on fait un film, on est moins là pour raconter une histoire que pour vivre une expérience commune. » Le premier nous parle de son expérience sur le film « Le Règne Animal » de Thomas Cailley et le second sur la comédie musicale « Annette » de Leos Carax. Ce sont deux films où l’IA a été envisagée en post-production pour retravailler les voix - dans un cas pour hybrider une voix humaine avec un chant d’oiseau, et dans le second pour faire chanter Marion Cotillard comme une soprano virtuose. Or dans les deux cas, ce sont des solutions « artisanales » qui ont été préférées à l’IA. Dans « Le Règne Animal » tout comme dans « Annette » les comédien·nes ont poussé les curseurs de leur performance au maximum en s'entrainant avec d'autres personnes (chanteurs d'oiseaux et chanteuse d'opéra) et soutenus par un travail de montage-son et de sound design minutieux, cela a donné les résultats exceptionnels entendus dans ces films. L'IA est un outil qui sert à explorer et résoudre des tâches intermédiaires mais dans l'ensemble des projets et réalisations évoqués lors de cette rencontre, l'IA est restée à sa place d'outil. Les finalités artistiques ne peuvent échapper à l'humain tant que l'humain a besoin de s'exprimer. Dans le contexte de Annette, le travail imitatif d'une actrice auprès d'une chanteuse a donné place à une forme d'apprentissage (learning) qui a permis de laisser sa place à la mise en scène, au travail de l'humain avec l'humain, non seulement comme intelligence mais comme corps pensant et comme machine désirante.
Pour le volet son, étaient invités Nicolas Becker (sound designer et musicien), Erwan Kerzanet (ingénieur du son), les chercheurs Nicolas Obin (Ircam) et Pierre Lanchantin, tous deux spécialistes en synthèse vocale, ainsi que Lexx Lester (producteur de musique) qui a développé un outil de (re)composition musicale basé sur l'IA et utilisé pour générer des formes de « bandes-son infinies » pour l’exposition « Basquiat Soundtracks » à la Philharmonie de Paris.
Nicolas Becker et Erwan Kerzanet travaillent ensemble sur le nouveau film de Philippe Parreno pour lequel la voix occupe une place centrale., et ils nous préviennent : « L’IA n’est pas une fin, c’est un outil d’expérimentation comme un autre ! Quand on fait un film, on est moins là pour raconter une histoire que pour vivre une expérience commune. » Nicolas Becker nous parle alors de son expérience sur le film « Le Règne Animal » de Thomas Cailley, et Erwan Kerzanet et Nicolas Obin de la comédie musicale « Annette » de Leos Carax. Ce sont deux films où l’IA a été envisagée en post-production pour retravailler les voix - dans un cas pour hybrider une voix humaine avec un chant d’oiseau, et dans le second pour faire chanter Marion Cotillard comme une soprano virtuose. Or dans les deux cas, ce sont des solutions « artisanales » qui ont été préférées à l’IA. Dans « Le Règne Animal » tout comme dans « Annette » les comédien·nes ont poussé les curseurs de leur performance au maximum en s'entrainant avec d'autres personnes (chanteurs d'oiseaux et chanteuse d'opéra) et soutenus par un travail de montage-son et de sound design minutieux, cela a donné les résultats exceptionnels entendus dans ces films.
L'IA est un outil qui sert à explorer et résoudre des tâches intermédiaires mais dans l'ensemble des projets et réalisations évoqués lors de cette rencontre, l'IA est restée à sa place d'outil. Les finalités artistiques ne peuvent échapper à l'humain tant que l'humain a besoin de s'exprimer. Dans le contexte d’ « Annette », le travail imitatif d'une actrice auprès d'une chanteuse a donné place à une forme d'apprentissage (learning) qui a permis de laisser sa place à la mise en scène, au travail de l'humain avec l'humain, non seulement comme intelligence mais comme corps pensant et comme machine désirante.
Autre exemple : le réalisateur et scénariste Simon Bouisson nous parle de son usage de ChatGPT puis du logiciel Genario comme compagnons d’aide à l’écriture de scénario. Ces outils sont incroyablement puissants mais aussi extrêmement limités dans leurs capacités à surprendre, choquer, être drôles ou encore fascinants. Par définition, ce sont des modèles probabilistes, c’est-à-dire qu’ils produisent les séquences de mots les plus probables - comme une sorte de saisie prédictive surpuissante. Ils construisent donc des phrases statistiquement « moyennes », parfois même carrément fausses, mais ayant l’apparence de vérité.
En résumé, il ne faut pas avoir peur de voir nos métiers disparaître au profit des logiciels. Lors du passage de l’argentique au numérique, les outils ont changé et les métiers ont évolué, et c’est sensiblement la même chose qui risque de se produire avec l’IA. Il est rare de faire un film en se basant sur une seule typologie d’outil, et l’IA ne fera pas exception car personne n’aura jamais envie de concevoir un film entièrement grâce à une intelligence artificielle. Et d’ailleurs, qui aurait envie de le regarder ?
Qu’en dit la loi ?
De nombreux sujets sont encore à l’étude et actuellement sans réponse concernant la législation autour de l’IA. L’UE n’entend pas interdire l’utilisation de l’IA, mais l’encadrer de sorte à en empêcher les dérives, notamment concernant la question du droit d’auteur et de la propriété intellectuelle. Si un scénario, une chanson ou même un film peuvent être créés à partir d’un simple prompt, comment s’applique le droit d’auteur dans ce cas ? Qui est l’auteur d’une oeuvre conçue en un clic ? Et en plusieurs centaines de clics ?
Selon Patrick Raude, secrétaire général de la SACD, l’un des enjeux majeurs pour l’avenir va être de toujours pouvoir distinguer ce qui est synthétique de ce qui est humain, grâce à des outils de détection performants qui n’existent pas encore - et qui seront d’ailleurs sans doute eux-mêmes basés sur de l’IA. À l’image de la législation concernant les oeuvres tombées dans le domaine public, les oeuvres générées tout ou partie par IA pourront être considérées comme des co-créations, dont une partie des droits reviendraient à l’auteur et l’autre partie serviraient par exemple à financer la création culturelle.
A l’heure où des milliers de chansons entièrement générées par l’IA sont déposées chaque semaine sur les plateformes de streaming, le droit d’auteur doit évoluer pour maintenir et renforcer l’exception culturelle française. La culture n’est pas une marchandise ! Il faut reconnaître et valoriser la propriété intellectuelle et ne de considérer la création comme de la data. Les grands modèles d’IA tels ChatGPT se sont d’ailleurs bâtis sur ce qu’on appelle le data mining, c’est-à-dire un entraînement de leurs algorithmes à partir de quantités gargantuesques de données disponibles en ligne, et pourtant bien souvent protégées par le droit d’auteur. Le New York Times a d’ailleurs lancé des poursuites à l’encontre d’OpenAI, créateur de ChatGPT, pour violation du droit d’auteur. Un accord a finalement été trouvé début 2024, tout comme avec les journaux Le Monde et El País .
Sur tous ces sujets, l’AI Act ouvre la voie a une régulation européenne, mais les technologies évoluent bien plus vite que les lois, et nous ne sommes pas à l’abri des dérives éthiques, économiques et écologiques que pourrait causer l’IA.
Et après ?
Parlons déjà du futur (potentiel) de l’IA : l’AGI, qui signifie Intelligence Artificielle Générale. L’AGI ne sera plus confinée à un certain type d’opération (produire du texte, des images ou des sons) mais sera capable de se déplacer entre différentes opérations et de les réaliser en série ou simultanément, afin d’accomplir des tâches complexes sans nécessiter une programmation spécifique. À la manière d’un être humain, l’AGI aura la possibilité d’interagir avec le monde réel. L’AGI pourrait par exemple organiser des vacances (de l’achat des billets de train à la réservation des hôtels), rédiger des articles d’actualité en toute autonomie, diriger une entreprise, ou encore écrire des romans, les vendre et les envoyer à ses clients.
L'IA n’est peut-être pas la révolution que certains essayent de nous vendre mais il s’agit assurément d’un bond technologique sans précédent. Elle pourrait transformer en profondeur la manière dont les films sont fabriqués, produits et diffusés, en améliorant drastiquement les flux de travail et en réduisant les coûts - et pourquoi pas en repoussant les limites de l'imagination. Cependant, cette évolution technologique charrie avec elle son lots d’inquiétudes légitimes quant à l’uniformisation de la créativité, la protection du droit d’auteur, et l’avenir de nos métiers : vont-ils rester les même, se transformer, disparaître ? Allons-nous travailler mieux ? Travailler moins ?
Face à ces enjeux, une régulation adéquate de l'utilisation de l’IA, dans la monde du cinéma et ailleurs, est indispensable pour garantir le respect des droits fondamentaux, la préservation de la diversité culturelle et la promotion de la créativité humaine.
Antoine MARTIN, est chargé de recherche et développement chez PolySon - HAL
THE SOUND OF STORY
CES 3 JOURS DE CONFÉRENCES SE DÉROULENT PENDANT LE FESTIVAL DE BRIGHTON.
Bringing together...
LA POSTPRODUCTION SON TIRE LE SIGNAL D'ALARME
Cette date n'était pas le fruit du hasard, puisqu'elle précédait de 48 heures la réunion...
Clap de fin au studio d’enregistrement Davout
Nous y avons tourné notre documentaire sur la musique de film.....La musique du film...
Mobilisation de la post-production . 23 mars 2017 . compte-rendu
23 mars 2017
mobilisation de la post-production
#1
Merci à toutes celles et tous ceux...
Cannes 2017 . lettre ouverte de la post-production son
À l'occasion du festival de Cannes, les monteurs son et mixeurs de l'AFSI publient une lettre...
“La Belle et la meute”, prix de la meilleure création sonore
Kaouther Ben Hania ...