Le moment Miyazaki
avril 3rd, 2025 Posted in Création automatisée, IA, Images, logiciels | 6 Comments »L’IA générative, on en parle depuis bientôt trois ans, et malgré de nombreux malentendus, une bonne partie du public est désormais avertie des débats qui animent ce domaine, et qui vont de la question écologique à celle du droit d’auteur en passant par le sujet des bouleversements professionnels et celui de la duperie — deep-fake, fake news. Mais cette semaine il s’est passé quelque chose, le débat s’est cristallisé autour de ce qui eût pu être un événement parmi d’autres dans cette séquence : la possibilité, apparue lors d’une démonstration de la dernière version de chatGPT de reprendre la composition d’images existantes pour les « dessiner » dans un style inspiré des films produits par le studio Ghibli.

Je n’ai pas su résister à l’envie de demander à chatGPT de faire mon portrait à la manière d’un dessin de Yoshifumi Kondō : qui ne veut pas vivre dans un film du studio Ghibli ? Je n’ai pas détesté le résultat et je l’ai posté à droite et à gauche. Je m’attendais à voir quelques sourcils se froncer mais je dois dire que les réactions ont atteint un degré de réprobation ou même d’hostilité bien plus élevé que ça. Une personne m’a même dit que je l’avais déçue à un point qui lui mettait « les larmes aux yeux ». Dans la presse, on va jusqu’à parler de « Technofascisme ». Bigre ! Bien entendu, ces réactions ont une raison d’être, et même plusieurs.



Je ne dirais pas que le résultat semble sorti d’un film de Miyazaki, mais ça n’est pas si mal imité.
Beaucoup m’ont parlé de la citation d’Hayao Miyazaki, qui a qualifie l’Intelligence Artificielle d’« insulte à la vie elle-même ». Le mot est fort, mais le contexte est un peu faussé car ce n’est pas de l’usage des intelligences artificielles génératives à la mode actuelle dont le co-fondateur du studio Ghibli parlait, mais d’une expérience qui montrait un corps en 3D « apprenant » à se mouvoir par Intelligence Artificielle.
La vision dérangeante produite par ce système auto-apprenant avait immédiatement rappelé à Miyazaki un ami à lui, lourdement handicapé, dont chaque mouvement corporel est une épreuve. Sa réaction était plutôt une réaction à un effet Uncanny Valley qu’à la question de l’artificialité et du plagiat1.

On m’a parlé aussi du désastre écologique que représente indubitablement l’IA générative, technologie notoirement dispendieuse en ressources énergétiques2 et, comme tout ce qui réclame une grosse puissance de calcul informatique, en ressources minières. Et on sait que le cinéma d’Hayao Miyazaki et plus généralement celui du studio Ghibli est fortement politisé, mû par un triple engagement pacifiste, écologiste et, même si ce dernier point est parfois discuté, féministe. On peut dire que mettre une technologique écologiquement désastreuse au service de l’imitation d’un cinéma engagé pour l’écologie constitue un irrespectueux contresens.

Détail amusant : l’image ci-dessus est la seule, sur cette page, qui constitue une contrefaçon au droit d’auteur d’Hayao Miyazaki.
On m’a parlé aussi de la question du pillage des droits d’auteur, vaste sujet qui ne pourra peut-être être traité qu’en modifiant les principes actuels du droit3. En effet, pour l’instant, dessiner « à la manière de » n’est pas interdit. S’inspirer, pasticher, n’est pas interdit. À ce jour, aucun « style » n’est protégé par la loi, si ce n’est lorsque l’on peut démontrer une tromperie sur la marchandise, un parasitisme commercial ou bien entendu, la contrefaçon (reprendre une image existante). Si l’on peut pointer le fait qu’OpenAI a visiblement entraîné son modèle avec des œuvres issues du studio Ghibli on peut aussi dire que chaque artiste de chair et d’os est lui-même nourri des œuvres qu’il a vues4. Les datasets5 qui ont servi à créer le modèle de génération d’images sont insondables, y compris pour ceux qui les constituent et les utilisent puisqu’il est impossible à une seule personne d’avoir une idée générale de ce qui s’y trouve. Pour regarder chacune des 5 milliards d’images du célèbre dataset LAION5 il faudrait, à la cadence de une image seconde, y passer cent soixante ans, et cela sans dormir. Il n’est pas certain qu’OpenAI ait sciemment réalisé un entraînement spécifique pour produire du faux Ghibli, mais du Ghibli dans le dataset, pour reprendre une célèbre réplique de Lino Ventura : « y’en a ! ». En termes juridiques, OpenAI joue un jeu suspect, essayant visiblement de repousser les limites de ce qui est permis, notamment en mélangeant recherche scientifique et business, mais aussi grandes annonces et scandales, dans une dynamique malsaine, où le buzz seul permet de faire financer artificiellement un domaine qui est loin d’être rentable et qui ne le sera peut-être jamais.
La force du nouveau système de génération d’images de chatGPT ne réside cependant pas seulement dans les données mais aussi dans l’appréhension du contexte qu’a chatGPT lorsqu’on lui demande de produire une image. Il « comprend » (les guillemets sont ici très importants) les éléments de l’image qu’on lui soumet et parvient à effectuer la translation stylistique d’une manière bien plus avancée que celle des produits concurrents.






Un autre reproche concerne les usages faits de la « ghiblification », qui constituent souvent une insulte aux valeurs véhiculées par les films du studio Ghibli. Miyazaki, c’est la nature, la beauté, un univers fort et profondément humaniste, et voilà qu’on utilise une technologie énergivore pour singer son style graphique en l’appliquant aux représentations les plus triviales ou parfois les plus odieuses, comme lorsque la Maison Blanche se moque des larmes d’une sans-papiers dominicaine ramenée manu militari à la frontière, ou lorsque l’armée israélienne se représente en une équipe mignonne, au moment même où les soldats de cette armée sont occupés à massacrer les gazaouis — j’espère que même les gens qui défendent le droit pour Israël de bombarder des civils palestiniens en représailles de l’action du Hamas savent que la guerre n’a jamais eu et n’aura jamais rien de kawaï.
J’imagine que c’est ce dernier point qui touche la corde la plus sensible, aggravé par le fait que, très objectivement, ce « filtre Ghibli » fonctionne redoutablement bien — enfin comme toutes les images générées de ce genre, il fonctionne assez bien dans une petite résolution, sur l’écran de l’ordinateur et du smartphone, mais pas pour être imprimé ni sans doute pour être diffusé en salle de cinéma. Il donne le change de manière satisfaisante, disons.


Je peux moi-même ajouter un point négatif à la liste des raisons qui rendent ce genre d’usage de l’IA problématique : le déluge de contenus générées inonde d’ores et déjà le réseau et va nourrir des bases de données visuelles autant que les futurs datasets, participant à créer une confusion générale quant à la nature et à la généalogie des images que nous trouverons à l’avenir en effectuant des recherches iconographiques en ligne. On se rappelle que lorsque l’on demandait à Google des peintures de Jérôme Bosch, il y a quelques mois, la première image qui se présentait était non une peinture du maître flamand, mais un médiocre hommage réalisé par une Intelligence artificielle. Le problème a été réglé mais constitue un avertissement pour la suite.
Cependant on ne doit pas réduire ce genre de reproche à l’IA. On a su faire mentir des images, j’en suis convaincu, dès le Paléolithique, et on n’a pas cessé depuis. Et quant aux problèmes liés à la profusion d’images mal légendées, d’origine indéterminée, mal attribuée, ils sont dans la continuité de ce que nous vivons depuis la mise en ligne de FlickR, Instagram ou Pinterest, notamment.


Malgré toutes les bonnes raisons de haïr l’idée que l’on produise des faux Miyazaki, j’ai du mal à me sentir coupable, je ne m’impose pas de postures morales à ce sujet6, et au contraire, j’apprécie l’expérience non pour elle-même mais, en qualité d’observateur du monde numérique, pour ce qu’elle révèle de l’état d’esprit qui entoure actuellement les IAs génératives, mais aussi ce qu’elle révèle de l’aura singulière des films du Studio Ghibli, car je fais le pari qu’un autre « à la manière de… » (Salvador Dali, Matt Groening, Wes Anderson, Pablo Picasso, enluminure médiévale,… car tout ça est possible, il n’y a pas de fonctionnalité spécifiquement « Ghibli » dans chatGPT) n’aurait pas provoqué les mêmes réactions. C’est comme si il y avait dans les productions d’Hayao Miyazaki et d’Isao Takahata — les deux auteurs Ghibli dont nous connaissons le mieux le travail — quelque chose de foncièrement authentique, sincère, précieux, tant dans la philosophie développée par les récits que dans le processus de création de ces films — assez artisanal —, autant de qualités qui entrent frontalement en conflit avec la profusion inconséquente, l’artifice et la fausseté, enfin tout ce que représente l’Intelligence artificielle générative dans sa version populaire7.

Il est possible que l’œuvre de Miyazaki semble à même de conjurer, au moins symboliquement, la catastrophe dans laquelle nous sommes peut-être irrémédiablement engagés, et où les questions esthétiques ne seront, je le prophétise sans peine, qu’un sujet anecdotique.
Lire ailleurs : Le Ghibli effect sur ChatGPT, l’IA en terrain sensible (Clément Solym, sur actualitte) ; Images générées dans le style de Ghibli : des artistes spoliés, le technofascisme célébré (Benjamin Benoît, sur Blast)
- Accessoirement, le type d’utilisation de l’IA qui choque Miyazaki est, hors tout emploi à fins artistique, un domaine assez passionnant puisqu’il s’agit ici de provoquer et d’observer un apprentissage corporel — d’une corporalité qui évolue dans un environnement virtuel, mais d’une corporalité tout de même, et c’est le genre de travaux qui font progresser la robotique.
Au delà des usages qui en sont fait, il faut rappeler que la recherche en Intelligence Artificielle est une aventure intellectuelle passionnante. [↩] - Je note que l’impact énergétique de l’IA est possible à estimer de manière globale, mais que l’évaluation du coût de chaque opération est plus difficile à déterminer. Plusieurs articles estiment l’impact énergétique de chaque requête faite à chatGPT en intégrant le coût de l’infrastructure ainsi que de la création du modèle (si chatGPT répond à la seconde, c’est en utilisant un modèle dont la confection a fait mouliner des centaines de processeurs pendant des mois), c’est un peu comme si on estimait le prix d’un kilomètre d’autoroute en y ajoutant le coût du bitume. Ce n’est pas absurde (sans la route, pas d’auto) mais ça peut donner une idée fausse des choses et laisser accroire qu’il suffit de se retenir de produire une image pour sauver la planète. Un peu comme on l’a fait avec l’e-mail, là encore avec des calculs dénués de sens — non, un e-mail mis à la corbeille ne fait pas économiser n kWh, c’est le serveur entier qui consomme, pas chaque fichier qui s’y trouve. Je ne crois pas me tromper en disant que l’évaluation du coût énergétique de chaque « token » est très difficile à évaluer sérieusement. [↩]
- Mettre un copyright sur une manière de dessiner semble difficilement applicable. J’imagine que ce qui peut être réglementé à court-terme est le principe d’opt-out (demander à ce que son travail ne soit pas inclus à un dataset et/ou que certains noms de créateurs soient refusés par les logiciels de génération d’image), et j’imagine qu’à long terme, ce sont des taxes reversées aux sociétés de gestion de droits (SAIF, ADGP) qui seront mises en place, comme cela s’est fait pour la musique et les films. L’écueil étant ici que ce ne sont pas nécessairement les personnes dont le travail a servi qui en tireront une rémunération. [↩]
- C’est le propos de la vidéo All Creative Work Is Derivative dont le jeu formel est un peu artificiel mais dont le titre ne manque pas de pertinence. [↩]
- Dans le cadre des IAs génératives visuelles, le dataset est une base de données qui contient des images et leur description, qui sert à produire le modèle à partir duquel les contenus seront générés. [↩]
- Au passage, si je joue sans scrupule avec des IAs génératives, et si je prends avec légèreté les commentaires des social justice warriors de l’artifice qui viennent râler en commentaire de chaque image générée, je m’interdis totalement de pirater des films, des séries ou de la musique, et je ne verrai Severance ou quelques autres séries que l’on me conseille que le jour où elles passeront sur des plate-formes auxquelles je suis abonné. Et à vrai dire je suis toujours un peu choqué qu’on me propose de me fournir des moyens douteux pour accéder à des œuvres audiovisuelles soumises à droits d’auteur. [↩]
- L’IA a d’autres usages en art que ce dont il est question ici, et de nombreux artistes s’y engagent, soit pour produire un discours sur l’IA elle-même (ses biais, ses hallucinations), soit pour produire des formes nouvelles ou impossibles à obtenir autrement. Je recommande notamment Albertine Meunier, Gwenola Wagon et Stéphane Degoutin, Étienne Mineur, Grégory Chatonsky, Caroline Delieutraz, Philippe Boisnard, Ilan Manouach, Éric Tabuchi, Olivier Auber, Frank Manzano, Petr Válek,… [↩]




































