Le moment Miyazaki
avril 3rd, 2025 Posted in Création automatisée, IA, Images, logicielsL’IA générative, on en parle depuis bientôt trois ans, et malgré de nombreux malentendus, une bonne partie du public est désormais avertie des débats qui animent ce domaine, et qui vont de la question écologique à celle du droit d’auteur en passant par le sujet des bouleversements professionnels et celui de la duperie — deep-fake, fake news. Mais cette semaine il s’est passé quelque chose, le débat s’est cristallisé autour de ce qui eût pu être un événement parmi d’autres dans cette séquence : la possibilité, apparue lors d’une démonstration de la dernière version de chatGPT de reprendre la composition d’images existantes pour les « dessiner » dans un style inspiré des films produits par le studio Ghibli.

Je n’ai pas su résister à l’envie de demander à chatGPT de faire mon portrait à la manière d’un dessin de Yoshifumi Kondō : qui ne veut pas vivre dans un film du studio Ghibli ? Je n’ai pas détesté le résultat et je l’ai posté à droite et à gauche. Je m’attendais à voir quelques sourcils se froncer mais je dois dire que les réactions ont atteint un degré de réprobation ou même d’hostilité bien plus élevé que ça. Une personne m’a même dit que je l’avais déçue à un point qui lui mettait « les larmes aux yeux ». Dans la presse, on va jusqu’à parler de « Technofascisme ». Bigre ! Bien entendu, ces réactions ont une raison d’être, et même plusieurs.



Je ne dirais pas que le résultat semble sorti d’un film de Miyazaki, mais ça n’est pas si mal imité.
Beaucoup m’ont parlé de la citation d’Hayao Miyazaki, qui a qualifie l’Intelligence Artificielle d’« insulte à la vie elle-même ». Le mot est fort, mais le contexte est un peu faussé car ce n’est pas de l’usage des intelligences artificielles génératives à la mode actuelle dont le co-fondateur du studio Ghibli parlait, mais d’une expérience qui montrait un corps en 3D « apprenant » à se mouvoir par Intelligence Artificielle.
La vision dérangeante produite par ce système auto-apprenant avait immédiatement rappelé à Miyazaki un ami à lui, lourdement handicapé, dont chaque mouvement corporel est une épreuve. Sa réaction était plutôt une réaction à un effet Uncanny Valley qu’à la question de l’artificialité et du plagiat1.

On m’a parlé aussi du désastre écologique que représente indubitablement l’IA générative, technologie notoirement dispendieuse en ressources énergétiques2 et, comme tout ce qui réclame une grosse puissance de calcul informatique, en ressources minières. Et on sait que le cinéma d’Hayao Miyazaki et plus généralement celui du studio Ghibli est fortement politisé, mû par un triple engagement pacifiste, écologiste et, même si ce dernier point est parfois discuté, féministe. On peut dire que mettre une technologique écologiquement désastreuse au service de l’imitation d’un cinéma engagé pour l’écologie constitue un irrespectueux contresens.

Détail amusant : l’image ci-dessus est la seule, sur cette page, qui constitue une contrefaçon au droit d’auteur d’Hayao Miyazaki.
On m’a parlé aussi de la question du pillage des droits d’auteur, vaste sujet qui ne pourra peut-être être traité qu’en modifiant les principes actuels du droit3. En effet, pour l’instant, dessiner « à la manière de » n’est pas interdit. S’inspirer, pasticher, n’est pas interdit. À ce jour, aucun « style » n’est protégé par la loi, si ce n’est lorsque l’on peut démontrer une tromperie sur la marchandise, un parasitisme commercial ou bien entendu, la contrefaçon (reprendre une image existante). Si l’on peut pointer le fait qu’OpenAI a visiblement entraîné son modèle avec des œuvres issues du studio Ghibli on peut aussi dire que chaque artiste de chair et d’os est lui-même nourri des œuvres qu’il a vues4. Les datasets5 qui ont servi à créer le modèle de génération d’images sont insondables, y compris pour ceux qui les constituent et les utilisent puisqu’il est impossible à une seule personne d’avoir une idée générale de ce qui s’y trouve. Pour regarder chacune des 5 milliards d’images du célèbre dataset LAION5 il faudrait, à la cadence de une image seconde, y passer cent soixante ans, et cela sans dormir. Il n’est pas certain qu’OpenAI ait sciemment réalisé un entraînement spécifique pour produire du faux Ghibli, mais du Ghibli dans le dataset, pour reprendre une célèbre réplique de Lino Ventura : « y’en a ! ». En termes juridiques, OpenAI joue un jeu suspect, essayant visiblement de repousser les limites de ce qui est permis, notamment en mélangeant recherche scientifique et business, mais aussi grandes annonces et scandales, dans une dynamique malsaine, où le buzz seul permet de faire financer artificiellement un domaine qui est loin d’être rentable et qui ne le sera peut-être jamais.
La force du nouveau système de génération d’images de chatGPT ne réside cependant pas seulement dans les données mais aussi dans l’appréhension du contexte qu’a chatGPT lorsqu’on lui demande de produire une image. Il « comprend » (les guillemets sont ici très importants) les éléments de l’image qu’on lui soumet et parvient à effectuer la translation stylistique d’une manière bien plus avancée que celle des produits concurrents.






Un autre reproche concerne les usages faits de la « ghiblification », qui constituent souvent une insulte aux valeurs véhiculées par les films du studio Ghibli. Miyazaki, c’est la nature, la beauté, un univers fort et profondément humaniste, et voilà qu’on utilise une technologie énergivore pour singer son style graphique en l’appliquant aux représentations les plus triviales ou parfois les plus odieuses, comme lorsque la Maison Blanche se moque des larmes d’une sans-papiers dominicaine ramenée manu militari à la frontière, ou lorsque l’armée israélienne se représente en une équipe mignonne, au moment même où les soldats de cette armée sont occupés à massacrer les gazaouis — j’espère que même les gens qui défendent le droit pour Israël de bombarder des civils palestiniens en représailles de l’action du Hamas savent que la guerre n’a jamais eu et n’aura jamais rien de kawaï.
J’imagine que c’est ce dernier point qui touche la corde la plus sensible, aggravé par le fait que, très objectivement, ce « filtre Ghibli » fonctionne redoutablement bien — enfin comme toutes les images générées de ce genre, il fonctionne assez bien dans une petite résolution, sur l’écran de l’ordinateur et du smartphone, mais pas pour être imprimé ni sans doute pour être diffusé en salle de cinéma. Il donne le change de manière satisfaisante, disons.


Je peux moi-même ajouter un point négatif à la liste des raisons qui rendent ce genre d’usage de l’IA problématique : le déluge de contenus générées inonde d’ores et déjà le réseau et va nourrir des bases de données visuelles autant que les futurs datasets, participant à créer une confusion générale quant à la nature et à la généalogie des images que nous trouverons à l’avenir en effectuant des recherches iconographiques en ligne. On se rappelle que lorsque l’on demandait à Google des peintures de Jérôme Bosch, il y a quelques mois, la première image qui se présentait était non une peinture du maître flamand, mais un médiocre hommage réalisé par une Intelligence artificielle. Le problème a été réglé mais constitue un avertissement pour la suite.
Cependant on ne doit pas réduire ce genre de reproche à l’IA. On a su faire mentir des images, j’en suis convaincu, dès le Paléolithique, et on n’a pas cessé depuis. Et quant aux problèmes liés à la profusion d’images mal légendées, d’origine indéterminée, mal attribuée, ils sont dans la continuité de ce que nous vivons depuis la mise en ligne de FlickR, Instagram ou Pinterest, notamment.


Malgré toutes les bonnes raisons de haïr l’idée que l’on produise des faux Miyazaki, j’ai du mal à me sentir coupable, je ne m’impose pas de postures morales à ce sujet6, et au contraire, j’apprécie l’expérience non pour elle-même mais, en qualité d’observateur du monde numérique, pour ce qu’elle révèle de l’état d’esprit qui entoure actuellement les IAs génératives, mais aussi ce qu’elle révèle de l’aura singulière des films du Studio Ghibli, car je fais le pari qu’un autre « à la manière de… » (Salvador Dali, Matt Groening, Wes Anderson, Pablo Picasso, enluminure médiévale,… car tout ça est possible, il n’y a pas de fonctionnalité spécifiquement « Ghibli » dans chatGPT) n’aurait pas provoqué les mêmes réactions. C’est comme si il y avait dans les productions d’Hayao Miyazaki et d’Isao Takahata — les deux auteurs Ghibli dont nous connaissons le mieux le travail — quelque chose de foncièrement authentique, sincère, précieux, tant dans la philosophie développée par les récits que dans le processus de création de ces films — assez artisanal —, autant de qualités qui entrent frontalement en conflit avec la profusion inconséquente, l’artifice et la fausseté, enfin tout ce que représente l’Intelligence artificielle générative dans sa version populaire7.

Il est possible que l’œuvre de Miyazaki semble à même de conjurer, au moins symboliquement, la catastrophe dans laquelle nous sommes peut-être irrémédiablement engagés, et où les questions esthétiques ne seront, je le prophétise sans peine, qu’un sujet anecdotique.
Lire ailleurs : Le Ghibli effect sur ChatGPT, l’IA en terrain sensible (Clément Solym, sur actualitte) ; Images générées dans le style de Ghibli : des artistes spoliés, le technofascisme célébré (Benjamin Benoît, sur Blast)
- Accessoirement, le type d’utilisation de l’IA qui choque Miyazaki est, hors tout emploi à fins artistique, un domaine assez passionnant puisqu’il s’agit ici de provoquer et d’observer un apprentissage corporel — d’une corporalité qui évolue dans un environnement virtuel, mais d’une corporalité tout de même, et c’est le genre de travaux qui font progresser la robotique.
Au delà des usages qui en sont fait, il faut rappeler que la recherche en Intelligence Artificielle est une aventure intellectuelle passionnante. [↩] - Je note que l’impact énergétique de l’IA est possible à estimer de manière globale, mais que l’évaluation du coût de chaque opération est plus difficile à déterminer. Plusieurs articles estiment l’impact énergétique de chaque requête faite à chatGPT en intégrant le coût de l’infrastructure ainsi que de la création du modèle (si chatGPT répond à la seconde, c’est en utilisant un modèle dont la confection a fait mouliner des centaines de processeurs pendant des mois), c’est un peu comme si on estimait le prix d’un kilomètre d’autoroute en y ajoutant le coût du bitume. Ce n’est pas absurde (sans la route, pas d’auto) mais ça peut donner une idée fausse des choses et laisser accroire qu’il suffit de se retenir de produire une image pour sauver la planète. Un peu comme on l’a fait avec l’e-mail, là encore avec des calculs dénués de sens — non, un e-mail mis à la corbeille ne fait pas économiser n kWh, c’est le serveur entier qui consomme, pas chaque fichier qui s’y trouve. Je ne crois pas me tromper en disant que l’évaluation du coût énergétique de chaque « token » est très difficile à évaluer sérieusement. [↩]
- Mettre un copyright sur une manière de dessiner semble difficilement applicable. J’imagine que ce qui peut être réglementé à court-terme est le principe d’opt-out (demander à ce que son travail ne soit pas inclus à un dataset et/ou que certains noms de créateurs soient refusés par les logiciels de génération d’image), et j’imagine qu’à long terme, ce sont des taxes reversées aux sociétés de gestion de droits (SAIF, ADGP) qui seront mises en place, comme cela s’est fait pour la musique et les films. L’écueil étant ici que ce ne sont pas nécessairement les personnes dont le travail a servi qui en tireront une rémunération. [↩]
- C’est le propos de la vidéo All Creative Work Is Derivative dont le jeu formel est un peu artificiel mais dont le titre ne manque pas de pertinence. [↩]
- Dans le cadre des IAs génératives visuelles, le dataset est une base de données qui contient des images et leur description, qui sert à produire le modèle à partir duquel les contenus seront générés. [↩]
- Au passage, si je joue sans scrupule avec des IAs génératives, et si je prends avec légèreté les commentaires des social justice warriors de l’artifice qui viennent râler en commentaire de chaque image générée, je m’interdis totalement de pirater des films, des séries ou de la musique, et je ne verrai Severance ou quelques autres séries que l’on me conseille que le jour où elles passeront sur des plate-formes auxquelles je suis abonné. Et à vrai dire je suis toujours un peu choqué qu’on me propose de me fournir des moyens douteux pour accéder à des œuvres audiovisuelles soumises à droits d’auteur. [↩]
- L’IA a d’autres usages en art que ce dont il est question ici, et de nombreux artistes s’y engagent, soit pour produire un discours sur l’IA elle-même (ses biais, ses hallucinations), soit pour produire des formes nouvelles ou impossibles à obtenir autrement. Je recommande notamment Albertine Meunier, Gwenola Wagon et Stéphane Degoutin, Étienne Mineur, Grégory Chatonsky, Caroline Delieutraz, Philippe Boisnard, Ilan Manouach, Éric Tabuchi, Olivier Auber, Frank Manzano, Petr Válek,… [↩]
6 Responses to “Le moment Miyazaki”
By Brocante japonaise Tanpopo on Avr 3, 2025
Je pense que ce qui me trouble le plus avec ce truc est l’idée que « Ghibli » serait une « esthétique ». J’imagine que ça en dit long sur les attentes du public, et ce qui fait que le cinéma de Miyazaki est infiniment plus populaire que celui de Takahata, plus difficile à enfermer visuellement et donc moins « marketing » (la plupart des gens n’ont d’ailleurs vu que le Tombeau des lucioles, pas franchement feel good cottagecore nunuche).
Ce qui m’a vraiment déroutée ce sont les usages « vidéo ». J’étais tombée sur une version « Ghiblifiée » d’un trailer du seigneur des anneaux, et ça m’a interrogée sur ce que les gens entendent par « animer », et ce qu’ils attendent de l’animation comme forme artistique.
Si on pense que l’animation c’est « des jolis dessins » (de l’illustration, quoi) + « l’illusion du mouvement » (ce que le cinéma en prise de vue réelle peut déjà faire sans le moindre effort), alors j’imagine qu’on ne voit aucune limite à ce qu’il est possible d’atteindre avec l’IA.
Mais « animer » au sens de « donner vie » à une succession de dessins fixes, ça va tellement au delà de ça, et l’aventure Ghibli qui touche à sa fin en est une démonstration si claire (jusqu’au nom, Ghibli, car pour qu’un vent chaud « souffle » dans un film d’animation il ne suffit pas d’allumer un sèche cheveux) qu’inventer une « esthétique » Ghibli « sans intervention humaine », « dépolitisée » à l’extrême, creuse, lisse et « mignonnette » me semble particulièrement cynique !
Au moment où l’aventure artistique Ghibli touche à sa fin (on entre dans l’ère de la gestion de patrimoine), le succès de ce générateur m’apparaît comme assez déprimant : si c’est ce qu’on retient du corpus des studios Ghibli, est-ce que ça signifie que tous leurs films virtuoses étaient en fait de la confiture aux cochons ? C’est déprimant quand même.
Je sais bien que c’est mal d’être snob, hein, mais sur ce sujet là on ne peut pas me demander tant d’impartialité, donc je préfère parler du studio, de ses films et de ses réalisateurs plutôt que contribuer à faire monter la « hype » autour d’un truc qui m’intéresse beaucoup moins.
Je cloturerais ce rant beaucoup trop long et qui n’apprendra rien à personne par la jaquette ultra moche de la première vhs américaine de Kiki : https://vhscollector.com/movie/kikis-delivery-service
Elle a été dessinée par un humain mais bon, comme quoi, les IA n’ont pas le monopole des images insipides, creuses, dépolitisées, cucul et subtilement cheum, donc faut-il blamer la technologie ?
By Jean-Michel on Avr 3, 2025
Je pense que le non seulement trait de Miyazaki et de Kondō est singé, mais aussi l’humeur, l’esprit… Je pense que nombre de personnes transformant certains instants insouciants de leur vie par ce biais, le font par adhésions aux valeurs portées par les films du Studio Ghibli. Celui-ci a trouvé, dès « Porco Rosso », quelque chose qui oscille entre l’apaisement, la gravité, l’action, le rire, le sourire, les larmes. C’est tout à fait étonnant qu’une signature visuelle puisse s’adapter aussi élégamment à différents registres au sein d’une même narration. Aussi, je comprends que des fans du Studio trouvent inacceptables que ne soit effacée l’essence des propos politiques portés par Ghibli.
J’avoue tout de même avoir été surpris par, disons, l’audace de la Maison Blanche. C’est peut-être l’usage le plus à côté de la plaque que j’ai pu voir. Pour Tsahal, je suis moins étonné, il y a cette prétention ontologique des forces militaires à se glorifier ; quand bien même les images qu’ils ont diffusées – dans une perspective Ghibli – les placent du côté de la tyrannie (« Tombeau des lucioles », « Le vent se lève »).
Pour l’usage de l’intelligence artificielle – des logiciels prédictifs -, il me semble effectivement de mauvaise fois ou par ignorance de signifier que Miyazaki est foncièrement contre. « Mes voisins les Yamada » a été réalisé en partie grâce aux logiciels maison d’animation, mais aussi de Disney, à partir de dessins aquarellés.
By Benjamin Benoit on Avr 5, 2025
Bonjour Jean-Noël, (quel beau blog ! Vous le tenez depuis longtemps, respect)
J’ai rédigé l’article de Blast, et suis d’accord avec l’ensemble de vos réflexions, merci pour votre billet. Il m’est difficile d’expliciter ça sur Blast car on est bien plus dans le hors-sujet, mais cette histoire renforce des méconceptions sur l’animation japonaise. Comme le souligne Tanpopo, trouver un « style Ghibli » est dans le fond un peu absurde (on ne parlera pas de son fiston qui essaye, qui se rate, et qui fait un authentique naufrage en 3D) même si d’autres artistes l’imitent, comme le fait Yonebayashi. Il m’est très frustrant d’expliquer au public, aux exploitants, à des journalistes généraliste cinéma bien moins otakus – que Ghibli n’est plus l’alpha et l’omega et que l’actu télé des animes est, sinon plus grande, équivalente et explose avec une offre légale croissante depuis désormais une bonne quinzaine d’années. Et il contribue à fétichiser un artiste qui n’est plus si pertinent que ça – donc à renforcer l’idée que le medium tourne autour de lui. C’est un peu vain, mais en plus d’en faire une esthétique passe-partout (il est vrai, redoutable, vous le dites), ça cache bien des merveilles derrière qui, pour l’instant, sont à l’abri – il sera bien plus difficile de singer proprement les production numérique et 3D, et les premiers essais d’IA génératives qui atteignent le festival d’Annecy sont, pour le moment, largement conspuées. C’est un autre angle…
Merci pour vos réflexions plus techniques. Je souhaiterais savoir aussi mieux jauger combien « pèse » et coûte un token.
À bientôt, merci pour votre rétrolien
By J.-N. on Avr 5, 2025
@Benjamin : bigre ! Il y a des spécialistes du studio Ghibli dans cette section commentaires :-D
Bon, pour Tanpopo, je le savais, elle a vu Porco Rosso à sa sortie, à l’âge de quatre ans, et n’a plus atterri depuis.
By Xavier lowenthal on Avr 7, 2025
Je crois que tu as raison de dire que c’est le modèle qui doit changer. Incriminer le petit usager dans un système fondé sur l’expansion et le profit des actionnaires, c’est parfaitement ridicule. Les artistes doivent être rémunérés. Aujourd’hui, on fait semblant de compter le fric que leur œuvre produit et on leur laisse un pourcentage. C’est évidemment fictif. Plutôt que de renforcer la propriété privée et ses vices, on ferait bien de repenser le commun. Un prélèvement sur la masse d’abonnements aux services de télécommunications, ou sur le chiffre d’affaires de ses compagnies, en fonction ou non de la bande passante, générerait une manne très importante qui permettrait de financer la culture et ses travailleurs. Les ia seront forcément rentables: elles deviennent payantes, un peu comme Deezer, Spotify ou Netflix, et, contrairement à ces plateformes de diffusion, indispensables. Je pirate allègrement, sans honte et sans complexe, comme je produit et consomme de la culture. Bien entendu, toutes les productions de l’esprit ont un caractère collectif. J’irais jusqu’à prétendre que toutes les productions, de l’esprit ou non, ont un caractère collectif.