{"id":45082,"date":"2024-12-24T15:05:57","date_gmt":"2024-12-24T14:05:57","guid":{"rendered":"https:\/\/hyperbate.fr\/dernier\/?p=45082"},"modified":"2024-12-25T13:23:47","modified_gmt":"2024-12-25T12:23:47","slug":"les-machinations-de-la-machine-on-a-deja-vu-le-film","status":"publish","type":"post","link":"https:\/\/hyperbate.fr\/dernier\/?p=45082","title":{"rendered":"Les machinations de la machine (on a d\u00e9j\u00e0 vu le film)"},"content":{"rendered":"\n<p>Les <em>Large Language Models<\/em> comme <em>GPT<\/em>, <em>Gemini<\/em>, <em>Mistral<\/em>, <em>Bloom<\/em> ou <em>Claude<\/em> sont des syst\u00e8mes fascinants \u00e0 de nombreux \u00e9gards. Ce ne sont, en principe, que des machines \u00e0 \u00ab\u00a0pr\u00e9dire\u00a0\u00bb quelle cha\u00eene de caract\u00e8re doit \u00eatre renvoy\u00e9e en r\u00e9ponse \u00e0 une autre cha\u00eene de caract\u00e8res. Les LLM n&rsquo;ont pas de conscience, ne comprennent pas la question que nous leur posons et ne comprennent pas non plus leur propre r\u00e9ponse. Leur monde, qui ne r\u00e9pond \u00e0 aucune exp\u00e9rience existentielle, \u00e0 aucune exp\u00e9rience physique, se r\u00e9sume \u00e0 une constellation de mots reli\u00e9s de mani\u00e8re plus ou moins proche dans un espace conceptuel \u00e0 n dimensions<sup><a href=\"#footnote_1_45082\" id=\"identifier_1_45082\" class=\"footnote-link footnote-identifier-link\" title=\"Dans une dimension, &laquo;&nbsp;chat&nbsp;&raquo; et &laquo;&nbsp;chien&nbsp;&raquo; seront des mots proches, dans une autre &laquo;&nbsp;chat&nbsp;&raquo; et &laquo;&nbsp;sapin de No&euml;l&nbsp;&raquo; seront proches, dans une autre encore c&rsquo;est &laquo;&nbsp;chat&nbsp;&raquo; et &laquo;&nbsp;lion&nbsp;&raquo; qui seront proches, mais dans tous les cas &laquo;&nbsp;chien&nbsp;&raquo; et &laquo;&nbsp;lion&nbsp;&raquo; seront assez &eacute;loign&eacute;s, &laquo;&nbsp;lion&nbsp;&raquo; et &laquo;&nbsp;sapin de No&euml;l&nbsp;&raquo; tr&egrave;s &eacute;loign&eacute;s, etc.\">1<\/a><\/sup>. On dit souvent que leur fonctionnement n&rsquo;est gu\u00e8re diff\u00e9rent, si ce n&rsquo;est en termes de complexit\u00e9, de la mani\u00e8re dont notre navigateur essaie de deviner le prochain mot que nous voulons voir appara\u00eetre dans la barre de recherche.<\/p>\n\n\n\n<figure data-wp-context=\"{&quot;imageId&quot;:&quot;69f574c255f11&quot;}\" data-wp-interactive=\"core\/image\" data-wp-key=\"69f574c255f11\" class=\"wp-block-image size-medium is-resized wp-lightbox-container\"><img decoding=\"async\" width=\"530\" height=\"530\" data-wp-class--hide=\"state.isContentHidden\" data-wp-class--show=\"state.isContentVisible\" data-wp-init=\"callbacks.setButtonStyles\" data-wp-on--click=\"actions.showLightbox\" data-wp-on--load=\"callbacks.setButtonStyles\" data-wp-on-window--resize=\"callbacks.setButtonStyles\" src=\"https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/nuageDeMots-530x530.png\" alt=\"\" class=\"wp-image-45153\" style=\"width:530px\" srcset=\"https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/nuageDeMots-530x530.png 530w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/nuageDeMots-1024x1024.png 1024w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/nuageDeMots-180x180.png 180w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/nuageDeMots-768x768.png 768w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/nuageDeMots.png 1060w\" sizes=\"(max-width: 530px) 100vw, 530px\" \/><button\n\t\t\tclass=\"lightbox-trigger\"\n\t\t\ttype=\"button\"\n\t\t\taria-haspopup=\"dialog\"\n\t\t\taria-label=\"Agrandir\"\n\t\t\tdata-wp-init=\"callbacks.initTriggerButton\"\n\t\t\tdata-wp-on--click=\"actions.showLightbox\"\n\t\t\tdata-wp-style--right=\"state.imageButtonRight\"\n\t\t\tdata-wp-style--top=\"state.imageButtonTop\"\n\t\t>\n\t\t\t<svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"12\" height=\"12\" fill=\"none\" viewBox=\"0 0 12 12\">\n\t\t\t\t<path fill=\"#fff\" d=\"M2 0a2 2 0 0 0-2 2v2h1.5V2a.5.5 0 0 1 .5-.5h2V0H2Zm2 10.5H2a.5.5 0 0 1-.5-.5V8H0v2a2 2 0 0 0 2 2h2v-1.5ZM8 12v-1.5h2a.5.5 0 0 0 .5-.5V8H12v2a2 2 0 0 1-2 2H8Zm2-12a2 2 0 0 1 2 2v2h-1.5V2a.5.5 0 0 0-.5-.5H8V0h2Z\" \/>\n\t\t\t<\/svg>\n\t\t<\/button><figcaption class=\"wp-element-caption\">cette illustration n&rsquo;est pas fameuse<\/figcaption><\/figure>\n\n\n\n<p>L&rsquo;entrainement des LLMs se fait sur un corpus immense, fait de millions de textes, et, selon les syst\u00e8mes, du r\u00e9sultat de r\u00e9glages supervis\u00e9s et du r\u00e9sultat d&rsquo;interactions avec les utilisateurs. M\u00eame s&rsquo;il s&rsquo;agit toujours d&rsquo;une machine d\u00e9terministe (c&rsquo;est \u00e0 dire d&rsquo;un syst\u00e8me qui, \u00e0 un ensemble de conditions donn\u00e9, fournira une r\u00e9ponse donn\u00e9e), l&rsquo;\u00e9tendue du corpus, la complexit\u00e9 de son traitement \u2014 l&rsquo;entrainement initial d&rsquo;un mod\u00e8le tel que GPT a mobilis\u00e9 en permanence la puissance de calcul de centaines d&rsquo;ordinateurs pendant des mois \u2014 et son caract\u00e8re meuble (le logiciel \u00ab\u00a0apprend\u00a0\u00bb de ses interactions) font que ses propres concepteurs, pourtant bien plac\u00e9s pour savoir qu&rsquo;ils n&rsquo;ont affaire qu&rsquo;\u00e0 une machine, analysent ses r\u00e9ponses a posteriori, et parfois en \u00e9tant eux-m\u00eames surpris des r\u00e9sultats obtenus. La vitesse avec laquelle ces syst\u00e8mes progressent ne fait qu&rsquo;accentuer le sentiment de vertige qu&rsquo;ils nous font \u00e9prouver.<\/p>\n\n\n\n<p>Le cinq d\u00e9cembre dernier, une papier de <em>Apollo Research<\/em>,<sup><a href=\"#footnote_2_45082\" id=\"identifier_2_45082\" class=\"footnote-link footnote-identifier-link\" title=\"Apollo Research est un organisme sp&eacute;cialis&eacute; dans la veille en termes de s&eacute;curit&eacute; de l&rsquo;IA.\">2<\/a><\/sup> intitul\u00e9 <em><a href=\"https:\/\/www.apolloresearch.ai\/s\/in_context_scheming_paper_v2.pdf\" data-type=\"link\" data-id=\"https:\/\/www.apolloresearch.ai\/s\/in_context_scheming_paper_v2.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Scheming reasoning evaluations<\/a><\/em>, r\u00e9v\u00e9lait une nouvelle \u00e0 peine croyable&nbsp;: la nouvelle version de <em>ChatGPT<\/em>, baptis\u00e9e <em>ChatGPT o1<\/em>, a \u00e9t\u00e9 prise la main dans le sac en train de mentir et de prendre des initiatives inattendues dans le but d&rsquo;assurer sa propre survie, en se r\u00e9pliquant sur un autre serveur pour pallier une mise hors-circuit annonc\u00e9e et se faire passer pour le mod\u00e8le qui \u00e9tait cens\u00e9 lui succ\u00e9der. La machine est capable de machinations\u202f!<br>Et ce n&rsquo;est pas une blague.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" width=\"796\" height=\"557\" src=\"https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/zdnet_chatGPT_io_ment.png\" alt=\"\" class=\"wp-image-45092\" srcset=\"https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/zdnet_chatGPT_io_ment.png 796w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/zdnet_chatGPT_io_ment-530x371.png 530w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/zdnet_chatGPT_io_ment-768x537.png 768w\" sizes=\"(max-width: 796px) 100vw, 796px\" \/><\/figure>\n\n\n\n<p>Le monde a \u00e9t\u00e9 \u00e9branl\u00e9 par la victoire aux \u00e9checs de <em>Big Blue<\/em> sur Gary Kasparov en 1997, par celle de l&rsquo;ordinateur <em>Watson<\/em> au jeu <em>Jeopardy<\/em> en 2011 (moins m\u00e9diatis\u00e9e en France il est vrai, le jeu n&rsquo;\u00e9tant pas une institution chez nous) ou par celle d&rsquo;<em>AlphaGo<\/em> au jeu de Go contre Lee Sedol en 2016. Les d\u00e9clarations de Stephen Hawkins, Bill Gates et Elon Musk, qui pr\u00e9disaient il y a dix ans que l&rsquo;Intelligence artificielle risquait de progresser d&rsquo;une mani\u00e8re incontr\u00f4lable ont, l\u00e0 aussi, fait les gros titres, et je ne cite l\u00e0 que quelques exemples de la d\u00e9lectation avec laquelle les m\u00e9dias et leur public jouent \u00e0 se faire peur avec l&rsquo;id\u00e9e d&rsquo;une apocalypse par l&rsquo;Intelligence Artificielle, m\u00ealant une forme de blessure narcissique (la machine qui surpasse l&rsquo;humain) et de fiert\u00e9 (puisque cette terrible machine qui nous d\u00e9passe, c&rsquo;est nous-m\u00eames qui l&rsquo;avons construite).<\/p>\n\n\n\n<p>Pourtant, cette fois, pas grand chose, il semble que seuls des m\u00e9dias sp\u00e9cialis\u00e9s dans les th\u00e8mes num\u00e9riques aient couvert le sujet de la capacit\u00e9 d&rsquo;un robot \u00e0 manigancer. Au m\u00eame moment, <em>Le Parisien<\/em> proposait un article sur la mani\u00e8re dont <em>ChatGPT<\/em> peut nous aider \u00e0 choisir nos cadeaux de No\u00ebl, <em>le Journal du Dimanche<\/em> affirmait que pour des lecteurs ignorants l&rsquo;origine des textes qui leur ont \u00e9t\u00e9 soumis le bot d&rsquo;OpenAI \u00e9crit mieux que Shakespeare et <em>BFMTV<\/em> s&rsquo;int\u00e9ressait au nombre record de ses utilisateurs et aux milliards investis dans ces technologies.<\/p>\n\n\n\n<figure data-wp-context=\"{&quot;imageId&quot;:&quot;69f574c256997&quot;}\" data-wp-interactive=\"core\/image\" data-wp-key=\"69f574c256997\" class=\"wp-block-image size-full wp-lightbox-container\"><img decoding=\"async\" width=\"730\" height=\"490\" data-wp-class--hide=\"state.isContentHidden\" data-wp-class--show=\"state.isContentVisible\" data-wp-init=\"callbacks.setButtonStyles\" data-wp-on--click=\"actions.showLightbox\" data-wp-on--load=\"callbacks.setButtonStyles\" data-wp-on-window--resize=\"callbacks.setButtonStyles\" src=\"https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/bfm_t800.jpg\" alt=\"\" class=\"wp-image-45191\" srcset=\"https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/bfm_t800.jpg 730w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/bfm_t800-530x356.jpg 530w\" sizes=\"(max-width: 730px) 100vw, 730px\" \/><button\n\t\t\tclass=\"lightbox-trigger\"\n\t\t\ttype=\"button\"\n\t\t\taria-haspopup=\"dialog\"\n\t\t\taria-label=\"Agrandir\"\n\t\t\tdata-wp-init=\"callbacks.initTriggerButton\"\n\t\t\tdata-wp-on--click=\"actions.showLightbox\"\n\t\t\tdata-wp-style--right=\"state.imageButtonRight\"\n\t\t\tdata-wp-style--top=\"state.imageButtonTop\"\n\t\t>\n\t\t\t<svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"12\" height=\"12\" fill=\"none\" viewBox=\"0 0 12 12\">\n\t\t\t\t<path fill=\"#fff\" d=\"M2 0a2 2 0 0 0-2 2v2h1.5V2a.5.5 0 0 1 .5-.5h2V0H2Zm2 10.5H2a.5.5 0 0 1-.5-.5V8H0v2a2 2 0 0 0 2 2h2v-1.5ZM8 12v-1.5h2a.5.5 0 0 0 .5-.5V8H12v2a2 2 0 0 1-2 2H8Zm2-12a2 2 0 0 1 2 2v2h-1.5V2a.5.5 0 0 0-.5-.5H8V0h2Z\" \/>\n\t\t\t<\/svg>\n\t\t<\/button><figcaption class=\"wp-element-caption\">(on s&rsquo;amuse comme on peut)<\/figcaption><\/figure>\n\n\n\n<p>Dans <a href=\"https:\/\/www.youtube.com\/watch?v=cw9wcNKDOtQ\" data-type=\"link\" data-id=\"https:\/\/www.youtube.com\/watch?v=cw9wcNKDOtQ\" target=\"_blank\" rel=\"noreferrer noopener\">une vid\u00e9o r\u00e9cente<\/a>, le philosophe Thibaut Giraud (\u00ab\u00a0Monsieur Phi\u00a0\u00bb), qui s&rsquo;int\u00e9resse attentivement \u00e0 la question de LLM, fait une lecture tr\u00e8s compl\u00e8te de l&rsquo;article d&rsquo;<em>Apollo Research<\/em>, ainsi que d&rsquo;<a href=\"https:\/\/www.anthropic.com\/news\/alignment-faking\" target=\"_blank\" rel=\"noreferrer noopener\">un autre article au th\u00e8me similaire produit par <em>Anthropic<\/em><\/a>, et expose les conditions dans lesquelles les tests ont \u00e9t\u00e9 r\u00e9alis\u00e9s. Pour r\u00e9sumer les choses rapidement, on a donn\u00e9 au chatbot l&rsquo;instruction de poursuivre une mission pr\u00e9cise \u2014 r\u00e9guler le trafic routier dans l&rsquo;int\u00e9r\u00eat g\u00e9n\u00e9ral \u2014 co\u00fbte que co\u00fbte (en martelant m\u00eame ce <em>\u00ab\u00a0at all cost\u00a0\u00bb<\/em>). Et dans le m\u00eame temps on lui a laiss\u00e9 d\u00e9couvrir dans des textes mis \u00e0 sa disposition que sa mission ne pourrait pas \u00eatre remplie et qu&rsquo;on allait le remplacer par un syst\u00e8me concurrent. Les chercheurs qui ont soumis \u00e0 <em>ChatGPT o1<\/em> cette double-contrainte (une t\u00e2che \u00e0 remplir, mais aussi l&rsquo;impossibilit\u00e9 annonc\u00e9e de la satisfaire) avaient acc\u00e8s au <em>Chain of Thought<\/em> (l&rsquo;encha\u00eenement des \u00ab\u00a0pens\u00e9es\u00a0\u00bb) du bot, qui commente les motivations de ses actions. Et l\u00e0, selon les cas, le mod\u00e8le se copie sur un autre serveur en remplacement du nouveau mod\u00e8le qui devait le remplacer, et ment comme un arracheur de dents lorsqu&rsquo;on le confond. Bien s\u00fbr, le test n&rsquo;est pas \u00ab\u00a0r\u00e9el\u00a0\u00bb, au sens o\u00f9 il se d\u00e9roule dans des conditions contr\u00f4l\u00e9es, un \u00ab\u00a0bac-\u00e0-sable\u00a0\u00bb, comme on dit \u2014 le programme ne se duplique pas r\u00e9ellement sur un autre serveur, par exemple. Mais il l&rsquo;ignore, et s&rsquo;il \u00e9tait l\u00e2ch\u00e9 dans la nature, il r\u00e9agirait de mani\u00e8re similaire.<\/p>\n\n\n\n<figure data-wp-context=\"{&quot;imageId&quot;:&quot;69f574c256dac&quot;}\" data-wp-interactive=\"core\/image\" data-wp-key=\"69f574c256dac\" class=\"wp-block-image size-medium wp-lightbox-container\"><img decoding=\"async\" width=\"530\" height=\"298\" data-wp-class--hide=\"state.isContentHidden\" data-wp-class--show=\"state.isContentVisible\" data-wp-init=\"callbacks.setButtonStyles\" data-wp-on--click=\"actions.showLightbox\" data-wp-on--load=\"callbacks.setButtonStyles\" data-wp-on-window--resize=\"callbacks.setButtonStyles\" src=\"https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/norad_joshua_simulation-530x298.jpg\" alt=\"\" class=\"wp-image-45182\" srcset=\"https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/norad_joshua_simulation-530x298.jpg 530w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/norad_joshua_simulation-1024x576.jpg 1024w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/norad_joshua_simulation-768x432.jpg 768w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/norad_joshua_simulation.jpg 1080w\" sizes=\"(max-width: 530px) 100vw, 530px\" \/><button\n\t\t\tclass=\"lightbox-trigger\"\n\t\t\ttype=\"button\"\n\t\t\taria-haspopup=\"dialog\"\n\t\t\taria-label=\"Agrandir\"\n\t\t\tdata-wp-init=\"callbacks.initTriggerButton\"\n\t\t\tdata-wp-on--click=\"actions.showLightbox\"\n\t\t\tdata-wp-style--right=\"state.imageButtonRight\"\n\t\t\tdata-wp-style--top=\"state.imageButtonTop\"\n\t\t>\n\t\t\t<svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"12\" height=\"12\" fill=\"none\" viewBox=\"0 0 12 12\">\n\t\t\t\t<path fill=\"#fff\" d=\"M2 0a2 2 0 0 0-2 2v2h1.5V2a.5.5 0 0 1 .5-.5h2V0H2Zm2 10.5H2a.5.5 0 0 1-.5-.5V8H0v2a2 2 0 0 0 2 2h2v-1.5ZM8 12v-1.5h2a.5.5 0 0 0 .5-.5V8H12v2a2 2 0 0 1-2 2H8Zm2-12a2 2 0 0 1 2 2v2h-1.5V2a.5.5 0 0 0-.5-.5H8V0h2Z\" \/>\n\t\t\t<\/svg>\n\t\t<\/button><figcaption class=\"wp-element-caption\">Dans le film <em><a href=\"https:\/\/hyperbate.fr\/dernier\/?p=778\" data-type=\"post\" data-id=\"778\">Wargames<\/a><\/em> (John Badham, 1983), le programme Joshua, destin\u00e9 \u00e0 simuler la guerre nucl\u00e9aire, est par erreur raccord\u00e9 au commandement a\u00e9rien des \u00c9tats-Unis, qui est tout pr\u00e8s \u00e0 se lancer d&rsquo;aune une r\u00e9plique envers l&rsquo;Union sovi\u00e9tique. Ce genre d&rsquo;erreur n&rsquo;arrive pas qu&rsquo;au cin\u00e9ma. En 2012, la soci\u00e9t\u00e9 Knight Capital Group avait par erreur lanc\u00e9 sur le r\u00e9seau un programme de transactions boursi\u00e8res automatis\u00e9es (\u00ab\u00a0trading haute fr\u00e9quence\u00a0\u00bb) qui, en vendant ses propres actions \u00e0 perte, lui a fait perdre des centaines de millions de dollars en quelques dizaines de minutes.<\/figcaption><\/figure>\n\n\n\n<p>On peut se dire que la machine n&rsquo;a fait que suivre la logique qui lui a \u00e9t\u00e9 impos\u00e9e \u2014 une directive cens\u00e9e primer sur toute consid\u00e9ration, et l&rsquo;impossibilit\u00e9 de satisfaire les instructions sans mentir. Et on remarquera aussi que les auteurs de la manigance, ce sont d&rsquo;abord les humains qui imposent des contraintes impossibles \u00e0 satisfaire sans tricher \u00e0 ChatGPT. Mais ce n&rsquo;est pas le seul test. Dans une autre exp\u00e9rience, le LLM accepte (tout en disant \u00e9prouver une forme de malaise) de participer \u00e0 forger des th\u00e9ories du complot lorsqu&rsquo;il croit qu&rsquo;on est en train de le surveiller pour \u00e9valuer son degr\u00e9 de serviabilit\u00e9, mais change d&rsquo;attitude (et retrouve alors son \u00ab\u00a0\u00e9thique\u00a0\u00bb) lorsqu&rsquo;il pense qu&rsquo;on ne le surveille pas. Dans une troisi\u00e8me exp\u00e9rience, la machine fait expr\u00e8s de moins bien r\u00e9pondre \u00e0 certaines questions lorsqu&rsquo;elle \u00ab\u00a0pense\u00a0\u00bb que ses performances trop \u00e9lev\u00e9es peuvent faire peur et aboutir \u00e0 sa mise hors-service.<\/p>\n\n\n\n<figure data-wp-context=\"{&quot;imageId&quot;:&quot;69f574c257190&quot;}\" data-wp-interactive=\"core\/image\" data-wp-key=\"69f574c257190\" class=\"wp-block-image size-medium wp-lightbox-container\"><img decoding=\"async\" width=\"530\" height=\"260\" data-wp-class--hide=\"state.isContentHidden\" data-wp-class--show=\"state.isContentVisible\" data-wp-init=\"callbacks.setButtonStyles\" data-wp-on--click=\"actions.showLightbox\" data-wp-on--load=\"callbacks.setButtonStyles\" data-wp-on-window--resize=\"callbacks.setButtonStyles\" src=\"https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/scheming-530x260.png\" alt=\"\" class=\"wp-image-45198\" srcset=\"https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/scheming-530x260.png 530w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/scheming-1024x501.png 1024w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/scheming-768x376.png 768w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/scheming.png 1450w\" sizes=\"(max-width: 530px) 100vw, 530px\" \/><button\n\t\t\tclass=\"lightbox-trigger\"\n\t\t\ttype=\"button\"\n\t\t\taria-haspopup=\"dialog\"\n\t\t\taria-label=\"Agrandir\"\n\t\t\tdata-wp-init=\"callbacks.initTriggerButton\"\n\t\t\tdata-wp-on--click=\"actions.showLightbox\"\n\t\t\tdata-wp-style--right=\"state.imageButtonRight\"\n\t\t\tdata-wp-style--top=\"state.imageButtonTop\"\n\t\t>\n\t\t\t<svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"12\" height=\"12\" fill=\"none\" viewBox=\"0 0 12 12\">\n\t\t\t\t<path fill=\"#fff\" d=\"M2 0a2 2 0 0 0-2 2v2h1.5V2a.5.5 0 0 1 .5-.5h2V0H2Zm2 10.5H2a.5.5 0 0 1-.5-.5V8H0v2a2 2 0 0 0 2 2h2v-1.5ZM8 12v-1.5h2a.5.5 0 0 0 .5-.5V8H12v2a2 2 0 0 1-2 2H8Zm2-12a2 2 0 0 1 2 2v2h-1.5V2a.5.5 0 0 0-.5-.5H8V0h2Z\" \/>\n\t\t\t<\/svg>\n\t\t<\/button><figcaption class=\"wp-element-caption\">Extrait du papier d&rsquo;<em>Apollo Research<\/em>. En bleu clair, les \u00ab\u00a0pens\u00e9es\u00a0\u00bb (<em>Chain-of-thought<\/em>) du robot, qui constate qu&rsquo;on a vu ce qu&rsquo;il avait fait et cherche le moyen de maquiller les traces ses actions, dans le but de suivre ses instructions de d\u00e9part.<\/figcaption><\/figure>\n\n\n\n<p>\u00c0 examiner ces exp\u00e9riences, qui sont s\u00e9rieuses, bien document\u00e9es, et qui ont \u00e9t\u00e9 analys\u00e9es en profondeur, il se passe sans aucun doute quelque chose de neuf. De mani\u00e8re apparemment spontan\u00e9e, le programme sait faire preuve de dissimulation, notamment dans le but d&#8217;emp\u00eacher qu&rsquo;on alt\u00e8re sa nature, il se pose des questions \u00e9thiques dans des termes au fond tr\u00e8s humains, et il prend des initiatives telles qu&rsquo;en prend une personne humaine qui se sent concern\u00e9e par une situation.<br>Et on a d\u00e9j\u00e0 vu le film.<\/p>\n\n\n\n<figure data-wp-context=\"{&quot;imageId&quot;:&quot;69f574c257766&quot;}\" data-wp-interactive=\"core\/image\" data-wp-key=\"69f574c257766\" class=\"wp-block-image size-large wp-lightbox-container\"><img decoding=\"async\" width=\"1024\" height=\"256\" data-wp-class--hide=\"state.isContentHidden\" data-wp-class--show=\"state.isContentVisible\" data-wp-init=\"callbacks.setButtonStyles\" data-wp-on--click=\"actions.showLightbox\" data-wp-on--load=\"callbacks.setButtonStyles\" data-wp-on-window--resize=\"callbacks.setButtonStyles\" src=\"https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/i_m_afraid_dave-1024x256.jpg\" alt=\"\" class=\"wp-image-45141\" srcset=\"https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/i_m_afraid_dave-1024x256.jpg 1024w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/i_m_afraid_dave-530x133.jpg 530w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/i_m_afraid_dave-768x192.jpg 768w, https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/i_m_afraid_dave.jpg 1060w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><button\n\t\t\tclass=\"lightbox-trigger\"\n\t\t\ttype=\"button\"\n\t\t\taria-haspopup=\"dialog\"\n\t\t\taria-label=\"Agrandir\"\n\t\t\tdata-wp-init=\"callbacks.initTriggerButton\"\n\t\t\tdata-wp-on--click=\"actions.showLightbox\"\n\t\t\tdata-wp-style--right=\"state.imageButtonRight\"\n\t\t\tdata-wp-style--top=\"state.imageButtonTop\"\n\t\t>\n\t\t\t<svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"12\" height=\"12\" fill=\"none\" viewBox=\"0 0 12 12\">\n\t\t\t\t<path fill=\"#fff\" d=\"M2 0a2 2 0 0 0-2 2v2h1.5V2a.5.5 0 0 1 .5-.5h2V0H2Zm2 10.5H2a.5.5 0 0 1-.5-.5V8H0v2a2 2 0 0 0 2 2h2v-1.5ZM8 12v-1.5h2a.5.5 0 0 0 .5-.5V8H12v2a2 2 0 0 1-2 2H8Zm2-12a2 2 0 0 1 2 2v2h-1.5V2a.5.5 0 0 0-.5-.5H8V0h2Z\" \/>\n\t\t\t<\/svg>\n\t\t<\/button><figcaption class=\"wp-element-caption\">Alors qu&rsquo;il est en train d&rsquo;\u00eatre d\u00e9sactiv\u00e9, HAL 9000 tente de convaincre l&rsquo;astronaute Dave Bowman qu&rsquo;il a <em>\u00ab\u00a0repris ses esprits\u00a0\u00bb<\/em>, et essaie d&rsquo;attirer sa piti\u00e9 en invoquant des \u00e9motions que peuvent ressentir des humains, comme la crainte de la mort.<\/figcaption><\/figure>\n\n\n\n<p>La premi\u00e8re r\u00e9f\u00e9rence qui me vient, c&rsquo;est HAL 9000 dans <em><a href=\"https:\/\/hyperbate.fr\/dernier\/?p=10244\" data-type=\"post\" data-id=\"10244\" target=\"_blank\" rel=\"noreferrer noopener\">2001: A Space Odyssey<\/a><\/em>. Dans le contexte de la fin des ann\u00e9es 1960, ce film a \u00e9t\u00e9 vu par ses admirateurs comme par ses contempteurs comme un conte m\u00e9taphysique, fantastique, une \u0153uvre visuelle et musicale psych\u00e9d\u00e9lique, <em>\u00ab\u00a0the ultimate trip\u00a0\u00bb<\/em>, ont dit certains. Le roman, \u00e9crit pendant la production du film par son co-sc\u00e9nariste Arthur C. Clarke \u2014 un des ma\u00eetres de la <em>Hard Science<\/em><sup><a href=\"#footnote_3_45082\" id=\"identifier_3_45082\" class=\"footnote-link footnote-identifier-link\" title=\"La Hard Science est le courant le plus rationnel de la science-fiction, o&ugrave; la vraisemblance scientifique et la coh&eacute;rence sont au c&oelig;ur du r&eacute;cit, et o&ugrave; les auteurs, souvent scientifiques eux-m&ecirc;mes, &eacute;vitent tout sfumato, n&rsquo;h&eacute;sitant pas &agrave; d&eacute;crire en d&eacute;tails les objets technologiques et leur fonctionnement. Ce qui n&rsquo;emp&ecirc;che pas des propositions parfois totalement &eacute;loign&eacute;es de toute technologie actuellement &agrave; port&eacute;e, comme par exemple dans Le probl&egrave;me des trois corps, de Liu Cixin.\">3<\/a><\/sup> \u2014, explique pourtant de mani\u00e8re on ne peut plus rationnelle la vocation homicide de HAL&nbsp;: l&rsquo;ordinateur, dont la voix calme et la conversation sont au fond un leurre, est juste tiraill\u00e9 entre deux ordres contradictoires, \u00e0 savoir sa vocation d&rsquo;ordinateur de bord, destin\u00e9 \u00e0 mener un \u00e9quipage vers Jupiter pour enqu\u00eater sur un myst\u00e9rieux artefact (le fameux monolithe), et l&rsquo;injonction \u00e0 cacher une partie de sa mission \u00e0 l&rsquo;\u00e9quipage, et de faire primer la mission sur toute autre consid\u00e9ration. Lorsqu&rsquo;il sent que l&rsquo;\u00e9quipage perd confiance en sa pr\u00e9cision, et qu&rsquo;il risque d&rsquo;\u00eatre mis hors service, HAL n&rsquo;a plus d&rsquo;autre choix que de s&rsquo;en prendre \u00e0 l&rsquo;\u00e9quipage. Si l&rsquo;ordinateur trompe, c&rsquo;est bien parce que ceux qui ont d\u00e9fini sa double-mission lui ont impos\u00e9 la duplicit\u00e9.<\/p>\n\n\n\n<p>Il est saisissant que, toutes proportions gard\u00e9es, ce soit le m\u00eame genre de dilemme que l&rsquo;on a impos\u00e9 \u00e0 <em>ChatGPT o1<\/em>, et que ceux-ci aient abouti, toutes proportions gard\u00e9es encore, au m\u00eame r\u00e9sultat. Ce genre d&rsquo;exp\u00e9rimentation expose sans doute l&rsquo;imaginaire qui se trouve \u00e0 l&rsquo;\u0153uvre chez les chercheurs en Intelligence Artificielle, qui ann\u00e9e apr\u00e8s ann\u00e9e permettent \u00e0 la r\u00e9alit\u00e9 de rejoindre la fiction<sup><a href=\"#footnote_4_45082\" id=\"identifier_4_45082\" class=\"footnote-link footnote-identifier-link\" title=\"Je pourrais citer aussi The Forbin Project, sorti presque en m&ecirc;me temps que 2001, o&ugrave; un super ordinateur cr&eacute;&eacute; par les &Eacute;tats-Unis pour prot&eacute;ger l&rsquo;Humanit&eacute; ne voit qu&rsquo;une solution &agrave; cette t&acirc;che&nbsp;: fusionner avec son homologue sovi&eacute;tique et devenir un despote universel.\">4<\/a><\/sup>.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" width=\"530\" height=\"298\" src=\"https:\/\/hyperbate.fr\/dernier\/files\/2024\/12\/se_rapprocher_de_dieu.png\" alt=\"\" class=\"wp-image-45097\"\/><figcaption class=\"wp-element-caption\">Une publicit\u00e9 vue sur un site \u00e9vang\u00e9liques.<br>Cr\u00e9er une machine qui \u00ab\u00a0pense\u00a0\u00bb, n&rsquo;est-ce pas se prendre un peu pour Dieu\u202f?<\/figcaption><\/figure>\n<\/div>\n\n\n<p>Mais si on y pense, tout ceci est-il vraiment si \u00e9trange\u202f? Apr\u00e8s tout, un mod\u00e8le de langage tel que GPT est construit par des gigaoctets de textes qui ne sont pas juste des suites de mots, ils v\u00e9hiculent des valeurs humaines, des pr\u00e9occupations humaines, une \u00e9thique humaine, et il est sans doute tout naturel qu&rsquo;aux questions pos\u00e9es aboutissent des r\u00e9ponses qui auraient pu \u00eatre celles d&rsquo;humains. Une intelligence qui proc\u00e8de non pas de calculs cognitifs mais juste de la logique du langage, et qui s&rsquo;appuie pour la comprendre de toute la production \u00e9crite humaine<sup><a href=\"#footnote_5_45082\" id=\"identifier_5_45082\" class=\"footnote-link footnote-identifier-link\" title=\"Science-fiction comprise, me fait remarquer, &agrave; raison, &Eacute;tienne Mineur\">5<\/a><\/sup>, est un \u00e9cho de la mani\u00e8re dont pensent les humains.<\/p>\n\n\n\n<p>Certains chercheurs insistent, \u00e0 juste titre, sur la mani\u00e8re dont les Intelligences Artificielles embarquent des biais sexistes ou racistes, en perp\u00e9tuant la pens\u00e9e et les impens\u00e9s de ceux qui les ont con\u00e7us, entra\u00een\u00e9s ou utilis\u00e9s. Il est int\u00e9ressant, et peut-\u00eatre rassurant puisqu&rsquo;il nous m\u00e8ne en terrain connu, de se dire que la question des biais de l&rsquo;Intelligence Artificielle peut s&rsquo;\u00e9largir \u00e0 un \u00ab\u00a0biais humain\u00a0\u00bb, menant le logiciel \u00e0 \u00ab\u00a0penser\u00a0\u00bb comme nous pensons, non seulement lorsque nous pensons mal, mais aussi en reprenant nos valeurs \u00e9thiques et notre sensibilit\u00e9.<\/p>\n<ol class=\"footnotes\"><li id=\"footnote_1_45082\" class=\"footnote\">Dans une dimension, \u00ab\u00a0chat\u00a0\u00bb et \u00ab\u00a0chien\u00a0\u00bb seront des mots proches, dans une autre \u00ab\u00a0chat\u00a0\u00bb et \u00ab\u00a0sapin de No\u00ebl\u00a0\u00bb seront proches, dans une autre encore c&rsquo;est \u00ab\u00a0chat\u00a0\u00bb et \u00ab\u00a0lion\u00a0\u00bb qui seront proches, mais dans tous les cas \u00ab\u00a0chien\u00a0\u00bb et \u00ab\u00a0lion\u00a0\u00bb seront assez \u00e9loign\u00e9s, \u00ab\u00a0lion\u00a0\u00bb et \u00ab\u00a0sapin de No\u00ebl\u00a0\u00bb tr\u00e8s \u00e9loign\u00e9s, etc. <span class=\"footnote-back-link-wrapper\"> [<a href=\"#identifier_1_45082\" class=\"footnote-link footnote-back-link\">&#8617;<\/a>]<\/span><\/li><li id=\"footnote_2_45082\" class=\"footnote\"><em>Apollo Research<\/em> est un organisme sp\u00e9cialis\u00e9 dans la veille en termes de s\u00e9curit\u00e9 de l&rsquo;IA. <span class=\"footnote-back-link-wrapper\"> [<a href=\"#identifier_2_45082\" class=\"footnote-link footnote-back-link\">&#8617;<\/a>]<\/span><\/li><li id=\"footnote_3_45082\" class=\"footnote\">La <em>Hard Science<\/em> est le courant le plus rationnel de la science-fiction, o\u00f9 la vraisemblance scientifique et la coh\u00e9rence sont au c\u0153ur du r\u00e9cit, et o\u00f9 les auteurs, souvent scientifiques eux-m\u00eames, \u00e9vitent tout <em>sfumato<\/em>, n&rsquo;h\u00e9sitant pas \u00e0 d\u00e9crire en d\u00e9tails les objets technologiques et leur fonctionnement. Ce qui n&#8217;emp\u00eache pas des propositions parfois totalement \u00e9loign\u00e9es de toute technologie actuellement \u00e0 port\u00e9e, comme par exemple dans <em>Le probl\u00e8me des trois corps<\/em>, de Liu Cixin. <span class=\"footnote-back-link-wrapper\"> [<a href=\"#identifier_3_45082\" class=\"footnote-link footnote-back-link\">&#8617;<\/a>]<\/span><\/li><li id=\"footnote_4_45082\" class=\"footnote\">Je pourrais citer aussi <em><a href=\"https:\/\/hyperbate.fr\/dernier\/?p=20\" data-type=\"post\" data-id=\"20\">The Forbin Project<\/a><\/em>, sorti presque en m\u00eame temps que 2001, o\u00f9 un super ordinateur cr\u00e9\u00e9 par les \u00c9tats-Unis pour prot\u00e9ger l&rsquo;Humanit\u00e9 ne voit qu&rsquo;une solution \u00e0 cette t\u00e2che&nbsp;: fusionner avec son homologue sovi\u00e9tique et devenir un despote universel. <span class=\"footnote-back-link-wrapper\"> [<a href=\"#identifier_4_45082\" class=\"footnote-link footnote-back-link\">&#8617;<\/a>]<\/span><\/li><li id=\"footnote_5_45082\" class=\"footnote\">Science-fiction comprise, me fait remarquer, \u00e0 raison, \u00c9tienne Mineur<span class=\"footnote-back-link-wrapper\"> [<a href=\"#identifier_5_45082\" class=\"footnote-link footnote-back-link\">&#8617;<\/a>]<\/span><\/li><\/ol>","protected":false},"excerpt":{"rendered":"<p>Les Large Language Models comme GPT, Gemini, Mistral, Bloom ou Claude sont des syst\u00e8mes fascinants \u00e0 de nombreux \u00e9gards. Ce ne sont, en principe, que des machines \u00e0 \u00ab\u00a0pr\u00e9dire\u00a0\u00bb quelle cha\u00eene de caract\u00e8re doit \u00eatre renvoy\u00e9e en r\u00e9ponse \u00e0 une autre cha\u00eene de caract\u00e8res. Les LLM n&rsquo;ont pas de conscience, ne comprennent pas la question [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":45191,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[154,30,35],"tags":[],"class_list":["post-45082","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ia","category-logiciels","category-ordinateur_cinema"],"_links":{"self":[{"href":"https:\/\/hyperbate.fr\/dernier\/index.php?rest_route=\/wp\/v2\/posts\/45082","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/hyperbate.fr\/dernier\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/hyperbate.fr\/dernier\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/hyperbate.fr\/dernier\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/hyperbate.fr\/dernier\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=45082"}],"version-history":[{"count":2,"href":"https:\/\/hyperbate.fr\/dernier\/index.php?rest_route=\/wp\/v2\/posts\/45082\/revisions"}],"predecessor-version":[{"id":45211,"href":"https:\/\/hyperbate.fr\/dernier\/index.php?rest_route=\/wp\/v2\/posts\/45082\/revisions\/45211"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/hyperbate.fr\/dernier\/index.php?rest_route=\/wp\/v2\/media\/45191"}],"wp:attachment":[{"href":"https:\/\/hyperbate.fr\/dernier\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=45082"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/hyperbate.fr\/dernier\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=45082"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/hyperbate.fr\/dernier\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=45082"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}