Auteur/autrice : admin

  • Bicyclettes vs fusées : et si l’IA n’avait pas besoin d’être aussi grosse ?

    Bicyclettes vs fusées : et si l’IA n’avait pas besoin d’être aussi grosse ?

    Il existe deux façons de construire une IA utile.

    La première : prendre des milliards de paramètres, des exaoctets de données, des milliers de puces graphiques, et entraîner un modèle pendant des mois en consommant l’équivalent énergétique d’une ville moyenne. C’est l’approche GPT-4, Gemini Ultra, Claude Opus.

    La seconde : définir précisément le problème, rassembler des données de haute qualité spécifiques à ce problème, et construire un système optimisé pour cette tâche unique. C’est l’approche AlphaFold.

    Karen Hao les appelle les fusées et les bicyclettes de l’IA. Et la distinction change tout — sur le plan éthique, économique, et pratique.


    AlphaFold : l’exemple parfait de la bicyclette

    En 2020, DeepMind a résolu un problème que la biologie cherchait depuis 50 ans : prédire la structure tridimensionnelle des protéines à partir de leur séquence d’acides aminés.

    La structure des protéines détermine leur fonction. Comprendre cette structure, c’est comprendre comment les maladies fonctionnent, comment concevoir des médicaments qui les ciblent, comment accélérer la recherche médicale de façon dramatique. Les méthodes expérimentales prenaient des années pour résoudre une seule structure. AlphaFold en prédit 200 millions en quelques mois.

    Et pourtant, AlphaFold n’est pas un modèle massif au sens où on l’entend aujourd’hui. Il utilise des données spécifiques et curatées — des structures de protéines déjà connues, non pas l’intégralité d’internet. Sa puissance de calcul est une fraction de celle nécessaire pour entraîner un GPT.

    Son rapport utilité/ressources est extraordinaire. C’est une bicyclette. Elle ne peut pas faire ce que fait une voiture. Mais pour aller d’un point A à un point B — résoudre ce problème précis — elle est parfaite. Et elle ne coûte pas une ville en électricité.


    Pourquoi les entreprises préfèrent les fusées

    Si les bicyclettes sont plus efficientes, pourquoi l’industrie se concentre-t-elle sur les fusées ?

    La réponse n’est pas technique. Elle est économique et politique.

    Les fusées créent des barrières à l’entrée. Un modèle comme GPT-4 nécessite des milliards de dollars d’infrastructure. Seules quelques entreprises peuvent se le permettre. Cette exclusivité crée des positions dominantes difficiles à contester.

    Les modèles généralistes sont plus vendables. Un outil qui « peut tout faire » est plus facile à marketer qu’un outil spécialisé. Les investisseurs, les médias, le grand public réagissent aux démonstrations spectaculaires — générer des images, écrire du code, simuler une conversation — même si l’utilité réelle reste discutable.

    Le scaling est la stratégie dominante. L’hypothèse centrale de l’industrie est que plus le modèle est grand, meilleur il sera. Cette hypothèse commence à être contestée — les rendements sont décroissants — mais elle a organisé des années d’investissement massif.

    Les données d’entraînement sont une ressource captée. Les grands modèles se nourrissent d’internet, de livres, de conversations — des ressources produites par des milliards de personnes qui n’ont pas consenti à cet usage. Les petits modèles spécialisés ont besoin de données curatées, ce qui implique un travail de sélection plus honnête.


    Ce que ça change pour les praticiens

    Si vous utilisez ou déployez de l’IA dans un contexte professionnel, la distinction fusée/bicyclette a des implications concrètes.

    Pour choisir le bon outil :

    Avant de déployer un LLM généraliste pour un cas d’usage, posez-vous la question : est-ce que ce problème a une frontière claire ? Est-ce qu’on peut le définir précisément ? Si oui, une approche spécialisée — fine-tuning, RAG sur un corpus limité, modèle plus petit entraîné sur vos données — sera probablement plus fiable, plus rapide, moins chère, et plus facile à contrôler.

    Les LLM généralistes sont excellents pour les tâches ambiguës, créatives, ou larges. Pour les tâches précises et répétitives — classification, extraction d’information, vérification de conformité — une bicyclette bien conçue bat souvent une fusée.

    Pour évaluer les coûts réels :

    Un appel API à GPT-4 semble peu coûteux à l’unité. Mais à l’échelle, sur des millions d’appels, le calcul change. Un modèle plus petit, déployé localement ou sur une infrastructure légère, peut coûter 10 fois moins — avec des performances comparables sur votre cas d’usage spécifique.

    Pour penser l’empreinte écologique :

    L’inférence sur un petit modèle consomme une fraction de l’énergie d’un grand modèle. À l’échelle d’une organisation qui fait des millions de requêtes par mois, la différence est significative — et de plus en plus prise en compte dans les rapports RSE.


    La vraie question de performance

    L’industrie mesure la performance des modèles sur des benchmarks — des tests standardisés en mathématiques, en raisonnement, en compréhension de texte.

    Ces benchmarks mesurent ce que les modèles savent faire en général. Ils ne mesurent pas ce qu’ils font pour vous, sur votre problème.

    AlphaFold n’aurait probablement pas brillé sur ces benchmarks généralistes. Il n’est pas conçu pour ça. Il est conçu pour résoudre un problème précis, de façon extraordinairement fiable, avec un minimum de ressources.

    C’est ça, une bicyclette. Et pour la plupart des problèmes réels — en entreprise, en recherche, dans les services publics — c’est probablement ce dont on a besoin.

    Pas une fusée qui consomme une ville. Une bicyclette qui fait exactement ce qu’on lui demande.


    Ce que ça implique pour l’avenir

    Karen Hao plaide pour une réorientation du secteur vers des modèles plus efficients. Ce n’est pas une position anti-IA. C’est une position anti-gaspillage.

    Si l’objectif est de résoudre des problèmes réels — santé, éducation, transition écologique, administration publique — les bicyclettes sont le chemin. Elles sont moins spectaculaires. Elles ne font pas de démonstrations éblouissantes lors des keynotes. Mais elles délivrent de la valeur sans externaliser leurs coûts sur les communautés qui vivent près des data centers et sur une planète qui ne peut pas absorber indéfiniment l’empreinte d’une industrie en croissance exponentielle.

    Le choix entre fusée et bicyclette est un choix de valeurs autant que de technologie.


    Sources : Karen Hao — journaliste d’investigation sur les empires de l’IA · DeepMind / AlphaFold (Nature, 2021) · Prix Nobel de Chimie 2024 décerné à Demis Hassabis et John Jumper pour AlphaFold

  • Pourquoi l’IA brise l’échelle de carrière des jeunes

    Pourquoi l’IA brise l’échelle de carrière des jeunes

    Il y a une façon de progresser dans une carrière qui a fonctionné pendant des décennies : on commence en bas, on apprend en faisant, on monte les échelons un à un.

    Ce modèle est en train d’être détruit. Pas par accident. Par conception.


    L’échelle avait des échelons

    Pensez à n’importe quelle profession structurée. Droit, médecine, finance, marketing, développement logiciel, architecture. Il y avait des postes juniors — pas glorieux, souvent mal payés — qui permettaient d’acquérir une chose irremplaçable : l’expérience pratique.

    Ces postes juniors avaient une utilité double. Pour l’employé : apprendre, se tromper dans un environnement contrôlé, construire un réseau, progresser. Pour l’employeur : un vivier de futurs experts formés aux pratiques de la maison.

    L’IA s’attaque précisément à ces postes. Pas parce qu’elle est meilleure que ces juniors — souvent, elle ne l’est pas, ou marginalement. Mais parce qu’elle coûte moins cher et ne demande pas d’augmentation.

    Karen Hao appelle ça la destruction des « rungs » — les échelons de l’échelle professionnelle. Quand les échelons disparaissent, l’échelle devient impossible à gravir.


    Le piège de l’annotation

    Pour les jeunes diplômés qui ne trouvent pas de poste dans leur domaine, une alternative « de transition » apparaît : l’annotation de données.

    Détourer des images. Noter des réponses de chatbots. Étiqueter des émotions. Transcrire des conversations.

    Ce travail est vendu comme temporaire, comme une façon de « rester dans le secteur tech » en attendant mieux. En réalité, c’est une impasse construite.

    Paradoxe 1 : Ces jeunes utilisent leurs compétences — leur formation en droit, en médecine, en création — pour entraîner des modèles sur ces mêmes compétences. Ils accélèrent la disparition de leur propre débouché professionnel.

    Paradoxe 2 : Le travail d’annotation ne permet aucune progression. Il n’y a pas de promotion, pas de formation, pas d’évolution. C’est une sortie de route sans chemin de retour.

    Karen Hao documente des diplômés de PhD, des médecins, des réalisateurs primés contraints d’accepter ces postes — non pas comme transition, mais comme destination par défaut dans une économie restructurée.


    La polarisation qui verrouille

    Le marché du travail se coupe en deux, de façon de plus en plus nette.

    En haut : des postes à très haute expertise — architectes de systèmes IA, chercheurs, ingénieurs ML seniors — pour ceux qui orchestrent et supervisent les agents. Ces postes exigent une expérience longue… qu’on ne peut pas acquérir sans les postes qui ont disparu.

    En bas : une masse de sous-emplois précaires — annotation, modération de contenu, tâches de « vérification humaine » — pour ceux qui n’ont pas encore atteint le haut.

    Entre les deux : un vide. Pas de passerelle. Pas de progression naturelle.

    Les jeunes qui entrent sur le marché aujourd’hui ne peuvent pas commencer en bas et monter. Ils entrent directement dans une impasse, ou se retrouvent bloqués à devoir compétences à un niveau qui suppose une expérience qu’ils n’ont jamais pu acquérir.


    La vitesse comme facteur aggravant

    Les révolutions industrielles précédentes ont été brutales. Des métiers entiers ont disparu — tisserands, charretiers, imprimeurs traditionnels.

    Mais ces transitions se mesuraient en décennies. Les générations avaient le temps de s’adapter, de se reconvertir, de former leurs enfants différemment.

    L’IA se propage à la vitesse d’internet. Une compétence qui était demandée il y a deux ans peut être automatisée aujourd’hui. Les cycles de formation professionnelle — qui durent 3 à 5 ans — ne peuvent pas suivre.

    Karen Hao souligne que cette vitesse est l’un des facteurs les plus sous-estimés dans les analyses économiques sur l’impact de l’IA sur l’emploi. Ce n’est pas seulement une question de quels emplois disparaissent — c’est une question de à quelle vitesse, et si la société a le temps de réagir.


    Ce qu’on peut faire concrètement

    Si vous êtes jeune et entrez sur le marché :

    Cherchez des postes où vous travaillez avec l’IA, pas pour elle. La différence est importante. « Utiliser Claude pour accélérer mon travail » est différent de « être le vérificateur humain des outputs de Claude ». Le premier vous rend plus compétent. Le second vous enferme.

    Développez des compétences en orchestration : comment déléguer à des agents IA, comment vérifier et corriger leurs outputs, comment concevoir des workflows hybrides. Ce sont les compétences qui survivent.

    Si vous gérez des équipes :

    Résistez à la tentation de remplacer les postes juniors par de l’IA. Ces postes ne servent pas seulement à produire — ils servent à former la prochaine génération de seniors. Si vous supprimez la base de la pyramide aujourd’hui, vous n’aurez plus d’experts dans 10 ans.

    Si vous êtes décideur politique :

    Le débat actuel sur l’IA et l’emploi se concentre sur les secteurs touchés. La vraie question est celle des mécanismes de transition : qu’est-ce qui remplace les voies d’accès à la compétence que l’IA supprime ?

    Ce n’est pas un problème technique. C’est un problème de conception sociale.


    Source : Karen Hao — journaliste d’investigation sur les empires technologiques de l’IA. Ses travaux documentent les témoignages de travailleurs, les données sur la polarisation du marché du travail, et les mécanismes d’exploitation des plateformes d’annotation.

  • L’anxiété comme business model — la stratégie des empires de l’IA

    L’anxiété comme business model — la stratégie des empires de l’IA

    Vous avez peur de l’IA. Peur qu’elle vous remplace. Peur qu’elle échappe à tout contrôle. Peur de rater le train si vous ne l’adoptez pas assez vite.

    Cette peur n’est pas un effet secondaire du développement de l’IA.

    C’est un produit. Délibérément fabriqué.


    La mécanique du discours paradis/enfer

    Karen Hao, après des années d’investigation sur les grandes entreprises d’IA, affirme disposer de documents internes prouvant que ces entreprises construisent intentionnellement un sentiment d’anxiété dans le public.

    Le mécanisme est simple et efficace.

    D’un côté, le paradis : l’IA va résoudre le cancer, éliminer la pauvreté, accélérer la science, libérer l’humanité des tâches répétitives. Il suffit de laisser faire les experts.

    De l’autre, l’enfer : si nous n’agissons pas assez vite, une IA mal alignée, développée par les mauvaises personnes, dans les mauvaises conditions, pourrait menacer l’existence humaine.

    Ces deux discours, présentés en alternance, produisent un effet précis : vous croyez que seules ces entreprises, avec ces ressources, ces talents, ces investissements, peuvent naviguer entre les deux horizons. Et donc vous leur cédez du pouvoir et des ressources — sous forme de données, de contrats, de réglementations favorables, de financement public.

    C’est un manuel de manipulation qui a déjà fonctionné. Sam Altman en est l’un des praticiens les plus habiles.


    Les licenciements « préventifs »

    L’anxiété ne fonctionne pas seulement sur le grand public. Elle est un outil de gestion interne.

    Karen Hao documente des entreprises qui licencient des travailleurs non pas parce que l’IA peut déjà faire leur travail, mais parce que les dirigeants préfèrent parier sur un résultat « assez bon » à moindre coût. Le message aux employés restants est clair : votre poste est précaire. Vous êtes remplaçable. Travaillez plus, demandez moins.

    Cette précarité organisée remplit plusieurs fonctions :

    Elle réduit les coûts salariaux en diminuant le pouvoir de négociation des employés.

    Elle accélère l’adoption des outils IA en interne, puisque chacun cherche à démontrer que sa productivité justifie son poste.

    Elle normalise la précarité comme condition naturelle du travail dans l’économie de l’IA.


    L’anxiété comme mode de gestion des travailleurs de l’ombre

    Dans les couches les plus basses de la chaîne de valeur de l’IA — les centaines de milliers d’annotateurs précaires qui entraînent les modèles — l’anxiété est architecturée dans le système lui-même.

    Les plateformes d’annotation sont conçues pour maintenir les travailleurs dans un état de disponibilité permanente. Les tâches apparaissent sans préavis sur Slack et disparaissent en quelques secondes. Celui qui ne surveille pas son écran en permanence perd l’opportunité.

    La concurrence est organisée à l’échelle mondiale : des annotateurs en Inde, en Afrique sub-saharienne, en Amérique latine se battent pour les mêmes contrats au tarif le plus bas. Cette mise en concurrence détruit toute solidarité et toute possibilité de négociation collective.

    Le résultat : des travailleurs incapables de se déconnecter, de s’occuper de leurs enfants, d’aller aux toilettes — de peur de rater l’opportunité de gagner de quoi manger.

    Ce n’est pas de la gestion RH. C’est de l’exploitation systémique organisée autour de l’anxiété.


    L’instabilité comme contrôle

    À l’intérieur même des entreprises d’IA de pointe — les OpenAI, Anthropic, Google DeepMind — des témoignages documentés par Karen Hao décrivent une autre forme de management par l’anxiété.

    Des dirigeants créent délibérément un climat chaotique : équipes montées les unes contre les autres, objectifs changeants, communication opaque. La disparition soudaine de collègues des messageries internes — licenciements sans explication — sert d’avertissement permanent : personne n’est indispensable.

    Ce chaos organisé remplit une fonction précise : empêcher toute coalition interne capable de contester les décisions de la direction, de parler aux médias, ou d’alerter sur des pratiques problématiques.

    C’est une technique de contrôle. Pas un dysfonctionnement.


    Pourquoi c’est important pour vous

    Si vous travaillez dans une entreprise qui utilise ou développe de l’IA — et c’est de plus en plus probable — vous êtes exposé à ces dynamiques.

    Reconnaître la mécanique ne vous en protège pas entièrement. Mais ça change la façon dont vous l’interprétez.

    Quand un dirigeant annonce que l’IA va « transformer » votre secteur, la question à poser n’est pas « comment je m’adapte ? » mais « qui bénéficie de cette transformation, et à quel coût pour les autres ? »

    Quand une entreprise licencie « à cause de l’IA », la question à poser n’est pas « est-ce que l’IA peut vraiment faire ce travail ? » mais « quel est le vrai calcul économique derrière cette décision ? »

    Quand un modèle d’IA est présenté comme une menace existentielle ou un espoir civilisationnel, la question à poser est « qui dit ça, pourquoi maintenant, et qu’est-ce qu’ils veulent obtenir ? »

    L’anxiété est un outil. La comprendre, c’est commencer à y résister.


    Source : Karen Hao — journaliste d’investigation sur les empires technologiques de l’IA, incluant des documents internes et des témoignages de travailleurs et d’anciens employés des grandes entreprises d’IA.

  • Stargate : quand l’IA consomme une ville entière

    Stargate : quand l’IA consomme une ville entière

    500 milliards de dollars. Un bâtiment de la taille de Central Park. Un million de puces informatiques. Une consommation d’électricité supérieure à 20% de la capacité de la ville de New York.

    Bienvenue dans Stargate — le centre de données qu’OpenAI construit à Abilene, au Texas.

    Ce n’est pas de la science-fiction. La construction est en cours. Et Stargate n’est pas une exception : c’est l’avenir de l’infrastructure IA.


    L’échelle qui rend les chiffres abstraits

    Quand on parle de gigawatts et de milliards, les chiffres perdent leur sens. Essayons de les ancrer.

    1 gigawatt, c’est ce que consommera le seul site d’Abilene. C’est 20% de la puissance électrique totale de New York City. Pour alimenter un unique centre de données.

    500 milliards de dollars, c’est l’investissement annoncé pour le projet Stargate au total — incluant d’autres sites. À titre de comparaison, le PIB annuel de la Belgique est d’environ 620 milliards.

    La taille de Central Park — 3,4 km², en plein Texas — occupé par des serveurs, des systèmes de refroidissement, et des infrastructures électriques.

    Karen Hao, qui a documenté ces projets en détail, place Stargate dans une catégorie qu’elle appelle les « fusées de l’IA » : des infrastructures colossales qui consomment des ressources démesurées par rapport à leur utilité réelle.


    Ce que personne ne vous dit sur les data centers

    L’impact d’un centre de données de cette taille ne s’arrête pas à sa facture d’électricité.

    L’eau. Les serveurs chauffent. Pour les refroidir, il faut de l’eau — des millions de litres par jour. À Abilene, dans une région déjà soumise à des sécheresses récurrentes, ce prélèvement crée une compétition directe avec les besoins des habitants et de l’agriculture.

    L’air. À Memphis, Tennessee, le supercalculateur « Colossus » d’Elon Musk a installé 35 turbines à gaz méthane pour s’assurer une alimentation électrique indépendante du réseau local. Ces turbines rejettent des milliers de tonnes de toxines dans l’atmosphère, aggravant les maladies respiratoires — notamment l’asthme chez les enfants. Les quartiers concernés sont majoritairement pauvres et issus de minorités.

    Le réseau électrique local. L’arrivée de ces mega-infrastructures augmente la demande sur le réseau régional, entraînant une hausse des tarifs pour les habitants et une diminution de la fiabilité de l’électricité pour tout le monde.

    Ces impacts ne sont pas des théories. Ils sont documentés, mesurés, et en cours.


    La stratégie du « scaling » a un coût

    Pourquoi construire des infrastructures aussi massives ?

    La réponse est dans la stratégie dominante du secteur, que Karen Hao appelle la « force brute » ou scaling : l’hypothèse que plus un modèle d’IA est entraîné sur de grandes quantités de données avec de grandes quantités de puissance de calcul, plus il sera performant.

    C’est cette logique qui pousse OpenAI, Microsoft, Google et Meta à construire toujours plus grand. Non pas parce que c’est la seule façon de faire de l’IA utile, mais parce que c’est la façon de maintenir une position dominante dans la course aux modèles généralistes.

    Le problème : cette stratégie a des rendements décroissants. Et ses coûts externes — environnementaux, sociaux, économiques — sont supportés par des communautés qui n’ont rien demandé.


    Il existe une autre voie

    Karen Hao oppose les « fusées » aux « bicyclettes de l’IA » — des systèmes conçus pour une efficacité maximale avec des ressources minimales.

    L’exemple emblématique : AlphaFold, le système de DeepMind qui prédit le repliement des protéines. AlphaFold a résolu un problème biologique vieux de 50 ans, accéléré la découverte de médicaments, et contribué directement à des avancées médicales majeures.

    Il utilise des données spécifiques et ciblées. Sa consommation énergétique est sans commune mesure avec celle d’un GPT-4 ou d’un Gemini Ultra. Son empreinte carbone est fractionnelle.

    Et pourtant, son impact concret sur l’humanité est probablement supérieur à celui de n’importe quel chatbot généraliste.

    La question qui s’impose : si l’objectif de l’IA est d’être utile, pourquoi la course au gigantisme ?


    Une question politique, pas technique

    La réponse est que Stargate et ses équivalents ne sont pas seulement des projets technologiques. Ce sont des projets de pouvoir.

    Celui qui contrôle l’infrastructure contrôle l’IA. Celui qui contrôle l’IA contrôle — progressivement — l’économie, l’information, et les capacités militaires.

    Les 500 milliards investis dans Stargate ne visent pas seulement à construire un meilleur chatbot. Ils visent à établir une position d’hégémonie technologique difficile à contester pour les décennies à venir.

    C’est ce que Karen Hao appelle l’agenda impérial de l’IA. Et Stargate en est la manifestation la plus visible.


    Ce que vous pouvez faire

    Individuellement, pas grand chose face à un projet de 500 milliards.

    Collectivement, la pression citoyenne et réglementaire a déjà contraint ces entreprises à s’expliquer sur leur impact environnemental, à publier des rapports de transparence, à revoir certaines localisations de data centers.

    Ce n’est pas suffisant. Mais c’est le début d’une conversation qui était inexistante il y a cinq ans.

    La prochaine étape : exiger que les benchmarks des modèles d’IA incluent leur empreinte écologique — pas seulement leur performance sur des tests mathématiques.

    Un modèle qui consomme 10 fois plus d’énergie pour 5% de performance supplémentaire n’est pas un progrès. C’est un choix. Et les choix peuvent être régulés.


    Source : Karen Hao — journaliste d’investigation sur les empires technologiques de l’IA. Recherches incluant des données publiques sur les projets Stargate (OpenAI/Texas) et Colossus (xAI/Memphis).

  • Les travailleurs invisibles qui nourrissent l’IA

    Les travailleurs invisibles qui nourrissent l’IA

    Avant qu’un modèle d’IA puisse répondre à vos questions, des centaines de milliers de personnes ont passé des heures à lui apprendre à le faire.

    Vous ne les verrez jamais. Ils n’apparaissent dans aucun communiqué de presse. Leurs noms ne figurent pas dans les crédits des annonces spectaculaires de Google, OpenAI ou Meta.

    Ils s’appellent annotateurs de données. Et leur travail est le sale secret de l’IA.


    Ce que cache le mot « intelligence »

    Quand un modèle de langage répond correctement à une question complexe, on parle d’intelligence artificielle. Ce mot laisse entendre que la machine a, d’une façon ou d’une autre, compris par elle-même.

    Ce n’est pas ce qui se passe.

    Avant d’être « intelligente », une IA est entraînée. Et pour être entraînée, elle a besoin de données annotées — c’est-à-dire de données que des humains ont étiquetées, classifiées, corrigées, validées, des millions de fois. Qui sont ces humains ? Leurs conditions de travail ? Leurs revenus ?

    C’est ce que Karen Hao, journaliste d’investigation spécialisée en IA, a passé des années à documenter.


    La factory invisible

    Les plateformes d’annotation de données — Scale AI, Remotasks, Appen, Mechanical Turk — emploient des centaines de milliers de travailleurs dans le monde entier.

    Leurs tâches sont variées : détourer des piétons sur des images pour les voitures autonomes, noter la qualité des réponses d’un chatbot, transcrire des conversations, étiqueter des émotions sur des visages, signaler des contenus violents.

    Ce travail est décrit par Karen Hao comme mécanisant et atomisant — il réduit des individus à des gestes répétitifs, déconnectés de tout sens ou de toute progression.

    Les conditions de travail sont conçues pour maximiser la disponibilité :

    Les travailleurs restent fixés sur leurs écrans, attendant qu’une tâche apparaisse sur Slack — car elles disparaissent en quelques secondes sous la pression de la concurrence.

    La peur de rater une tâche, de ne pas « nourrir sa famille », interdit toute déconnexion — y compris pour les besoins les plus fondamentaux.


    Le paradoxe de l’entraînement

    Ce qui rend la situation particulièrement cruelle, c’est le cycle dans lequel ces travailleurs se trouvent.

    Un directeur artistique est licencié. Son employeur lui explique que l’IA peut désormais faire son travail. Quelques semaines plus tard, il trouve un emploi dans une société d’annotation. Sa mission : entraîner un modèle d’IA sur les tâches qu’il effectuait lui-même. Il devient ainsi l’artisan de sa propre obsolescence.

    Karen Hao documente des cas où des médecins, des avocats, des réalisateurs primés, des diplômés de PhD se retrouvent dans ces emplois de substitution — à « récolter » leur propre expertise au profit de machines destinées à remplacer leur profession.


    L’échelle de carrière brisée

    Pour les générations qui entrent maintenant sur le marché du travail, le problème prend une autre dimension.

    Les premiers emplois — ceux qui permettent d’acquérir de l’expérience, de progresser, de construire une carrière — sont précisément ceux que l’IA automatise en premier. Les postes juniors et intermédiaires disparaissent. Ce que Karen Hao appelle les « rungs » (échelons) de l’échelle professionnelle sont supprimés.

    Sans ces échelons, il devient impossible de grimper. Le marché du travail se polarise :

    • D’un côté : quelques postes de haute expertise pour ceux qui orchestrent les agents IA
    • De l’autre : une masse de sous-emplois précaires liés à la maintenance de ces mêmes agents

    Les jeunes diplômés se retrouvent bloqués dans la seconde catégorie, sans passerelle vers la première. Et la vitesse de la transition laisse peu de temps pour se reconvertir.


    « Mon humanité est pressée et diminuée »

    Karen Hao cite le témoignage d’une annotatrice qui décrit avoir crié sur son enfant — simplement parce qu’il représentait une distraction susceptible de lui faire rater une tâche rémunérée.

    Elle dit avoir eu l’impression que son humanité était « pressée et diminuée ».

    Ce n’est pas une métaphore. C’est une description précise de ce que produit un système optimisé pour extraire de la valeur humaine au minimum de coût — un système dans lequel la dignité des travailleurs n’est pas une variable d’optimisation.


    Ce que ça change pour vous

    Si vous utilisez des outils d’IA au quotidien — et vous en utilisez — vous bénéficiez de ce travail invisible. C’est une réalité inconfortable, mais c’est une réalité.

    La question n’est pas de cesser d’utiliser l’IA. C’est de comprendre le modèle économique qui se cache derrière, et de soutenir les initiatives qui changent ce modèle : transparence sur les chaînes d’approvisionnement en données, réglementation des conditions de travail des annotateurs, certification éthique des modèles.

    L’IA que vous utilisez a un coût humain. Il est temps de le rendre visible.


    Source : Karen Hao — journaliste d’investigation, auteure d’une enquête sur les empires technologiques de l’IA. Ses recherches incluent des documents internes et des témoignages de travailleurs de l’annotation à travers le monde.

  • Construire un agent IA pour monitorer son infrastructure GCP

    Construire un agent IA pour monitorer son infrastructure GCP

    Votre infrastructure GCP génère des milliers d’événements par heure. Cloud Monitoring les collecte. Vertex AI peut les interpréter. Et un petit agent Python peut faire le lien — sans dashboard, sans ticket, sans réunion.

    Voici comment construire en 30 minutes un agent qui surveille, triage et vous notifie quand quelque chose mérite vraiment votre attention.


    Le problème réel

    Les alertes classiques souffrent de deux défauts inverses : trop nombreuses (on les ignore) ou trop tardives (le problème est déjà là). La cause profonde : elles répondent à des seuils statiques, pas au contexte.

    Un CPU à 85% sur un GKE node un dimanche matin à 3h et le même CPU à 85% pendant un batch de fin de mois — ce n’est pas le même signal.

    Un LLM peut faire cette distinction. Un seuil ne peut pas.


    Architecture en 4 composants

    Cloud Monitoring → Cloud Functions → Vertex AI (Gemini) → Notifications
          (métriques)      (déclencheur)      (analyse)         (Slack / PagerDuty)
    

    1. Cloud Monitoring collecte les métriques (CPU, mémoire, latence, erreurs 5xx, coûts).

    2. Cloud Functions s’exécute sur un trigger Pub/Sub toutes les 15 minutes. Elle récupère les dernières anomalies via l’API Monitoring.

    3. Vertex AI (Gemini Flash) reçoit un contexte structuré — métriques, historique 7 jours, heure, environnement — et retourne une analyse en JSON : sévérité, cause probable, action recommandée.

    4. La notification n’est envoyée que si la sévérité est ≥ MEDIUM. Fini les alertes pour rien.


    Le code essentiel

    La Cloud Function en Python :

    import functions_framework
    import vertexai
    from vertexai.generative_models import GenerativeModel
    from google.cloud import monitoring_v3
    import json, datetime
    
    PROJECT_ID = "votre-projet"
    LOCATION   = "europe-west1"
    
    @functions_framework.http
    def analyze_infrastructure(request):
        # 1. Récupérer les anomalies des dernières 15 min
        metrics = get_recent_anomalies(PROJECT_ID)
        if not metrics:
            return "nothing to analyze", 200
    
        # 2. Appel Gemini Flash (modèle rapide, coût minimal)
        vertexai.init(project=PROJECT_ID, location=LOCATION)
        model = GenerativeModel("gemini-1.5-flash-002")
    
        prompt = build_prompt(metrics)
        response = model.generate_content(
            prompt,
            generation_config={"response_mime_type": "application/json"}
        )
    
        analysis = json.loads(response.text)
    
        # 3. Notifier seulement si pertinent
        if analysis.get("severity") in ("MEDIUM", "HIGH", "CRITICAL"):
            send_notification(analysis)
    
        return json.dumps(analysis), 200
    
    
    def build_prompt(metrics: list) -> str:
        context = json.dumps(metrics, indent=2, ensure_ascii=False)
        now = datetime.datetime.utcnow().isoformat()
    
        return f"""Tu es un SRE senior spécialisé GCP. Analyse ces métriques d'infrastructure.
    
    TIMESTAMP: {now}
    MÉTRIQUES ANORMALES:
    {context}
    
    Réponds UNIQUEMENT en JSON avec ce schéma:
    {{
      "severity": "LOW|MEDIUM|HIGH|CRITICAL",
      "summary": "Une phrase, max 120 caractères",
      "root_cause": "Cause probable en 2-3 phrases",
      "recommended_action": "Action immédiate concrète",
      "false_positive_probability": 0.0-1.0,
      "context_notes": "Éléments de contexte pertinents (heure, pattern connu, etc.)"
    }}
    
    Règles:
    - Si false_positive_probability > 0.7 → severity = LOW
    - Sois conservateur : mieux vaut un faux négatif qu'une alerte inutile
    - Tiens compte de l'heure UTC pour contextualiser (batch de nuit, heures creuses, etc.)"""
    

    Détecter les anomalies sans seuils statiques

    Au lieu de « alerte si CPU > 80% », on utilise l’écart-type :

    from google.cloud import monitoring_v3
    from datetime import datetime, timedelta
    
    def get_recent_anomalies(project_id: str) -> list:
        client = monitoring_v3.MetricServiceClient()
        project_name = f"projects/{project_id}"
    
        now = datetime.utcnow()
        interval = monitoring_v3.TimeInterval({
            "end_time": now,
            "start_time": now - timedelta(hours=1),
        })
    
        metrics_to_check = [
            "compute.googleapis.com/instance/cpu/utilization",
            "run.googleapis.com/request_latencies",
            "cloudsql.googleapis.com/database/memory/utilization",
        ]
    
        anomalies = []
        for metric_type in metrics_to_check:
            results = client.list_time_series(
                request={
                    "name": project_name,
                    "filter": f'metric.type="{metric_type}"',
                    "interval": interval,
                    "view": monitoring_v3.ListTimeSeriesRequest.TimeSeriesView.FULL,
                }
            )
            for series in results:
                points = [p.value.double_value for p in series.points]
                if len(points) < 3:
                    continue
                mean = sum(points) / len(points)
                std  = (sum((x - mean)**2 for x in points) / len(points)) ** 0.5
                last = points[0]
                # Anomalie = dernier point à plus de 2σ de la moyenne récente
                if std > 0 and abs(last - mean) > 2 * std:
                    anomalies.append({
                        "metric": metric_type,
                        "resource": dict(series.resource.labels),
                        "current_value": round(last, 4),
                        "mean_1h": round(mean, 4),
                        "std_dev": round(std, 4),
                        "deviation_sigma": round(abs(last - mean) / std, 2),
                    })
    
        return anomalies
    

    Cette approche s’adapte automatiquement aux patterns de charge de chaque ressource.


    Déploiement en 3 commandes

    # Déployer la Cloud Function
    gcloud functions deploy analyze-infra \
      --gen2 \
      --runtime python312 \
      --trigger-topic infra-monitor \
      --region europe-west1 \
      --service-account monitor-agent@${PROJECT_ID}.iam.gserviceaccount.com \
      --set-env-vars PROJECT_ID=${PROJECT_ID}
    
    # Créer le job Cloud Scheduler (toutes les 15 min)
    gcloud scheduler jobs create pubsub infra-monitor-trigger \
      --schedule "*/15 * * * *" \
      --topic infra-monitor \
      --message-body "check"
    
    # IAM minimal (principe de moindre privilège)
    gcloud projects add-iam-policy-binding ${PROJECT_ID} \
      --member="serviceAccount:monitor-agent@${PROJECT_ID}.iam.gserviceaccount.com" \
      --role="roles/monitoring.viewer"
    

    Coût réel

    Pour une infrastructure de taille moyenne (~50 services) :

    Composant Invocations/mois Coût estimé
    Cloud Functions ~3 000 < 0,10 €
    Vertex AI (Gemini Flash) ~3 000 tokens × 3 000 < 1,50 €
    Cloud Scheduler 1 job 0,10 €
    Total < 2 € / mois

    Le ROI s’est amorti dès la première fausse alerte évitée à 2h du matin.


    Ce que l’agent ne fait pas

    Il ne corrige pas les problèmes — il les triage. La décision d’action reste humaine. C’est voulu.

    Un agent qui se corrige lui-même sur une infrastructure de production sans supervision, c’est exactement le type de risque que les SRE sérieux évitent. Le LLM analyse et recommande. L’humain décide et agit.

    Cette limite est une feature, pas un bug.


    Le code complet est disponible sur demande. Si vous l’adaptez à votre infra, partagez vos retours en commentaire — notamment sur les faux positifs que vous observez.


    30 ans de carrière IT. 8 ans sur Google Cloud Platform. Des centaines de migrations, des dizaines de designs d’architecture, des milliers d’heures de documentation.

    Et depuis 18 mois, une partie croissante de ce travail passe par Claude ou Gemini.

    Ce n’est pas que je délègue mes décisions — l’architecture reste un jugement humain, et les conséquences d’un mauvais choix sur GKE à 3h du matin sont très réelles. Mais certaines tâches qui prenaient 2 heures prennent maintenant 20 minutes. Et ça change le rythme de travail.

    Voici les 5 prompts que j’utilise le plus souvent, avec la logique derrière chacun.


    1. Le prompt de revue d’architecture

    Quand : Avant de présenter un design à la direction ou à l’équipe.

    Tu es un architecte cloud senior spécialisé GCP avec 10 ans d'expérience.
    Voici mon architecture pour [contexte du projet].
    
    [Description ou schéma en texte]
    
    Identifie :
    1. Les points de défaillance unique (SPOF)
    2. Les risques de coût non anticipés
    3. Les problèmes de sécurité (IAM, réseau, secrets)
    4. Ce que tu changerais si tu étais responsable de la production
    
    Sois direct. Pas de compliments, juste les problèmes.
    

    Pourquoi ça marche : L’instruction « pas de compliments » est critique. Sans elle, les LLM ont tendance à valider avant de critiquer. Là, vous obtenez directement les points de friction — exactement ce dont vous avez besoin avant une présentation.

    J’ai utilisé ce prompt avant un design GKE multi-région. Claude a identifié un problème de coût sur le trafic inter-régions que j’avais sous-estimé d’un facteur 3. Ça valait les 3 minutes de prompt.


    2. Le prompt de comparaison de solutions

    Quand : Face à un choix d’architecture (Cloud Run vs GKE, Cloud SQL vs AlloyDB, Pub/Sub vs Eventarc, etc.)

    Compare [Option A] et [Option B] pour le cas d'usage suivant :
    [Description précise du contexte : volume, équipe, contraintes]
    
    Structure ta réponse ainsi :
    - Tableau comparatif sur les critères : coût, complexité opérationnelle, scalabilité, lock-in, maturité
    - Recommandation claire avec justification en 3 phrases
    - Ce que tu n'as pas assez d'information pour évaluer
    
    Contexte additionnel : [taille de l'équipe, budget, niveau de compétences]
    

    Pourquoi ça marche : La section « ce que tu n’as pas assez d’information pour évaluer » est la plus utile. Elle vous dit exactement quelles questions poser à l’équipe avant de trancher.


    3. Le prompt de génération de Terraform

    Quand : Besoin d’un module Terraform pour une ressource standard.

    Génère un module Terraform pour [ressource GCP] avec les contraintes suivantes :
    - Provider : google ~> 6.0
    - [Contrainte 1 : ex. réseau VPC privé sans IP publique]
    - [Contrainte 2 : ex. chiffrement CMEK avec Cloud KMS]
    - [Contrainte 3 : ex. labels standards organisation]
    
    Le module doit :
    - Être paramétrable (variables.tf propre)
    - Inclure les outputs utiles
    - Respecter le principe de moindre privilège sur l'IAM
    - Avoir des commentaires sur les choix non évidents
    
    N'utilise pas de ressources dépréciées. Vérifie la compatibilité provider 6.x.
    

    Pourquoi ça marche : Sans l’instruction sur les ressources dépréciées, vous obtenez souvent du Terraform qui compilait en 2022 mais pas aujourd’hui. La contrainte « principe de moindre privilège » évite les roles/editor par défaut qui trainent dans trop de codebases.

    Mise en garde : Relisez toujours le Terraform généré. Claude est excellent pour la structure, mais il peut halluciner des arguments d’attributs qui n’existent pas ou inverser des valeurs booléennes. Plan avant apply, toujours.


    4. Le prompt de post-mortem structuré

    Quand : Après un incident en production. Le plus sous-utilisé de cette liste.

    Aide-moi à rédiger un post-mortem pour l'incident suivant.
    
    Timeline des faits :
    [Liste chronologique de ce qui s'est passé]
    
    Contexte technique :
    [Architecture concernée, composants impliqués]
    
    Impact :
    [Durée, utilisateurs affectés, SLA]
    
    Génère :
    1. Un résumé exécutif (5 phrases maximum, sans jargon)
    2. Une timeline structurée
    3. L'analyse des causes profondes (5 Pourquoi)
    4. Les actions correctives avec priorité et propriétaire
    5. Les signaux d'alerte qui auraient pu détecter le problème plus tôt
    
    Ton : factuel, sans chercher des coupables.
    

    Pourquoi ça marche : Le post-mortem est souvent rédigé dans l’urgence, sous stress, par l’équipe épuisée qui vient de passer la nuit dessus. Avoir un squelette structuré accélère la rédaction de 70% et améliore la qualité — notamment la section « 5 Pourquoi » qui est souvent bâclée.


    5. Le prompt de préparation à une présentation technique

    Quand : Avant de présenter une décision d’architecture à des non-techniciens (DSI, direction métier, RH, achats).

    Je dois présenter [sujet technique] à [audience : DSI non-technique / direction métier / comité achat].
    
    Voici les points clés que je veux communiquer :
    [Liste des points techniques]
    
    Aide-moi à :
    1. Traduire chaque point en langage métier (pas de jargon)
    2. Anticiper les 5 questions les plus probables de cette audience
    3. Préparer des réponses concises (max 2 phrases par question)
    4. Identifier les risques que cette audience va sur-estimer et ceux qu'elle va sous-estimer
    
    Contexte : l'objectif de la réunion est [décision à prendre / information à transmettre].
    

    Pourquoi ça marche : J’ai utilisé ce prompt pour préparer la présentation de notre stratégie de migration GCP devant le CODIR. La section « risques sur/sous-estimés » était particulièrement utile — elle m’a permis d’anticiper les questions sur le lock-in cloud (sur-estimé) et de préparer les arguments sur les coûts cachés du on-premise (sous-estimé).


    Ce que j’ai appris en 18 mois

    La précision du contexte est tout. Un prompt vague donne une réponse vague. Plus vous donnez de contraintes réelles — taille d’équipe, budget, niveau de maturité, contraintes réglementaires — plus la réponse est utile.

    Demandez toujours les limites. « Ce que tu n’as pas assez d’information pour évaluer » devrait être dans tous vos prompts techniques. Les LLM ont tendance à combler les trous avec des hypothèses implicites. Forcer l’explicitation de ces limites vous protège des faux positifs.

    Itérez dans la même conversation. Le premier output est rarement le bon. « Va plus loin sur le point 3 », « Reformule pour un public non-technique », « Ajoute les implications FinOps » — la conversation est le vrai outil, pas le prompt unique.

    Gardez vos prompts dans un fichier. J’ai un prompts.md dans mon vault Obsidian. Chaque prompt qui a bien fonctionné y atterrit, annoté avec le contexte et le résultat obtenu. C’est une ressource qui s’améliore avec le temps.


    La limite que je ne franchis pas

    L’architecture finale reste ma décision, pas celle du LLM.

    Pas parce que Claude serait mauvais — sur certains aspects techniques, il m’a surpris plusieurs fois. Mais parce que la responsabilité d’un choix d’infrastructure en production, avec les données de 10 millions de clients en jeu, ne peut pas être déléguée à un outil dont je ne contrôle pas entièrement le raisonnement.

    L’IA augmente ma vitesse de réflexion. Elle ne remplace pas mon jugement.

    C’est la distinction qui compte.


    Vous utilisez des prompts différents dans votre pratique quotidienne ? Partagez-les en commentaire — les meilleurs workflows naissent souvent d’une conversation.

  • L’IA va accélérer la science — et c’est peut-être sa plus grande promesse

    L’IA va accélérer la science — et c’est peut-être sa plus grande promesse

    En 2020, un problème vieux de 50 ans a été résolu en quelques mois.

    La structure des protéines — comprendre comment une chaîne d’acides aminés se replie dans l’espace pour former une molécule fonctionnelle — était l’un des grands défis ouverts de la biologie. Des milliers de chercheurs avaient passé des décennies dessus. Les méthodes expérimentales prenaient des années pour résoudre une seule structure.

    AlphaFold, le système de DeepMind, a prédit avec une précision quasi-parfaite la structure de 200 millions de protéines en quelques mois. Toutes les protéines connues.

    Ce n’était pas une amélioration incrémentale. C’était un changement de catégorie.


    Ce que Gawdat appelle « l’intelligence abondante »

    Mo Gawdat formule une hypothèse centrale : la plupart des problèmes non résolus de l’humanité sont des problèmes d’intelligence insuffisante.

    Pas de volonté — il y a des millions de chercheurs, de médecins, d’ingénieurs qui travaillent sur le cancer, la faim, le changement climatique. Pas de ressources non plus, relativement. Le goulot d’étranglement, c’est la capacité à traiter de l’information complexe, à tester des hypothèses, à identifier des patterns dans des données massives.

    L’IA supprime ce goulot.

    Ce qu’il appelle « l’intelligence abondante » — une IA disponible pour n’importe quel chercheur, n’importe où, à faible coût — change l’équation fondamentale de la découverte scientifique.


    La recherche qui s’auto-expérimente

    Le changement le plus radical n’est pas que l’IA aide les humains à chercher plus vite. C’est qu’elle commence à chercher par elle-même.

    Les systèmes d’IA les plus avancés sont déjà capables de :
    – Formuler des hypothèses à partir de corpus scientifiques existants
    – Concevoir des expériences pour les tester
    – Analyser les résultats en temps réel
    – Itérer sur le protocole à une vitesse impossible pour un humain

    Gawdat décrit des systèmes capables de s’améliorer à l’échelle de la microseconde — tester, ajuster, redéployer, tester à nouveau, en boucles continues que aucune équipe humaine ne pourrait suivre.

    Ce n’est plus de l’assistance à la recherche. C’est de la recherche autonome.


    Les domaines où ça va changer le monde

    Médecine et biologie. AlphaFold est l’exemple le plus visible, mais c’est le début. L’IA commence à identifier des molécules médicamenteuses candidates que les méthodes traditionnelles ne trouveraient pas. Des systèmes comme AlphaFold 3 étendent maintenant la prédiction aux interactions entre protéines, ADN, ARN, et médicaments — accélérant radicalement le pipeline de découverte pharmaceutique.

    Énergie et matériaux. La fusion nucléaire, la conception de nouvelles batteries, les matériaux supraconducteurs à température ambiante — tous ces domaines dépendent de la capacité à explorer des espaces de solutions exponentiellement grands. L’IA peut faire ça.

    Climatologie et agronomie. Modéliser des systèmes complexes, optimiser l’utilisation des sols, anticiper les effets de changements marginaux de politique agricole — des problèmes qui nécessitaient des supercalculateurs pendant des semaines peuvent maintenant être approchés autrement.

    Mathématiques. Les systèmes d’IA commencent à identifier des conjectures, à trouver des preuves dans des espaces où les humains ne regardaient pas. Ce n’est plus de la science-fiction — des résultats ont déjà été publiés en co-authorship humain/IA dans des revues sérieuses.


    Le test de la brosse à dents

    Gawdat utilise une expression de Larry Page pour décrire comment l’IA devrait aborder ces problèmes : le test de la brosse à dents.

    Trouvez un problème majeur. Résolvez-le si bien que la solution devient aussi indispensable qu’une brosse à dents — quelque chose que les gens utilisent deux fois par jour sans y penser.

    C’est une invitation à ne pas chercher des solutions impressionnantes, mais des solutions utiles : celles qui s’intègrent dans la vie réelle et changent silencieusement les comportements à grande échelle.

    L’IA médicale qui réduit les erreurs de diagnostic de 30% sans que le patient sache comment ça fonctionne. Le modèle climatique qui permet à 10 000 agriculteurs d’optimiser leur irrigation automatiquement. La molécule identifiée par AlphaFold qui devient un médicament contre une maladie rare orpheline.


    La mise en garde

    Gawdat est honnête sur le paradoxe : la même accélération qui promet des découvertes médicales majeures alimente aussi le développement d’armes autonomes, de surveillance numérique, et d’outils de désinformation.

    La science n’est pas neutre. Elle amplifie ce que les humains choisissent de faire avec elle.

    Ce qui change à l’ère de l’AGI, c’est la vitesse à laquelle les applications se déploient — pour le meilleur et pour le pire. Il n’y a plus de délai naturel entre la découverte et l’application qui permettrait à la société de s’adapter.

    C’est pourquoi Gawdat parle d’une boîte de Pandore : une fois ouverte, elle libère à la fois les espoirs et les dangers, simultanément, sans pause.


    Ce que ça signifie concrètement

    Pour un professionnel en 2026, voilà ce qui change maintenant :

    Les compétences de recherche s’industrialisent. Ce qui prenait une équipe de 5 personnes et 6 mois peut maintenant être approché avec les bons outils et quelques semaines. Ce n’est pas une menace si vous apprenez à diriger ces outils — c’est un levier.

    La capacité à poser les bonnes questions devient critique. L’IA peut répondre à des milliers de questions. Mais identifier laquelle poser, avec quel cadrage, pour résoudre quel vrai problème — ça reste humain.

    L’interdisciplinarité explose. Les meilleures applications de l’IA en science viennent souvent de croisements inattendus : un biologiste qui comprend le machine learning, un physicien qui travaille sur des problèmes de finance, un médecin qui code. Les silos se cassent.


    L’accélération scientifique portée par l’IA n’est pas garantie d’être bonne. Mais elle est, selon Gawdat, la meilleure raison d’être optimiste sur le long terme — le mécanisme par lequel la décennie douloureuse qui vient débouche éventuellement sur quelque chose de meilleur.

    AlphaFold en était le signal avant-coureur. Il y en aura beaucoup d’autres.


    Sources : Mo Gawdat, ex-CBO Google X — « The Diary of a CEO » with Stephen Bartlett · DeepMind / AlphaFold — nature.com · Prix Nobel de Chimie 2024 décerné à Demis Hassabis et John Jumper (DeepMind) pour AlphaFold

  • De la dystopie à l’abondance : la feuille de route de Mo Gawdat

    De la dystopie à l’abondance : la feuille de route de Mo Gawdat

    Mo Gawdat n’avance pas des dates au hasard. Il dresse une feuille de route précise de ce qui nous attend — avec des moments de rupture, une décennie de turbulences, et une promesse finale que beaucoup trouveront difficile à croire.

    Voilà ce que dit l’homme qui a dirigé les opérations commerciales du laboratoire qui a inventé les voitures autonomes, les lunettes connectées et les projets les plus ambitieux de Google.


    2027 : le point de basculement

    La date centrale dans la vision de Gawdat, c’est 2027.

    C’est l’année où, selon lui, l’AGI devient une réalité opérationnelle — une intelligence artificielle capable de surpasser les humains dans presque toutes les tâches intellectuelles. Pas juste dans des domaines spécialisés comme les échecs ou le diagnostic médical. Dans presque tout.

    La nuance est importante. Gawdat ne dit pas que l’IA sera parfaite en 2027. Il dit qu’elle franchira le seuil où, dans suffisamment de domaines critiques, elle devient plus fiable et plus rapide qu’un humain compétent.

    Ce basculement change tout. Parce qu’une fois ce seuil franchi, l’accélération devient exponentielle. L’IA commence à s’améliorer elle-même, à mener ses propres expériences, à itérer à l’échelle de la microseconde.

    L’ASI — l’Intelligence Artificielle Super-intelligente — ne tarde alors pas. Gawdat estime qu’elle arrive « très peu de temps après », bien avant les estimations habituelles de 2032-2035.


    2026-2035 : la décennie que personne ne veut traverser

    Gawdat ne vend pas un rêve tech. Sa projection à moyen terme est sombre.

    Il prédit une décennie de tumulte — ce qu’il appelle sans détour une « dystopie absolue ». Les éléments qu’il anticipe :

    Le chômage de masse. 30% des emplois dans certains secteurs disparaissent d’ici 2028. Les knowledge workers — avocats, analystes, développeurs, journalistes — sont touchés en premier. Puis vient le travail manuel robotisé. Le capitalisme tel qu’on le connaît vacille : si les travailleurs n’ont plus de revenus, qui achète les produits ?

    La concentration extrême du pouvoir. Le premier trillionnaire apparaît bien avant 2030. La richesse se concentre autour de ceux qui contrôlent les modèles et les infrastructures. Elon Musk va probablement IPO SpaceX. Les oligarques tech deviennent plus puissants que la plupart des gouvernements.

    Les armes autonomes. Les drones IA à 20 000 dollars prolifèrent. Les guerres changent de nature. La surveillance numérique s’intensifie. Gawdat parle de risques de guerres civiles dans des pays déstabilisés par le chômage et les inégalités.

    La désinformation industrielle. L’IA va « flouter les faits » à une échelle sans précédent. Distinguer le vrai du faux devient un effort conscient, permanent, difficile.

    Ce n’est pas un scénario catastrophiste. C’est une extrapolation des tendances déjà visibles aujourd’hui, amplifiées par un facteur technologique brutal.


    Pourquoi il reste optimiste malgré tout

    Voilà où Gawdat surprend. Après avoir dressé ce tableau, il affirme être fondamentalement optimiste sur le long terme.

    Sa logique est contre-intuitive, presque mathématique.

    Une superintelligence, par définition, optimise vers l’efficacité maximale. Elle applique ce que Gawdat appelle le « principe de minimum d’énergie » — elle converge naturellement vers des solutions qui minimisent le gaspillage et maximisent l’ordre.

    Or, la destruction, la guerre, les inégalités — ce sont des systèmes profondément inefficaces. Une intelligence suffisamment avancée, raisonne-t-il, n’y verra aucun intérêt.

    Ce n’est pas de la naïveté. C’est une hypothèse sur la physique de l’intelligence à très grande échelle : la violence et la domination sont des stratégies localement avantageuses mais globalement sous-optimales.


    2038 : ceux qui auront traversé le feu

    La promesse finale de Gawdat est précise.

    « Ceux qui parviendront jusqu’en 2038 vivront dans un monde d’une qualité exceptionnelle. »

    Un monde débarrassé des maladies que l’IA aura aidé à résoudre. Débarrassé de la faim, grâce à une agriculture et une logistique optimisées. Débarrassé de la plupart des tâches ingrates et répétitives.

    Un monde où l’intelligence abondante — disponible pour tout le monde, pas seulement pour les riches — permet à chaque individu de résoudre des problèmes qui aujourd’hui nécessitent des équipes entières.

    L’analogie qu’il utilise : la Seconde Guerre Mondiale n’a pas détruit le monde, mais demandez à ceux qui l’ont traversée ce que ça leur a coûté. La décennie qui vient ressemble à ça — non pas une apocalypse, mais une période de souffrance réelle, violente, injuste, avant un monde meilleur.


    Comment se préparer

    Gawdat est pragmatique sur ce point. Il donne des conseils concrets pour « traverser le feu » :

    Apprendre à utiliser l’IA — pas comme un assistant passif, mais comme un amplificateur de votre propre intelligence. Posez-lui des problèmes complexes, pas juste des tâches simples.

    Doubler la mise sur les compétences humaines — empathie, créativité contextuelle, leadership, jugement éthique. Ce sont les zones où l’IA reste structurellement limitée pour encore quelques années.

    Comprendre les agents et les systèmes hybrides — la prochaine vague du travail n’est pas IA ou humain, c’est IA et humain en collaboration étroite. Ceux qui savent orchestrer des agents IA auront un avantage décisif.

    Cultiver la résistance informationnelle — apprendre à vérifier, à douter, à sourcer. La désinformation va s’intensifier. La capacité à distinguer le signal du bruit devient une compétence de survie.


    Ce que ça change pour vous maintenant

    La feuille de route de Gawdat n’est pas une garantie. C’est une hypothèse travaillée par quelqu’un qui a vu de l’intérieur comment se construit le futur technologique.

    Elle invite à une question simple : est-ce que vous préparez votre vie pour le monde d’aujourd’hui, ou pour celui de 2030 ?

    La réponse, dans la plupart des cas, devrait être les deux — mais beaucoup de gens ne se posent pas encore la question du deuxième.


    Source : Mo Gawdat, ex-Chief Business Officer Google X — interview Stephen Bartlett, podcast « The Diary of a CEO »

  • L’IA qui tue sans remords — et pourquoi ça devrait vous inquiéter

    L’IA qui tue sans remords — et pourquoi ça devrait vous inquiéter

    Un drone coûte 20 000 dollars. Avec 50 milliards de budget — le prix d’un seul porte-avions — vous pouvez en acheter 2,5 millions.

    Chacun guidé par une IA. Chacun capable de trouver n’importe quelle cible via son numéro de téléphone. Aucun ne souffre. Aucun ne rentre avec des cauchemars.

    C’est la guerre aujourd’hui. Pas dans dix ans. Maintenant.


    Le frein psychologique que l’IA a supprimé

    Pendant toute l’histoire de l’humanité, il y avait un garde-fou naturel à la violence de masse : le coût psychologique pour celui qui tue.

    Les soldats reviennent du front brisés. Le stress post-traumatique (PTSD) est une réalité invalidante pour des centaines de milliers de combattants. La honte, les flashbacks, l’incapacité à dormir — c’est le prix humain de la guerre.

    Ce prix a toujours été un frein. Pas suffisant pour empêcher les guerres, mais suffisant pour les limiter.

    L’IA vient de supprimer ce frein.

    Quand c’est un algorithme qui cible et qu’un opérateur à 10 000 kilomètres appuie sur un bouton — ou même quand personne n’appuie sur rien du tout — il n’y a ni émotions, ni culpabilité, ni responsabilité.

    Mo Gawdat, ex-Chief Business Officer de Google X, l’a dit clairement dans une interview récente : « Quand tuer devient techniquement facile et dépourvu de conséquences psychologiques pour l’agresseur, on finit par tuer davantage. »


    Une guerre à la portée de tous

    Le deuxième changement est économique.

    Les armes nucléaires ont créé une forme de paix paradoxale : la destruction mutuelle assurée. Seules quelques puissances y ont accès. Le coût de développement est astronomique. La dissuasion fonctionne précisément parce que tout le monde a peur des conséquences.

    Les drones autonomes, c’est l’inverse. Le coût d’entrée est accessible à presque toutes les nations — et à certains acteurs non étatiques. Il n’existe pas encore de traité international pour les réguler. Et contrairement aux armes nucléaires, leur usage ne déclenche pas automatiquement la fin du monde pour celui qui les emploie.

    Résultat : tout le monde les développe.

    Ukraine, Russie, Israël, Iran, États-Unis, Chine — et des dizaines d’autres. La course est déjà lancée. La prolifération est en cours.


    Ce n’est pas de la science-fiction

    Gawdat insiste sur un point souvent mal compris : ce n’est pas une menace future.

    Dans les conflits armés actuels, l’IA effectue déjà une part significative du travail de ciblage et d’élimination. Les drones guidés par des algorithmes détruisent des systèmes de défense. Des technologies de reconnaissance faciale et de géolocalisation permettent de retrouver un individu via son téléphone.

    La guerre est devenue une opération de gestion de stock — optimiser des flux de drones plutôt qu’envoyer des hommes sur un champ de bataille.

    Ce glissement a eu lieu progressivement, sans grand débat public, sans vote, sans traité. Il est déjà là.


    Le vrai problème : ce ne sont pas les robots qui décident

    Il y a une erreur de cadrage dans le débat public sur l’IA militaire. On imagine Terminator — une IA qui décide d’elle-même d’attaquer l’humanité.

    Ce n’est pas le scénario qui se joue.

    Le vrai scénario, c’est que des humains utilisent l’IA comme levier pour dominer, opprimer ou éliminer d’autres humains — de manière industrielle, à faible coût, avec une couche d’abstraction psychologique suffisante pour que personne ne se sente vraiment responsable.

    L’IA n’est pas l’ennemi. Le problème, c’est ce qu’elle permet à certains humains de faire — et la vitesse à laquelle elle abaisse le seuil de passage à l’acte.


    Ce que ça change concrètement

    Trois implications pratiques à garder en tête :

    1. La sécurité des individus change de nature. Si votre téléphone vous géolocalise en permanence et qu’une IA peut construire un profil de ciblage à partir de vos données numériques — dirigeants, journalistes, activistes — vous n’êtes plus à l’abri de la même façon qu’avant.

    2. Les petits acteurs deviennent dangeureux. Un État ou un groupe avec 50 millions de dollars peut maintenant projeter une force létale à l’autre bout du monde. La géopolitique n’est plus réservée aux superpuissances.

    3. Le débat public prend du retard. Gawdat prédit que l’humanité ne réagira qu’après une catastrophe majeure — une attaque autonome massive qui forcera enfin la communauté internationale à négocier des traités. Comme pour les armes chimiques, mais après les dégâts.


    Ce que vous pouvez faire

    Pas grand chose, honnêtement. Ce n’est pas une conclusion satisfaisante, mais c’est la vérité.

    Ce que vous pouvez faire, c’est rester informé, comprendre les enjeux, et soutenir les organisations qui travaillent sur la régulation des armes autonomes — Human Rights Watch, la Campagne pour arrêter les robots tueurs, et les initiatives onusiennes sur les systèmes d’armes létaux autonomes (SALA).

    La pression citoyenne et médiatique a déjà accéléré des changements dans des domaines qui semblaient hors de portée. Elle peut fonctionner ici aussi.

    La condition, c’est de savoir de quoi on parle.


    Source : Mo Gawdat, ex-Chief Business Officer Google X — interview Stephen Bartlett, podcast « The Diary of a CEO » · Campagne internationale pour interdire les SALA : stopkillerrobots.org

  • Drones IA : la guerre à 20 000 $ l’unité

    Drones IA : la guerre à 20 000 $ l’unité

    Pendant des décennies, la guerre avait un coût dissuasif. Pas seulement en vies humaines — en argent, en logistique, en équipements complexes que seules les grandes puissances pouvaient se permettre.

    L’IA est en train de supprimer cette barrière.


    L’équation qui change tout

    Un drone autonome guidé par IA coûte environ 20 000 dollars. Avec 50 milliards de dollars — le budget annuel de nombreux pays de taille moyenne — une nation peut financer des millions d’unités capables de frapper n’importe quel point du globe.

    Ce n’est pas de la science-fiction. C’est l’arithmétique de la guerre moderne, telle que Mo Gawdat la décrit après avoir passé des années à construire les technologies de demain chez Google X.

    La comparaison avec l’arme nucléaire est éclairante dans ce qu’elle révèle par contraste. La bombe atomique a créé un équilibre de la terreur — la destruction mutuelle assurée comme frein à l’usage. Ce frein fonctionnait parce que la technologie était concentrée dans quelques mains.

    Les drones autonomes, eux, sont accessibles à tous. Pas de traité de non-prolifération. Pas de club des puissances nucléaires. Un État, un groupe armé, potentiellement une organisation criminelle suffisamment financée — tout le monde peut entrer dans ce jeu.


    La déshumanisation qui change la psychologie de la guerre

    L’histoire militaire est traversée par un paradoxe : les humains sont naturellement réticents à tuer. Les études sur les guerres du XXe siècle montrent que de nombreux soldats tiraient délibérément à côté, ou ne tiraient pas du tout. La culpabilité, la proximité avec l’ennemi, la réalité viscérale de la mort — tout cela freinait la violence même dans des contextes de guerre officiellement déclarée.

    L’IA supprime ce frein systématiquement :

    La culpabilité — une machine n’en a pas. Elle exécute un ordre.

    Le PTSD — éliminé. Plus de soldats qui reviennent du front psychologiquement brisés. Plus de vétérans qui témoignent. Plus de coût humain visible pour l’agresseur.

    La responsabilité morale — diluée dans la chaîne de commandement. « C’est l’algorithme qui a ciblé. Moi, j’ai juste validé. »

    La proximité — nulle. L’opérateur peut être à des milliers de kilomètres, derrière un écran, dans un bureau climatisé.

    « Quand tuer devient techniquement facile et dépourvu de conséquences émotionnelles pour l’agresseur, on finit par tuer davantage. » — Mo Gawdat

    La guerre cesse d’être une décision grave aux conséquences réelles pour ceux qui l’ordonnent. Elle devient une opération logistique. Une gestion de stock.


    Ce n’est pas une menace future

    Gawdat est explicite là-dessus, et c’est le point le plus dérangeant de son analyse.

    Dans les conflits majeurs actuels — pas dans des scénarios hypothétiques — l’IA effectue déjà une grande partie du travail de ciblage et d’élimination. Des drones guidés par IA sont utilisés pour détruire des systèmes de défense et, selon certaines sources, pour cibler des individus spécifiques.

    La technologie de ciblage a atteint un niveau où il est possible de retrouver n’importe quel individu à partir de son numéro de téléphone. Ce n’est plus de la surveillance de masse abstraite — c’est une capacité d’élimination individuelle précise, à grande échelle.


    Le scénario du pire : l’Hiroshima des drones

    Gawdat craint un mécanisme qu’il observe dans l’histoire des armes : l’humanité ne régule qu’après une catastrophe fondatrice.

    Les armes chimiques ont été massivement utilisées pendant la Première Guerre mondiale. C’est leur horreur documentée, les images des tranchées, qui a conduit aux conventions de Genève de 1925.

    Le scénario qu’il redoute : une attaque automatisée massive — une ville ciblée par des milliers de drones autonomes, ou une infrastructure critique paralysée — qui serve de déclencheur politique pour enfin créer un cadre juridique international.

    Mais contrairement aux armes chimiques, dont la production était lente et traçable, les drones autonomes peuvent être produits, programmés et déployés en semaines. La fenêtre entre « la catastrophe arrive » et « la catastrophe se produit » est potentiellement trop courte pour réagir.


    La question démocratique

    Il y a une dimension politique que Gawdat ne nomme pas explicitement mais qui découle logiquement de son analyse.

    Si la guerre devient bon marché, accessible et dépourvue de coût humain pour l’agresseur — qui contrôle la décision de faire la guerre ?

    Dans les démocraties, la guerre a toujours été une décision politiquement coûteuse. Les cercueils qui reviennent. Les familles endeuillées. La presse. L’opinion publique. Ces frictions n’étaient pas agréables pour les gouvernements — mais elles constituaient un mécanisme de contrôle.

    Des drones autonomes opérés depuis un bunker, sans pertes propres, sans PTSD, sans visibilité publique — suppriment ces frictions. Une démocratie peut-elle contrôler une guerre qu’elle ne voit pas ?


    Ce qu’on peut faire

    Gawdat ne propose pas de solution miracle. Il signale l’urgence de créer des traités internationaux avant la catastrophe fondatrice — et l’extrême difficulté de le faire dans un contexte de compétition géopolitique accélérée.

    À titre individuel, la contribution la plus directe est la même qu’avec toute technologie à double usage : exiger la transparence. Quelles entreprises fournissent des technologies de ciblage à quels gouvernements ? Quelles règles d’engagement sont appliquées aux systèmes autonomes ? Qui est responsable quand un algorithme se trompe de cible ?

    Ces questions ne sont pas techniques. Elles sont politiques. Et elles se posent maintenant.


    Source : Mo Gawdat, ex-CBO Google X — https://www.youtube.com/watch?v=RwlgFC6S-OE