Bicyclettes vs fusées : et si l’IA n’avait pas besoin d’être aussi grosse ?

Il existe deux façons de construire une IA utile.

La première : prendre des milliards de paramètres, des exaoctets de données, des milliers de puces graphiques, et entraîner un modèle pendant des mois en consommant l’équivalent énergétique d’une ville moyenne. C’est l’approche GPT-4, Gemini Ultra, Claude Opus.

La seconde : définir précisément le problème, rassembler des données de haute qualité spécifiques à ce problème, et construire un système optimisé pour cette tâche unique. C’est l’approche AlphaFold.

Karen Hao les appelle les fusées et les bicyclettes de l’IA. Et la distinction change tout — sur le plan éthique, économique, et pratique.

AlphaFold : l’exemple parfait de la bicyclette

En 2020, DeepMind a résolu un problème que la biologie cherchait depuis 50 ans : prédire la structure tridimensionnelle des protéines à partir de leur séquence d’acides aminés.

La structure des protéines détermine leur fonction. Comprendre cette structure, c’est comprendre comment les maladies fonctionnent, comment concevoir des médicaments qui les ciblent, comment accélérer la recherche médicale de façon dramatique. Les méthodes expérimentales prenaient des années pour résoudre une seule structure. AlphaFold en prédit 200 millions en quelques mois.

Et pourtant, AlphaFold n’est pas un modèle massif au sens où on l’entend aujourd’hui. Il utilise des données spécifiques et curatées — des structures de protéines déjà connues, non pas l’intégralité d’internet. Sa puissance de calcul est une fraction de celle nécessaire pour entraîner un GPT.

Son rapport utilité/ressources est extraordinaire. C’est une bicyclette. Elle ne peut pas faire ce que fait une voiture. Mais pour aller d’un point A à un point B — résoudre ce problème précis — elle est parfaite. Et elle ne coûte pas une ville en électricité.

Pourquoi les entreprises préfèrent les fusées

Si les bicyclettes sont plus efficientes, pourquoi l’industrie se concentre-t-elle sur les fusées ?

La réponse n’est pas technique. Elle est économique et politique.

Les fusées créent des barrières à l’entrée. Un modèle comme GPT-4 nécessite des milliards de dollars d’infrastructure. Seules quelques entreprises peuvent se le permettre. Cette exclusivité crée des positions dominantes difficiles à contester.

Les modèles généralistes sont plus vendables. Un outil qui « peut tout faire » est plus facile à marketer qu’un outil spécialisé. Les investisseurs, les médias, le grand public réagissent aux démonstrations spectaculaires — générer des images, écrire du code, simuler une conversation — même si l’utilité réelle reste discutable.

Le scaling est la stratégie dominante. L’hypothèse centrale de l’industrie est que plus le modèle est grand, meilleur il sera. Cette hypothèse commence à être contestée — les rendements sont décroissants — mais elle a organisé des années d’investissement massif.

Les données d’entraînement sont une ressource captée. Les grands modèles se nourrissent d’internet, de livres, de conversations — des ressources produites par des milliards de personnes qui n’ont pas consenti à cet usage. Les petits modèles spécialisés ont besoin de données curatées, ce qui implique un travail de sélection plus honnête.

Ce que ça change pour les praticiens

Si vous utilisez ou déployez de l’IA dans un contexte professionnel, la distinction fusée/bicyclette a des implications concrètes.

Pour choisir le bon outil :

Avant de déployer un LLM généraliste pour un cas d’usage, posez-vous la question : est-ce que ce problème a une frontière claire ? Est-ce qu’on peut le définir précisément ? Si oui, une approche spécialisée — fine-tuning, RAG sur un corpus limité, modèle plus petit entraîné sur vos données — sera probablement plus fiable, plus rapide, moins chère, et plus facile à contrôler.

Les LLM généralistes sont excellents pour les tâches ambiguës, créatives, ou larges. Pour les tâches précises et répétitives — classification, extraction d’information, vérification de conformité — une bicyclette bien conçue bat souvent une fusée.

Pour évaluer les coûts réels :

Un appel API à GPT-4 semble peu coûteux à l’unité. Mais à l’échelle, sur des millions d’appels, le calcul change. Un modèle plus petit, déployé localement ou sur une infrastructure légère, peut coûter 10 fois moins — avec des performances comparables sur votre cas d’usage spécifique.

Pour penser l’empreinte écologique :

L’inférence sur un petit modèle consomme une fraction de l’énergie d’un grand modèle. À l’échelle d’une organisation qui fait des millions de requêtes par mois, la différence est significative — et de plus en plus prise en compte dans les rapports RSE.

La vraie question de performance

L’industrie mesure la performance des modèles sur des benchmarks — des tests standardisés en mathématiques, en raisonnement, en compréhension de texte.

Ces benchmarks mesurent ce que les modèles savent faire en général. Ils ne mesurent pas ce qu’ils font pour vous, sur votre problème.

AlphaFold n’aurait probablement pas brillé sur ces benchmarks généralistes. Il n’est pas conçu pour ça. Il est conçu pour résoudre un problème précis, de façon extraordinairement fiable, avec un minimum de ressources.

C’est ça, une bicyclette. Et pour la plupart des problèmes réels — en entreprise, en recherche, dans les services publics — c’est probablement ce dont on a besoin.

Pas une fusée qui consomme une ville. Une bicyclette qui fait exactement ce qu’on lui demande.

Ce que ça implique pour l’avenir

Karen Hao plaide pour une réorientation du secteur vers des modèles plus efficients. Ce n’est pas une position anti-IA. C’est une position anti-gaspillage.

Si l’objectif est de résoudre des problèmes réels — santé, éducation, transition écologique, administration publique — les bicyclettes sont le chemin. Elles sont moins spectaculaires. Elles ne font pas de démonstrations éblouissantes lors des keynotes. Mais elles délivrent de la valeur sans externaliser leurs coûts sur les communautés qui vivent près des data centers et sur une planète qui ne peut pas absorber indéfiniment l’empreinte d’une industrie en croissance exponentielle.

Le choix entre fusée et bicyclette est un choix de valeurs autant que de technologie.

Sources : Karen Hao — journaliste d’investigation sur les empires de l’IA · DeepMind / AlphaFold (Nature, 2021) · Prix Nobel de Chimie 2024 décerné à Demis Hassabis et John Jumper pour AlphaFold

Bicyclettes vs fusées : et si l’IA n’avait pas besoin d’être aussi grosse ?

Bicyclettes vs fusées : et si l’IA n’avait pas besoin d’être aussi grosse ?

AlphaFold : l’exemple parfait de la bicyclette

Pourquoi les entreprises préfèrent les fusées

Ce que ça change pour les praticiens

La vraie question de performance

Ce que ça implique pour l’avenir

Commentaires

Laisser un commentaire Annuler la réponse

Plus de publications

Bicyclettes vs fusées : et si l’IA n’avait pas besoin d’être aussi grosse ?

Pourquoi l’IA brise l’échelle de carrière des jeunes

L’anxiété comme business model — la stratégie des empires de l’IA

Stargate : quand l’IA consomme une ville entière