«Je dépense probablement plus en IA que ce que je gagne.» Max Linder, développeur basé à Stockholm, ne plaisante pas. Son employeur règle la facture, mais le montant dépasse son salaire annuel. Et loin d’être un cas isolé, Linder incarne une tendance qui a désormais un nom dans la Silicon Valley : le tokenmaxxing.

210 milliards de tokens en sept jours

Le phénomène a pris une ampleur spectaculaire. Selon une enquête du New York Times publiée le 20 mars, un ingénieur d’OpenAI a traité 210 milliards de tokens en une seule semaine, soit l’équivalent de 33 fois le contenu intégral de Wikipédia. Chez Anthropic, un utilisateur unique de l’outil de programmation Claude Code a généré une facture dépassant 150 000 dollars sur un mois. Et ces chiffres ne sont pas des accidents de parcours.

Chez Meta et Shopify, les managers intègrent désormais la consommation d’IA dans les évaluations de performance, rapporte le Times. Meta et OpenAI ont même créé des classements internes où les employés s’affrontent pour savoir qui consomme le plus de tokens. Le parallèle avec la culture du « crunch » dans le jeu vidéo ou les heures facturées en cabinet d’avocats saute aux yeux : la productivité ne se mesure plus en lignes de code écrites, mais en puissance de calcul brûlée.

Jensen Huang fixe le seuil à 250 000 dollars

Le PDG de Nvidia a posé les termes de l’équation lors d’un épisode du podcast All-In diffusé le 20 mars. «Si cet ingénieur à 500 000 dollars ne consomme pas au moins 250 000 dollars de tokens, je vais être profondément inquiet», a déclaré Jensen Huang, selon Business Insider. Et d’ajouter : «S’il me dit 5 000 dollars, je vais péter un câble.»

Interrogé sur le fait de savoir si Nvidia dépensait deux milliards de dollars en tokens pour son équipe d’ingénierie, Huang a répondu : «On essaie.» Plus tôt dans la semaine, lors de la conférence GTC de Nvidia, il avait suggéré d’offrir aux ingénieurs l’équivalent de la moitié de leur salaire de base en tokens IA, pour «les amplifier d’un facteur 10». Il présente le budget de tokens comme un nouvel outil de recrutement dans la tech.

Le quatrième pilier de la rémunération

L’idée n’est pas sortie de nulle part. Dès la mi-février, Tomasz Tunguz, investisseur chez Theory Ventures et figure influente de la Silicon Valley, avait posé le cadre sur son blog. En s’appuyant sur les données de la plateforme salariale Levels.fyi, il estimait le salaire d’un développeur au 75e percentile à 375 000 dollars. Ajoutez 100 000 dollars de tokens et le coût total grimpe à 475 000 dollars, dont 21 % en puissance de calcul pure. Tunguz parle d’un «quatrième pilier» de la rémunération, après le salaire, le bonus et les actions.

Tunguz sait de quoi il parle : ses propres coûts d’inférence IA sont passés de 200 dollars par mois à un rythme annualisé de 100 000 dollars en moins de six mois. Il effectue aujourd’hui 31 tâches par jour assistées par l’IA. Il a fini par migrer vers un modèle open source et divisé la facture par huit en un week-end de travail. Un détail qui en dit long sur la volatilité de ce «salaire» d’un genre nouveau.

Un avantage qui ne se négocie pas, ne se revend pas, ne prend pas de valeur

C’est là que le vernis craque. Jamaal Glenn, ancien investisseur en capital-risque devenu directeur financier, a publié une analyse cinglante sur Substack. Son verdict : cette présentation des tokens comme rémunération relève de la «propagande d’entreprise». Un budget de tokens ne se capitalise pas au fil des années. Il ne figure pas dans votre prochaine négociation salariale. Il ne prend pas de valeur comme des actions. «Votre ordinateur portable n’est pas un salaire. Votre licence Slack non plus. Votre budget de tokens ne l’est pas davantage», écrit Glenn.

TechCrunch enfonce le clou dans une analyse publiée le 21 mars. Si le coût en tokens par employé approche ou dépasse le salaire de cet employé, la direction financière commence à se poser une question gênante : combien de têtes faut-il vraiment pour piloter tout ce calcul ? L’investissement massif dans la puissance de calcul contient, en creux, la possibilité de réduire les effectifs. L’ingénieur qui exhibe fièrement sa consommation de tokens construit peut-être, sans le savoir, l’argumentaire de son propre remplacement.

La course aux tokens profite d’abord à ceux qui les vendent

Le calcul financier mérite d’être retourné. Si Nvidia pousse les entreprises à dépenser 250 000 dollars par ingénieur en tokens, et que ces tokens tournent sur des GPU Nvidia, le principal bénéficiaire de cette nouvelle norme n’est ni l’ingénieur, ni même son employeur. Jensen Huang vend des pelles pendant la ruée vers l’or, et il vient de convaincre les chercheurs d’or de creuser deux fois plus vite.

Les chiffres de Tunguz illustrent aussi la fragilité du modèle. Passer de 100 000 dollars annuels à 12 000 dollars en un week-end de migration prouve que la valeur d’un token chute à mesure que l’écosystème mûrit. Accepter aujourd’hui des tokens à 100 000 dollars comme «avantage» revient à se faire payer en monnaie dont le cours s’effondre en temps réel.

Sam Altman rêve d’un «revenu universel en calcul»

Le PDG d’OpenAI avait anticipé cette évolution dès mai 2024 lors d’un passage au podcast All-In. «Je me demande si l’avenir ressemble davantage à un revenu universel en calcul qu’à un revenu universel en espèces», avait déclaré Sam Altman, selon Business Insider. Il imaginait un monde où chacun posséderait une tranche de la puissance de GPT-7, libre de l’utiliser, de la revendre ou de la consacrer à la recherche contre le cancer.

Deux ans plus tard, la vision s’est partiellement concrétisée, mais sous une forme que personne n’avait prévue. Ce ne sont pas les citoyens qui reçoivent des tokens, ce sont les employés. Et la différence entre un droit universel et un outil de productivité distribué par un employeur change radicalement la nature du contrat. Glenn résume la situation : «Demandez quel est le budget de tokens pendant un entretien, comme vous demanderiez quel matériel est fourni. Mais ne laissez personne inscrire ça sur votre offre d’emploi en appelant ça un salaire.»

Chez OpenAI, le recrutement intègre déjà la question du budget de calcul dans les discussions avec les candidats, selon Thibault Sottiaux, responsable d’équipe sur le projet Codex, cité par Business Insider. Les offres de postes d’ingénieur pourraient bientôt afficher le budget de tokens à côté de la fourchette salariale, comme on mentionne aujourd’hui la mutuelle ou le télétravail. Le glissement est en cours, et le rapport de force entre employeurs et salariés dans la tech se joue désormais aussi sur ce terrain.

À lire aussi