13 milliards de dollars investis dans OpenAI, et Microsoft vient de lancer ses propres modèles d’IA. La firme de Redmond a dévoilé jeudi trois systèmes maison capables de transcrire la voix, de la cloner, et de générer des images. Le message est clair : le partenaire le plus riche d’OpenAI veut désormais voler de ses propres ailes.
Trois modèles, trois terrains de bataille
Les trois modèles portent la marque « MAI », pour Microsoft AI. Le premier, MAI-Transcribe-1, convertit la parole en texte dans 25 langues avec un taux d’erreur moyen de 3,8 %, selon le benchmark de référence FLEURS. Microsoft affirme qu’il bat Whisper d’OpenAI sur les 25 langues testées, Gemini 3.1 Flash de Google sur 22 d’entre elles, et les outils d’ElevenLabs et de GPT-Transcribe sur 15 chacun. Le tout en étant 2,5 fois plus rapide que l’offre Azure actuelle de Microsoft.
Le deuxième, MAI-Voice-1, génère 60 secondes d’audio en une seule seconde. Il peut cloner une voix humaine à partir de quelques secondes d’enregistrement seulement. Le troisième, MAI-Image-2, se classe dans le top 3 mondial du classement Arena.ai pour la génération d’images et arrive dans Bing et PowerPoint avec des temps de génération deux fois plus courts que son prédécesseur.
Les prix sont calibrés pour faire mal à la concurrence : 0,36 dollar de l’heure pour la transcription, 22 dollars par million de caractères pour la voix, et 5 dollars par million de jetons en entrée pour l’image. Tous sont disponibles dès maintenant sur Microsoft Foundry, la plateforme d’accès aux modèles d’IA de l’entreprise.
La clause secrète qui bloquait Microsoft
Ces modèles n’auraient pas pu exister il y a six mois. Jusqu’en octobre 2025, Microsoft était contractuellement interdit de développer sa propre intelligence artificielle générale. L’accord signé en 2019 avec OpenAI accordait à Microsoft une licence sur les modèles d’OpenAI en échange de l’infrastructure cloud nécessaire à leur fonctionnement. Mais quand OpenAI a commencé à nouer des accords avec SoftBank et d’autres fournisseurs de calcul, Microsoft a renégocié.
« Jusqu’à il y a quelques semaines, Microsoft n’avait pas le droit, par contrat, de poursuivre de manière indépendante l’intelligence artificielle générale ou la superintelligence », a expliqué Mustafa Suleyman, patron de Microsoft AI, dans une interview avec Bloomberg en décembre 2025. Suleyman a confirmé à VentureBeat que la renégociation de septembre dernier a tout débloqué : « Depuis, nous avons rassemblé la puissance de calcul, l’équipe et les données nécessaires. »
L’équipe « superintelligence » entre en piste
Les trois modèles sortent de l’équipe MAI Superintelligence, créée en novembre 2025 et dirigée par Suleyman lui-même. Ce cofondateur de DeepMind, recruté par Microsoft en mars 2024, pilote une division dont la mission explicite est de rendre Microsoft autonome en IA. L’approche est assumée : construire les meilleurs modèles au monde dans les modalités les plus rentables pour l’entreprise, puis les injecter directement dans les produits utilisés par des centaines de millions de personnes.
MAI-Transcribe-1 tourne déjà en test dans Copilot Voice et Microsoft Teams pour la transcription de réunions. MAI-Image-2 s’intègre dans Bing et PowerPoint. WPP, l’un des plus gros groupes publicitaires au monde, figure parmi les premiers clients entreprise de MAI-Image-2.
Microsoft revendique un avantage de taille : « Nous livrons ce modèle avec deux fois moins de GPU que la concurrence », a précisé Suleyman à propos de MAI-Transcribe-1. Dans un secteur où le coût de l’inférence détermine les marges, produire un résultat équivalent avec la moitié du matériel change la donne.
Le pire trimestre boursier depuis 2008
L’annonce tombe à un moment critique. Microsoft vient de boucler son pire trimestre boursier depuis la crise financière de 2008, rappelle CNBC. Les investisseurs s’impatientent : les dépenses colossales en infrastructures IA (635 milliards de dollars prévus en 2026 pour les quatre géants tech, selon S&P Global) doivent commencer à rapporter. Ces modèles « maison », moins chers à faire tourner et intégrés aux produits existants, constituent la première réponse concrète de Suleyman à cette pression financière.
Pour autant, le partenariat avec OpenAI reste en place. Microsoft conserve une licence sur tous les modèles d’OpenAI jusqu’en 2032 au minimum. « Rien ne change dans notre partenariat avec OpenAI », assure Suleyman. Le PDG de Microsoft, Satya Nadella, a d’ailleurs participé à la dernière levée record d’OpenAI (122 milliards de dollars annoncés le 31 mars). Microsoft joue donc sur les deux tableaux : financer son fournisseur historique tout en construisant un rival interne.
Un Copilot qui ne dépendra plus d’OpenAI
La stratégie devient limpide quand on regarde le calendrier. En six mois, l’équipe de Suleyman a livré trois modèles de production. D’autres sont annoncés « bientôt » pour Foundry et les produits Microsoft. L’objectif à moyen terme : que Copilot, l’assistant IA embarqué dans Windows, Office et Edge (utilisé par plus de 400 millions de personnes chaque mois), puisse fonctionner entièrement sur des modèles Microsoft si nécessaire.
Pour les utilisateurs, le changement sera invisible. La voix qui transcrit leurs réunions Teams, l’outil qui génère leurs images dans PowerPoint, le moteur qui répond dans Bing : tout cela pourrait bientôt tourner sur du Microsoft natif. La vraie question n’est plus de savoir si Microsoft peut rivaliser avec OpenAI. C’est de savoir combien de temps OpenAI restera indispensable à son principal investisseur. Le prochain lot de modèles MAI, attendu dans les semaines qui viennent, apportera un début de réponse.