Interdit par contrat de créer ses propres modèles d’intelligence artificielle pendant six ans, Microsoft vient de lancer trois IA maison d’un coup. Le timing est brutal : l’action a perdu 23 % en un trimestre, le pire depuis la crise de 2008.

Six ans les mains liées, et soudain le champ libre

Pour comprendre ce qui se joue, il faut remonter à 2019. Cette année-là, Microsoft signe un accord avec OpenAI : le géant de Redmond fournit l’infrastructure cloud, et en échange, il obtient une licence sur les modèles d’OpenAI. Mais une clause verrouille tout : Microsoft n’a pas le droit de développer indépendamment une intelligence artificielle générale. Pendant six ans, le plus gros investisseur d’OpenAI reste donc un distributeur, pas un créateur.

En octobre 2025, la donne change. OpenAI cherche à diversifier ses fournisseurs cloud, signe avec SoftBank et d’autres. Microsoft en profite pour renégocier. Le nouvel accord, détaillé par Reuters et confirmé sur le blog officiel de Microsoft, libère l’entreprise de cette restriction. « Jusqu’à il y a quelques semaines, Microsoft n’avait pas le droit, par contrat, de poursuivre indépendamment l’intelligence artificielle générale ou la superintelligence », a expliqué Mustafa Suleyman, patron de l’IA chez Microsoft, dans une interview accordée à Bloomberg en décembre 2025.

Six mois plus tard, les premiers résultats tombent.

Trois modèles, trois marchés, zéro OpenAI dedans

Les trois modèles s’appellent MAI-Transcribe-1, MAI-Voice-1 et MAI-Image-2. Ils couvrent la transcription vocale, la synthèse de voix et la génération d’images. Tous sont disponibles immédiatement sur Microsoft Foundry et un nouveau « MAI Playground » ouvert au public.

Le modèle de transcription est la pièce maîtresse. Sur le benchmark FLEURS, référence internationale pour la reconnaissance vocale multilingue, MAI-Transcribe-1 affiche un taux d’erreur moyen de 3,8 % sur 25 langues. Selon les mesures publiées par Microsoft, il bat Whisper-large-v3 d’OpenAI sur les 25 langues testées, Gemini 3.1 Flash de Google sur 22, et les systèmes d’ElevenLabs et d’OpenAI sur 15 chacun. Le tout avec moitié moins de processeurs graphiques que la concurrence, selon Suleyman, interrogé en exclusivité par VentureBeat.

MAI-Voice-1 génère 60 secondes d’audio en moins d’une seconde. Il alimente déjà Copilot Daily et les podcasts de Microsoft. Le prix : 22 dollars par million de caractères. MAI-Image-2, classé dans le top 3 du classement Arena.ai, produit des images deux fois plus vite que son prédécesseur. Microsoft le déploie sur Bing et PowerPoint, facturé 5 dollars par million de jetons en entrée texte, 33 dollars pour la sortie image.

L’équipe « superintelligence » sort de l’ombre

Ces modèles sont le premier livrable concret de la division superintelligence de Microsoft, créée par Suleyman il y a six mois. Le cofondateur de DeepMind, passé par Inflection AI, a constitué une équipe dédiée avec un objectif assumé : rendre Microsoft autonome en IA.

« Depuis septembre dernier, nous avons renégocié le contrat avec OpenAI, et cela nous a permis de poursuivre indépendamment notre propre superintelligence », a déclaré Suleyman à VentureBeat. « Depuis, nous rassemblons la puissance de calcul, l’équipe et les données dont nous avons besoin. »

Le partenariat avec OpenAI reste en place. Microsoft conserve une licence sur tous les modèles d’OpenAI jusqu’en 2032. Mais la direction est claire : Redmond veut pouvoir se passer de son partenaire si nécessaire. OpenAI, de son côté, a contracté 250 milliards de dollars de services Azure, ce qui garantit un lien financier solide pour les années à venir, d’après le blog officiel de Microsoft.

Wall Street doute, Suleyman accélère

Ce lancement arrive dans un contexte boursier brutal. L’action Microsoft a chuté de 23 % au premier trimestre 2026, la pire performance depuis la crise financière de 2008, selon CNBC. Les investisseurs s’inquiètent : des centaines de milliards investis dans l’infrastructure IA, mais Copilot, l’assistant censé rentabiliser la mise, peine à décoller face à Google, OpenAI et Anthropic.

« Redmond est dans une impasse », a écrit Ben Reitzes, analyste chez Melius Research, fin mars. Le problème : Microsoft doit utiliser la capacité précieuse de son cloud Azure pour améliorer Copilot, tout en répondant à la demande explosive d’infrastructure IA de ses clients entreprises. La hausse du prix du pétrole, liée au conflit avec l’Iran, alourdit encore la facture des centres de données.

Tous les éditeurs de logiciels souffrent. Adobe, Atlassian et ServiceNow ont perdu plus de 30 % en 2026. Jason Lemkin, fondateur de SaaStr, parle de « SaaSpocalypse » et affirme que « une grande partie du SaaS traditionnel est en déclin terminal ». Le multiple de valorisation de Microsoft n’a plus été aussi bas depuis le quatrième trimestre 2022, quand OpenAI a lancé ChatGPT.

Trois modèles ne font pas un printemps

Les modèles MAI ne couvrent pas le texte, le domaine où OpenAI, Google et Anthropic se livrent la bataille la plus féroce. Microsoft ne prétend pas (encore) rivaliser sur les grands modèles de langage. Mais la voix, l’image et la transcription représentent des marchés colossaux dans l’entreprise : réunions Teams, présentations PowerPoint, assistants vocaux.

Gil Luria, analyste chez DA Davidson, estime que la vente massive d’actions n’est pas justifiée. Microsoft a affiché une croissance de son chiffre d’affaires de 17 % au dernier trimestre, en accélération. « La déconnexion entre la performance fondamentale de Microsoft et la performance de son action est la plus grande depuis des décennies », a-t-il déclaré à CNBC.

La vraie question se posera dans les prochains mois, quand Suleyman devra prouver que son équipe peut aussi produire des modèles de langage compétitifs. En attendant, Microsoft a posé un premier jalon : après six ans de dépendance contractuelle, l’IA maison existe. Reste à savoir si elle suffira à convaincre Wall Street que les milliards investis ne l’ont pas été en vain.