Demandez à Gemini de vous écrire une chanson. Depuis ce mercredi, c’est possible.

Google vient d’intégrer Lyria 3, le dernier modèle musical de DeepMind, directement dans l’application Gemini. Le principe : vous décrivez un genre, une ambiance, un souvenir, et l’IA génère un morceau de 30 secondes. Avec voix, paroles, pochette. Le tout en qualité 48 kHz stéréo.

Un studio dans une boîte de dialogue

Concrètement, il suffit de taper un prompt du style « un slow R&B comique sur une chaussette qui retrouve sa jumelle » pour obtenir un morceau complet, rapporte TechCrunch. On peut aussi envoyer une photo ou une vidéo, et Lyria 3 composera une bande-son assortie à l’ambiance du fichier.

Par rapport aux versions précédentes, le bond est net. Lyria 3 écrit ses propres paroles, offre davantage de contrôle sur le style, la voix et le tempo, et produit des compositions plus riches, selon The Decoder. La fonctionnalité est disponible sur ordinateur dès aujourd’hui et arrive sur mobile dans les jours qui viennent, pour les utilisateurs de 18 ans et plus, dans huit langues (dont le français et l’anglais).

Le copyright, sujet qui fâche

Google prend les devants sur la question des droits d’auteur. Si vous mentionnez un artiste dans votre prompt, Gemini s’en sert comme « inspiration large » sans chercher à copier le style exact. « La génération musicale avec Lyria 3 est conçue pour l’expression originale, pas pour imiter des artistes existants », précise Google sur son blog officiel. Des filtres comparent chaque morceau généré aux contenus existants, et les utilisateurs peuvent signaler d’éventuelles ressemblances.

Chaque piste reçoit un filigrane SynthID, la technologie maison de DeepMind, qui permet d’identifier les contenus générés par IA. Gemini peut même analyser un morceau qu’on lui soumet pour dire s’il a été créé par une machine.

YouTube aussi dans la boucle

En parallèle, Google ouvre Dream Track, son outil de création musicale IA pour les créateurs YouTube, à l’international. Jusqu’ici réservé aux États-Unis, le service permet aux vidéastes de générer des bandes-son sur mesure directement depuis la plateforme.

Suno garde une longueur d’avance

Reste que Google débarque sur un terrain déjà occupé. Suno, le générateur musical IA le plus populaire du moment, propose des morceaux complets bien au-delà des 30 secondes. Son concurrent Udio, racheté par Universal Music fin 2025, semble stagner depuis l’acquisition. OpenAI préparerait aussi un générateur musical pour ChatGPT, selon The Decoder.

La limite de 30 secondes et l’interface encore basique de Gemini placent Lyria 3 un cran en dessous de Suno pour l’instant. Google a choisi de présenter la chose comme un outil « ludique ». Malin, vu le nombre de procès que l’industrie musicale a lancé contre les générateurs IA ces derniers mois. Sony Music et d’autres labels ont multiplié les plaintes pour violation de droits d’auteur sur les données d’entraînement.

Quand même : taper trois mots et recevoir un morceau avec voix et pochette, c’est le genre de truc qui semblait de la science-fiction il y a deux ans. La vraie question maintenant, c’est combien de temps avant que la limite passe de 30 secondes à 3 minutes.