Trente secondes de musique, c’était le maximum que Gemini pouvait cracher il y a un mois. Google vient de multiplier ce chiffre par six. Lyria 3 Pro, la nouvelle version de son modèle de génération musicale, produit des morceaux de trois minutes avec couplets, refrains, ponts et intros. Suffisant pour écouter un titre entier sans que la machine s’arrête au milieu d’une phrase. Et pour les abonnés Gemini, la fonction est déjà active.
Mais le détail qui change tout n’est pas la durée. C’est la promesse collée dessus : Google affirme que Lyria 3 Pro a été entraîné uniquement sur des contenus « que YouTube et Google ont le droit d’utiliser en vertu de leurs conditions d’utilisation, de leurs accords avec les partenaires et de la loi applicable ». En clair, pas de morceaux piratés dans le dataset. C’est précisément cette question qui a envoyé son concurrent direct devant les tribunaux.
Suno face aux majors, Google face à la confiance
En juin 2024, la Recording Industry Association of America (RIAA) a porté plainte contre Suno et Udio, les deux générateurs de musique par IA les plus populaires du marché. Les majors Universal, Sony et Warner reprochent aux deux startups d’avoir aspiré des catalogues entiers de chansons protégées pour alimenter leurs modèles. L’affaire, toujours en cours, pourrait redessiner les contours du droit d’auteur appliqué à l’intelligence artificielle.
Le fondateur de Suno, Mikey Shulman, s’est défendu en comparant le processus à un enfant qui apprend le rock en écoutant du rock. « Apprendre n’est pas contrefaire », a-t-il répété dans un billet de blog, reprenant un argument que Google lui-même utilise dans d’autres procédures liées à l’IA. Suno revendique deux millions d’abonnés et 300 millions de dollars de revenus annuels, selon les données rapportées par The Decoder. L’enjeu financier est colossal.
Google prend le chemin inverse. Plutôt que de se battre devant un juge, la firme de Mountain View s’adosse à ses propres accords de licence, ceux que YouTube a tissés depuis des années avec les labels et les artistes. Le raisonnement est simple : si la plateforme verse déjà des droits sur les contenus hébergés, entraîner un modèle dessus ne constitue pas un détournement. C’est du moins la lecture de Google, qui refuse de détailler la composition exacte de son corpus d’entraînement.
Trois minutes, et tout ce qui va avec
Le bond technique n’est pas anodin. Lyria 3, lancé en février, se contentait de clips de trente secondes, suffisants pour des jingles mais inutilisables pour un vrai morceau. Lyria 3 Pro comprend la structure d’une chanson. On peut lui demander une intro en piano, un couplet en voix féminine, un refrain plus énergique, puis un pont instrumental. D’après 9to5Google, le modèle gère les transitions entre sections sans rupture audible, un point faible historique des générateurs musicaux.
L’accès dépend de l’abonnement Gemini. Les utilisateurs AI Plus disposent de dix générations par jour, les abonnés Pro de vingt, et les Ultra de cinquante. Google pousse l’outil vers les créateurs de contenu : vlogs, podcasts, vidéos de tutoriel. Pour les professionnels, Lyria 3 Pro est disponible en préversion publique sur Vertex AI, la plateforme cloud destinée aux entreprises, et sur Google AI Studio pour les développeurs.
ProducerAI, un outil collaboratif lancé par Google Labs, utilise aussi le modèle. Pensé pour les musiciens, il propose une expérience « agentique » : l’IA ne se contente pas de générer un morceau brut, elle itère avec l’utilisateur sur les arrangements, le tempo, le mixage. Le service est ouvert gratuitement dans le monde entier, avec une version payante pour des fonctions avancées.
Le filigrane invisible et ses limites
Chaque morceau produit par Lyria 3 Pro porte un filigrane SynthID, une technologie de DeepMind qui intègre une signature invisible dans le signal audio. Objectif : permettre d’identifier plus tard qu’un fichier a été généré par intelligence artificielle. Google ajoute un filtre de similarité qui compare les productions à du contenu existant pour éviter les plagiats involontaires. Si un prompt mentionne le nom d’un artiste, le modèle « s’en inspire » sans tenter de copier son style vocal ou sa signature sonore, précise la documentation officielle.
Ces garde-fous rassurent sur le papier. Dans la pratique, la détection de similarité musicale reste un exercice flou. Deux accords identiques ne font pas un plagiat, mais une mélodie trop proche peut suffire. L’industrie musicale a une longue mémoire : en 2015, un jury avait condamné Robin Thicke et Pharrell Williams à verser 7,4 millions de dollars aux héritiers de Marvin Gaye pour la chanson « Blurred Lines », sur la base d’une simple ressemblance d’atmosphère. Aucun algorithme de filtrage ne peut trancher ce type de litige.
Le marché se structure autour de la licence
Google n’est pas seul à jouer la carte de la légitimité. ElevenLabs, spécialiste de la synthèse vocale, a lancé un service de musique générée par IA avec des licences libres de droits. Mais une zone grise persiste : personne ne « possède » vraiment une chanson entièrement fabriquée par une machine. Le bureau américain du copyright a statué en 2023 que les œuvres créées sans intervention humaine significative ne bénéficient pas de la protection du droit d’auteur. Un musicien qui utilise Lyria 3 Pro comme point de départ et retravaille le morceau pourrait en revendiquer la propriété. Un utilisateur qui se contente de taper un prompt, probablement pas.
Côté régulation, la Cour suprême des États-Unis a contribué à brouiller le paysage en enterrant en février une procédure sur le copyright des images générées par IA, sans créer de jurisprudence claire. En Europe, l’AI Act impose depuis 2024 une obligation de transparence sur les données d’entraînement, mais ses modalités d’application restent floues, d’autant que les textes détaillés ne seront pas finalisés avant 2027.
La prochaine bataille se joue en studio
Le vrai test pour Lyria 3 Pro ne sera pas juridique. Il sera musical. Suno, malgré ses ennuis légaux, reste le choix par défaut de millions d’utilisateurs qui veulent un morceau complet en quelques secondes. Google doit prouver que sa version « propre » produit des résultats comparables en qualité. Les premières écoutes, disponibles sur la page DeepMind du projet, laissent entendre des productions étonnamment cohérentes, mais le jugement final appartiendra aux créateurs qui s’en serviront au quotidien.
ProducerAI et Vertex AI seront présentés en détail à l’ICLR 2026, la conférence internationale sur les représentations apprises, qui se tient à Rio de Janeiro en avril. Google y dévoilera les fondations techniques de Lyria 3 Pro, offrant à la communauté scientifique un premier regard sur l’architecture du modèle. De quoi alimenter la discussion sur ce qu’un générateur musical peut produire, et ce qu’il doit aux artistes qu’il a « écoutés » pour apprendre.