Générer de la musique avec l'IA, c'est possible, et c'est pas nouveau. Mais alors, vraiment pas... dès 1987, Experiments in Musical Intelligence (EMI) faisait déjà ses premiers pas. Plus proche de nous, mais déjà il y a quinze ans, Emily Howell, une IA spécialisée dans la musique, sortait son premier album. Du côté d'OpenAI, il y a MuseNet qui permet de générer de la musique depuis quelques temps aussi. Mais avec Suno, l'IA passe un cap en terme de créativité, tout en devenant accessible à tous.
Ce "ChatGPT de la musique" comme il aime à se présenter, propose en effet son troisième modèle, le premier à avoir la prétention de générer des chansons complètes, de plusieurs minutes, en qualité "radio".
Il suffit de lui donner un prompt définissant le type de musique ou de chanson voulue, et c'est parti. Si vous voulez des paroles, pas de problème : définissez un sujet et il les génère pour vous, rimes incluses. En une trentaine de secondes, vous avez une chanson complète. Impressionnant ! D'autant que, globalement, sa compréhension des prompts est bonne et l'ambiance générale de la chanson proche de ce que vous lui avez demandé.
Pour autant, Suno n'est pas une potion magique : du point de vue de la créativité et de la composition, le résultat est très plan-plan, très formaté. Les paroles sont aussi assez banales, sans grand travail sur la métrique ou les rimes riches. Ça ferait bien l'affaire pour une musique d'illustration, dans le domaine de la pub ou dans une vidéo YouTube, mais on est loin de la créativité d'un vrai groupe ou d'un artiste talentueux.
Plus embêtant, si par "qualité radio" on entend : digne de passer à la radio, on n'y est pas vraiment... En revanche, si par "qualité radio" on entend "la qualité audio est similaire à celle d'une radio FM qui crachote", c'est déjà un peu plus réaliste : les voix sont encore assez robotiques, les instruments mal définis et le son est globalement très brouillon, très "muddy" comme disent les anglophones.
Comme souvent en IA, on est donc partagé entre un effet "waouh !" parce qu'on a une chanson de 2 minutes qui est une approximation étonnante de ce que ferait un humain, et une analyse plus froide qui force à admettre que "c'est rigolo, mais c'est pas très pro", et que non, ce n'est pas du niveau de ce que fait un musicien humain même moyen.
Suno est un outil qui semble conçu pour générer une musique qui a vocation à être entendue, mais pas écoutée. De la musique de fond de supermarché ou donnant un peu de vie comme musique de fond à un tuto Youtube. Mais pas digne d'être diffusée en radio pour ce qu'elle est, une œuvre artistique. De ce point de vue, l'humain n'est pas encore remplacé.
C'est du moins notre analyse. Si vous voulez tester et vous faire une idée par vous-même, un compte gratuit vous propose de générer 10 chansons par jour (à raison de 3 chansons par prompt, soit 3-4 prompts par jour). C'est ici que ça se passe.