Patatras ! Une nouvelle pierre dans le jardin d'OpenAI ! Et cette fois, c'est Meta, la maison mère de Facebook, qui s'y met !
Quoi, vous ne le saviez pas ? Oui, Meta aussi fait dans l'IA. Après le flop du Metaverse, il semble que les têtes pensantes de chez Meta aient trouvé un nouvel eldorado. Et s'ils ont plusieurs projets sur le feu, le plus abouti et celui qui fait parler de lui est sans nul doute LLaMa, leur propre grand modèle de langage (LLM), dont ils viennent tout juste de publier la mouture 3.0. Ce LLaMa 3 est en train de faire grand bruit en ce moment même, mais pourquoi ?
Pas pour son intelligence extraordinaire. LLaMa 3 sort en deux versions : 8B (8 milliards de paramètres) et 70B (70 milliards de paramètres), le second étant nettement plus futé que le premier. Pour l'essentiel, LLaMa 3, même dans son modèle le plus complet, semble être peu ou prou aussi "intelligent" que GPT-4, pourtant sorti un an auparavant, c'est-à-dire il y a une éternité dans le monde de l'IA. Quant au modèle 8B,…
Vous les avez peut-être vu passer, ces covers improbables réalisées via un modèle d'IA... le streameur Antoine Daniel qui reprend Renaud, ou Kurt Cobain qui reprend Don't look back in anger d'Oasis... grâce au voice-cloning, il est possible de créer un modèle autonome d'imitation de voix, et de plaquer cette voix sur n'importe quel enregistrement audio d'une autre voix, qu'il s'agisse de chant ou de discours. Cela vous a sans doute amusé, un peu fasciné aussi, et peut-être avez-vous été poussé par la curiosité, à vous demander comment faire pareil chez vous, avec vos propres modèles. Derrière ces sons, souvent, la technologie d'IA RVC. Mais peut-on reproduire ça chez soi ?
Étonnamment, non seulement c'est possible, mais il n'est pas besoin d'une machine de guerre ou de connaissances ultra-poussées pour y parvenir. Avec Applio, qui reprend la technologie RVC2, il est très facile de faire vos propres modèles... et vos propres AI covers. Voyons comment on s'y prend, vous allez voir, c'est rien de sorcier ! Il vous faudra juste disposer d'un PC suffisamment performant, de quelques compétences très basiques en manipulation de fichier audio, et d'un peu de patience.
Vous avez tout ça en stock ? Alors c'est parti, on s'y met !
Les…
Il a impressionné les foules à sa sortie. Il a, à lui tout seul, généré l'intérêt de tout un public envers l'IA jusqu'alors largement ignorée. Il a pour ainsi dire révolutionné une industrie... le moins que l'on puisse dire, c'est que ChatGPT n'a pas laissé indifférent. Mais peu de gens savent comment le chatbot développé par OpenAI fonctionne réellement. Sa capacité à répondre à toutes sortes de questions, à résoudre des problèmes, à générer du code, à faire des maths, et bien d'autres choses sont tout à fait scotchantes. Pour la première fois, on a réellement l'impression de parler à un chatbot réellement intelligent. Mais est-il vraiment matheux ? Vraiment intelligent ?
Pour y répondre, il faut en revenir aux bases.
Au cœur de ChatGPT, les grands modèles de langages
L'aspect le plus fondamental de ChatGPT, c'est ce qu'on appelle un large language model (LLM), ou grand modèle de langage. Il s'agit d'un réseau de neurones entraîné sur une gigantesque quantité de textes pour inférer des relations statistiques entre les mots.
Un LLM a donc "appris" à parler l'humain en s'abreuvant de textes pour être capables de les imiter. Cela en fait un modèle d'abord statistique. Les données sont traitées à l'échelle…
Midjourney, Dall-E... les modèles d'IA dite "générative" appliquée à la création d'image font régulièrement parler d'elles. Mais en pratique, elles sont souvent soit payantes, soit très limitées dans ce que l'on peut faire avec. Généralement exécutées dans le cloud, vous êtes tributaire de la bonne volonté, et des pratiques économiques, de l'hébergeur du service. Et puis, quelle confidentialité quand les images sont littéralement générées par la machine de quelqu'un d'autre ? Aucune, sans doute.
Mais si je vous disais qu'il existe une IA que vous pouvez exécuter en local, sans avoir besoin d'une station de travail ultra-puissante, avec toutes les garanties qui vont avec ? Gratuité, illimité, confidentialité, liberté, et personnalisation infinie, avec des dizaines et des dizaines de modèles téléchargeables gratuitement pour les mettre au boulot ? Cette IA, c'est stable-diffusion. Vous en avez peut-être déjà entendu parler, mais faire fonctionner stable-diffusion n'est, en soi, pas une mince affaire.
Heureusement, de gentils passionnés vous ont mâché le travail avec une distribution toute faite. Installée et lancée en quelques clics, elle vous permet de vous lancer en quelques minutes. Cette distribution, c'est EasyDiffusion.…