En bref - Tous les brefs

La réponse du berger à la bergère ? Après que Meta a sorti LLaMa 3, son LLM open-source censé rivaliser avec GPT-4, OpenAI se retrouvait dans une posture délicate avec un ChatGPT un peu vieillissant. Maintenant que des IA réputées presque aussi smarts non seulement gratuites, mais en plus open source et exécutables sur le PC de Monsieur et Madame tout le monde, il devenait difficile pour OpenAI de justifier d'un GPT-4 payant et d'un GPT-3.5 de plus en plus vieillissant...

C'est sans doute pour cette raison qu'OpenAI a décidé de publier GPT-4o, une itération de GPT-4 censée être encore plus intelligente, encore plus rapide, capable d'interagir avec tous types de média (audio, image...), et surtout d'être gratuite, ouverte à tous. L'annonce a fait sensation et le web s'enthousiasme pour ce modèle incroyablement intelligent...

Sauf qu'à l'essai, nous sommes obligés de tempérer un peu cette ferveur. Et même de la tempérer deux fois, pour…

[Lire la suite] | Publié le : | Tags : LLM, texte, gratuit, cloud, ChatGPT

C'est vrai, le site n'a pas beaucoup bougé ces derniers temps. Mais nous allons y remédier dès maintenant avec la publication d'un nouvel article détaillé, sous forme de tuto : ce tutoriel vous permet d'utiliser LLaMa 3 à la maison à l'aide d'ollama et de Chatbox.

Pour rappel, LLaMa 3 est le nouveau LLM de Meta (Facebook), open-source et utilisable librement.  Sa particularité est de disposer d'un modèle suffisamment petit et optimisé pour pouvoir être exécuté par un PC grand public (à condition quand-même d'avoir un GPU correct), tout en offrant des performances supposément proches de GPT4. Nous vous en parlions dans un précédent bref.

Mais faire effectivement tourner LLaMa sur son propre PC, même si c'est relativement facile, demande quand-même de savoir où et quoi chercher. Pas d'inquiétude : on vous a fait un tutoriel complet, avec tous les liens qui vont bien, et deux trois trucs et astuces pour en tirer le meilleur profit…

[Lire la suite] | Publié le : | Tags : texte, gratuit, open-source, local, LLM

Patatras ! Une nouvelle pierre dans le jardin d'OpenAI ! Et cette fois, c'est Meta, la maison mère de Facebook, qui s'y met !

Quoi, vous ne le saviez pas ? Oui, Meta aussi fait dans l'IA. Après le flop du Metaverse, il semble que les têtes pensantes de chez Meta aient trouvé un nouvel eldorado. Et s'ils ont plusieurs projets sur le feu, le plus abouti et celui qui fait parler de lui est sans nul doute LLaMa, leur propre grand modèle de langage (LLM), dont ils viennent tout juste de publier la mouture 3.0. Ce LLaMa 3 est en train de faire grand bruit en ce moment même, mais pourquoi ?

Pas pour son intelligence extraordinaire. LLaMa 3 sort en deux versions : 8B (8 milliards de paramètres) et 70B (70 milliards de paramètres), le second étant nettement plus futé que le premier. Pour l'essentiel, LLaMa 3, même dans son modèle le plus complet, semble être peu ou prou aussi "intelligent" que GPT-4, pourtant sorti un an auparavant, c'est-à-dire il y a une éternité dans le monde de l'IA. Quant au modèle 8B,…

[Lire la suite] | Publié le : | Tags : gratuit, LLM, texte, cloud, local

Après Suno AI et Udio, Stability AI entend à son tour se faire une place dans les générateurs de musique par IA avec une nouvelle génération de son propre modèle. La concurrence est rude et cette version 2.0 du moteur maison de Stability AI a fort à faire pour se hisser au niveau de ses concurrents. 

Pour ce faire, Stable Audio 2.0 entend se démarquer avec quelques fonctionnalités particulières, qui portent un peu la signature de la maison-mère, puisqu'elles ressemblent à des adaptations au monde de l'audio des fonctions qui font la spécificité de Stable Diffusion dans le monde de l'image, qui laisse davantage de contrôle à l'utilisateur et favorise la possibilité d'itérer petit à petit pour "sculpter" le résultat attendu. Mais tout cela est-il vraiment suffisant ? Quel avenir pour cet outil face à des spécialistes qui avancent très vite ?

[Lire la suite] | Publié le : | Tags : gratuit, audio, musique, cloud

Si Suno tenait jusqu'ici la corde en tant que générateur musical le plus avancé du moment, un petit nouveau fraîchement débarqué entend bien faire parler de lui. Son petit nom : Udio.

Et pour l'avoir testé, le moins que l'on puisse dire est qu'Udio a effectivement des arguments à faire valoir.

Comme Suno AI, Udio a la prétention de générer des musiques à la demande, dans n'importe quel genre. Offrant une grande flexibilité, nous avons pu constater des qualités très similaires à Suno sur de nombreux points : sa compréhension des prompts nous a semblé tout aussi bonne et la qualité audio au moins équivalente, si ce n'est meilleure, avec des instruments mieux définis et moins brouillons. Capable de générer des instrumentales, des chansons avec paroles auto-générées ou bien de suivre des lyrics que vous lui aurez vous-même transmis, dans tous les genres. 

Nous l'avons ainsi testé sur du hard rock, de la trip hop, de la pop et même de l'opéra ! Dans tous les…

[Lire la suite] | Publié le : | Tags : audio, musique, gratuit, cloud

Décidément quel que soit le domaine de l'IA, et même dans celui ultra niche de l'unmixing/stem-separation, il ne se passe pas une semaine sans que les outsiders ne viennent contester les champions ou que l'équilibre des forces en présence ne soit chamboulé !

À peine a-t-on eu le temps d'écrire qu'UVR5 n'était plus au top et qu'il était dépassé par des outils en ligne comme le site MVSEP qu'une nouvelle bêta fait son apparition pour apporter de nouveaux modèles de pointe pour séparer les pistes voix des pistes instrumentales.

Dispo sur le Github de TRvlvr, cette nouvelle bêta inclut les modèles BS-RoFormer de viperx, considéré comme l'un des meilleurs du moment. À vrai dire, MVSEP dispose de son propre modèle BS-RoFormer censé être un poil plus efficace, sauf qu'UVR5 offre des fonctionnalités de personnalisation supplémentaires, notamment la possibilité de mélanger librement les modèles et de faire la moyenne des différents traitements (ce qu'on appelle un "Ensemble").…

[Lire la suite] | Publié le : | Tags : musique, audio, unmixing, foss, gratuit, local

C'est entendu : l'IA est dans l'air du temps. En vogue pourrait-on dire. Et comme tout sujet à la mode, elle attire toutes sortes de gens... des gens plus ou moins bien intentionnés. Il existe donc différentes pratiques douteuses ou relevant carrément de l'arnaque qui polluent ce milieu, et il est important de faire marcher son esprit critique et de se méfier des contrefaçons, ou des propositions trop belles pour être vraies.

Prenons un petit exemple très simple et qui peut vous concerner. Vous connaissez tous Dall-E 3, le générateur d'image d'OpenAI accessible via ChatGPT, et dont nous vous avons déjà expliqué comment profiter gratuitement via Bing Chat. L'ennui, c'est que tout le monde ne sait pas qu'il est possible de profiter ainsi gratuitement de Dall-E 3. Du coup, certains tentent de s'engouffrer dans la brèche, en profitant de la notoriété de la marque.

Regardez ce site, accessible via dalle3.org (nous ne mettons pas de lien vers ce…

[Lire la suite] | Publié le : | Tags : psa, blog, news

S'il est un domaine de l'IA très actif, c'est celui du clonage vocal. Fascinant pour les uns, inquiétant pour les autres, c'est en tout cas un domaine où les recherches avancent vite et les solutions se multiplient, chacune essayant de dépasser ses concurrents. Dernière née d'OpenAI, la solution Voice Engine s'annonce assez prometteuse.

Annoncé en fin de semaine dernière, Voice Engine n'a pas, contrairement à RVC, pour vocation à plaquer la voix clonée sur une voix "porte-greffe", mais à servir de moteur de voix en text-to-speech (TTS). Le principe est donc de lire n'importe quel texte, avec n'importe quelle voix. Ce n'est certes pas le premier modèle à proposer ce genre de service, mais la nouvelle génération proposée par OpenAI a un argument de taille à faire valoir : il suffirait d'à peine quinze secondes de voix pour réussir un clone pertinent, parfaitement adapté au text-to-speech.

Le service n'étant pas encore à la disposition du public, nous n'avons pas pu vérifier ces…

[Lire la suite] | Publié le : | Tags : audio, voix, cloud, text-to-speech

Générer de la musique avec l'IA, c'est possible, et c'est pas nouveau. Mais alors, vraiment pas... dès 1987, Experiments in Musical Intelligence (EMI) faisait déjà ses premiers pas. Plus proche de nous, mais déjà il y a quinze ans, Emily Howell, une IA spécialisée dans la musique, sortait son premier album. Du côté d'OpenAI, il y a MuseNet qui permet de générer de la musique depuis quelques temps aussi. Mais avec Suno, l'IA passe un cap en terme de créativité, tout en devenant accessible à tous.

Ce "ChatGPT de la musique" comme il aime à se présenter, propose en effet son troisième modèle, le premier à avoir la prétention de générer des chansons complètes, de plusieurs minutes, en qualité "radio".

Il suffit de lui donner un prompt définissant le type de musique ou de chanson voulue, et c'est parti. Si vous voulez des paroles, pas de problème : définissez un sujet et il les génère pour vous, rimes incluses. En…

[Lire la suite] | Publié le : | Tags : musique, news, gratuit

Face aux titans Dall-E et Midjourney, Stable Diffusion fait figure d'outsider. Ce modèle a l'avantage d'être open source et exécutable en local, vous avez d'ailleurs un tuto sur ce site, mais il faut bien reconnaître qu'il est technologiquement très en dessous de ce que proposent Dall-E 3 et Midjourney V6. De plus, Dall-E 3 en particulier, bien que propriétaire et non utilisable en local, propose une offre gratuite très généreuse via Bing Chat. On attendait donc un Stable-diffusion 3.0 avec une certaine impatience, sans trop savoir à quoi s'attendre.

Certes, les modèles Stable-Diffusion XL (SDXL pour les intimes) et Stable Cascade ont déjà apporté un vent de modernité bienvenu au poussiéreux SD1.5, sans parler de l'avantage des modèles supplémentaires téléchargeables et fine-tunés pour des usages précis, mais le retard ne cessait, malgré tout, de s'accroître. Aujourd'hui, alors qu'il est très facile d'obtenir…

[Lire la suite] | Publié le : | Tags : image, foss, news