Tutoriel: créer des images avec ComfyUI et Flux ou Stable Diffusion 3.5

Icône ComfyUI
En début d'année, on s'amusait encore sur Stable Diffusion 1.5. C'était sympathique, mais le modèle et ses dérivés étaient largement dépassés par les solutions commerciales. Mais cet automne sont arrivés coup sur coup deux modèles open-source, open-weights, exécutables en local et digne des modèles commerciaux dans le cloud que sont Dall-E et Midjourney, à savoir Flux.1 Dev et Stable Diffusion 3.5 Large. Pour les utiliser sur votre machine, exit EasyDiffusion, place à ComfyUI. Réputé complexe d'utilisation, vous allez voir qu'avec un peu d'aide, on parvient très vite à générer des images sans plus de problèmes que cela. Voici donc un tutoriel complet pour utiliser Stable Diffusion 3.5 et Flux avec ComfyUI.

Sortie de Stable Diffusion 3.5 : enfin un Flux.1-killer ?

Icône En Bref
Après un Stable Diffusion 3.0 en demi-teinte et l'arrivée du concurrent Flux.1 de Black Forest Labs, Stability AI avait intérêt à frapper fort pour revenir sur le devant de la scène. 5 mois plus tard, Stability AI affirme que c'est désormais chose faite, avec la sortie de Stable Diffusion 3.5, censé corriger la plupart des défauts de la mouture précédente. De quoi réconcilier la communauté avec Stable Diffusion et enterrer Flux.1 ? Pas encore tout à fait, même si ce nouveau modèle ne manque pas d'arguments...

Essayer FLUX.1 Dev gratuitement en ligne c'est possible

Icône En Bref
Il y a quelques semaines, nous vous parlions de FLUX, un nouveau modèle de génération d'image à la Midjourney, à la pointe du genre et rivalisant avec les meilleurs modèles commerciaux, mais open-source, open-weights, utilisable en local. Mais entre une utilisation en local compliquée et des exigences en hardware plutôt salées, certains d'entre vous préfèreront sans doute l'essayer, au moins dans un premier temps, gratuitement en ligne dans le cloud. Rassurez-vous, c'est tout à fait possible et on vous présente les meilleurs sites disponibles actuellement pour générer des images gratuitement en ligne avec Flux.1 Dev et même Flux1.1 Pro !

Quel est le meilleur modèle de séparation instru/voix du moment ?

Icône En Bref
Sur EverydAI, on aime la musique et on s'est pris de passion pour la séparation de pistes par IA, qui permet de générer une instrumentale et une version a cappella de ses morceaux préférés depuis une version mixée. Or, les solutions en la matière sont nombreuses, si bien qu'on a voulu savoir laquelle était la meilleure du moment parmi les différentes solutions gratuites actuellement disponibles. Nous avons donc mis en place un protocole de test et comparé six modèles pour élire le meilleur. Le travail fut long, mais riche d'enseignements... Découvrez nos résultats et écoutez une démo faite par nos soins de notre grand vainqueur...

FLUX : un nouveau modèle de génération d'image open-source

Icône En Bref
Après un Stable Diffusion 3.0 décevant, on se demandait ce qu'allait pouvoir nous apporter à l'avenir le monde des modèles de génération d'images par IA en terme de modèles open-source, libre d'accès à utiliser à la maison. La solution n'est pas venue de Stability AI, mais d'un petit nouveau, Black Forest Labs, qui avec FLUX, frappe un grand coup et semble apporter enfin un modèle nouvelle génération comme on en attendait. Mais attention au diable dans les détails : tout ne sera pas forcément accessible à tout le monde... Petit point sur cette nouvelle technologie prometteuse.

Apollo - Un modèle audio pour restaurer les mauvais MP3

Icône En Bref
S'il existe depuis longtemps des modèles d'IA de traitement du signal audio pour séparer les pistes d'un morceau, retirer la reverb ou couper un bruit de fond, il existe un domaine peu exploré jusqu'ici : la restauration/réparation de MP3 de mauvaise qualité (encodés à faible bitrate). Les solutions en la matière sont souvent peu performantes ou bien hors de prix... Apollo promet donc de remédier à cela avec un modèle efficace, open-source et gratuit. Promesse audacieuse ! Mais promesse tenue ?

LLaMa 3.2 : Meta passe à son tour au modèle d'IA multimodal

Icône En Bref
Après LLaMa 3, Meta propose LLaMa 3.2, une nouvelle version de son modèle de langage proposé en quatre versions... dont deux sont en principe interdits aux consommateurs européens. Mais quelles sont donc ces nouveautés si sérieuses qu'elles méritent d'en interdire l'accès à 500 Millions de consommateurs, et pourquoi quatre modèles ? On fait le point sur les nouveautés apportées par la dernière version maison du LLM open-source made in Facebook...

Udio passe en version 1.5 et apporte plein de nouveautés

Icône En Bref
On ne présente plus Udio, le générateur de musique par IA qui fait de l'ombre à Suno, mais le voici qui débarque en version bêta 1.5. Sa qualité, déjà au-dessus de la concurrence, progresse encore. Mais surtout, cette nouvelle version vient apporter des fonctionnalités bienvenues, déjà présentes chez la concurrence et qui lui faisaient puissamment défaut. De quoi devenir le générateur de musiques parfait ? Pas forcément, mais il faut admettre que les arguments en sa faveur ne manquent pas...

Stable Diffusion 3.0 : entre fou-rire et consternation

Icône En Bref
Sorti il y a quelques semaines, Stable Diffusion 3.0 était très attendu. Devant rattraper le retard et même dépasser Midjourney et Dall-E, la version publique de SD3 semble pourtant faire bien plus que décevoir la communauté, consternée, voire carrément hors d'elle. En cause, un modèle loin de respecter ses promesses, produisant des humains difformes et des images de qualité plus que douteuse. Si StabilityAI se défend d'avoir fourni un modèle pourri, les expériences faites avec semblent donner le plus souvent des résultats oscillant entre le pas-terrible et le grotesque...

Codestral : l'IA française spécialisée dans la génération de code

Icône En Bref
Depuis les premiers jours de ChatGPT, le code fait partie des domaines dans lesquels les LLM ont montré certaines capacités. Sans être excellent, GPT-3.5 permettait déjà de bidouiller des petits scripts et d'assister les codeurs dans le développement d'applis. Aujourd'hui, Mistral, la startup française spécialisée dans les LLM, présente Codestral : un modèle entraîné pour le code dans différents langages. Sans révolutionner l'industrie, il se veut une itération supplémentaire dans le domaine des LLM spécialisés développement. Au point de remplacer de vrais développeurs ?