Sortie de Stable Diffusion 3.5 : enfin un Flux.1-killer ?

Icône En Bref
Après un Stable Diffusion 3.0 en demi-teinte et l'arrivée du concurrent Flux.1 de Black Forest Labs, Stability AI avait intérêt à frapper fort pour revenir sur le devant de la scène. 5 mois plus tard, Stability AI affirme que c'est désormais chose faite, avec la sortie de Stable Diffusion 3.5, censé corriger la plupart des défauts de la mouture précédente. De quoi réconcilier la communauté avec Stable Diffusion et enterrer Flux.1 ? Pas encore tout à fait, même si ce nouveau modèle ne manque pas d'arguments...

Quel est le meilleur modèle de séparation instru/voix du moment ?

Icône En Bref
Sur EverydAI, on aime la musique et on s'est pris de passion pour la séparation de pistes par IA, qui permet de générer une instrumentale et une version a cappella de ses morceaux préférés depuis une version mixée. Or, les solutions en la matière sont nombreuses, si bien qu'on a voulu savoir laquelle était la meilleure du moment parmi les différentes solutions gratuites actuellement disponibles. Nous avons donc mis en place un protocole de test et comparé six modèles pour élire le meilleur. Le travail fut long, mais riche d'enseignements... Découvrez nos résultats et écoutez une démo faite par nos soins de notre grand vainqueur...

FLUX : un nouveau modèle de génération d'image open-source

Icône En Bref
Après un Stable Diffusion 3.0 décevant, on se demandait ce qu'allait pouvoir nous apporter à l'avenir le monde des modèles de génération d'images par IA en terme de modèles open-source, libre d'accès à utiliser à la maison. La solution n'est pas venue de Stability AI, mais d'un petit nouveau, Black Forest Labs, qui avec FLUX, frappe un grand coup et semble apporter enfin un modèle nouvelle génération comme on en attendait. Mais attention au diable dans les détails : tout ne sera pas forcément accessible à tout le monde... Petit point sur cette nouvelle technologie prometteuse.

Apollo - Un modèle audio pour restaurer les mauvais MP3

Icône En Bref
S'il existe depuis longtemps des modèles d'IA de traitement du signal audio pour séparer les pistes d'un morceau, retirer la reverb ou couper un bruit de fond, il existe un domaine peu exploré jusqu'ici : la restauration/réparation de MP3 de mauvaise qualité (encodés à faible bitrate). Les solutions en la matière sont souvent peu performantes ou bien hors de prix... Apollo promet donc de remédier à cela avec un modèle efficace, open-source et gratuit. Promesse audacieuse ! Mais promesse tenue ?

Stable Diffusion 3.0 : entre fou-rire et consternation

Icône En Bref
Sorti il y a quelques semaines, Stable Diffusion 3.0 était très attendu. Devant rattraper le retard et même dépasser Midjourney et Dall-E, la version publique de SD3 semble pourtant faire bien plus que décevoir la communauté, consternée, voire carrément hors d'elle. En cause, un modèle loin de respecter ses promesses, produisant des humains difformes et des images de qualité plus que douteuse. Si StabilityAI se défend d'avoir fourni un modèle pourri, les expériences faites avec semblent donner le plus souvent des résultats oscillant entre le pas-terrible et le grotesque...

Une nouvelle bêta d'UVR5 améliore les capacités de stem-separation

Icône En Bref
UVR5 n'était depuis quelques temps plus au top des solutions d'unmixing/stem-separation et était dépassé par des outils en ligne comme le site MVSEP. Mais une nouvelle bêta vient changer la donne en apportant de nouveaux modèles de pointe basés sur BS-RoFormer pour séparer les pistes voix des pistes instrumentales. L'outil entièrement gratuit et tournant en local fait donc son grand retour dans la course des meilleurs outils d'unmixing qui soient. Petit aperçu de la situation et des nouvelles possibilités apportées par cette bêta...

EasyDiffusion (via Github)

Icône EasyDiffusion, une distribution de stable-diffusion
Stable Diffusion est un modèle de génération d'images par diffusion. Il n'est pas le plus performant, mais il a l'avantage d'être non seulement gratuit, mais aussi libre, open source et téléchargeable et exécutable en local pour laisser un contrôle absolu sur la génération. Plusieurs distributions existent et EasyDiffusion en est la plus simple d'accès, tout en restant très personnalisable. La page github donne accès au téléchargement de la dernière version (pour une exécution en local), à la doc et au code source.

Ultimate Vocal Remover (UVR5)

Logo de Ultimate Voice Remover (UVR) 5
Ultimate Vocal Remover (UVR5) est un outil de séparation de source, aussi appelé unmixing ou stem-separation. Il permet de prendre une musique dans sa version mixée, et d'en séparer les différentes parties, soit séparer la partie instruments de la partie chant, soit carrément de séparer les différents instruments. Même si certains outils en ligne sont peut-être un poil plus performant, il reste dans la course des outils de pointe dans le domaine et a surtout l'avantage d'être gratuit, illimité, et de tourner en local. À télécharger sur son site officiel.

Upscayl.org

Icône / Logo d'Upscayl
Upscayl est un outil open-source permettant de redimensionner des images ou des photos avec le moins de pertes et d'artefacts possibles grâce à différents modèles d'upscaling par IA que vous pouvez choisir. Il fonctionne en local sur n'importe quel ordinateur (Windows/Mac/Linux) équipé d'un GPU même ancien. Le site officiel permet de télécharger le logiciel, d'accéder à la documentation, de télécharger des modèles customs, ou encore de se préinscrire pour la bêta de la version cloud à paraître prochainement.

Stable-Diffusion 3 en phase de bêta privée, bientôt disponible

Icône En Bref
Face à la rude concurrence de Dall-E 3 et de Midjourney V6, il était plus que temps pour stable-diffusion de rattraper un retard qui s'agrandissait de jour en jour. Il semble que c'est en phase d'être chose faite avec l'annonce de la sortie imminente de stable-diffusion 3.0, qui s'annonce comme un progrès majeur pour le modèle open-source d'IA générative d'images de StabilityAI.