En bref - Tous les brefs

C'est entendu : en matière de moteurs de recherche, Google règne sans partage. Et forcément, un monopole sur un nœud aussi stratégique du web, ça crée quelques convoitises. Chez Microsoft notamment, cela fait bien longtemps qu'on cherche à contester la suprématie de Google. Et quand on parle du loup, on voit la queue de son nouveau meilleur ami, OpenAI. Eux aussi rêvent de venir tailler des croupières à la firme de Mountain View. Et pour ça, un argument de poids : l'IA au service de la recherche. C'est ainsi qu'ils présentent aujourd'hui un "prototype temporaire" répondant au doux nom de SearchGPT.

Le nom n'est pas choisi par hasard : il surfe sur la hype autour de ChatGPT, mais recycle en fait un concept qu'on a déjà vu, y compris chez Google eux-même avec leur fonction "AI Overviews". Le principe : une IA comprend vos requêtes en langage naturel, parcourt les résultats d'un moteur de recherche (probablement Bing dans le cas de SearchGPT, vu la proximité d'OpenAI avec Microsoft) et vous fait un résumé…

[Lire la suite] | Publié le : | Tags : cloud, texte, recherche, beta

Nous vous avons déjà présenté Udio, à l'époque lors de sa sortie en version bêta. Fait amusant, en bêta, il l'est toujours... mais en version bêta 1.5. C'est original, ces services qui restent en bêta après la sortie de la 1.0... Toujours est-il que ce service de génération de musique par IA, concurrent de Stable Audio et de Suno AI, se distinguait par des instruments et des voix plutôt mieux définies et un système de facturation économique grâce à sa manière particulière de générer les chansons par petits bouts, permettant d'itérer à moindre prix.

Mais Suno présentait aussi un certain retard sur ses concurrents en terme de fonctionnalités. Avec la version 1.5, il se met enfin au niveau : outre une qualité audio améliorée, il permet désormais de télécharger les pistes séparées, mais aussi de laisser plus de maîtrise aux prompteurs avec une prise en charge des instructions sur la tonalité, et surtout, la prise en charge de l'audio to audio. Pour rappel, l'audio2audio consiste à envoyer au service de l'audio…

[Lire la suite] | Publié le : | Tags : audio, musique, cloud, gratuit

Avec le succès médiatique de GPT-4o, les concurrents ne pouvaient rester passif et du côté de Meta, LLaMa 3, dont nous avons déjà parlé dans nos colonnes, ne suffit plus. C'est donc tout naturellement que l'équipe de recherche menée par Yann LeCun et financée par Mark Zuckerberg s'est attelée à la création, elle aussi, d'une IA multimodale, capable de gérer non seulement le texte mais aussi l'image, le son, etc., et répondant au petit nom de Meta AI.

Mais tout récemment, la même équipe a fait une annonce choc : l'Europe sera purement et simplement privée de cette IA, en tout cas pour le moment. Chez Meta, on évoque une "trop grande imprévisibilité législative" du côté de l'UE. Comprendre : trop de régulations, et qui évoluent trop vite, au risque de mettre des bâtons dans les roues de Meta et de causer des incertitudes…

[Lire la suite] | Publié le : | Tags : cloud, LLM, multimodal

Sorti il y a quelques semaines, c'est peu dire que Stable Diffusion 3.0 était attendu. Alors que Midjourney et Dall-E avaient pris une avance considérable tant dans la qualité des rendus que dans la compréhension des prompts, SD3 promettait de rebattre les cartes avec des performances extraordinaires. La hype était à son comble, les promesses immenses : Stability AI promettait même que ce modèle serait sans doute le dernier modèle majeur de génération d'image qu'ils produiraient, tant ses performances étaient excellentes. Nous n'aurions tout simplement plus besoin de mieux. Photoréalisme parfait, compréhension de prompts archi-complexes, gestion impeccable des textes dans l'image... Stable Diffusion 3 était plus que prometteur : il devait mettre tout le monde d'accord.

Aussi la déception, voire la colère, de la communauté à sa sortie fut-elle à la hauteur des espérances. Pourquoi ? SD3 aurait-il échoué à tenir ses promesses ? Jugez plutôt...

 

[Lire la suite] | Publié le : | Tags : image, photo, gratuit, foss, local

Depuis les premiers jours de ChatGPT, le code fait partie des domaines dans lesquels les LLM ont montré certaines capacités. Sans être excellent, GPT-3.5 permettait déjà de bidouiller des petits scripts et d'assister les codeurs dans le développement d'applis. Aujourd'hui, Mistral, la startup française spécialisée dans les LLM, présente Codestral : un modèle entraîné pour le code dans différents langages. De quoi révolutionner l'industrie ?

Il y a quelques mois, Jensen Huang, PDG de Nvidia, envoyait le message aux jeunes : "laissez tomber l'apprentissage du code, dans quelques années, les IA s'en chargeront". Bien sûr, la remarque était intéressée... Nvidia a tout intérêt à pousser l'IA à devenir une nouvelle ruée vers l'or... c'est lui qui vend les pelles. Il n'empêche que la programmation est l'un des domaines dans lesquels les LLM montrent une certaine…

[Lire la suite] | Publié le : | Tags : open-source, gratuit, LLM, code, cloud, local

Autant il y a des jours où l'on est enthousiaste quant à ce que l'avenir avec l'IA nous réserve, autant il est des moments où les géants de la tech débarquent avec les pires idées de merde sous prétexte d'IA, et l'on se met à désespérer. Il ne suffit pas de mettre de l'IA dans une fonctionnalité pour que celle-ci vaille la peine d'être développée, et ce n'est pas parce qu'un usage de l'IA est possible qu'il est souhaitable. C'est ce que Microsoft semble ne pas avoir compris avec Recall (alias Rappel en bon français).

Prévu pour les nouveaux PC certifiés Copilot+ équipés de Windows 11, cette idée issue de gens apparemment incapables de réfléchir aux implications de leurs concepts propose de prendre des captures d'écran de tout ce que vous faites, en permanence, toutes les quelques secondes, de les enregistrer, et de les fournir à une IA qui sera capable de vous retrouver tout ce que vous avez fait ou vu sur demande, grâce à un mélange de…

[Lire la suite] | Publié le : | Tags : image, texte, IA de merde

La réponse du berger à la bergère ? Après que Meta a sorti LLaMa 3, son LLM open-source censé rivaliser avec GPT-4, OpenAI se retrouvait dans une posture délicate avec un ChatGPT un peu vieillissant. Maintenant que des IA réputées presque aussi smarts non seulement gratuites, mais en plus open source et exécutables sur le PC de Monsieur et Madame tout le monde, il devenait difficile pour OpenAI de justifier d'un GPT-4 payant et d'un GPT-3.5 de plus en plus vieillissant...

C'est sans doute pour cette raison qu'OpenAI a décidé de publier GPT-4o, une itération de GPT-4 censée être encore plus intelligente, encore plus rapide, capable d'interagir avec tous types de média (audio, image...), et surtout d'être gratuite, ouverte à tous. L'annonce a fait sensation et le web s'enthousiasme pour ce modèle incroyablement intelligent...

Sauf qu'à l'essai, nous sommes obligés de tempérer un peu cette ferveur. Et même de la tempérer deux fois, pour…

[Lire la suite] | Publié le : | Tags : LLM, texte, gratuit, cloud, ChatGPT

C'est vrai, le site n'a pas beaucoup bougé ces derniers temps. Mais nous allons y remédier dès maintenant avec la publication d'un nouvel article détaillé, sous forme de tuto : ce tutoriel vous permet d'utiliser LLaMa 3 à la maison à l'aide d'ollama et de Chatbox.

Pour rappel, LLaMa 3 est le nouveau LLM de Meta (Facebook), open-source et utilisable librement.  Sa particularité est de disposer d'un modèle suffisamment petit et optimisé pour pouvoir être exécuté par un PC grand public (à condition quand-même d'avoir un GPU correct), tout en offrant des performances supposément proches de GPT4. Nous vous en parlions dans un précédent bref.

Mais faire effectivement tourner LLaMa sur son propre PC, même si c'est relativement facile, demande quand-même de savoir où et quoi chercher. Pas d'inquiétude : on vous a fait un tutoriel complet, avec tous les liens qui vont bien, et deux trois trucs et astuces pour en tirer le meilleur profit…

[Lire la suite] | Publié le : | Tags : texte, gratuit, open-source, local, LLM

Patatras ! Une nouvelle pierre dans le jardin d'OpenAI ! Et cette fois, c'est Meta, la maison mère de Facebook, qui s'y met !

Quoi, vous ne le saviez pas ? Oui, Meta aussi fait dans l'IA. Après le flop du Metaverse, il semble que les têtes pensantes de chez Meta aient trouvé un nouvel eldorado. Et s'ils ont plusieurs projets sur le feu, le plus abouti et celui qui fait parler de lui est sans nul doute LLaMa, leur propre grand modèle de langage (LLM), dont ils viennent tout juste de publier la mouture 3.0. Ce LLaMa 3 est en train de faire grand bruit en ce moment même, mais pourquoi ?

Pas pour son intelligence extraordinaire. LLaMa 3 sort en deux versions : 8B (8 milliards de paramètres) et 70B (70 milliards de paramètres), le second étant nettement plus futé que le premier. Pour l'essentiel, LLaMa 3, même dans son modèle le plus complet, semble être peu ou prou aussi "intelligent" que GPT-4, pourtant sorti un an auparavant, c'est-à-dire il y a une éternité dans le monde de l'IA. Quant au modèle 8B,…

[Lire la suite] | Publié le : | Tags : gratuit, LLM, texte, cloud, local

Après Suno AI et Udio, Stability AI entend à son tour se faire une place dans les générateurs de musique par IA avec une nouvelle génération de son propre modèle. La concurrence est rude et cette version 2.0 du moteur maison de Stability AI a fort à faire pour se hisser au niveau de ses concurrents. 

Pour ce faire, Stable Audio 2.0 entend se démarquer avec quelques fonctionnalités particulières, qui portent un peu la signature de la maison-mère, puisqu'elles ressemblent à des adaptations au monde de l'audio des fonctions qui font la spécificité de Stable Diffusion dans le monde de l'image, qui laisse davantage de contrôle à l'utilisateur et favorise la possibilité d'itérer petit à petit pour "sculpter" le résultat attendu. Mais tout cela est-il vraiment suffisant ? Quel avenir pour cet outil face à des spécialistes qui avancent très vite ?

[Lire la suite] | Publié le : | Tags : gratuit, audio, musique, cloud