Meta présente un modèle multimodal qui pourra générer des univers virtuels ; Spotify lutte contre la musique créée avec l’IA ; le PDG d'OpenAI Sam Altman prépare une cryptomonnaie. Et Google se veut une entreprise "AI-First". Bienvenue dans Qant, jeudi 11 mai.
IA GÉNÉRATIVE : A la conférence Google I/O, Alphabet multiplie les annonces.
Meta présente un LLM multimodal combinant le texte, l’image, le son, la profondeur, la température et le mouvement.
Spotify supprime plusieurs dizaines de milliers de morceaux réalisés grâce à l’IA.
BLOCKCHAINS : Le fondateur d’OpenAI Sam Altman lance une application mobile pour son projet de cryptomonnaie.
Lors de l'édition 2023 de Google I/O, l'entreprise a clairement affiché son intention de remodeler l'ensemble de ses produits phares. Google Search promet de répondre de manière conversationnelle aux requêtes des utilisateurs et de suggérer des questions de recherche supplémentaires. pour ce faire, le chatbot de Google, Bard, se basera le nouveau modèle de langage naturel de Google, Palm 2. Ce dernier est capable de comprendre plus de 100 langues, y compris divers types de code, et a bénéficié d'améliorations en matière de mathématiques, de logique et de raisonnement.
Parmi les usages les plus marquants, Gmail va désormais permettre aux utilisateurs de générer automatiquement des emails grâce à la fonctionnalité "Help Me Write", exploitant l'IA pour suggérer du contenu basé sur les e-mails précédents. Ce qui ouvre de nouvelles perpectives aux interactions avec les banques et les grands opérateurs de réseaux (eau, électricité, télécoms…).
Les autres produits de Google n'ont pas été en reste. Google Photos introduit "Magic Editor", une fonctionnalité permettant de modifier et d'ajouter des éléments dans une photo. Et surtout, Google Maps déploiera progressivement une fonctionnalité de vue immersive, permettant aux utilisateurs de visualiser en 3D leurs itinéraires et leur environnement. Presque un métavers.
Source : Google
Pour en savoir plus : Reuters
"Le robot multiplie les outils" (Midjourney)
Meta vient de publier un article de recherche sur un modèle d'intelligence artificielle, appelé ImageBind, qui combine six modalités : le texte, l'image et l'audio, comme GPT-4, mais aussi la profondeur, la température et les unités de mesure inertielle (IMU), qui calculent la position et le mouvement. En reliant les éléments d'une image à leur forme, leur son, leur température et leur mouvement, le modèle génère une connaissance plus approfondie du monde. ImageBind génère un espace d'intégration partagé à travers plusieurs modalités sans nécessiter d’entraînement sur toutes les combinaisons de modalités possibles. Cela permettra, par exemple, d’utiliser des capteurs 3D et IMU pour créer des mondes virtuels immersifs ou générer du contenu en leur sein.
ImageBind serait donc le premier LLM capable de générer des métavers. En outre, ses capacités de recherche multimodale le rendent capable d’explorer des souvenirs multimédias à l'aide de n’importe quelle combinaison de texte, d'audio et d'images ou de vidéos. Ce qui pourrait offrir une nouvelle vie aux réseaux sociaux.
Pour en savoir plus : The Verge
"Le robot écoutant de la musique" (Midjourney)
La plateforme de streaming musical, Spotify, vient de retirer des dizaines de milliers de morceaux produits par une start-up spécialisée dans l'intelligence artificielle, Boomy, rapporte le Financial Times. Boomy permet aux utilisateurs de créer des morceaux de musique dans différents styles, allant du rap au lo-fi, puis de les diffuser sur des services de streaming pour percevoir des royalties. La start-up, lancée en 2021, affirme avoir généré 14,5 millions de morceaux, soit 14 % de la musique enregistrée dans le monde.
Universal Music (UMG) avait mis en garde les principales plateformes de streaming contre une activité suspecte sur les morceaux de Boomy, suggérant l'utilisation de bots pour gonfler les statistiques d'audience. Suite à cela, Spotify a retiré environ 7 % des morceaux mis en ligne par Boomy. Une part sans doute insuffisante à rassurer les majors, très inquiètes de la musique générée par IA. Le mois dernier, UMG avait fait retirer des principales plateformes Heart on my sleeve, une chanson créée sur TikTok par l’utilisateur Ghostwriter977 et interprétée par une IA comme un faux duo entre les rappeurs canadiens Drake et The Weeknd.
Source : Financial Times
Pour en savoir plus : Business Insider
"Sam Altman présente sa crypto-monnaie" (Midjourney)
Ancien CEO de l’incubateur Y Combinator, le cofondateur et directeur général d’OpenAI Sam Altman est aussi impliqué dans la start-up Worldcoin. Celle-ci décrit sa future cryptomonnaie comme le véhicule qui permettra de répartir les gains de l’intelligence artificielle sous la forme d’un revenu universel, que Sam Altman estime à plus de 1 000 dollars par mois et par Américain.
Pour l’heure, Worldcoin n’a présenté qu’une application, WorldApp, qui se veut à la fois un portefeuille et un passeport numérique. Depuis le lancement de sa version bêta, qui vient de se terminer, 1,5 million de personnes l’ont téléchargée et 500 000 l’utilisent régulièrement. Conçue pour être plus accessible que les autres services, WorldApp adopte un design épuré et un ensemble de fonctionnalités réduit. Les détenteurs d'un World ID vérifié pourront utiliser World App comme un passeport numérique, permettant l'accès à des applications et services exclusifs. Les premiers utilisateurs bénéficieront de transactions sans frais sur World App sur les cryptomonnaies implémentées : le bitcoin, l’éther et le stablecoin de Circle, USDC.
Source : World Coin
Pour en savoir plus : Sam Altman, CNBC, CryptoSlate
"Deux robots-journalistes" (Dall-e)
Qant, c'est le pari de deux journalistes d'accompagner les futures technologies de la presse et de l'audiovisuel, pour ne pas avoir à les subir : notamment l'IA générative, la réalité virtuelle et augmentée, le métavers et le Web3, mais aussi l'informatique quantique.
Qant, c'est le choix d'utiliser systématiquement des modèles d'intelligence artificielle pour rédiger et illustrer des articles qui restent conçus et édités par des humains. Écrire et illustrer avec l'IA, comme avec un traitement de texte, sans fantasmer sur un grand remplacement par les robots. Nous travaillons sur l’ingénierie d’invite (« prompt engineering ») pour mettre au point le traitement futur de l’actualité, dans le respect de la déontologie journalistique. Et c’est gratuit ! Pour en profiter c'est ici.
Qant Expert vous propose chaque semaine des analyses du marché, un modèle au banc d'essai, et une revue d'actualité détaillée. Vous recevrez gratuitement deux études par an, dont le Qant CES Report avec votre premier numéro.
Il faut s'abonner ici. C'est moins de dix euros par mois, et ça vous assure la reconnaissance des robots. Et même des journalistes.
Rédaction :
Nous avons utilisé dans ce numéro Midjourney pour illustrer nos articles, et ChatGPT Plus pour les synthétiser et les traduire.
Et comme toujours Kessel Media pour héberger et router la newsletter !