Pendant que l'IA se déploie dans l'e-commerce, que Meta lance un LLM vocal et qu'Oracle entre dans le bal, le risque de voir leurs modèles tourner en rond lance les grands de l'IA à la chasse aux données, particulièrement dans les archives des médias. Sans oublier la livre numérique et le quantique non-Ising. Bienvenue dans Qant, lundi 19 juin.
« Le progrès est devant nous, à condition de dépasser sa propagande » Paul Virilio
Chaque jour, les journalistes de Qant illustrent les tendances de fond qui animent la tech. Pour cela, ils s’appuient sur Kessel Média et utilisent l’IA générative depuis mars 2022. Les articles qui requièrent le plus de travail humain demandent un abonnement.
"Le robot feuillette les journaux" (Midjourney)
En 2030, estime l’institut Gartner, les intelligences artificielles produiront 10% de toutes les données (et le marché aura dépassé les 110 milliards de dollars). Les données synthétiques écraseront l’observaton du monde réel dans l’entraînement des modèles. Or, les IA entraînées en utilisant des textes et des images d'autres IA, elles-mêmes formées sur des résultats d'IA, pourraient finalement devenir inutiles. Ilia Shumailov et d’autres chercheurs de l'université d'Oxford viennent de publier un article de recherche montant que les modèles d'IA formés en utilisant les résultats d'autres IA deviennent fortement biaisés, trop simplifiés et déconnectés de la réalité - un problème qu'ils appellent l'effondrement des modèles. Cette perspective ne fera que renforcer l’appétit des créateurs d’IA pour les données humaines : les captchas, un marché contrôlé par Google (à peine concurrencé par H Captcha), ne suffisent plus.
D’après le Financial Times la semaine dernière, plusieurs géants mondiaux de la technologie, dont OpenAI, Google, Microsoft et Adobe, ont engagé des discussions avec News Corp, Axel Springer, le New York Times et The Guardian. L'objectif des négociations est de régler les problèmes de droits d'auteur liés à l'exploitation du contenu d'information pour entraîner des LLM. Un accord pourrait instaurer un modèle d’abonnement pour l'utilisation du contenu d'actualité par les entreprises technologiques. Des tarifs allant de 5 millions à 20 millions de dollars a été évoquée par certains éditeurs.
Pour en savoir plus :
Ilia Shumailov et al., The Curse of Recursion: Training on Generated Data Makes Models Forget, Arxiv.org
Fonctionnant à l'énergie solaire, YuMi automatise la plantation de graines, accélérant ainsi le processus de reforestation dans l'Amazonie. Bien que décrit comme collaboratif, YuMi travaille de manière autonome dans une région isolée de l'Amazonie péruvienne, permettant aux volontaires de Junglekeepers de concentrer leur temps et leurs ressources sur des tâches comme la surveillance de la zone pour dissuader les bûcherons illégaux ou l'éducation des habitants sur la préservation de la forêt tropicale, voire la plantation de jeunes arbres.
Pour en savoir plus : The Robot Report
Meta donne de la voix : Meta a présenté Voicebox, un modèle de synthèse vocale générative qui, à l'instar de ChatGPT et Dall-E pour le texte et l'image, génère des extraits audio à partir de textes. Le modèle a été formé sur plus de 50 000 heures d'audio non filtré dans plusieurs langues. Il atteint une performance presque équivalente à celle des modèles formés sur la parole réelle. Meta a cité le risque d’abus – la génération de deep fakes – pour expliquer qu’elle dérogerait à sa règle de mettre les modèles à disposition, en open source.
Pour en savoir plus: Engadget, CNET
Cohere joue à l’Oracle : Oracle a annoncé un partenariat avec la startup canadienne Cohere pour offrir des services d'intelligence artificielle générative à ses clients d'entreprise à travers le monde. Cohere développera, formera et déploiera des modèles d'IA générative sur Oracle Cloud Infrastructure, permettant aux clients de personnaliser les outils d'IA en fonction de leurs besoins spécifiques, tout en assurant la protection des données.
Pour en savoir plus: Fox Business
Squint lorgne sur les usines : Squint, une plateforme technologique utilisant la réalité augmentée pour optimiser les procédures d'usine, a levé 6 millions de dollars lors d'un tour de financement combiné de seed et de pre-seed.
Pour en savoir plus: Venture Beat
La BRI teste 18 usages de la livre numérique : Le BIS Innovation Hub de la Banque des Règlements Internationaux (BIS, en anglais) et la Banque d'Angleterre ont publié les résultats du Projet Rosalind, une initiative de monnaie numérique de banque centrale (CBDC) qui a exploré l'utilisation d'API pour permettre aux fournisseurs de paiement de s'intégrer au grand livre de la banque centrale.
Pour en savoir plus: Ledger Insights
Toshiba la joue Classiq : La société israélienne Classiq et Toshiba Digital Solutions, basée au Japon, ont annoncé une collaboration sur l'informatique quantique basée sur des portes logiques, visant à promouvoir l'exploration de cas d'usage et le développement de logiciels dans les domaines industriels. Les ordinateurs quantiques de type Ising créés jusqu’à présent excellent dans la résolution de problèmes d'optimisation combinatoire. L’ordinateur quantique gate-based (basé sur des portes logiques), encore en développement, sera destiné à des applications générales plus générales.
Pour en savoir plus : Calcalist Tech
"Le robot devient vendeur" (Midjourney)
La semaine dernière, Google a présenté deux nouvelles fonctionnalités d'intelligence artificielle permettant d'essayer virtuellement des vêtements sur une large gamme de mannequins et d'affiner les options de recherche grâce à de nouveaux filtres. Grâce à un outil d'essayage virtuel intégré à la fonction de recherche, les clients peuvent désormais visualiser à quoi ressemblerait un vêtement sur une silhouette qui leur ressemble avant de l'acheter. Ce n’est là que le dernier exemple d’une avalanche d’annonces, qui concernent la description et “l’essayage” des produits, les recommandations, le parcours client et généralement toute l’UX.
...