Qant: Révolution cognitive et Avenir du numérique

Chaque jour, les tendances de la tech et l'IA par Jean Rognetta et Maurice de Rambuteau

image_author_QANT:_Révolution cognitive et Avenir du numérique
Par QANT: Révolution cognitive et Avenir du numérique
322 articles
16 févr. · 5 mn à lire
Partager cet article :

Les agents, nouvelle génération de l'IA

OpenAI prépare deux IA capables d'agir par elles-mêmes • Les lunettes AR de Brilliant Labs vont plus loin que Meta (et Apple) • Boston Dynamics montre les progrès de son robot humanoïde Atlas • Microsoft concentre sa communication sur Copilot et Bard devient Gemini • Bienvenue dans Qant, vendredi 9 février 2024.

« Le progrès est devant nous, à condition de dépasser sa propagande » Paul Virilio

Chaque jour, les journalistes de Qant illustrent les tendances de fond qui animent la tech. Ils s’appuient sur Kessel Média et utilisent l’IA générative depuis mars 2022.

L’ÉVÉNEMENT

Après vous, monsieur l’agent

OpenAI, Google et Meta sont entrés dans la course aux agents d’IA, la nouvelle génération après l’IA générative. Ces modèles dépassent la simple conversation et deviennent capables d’agir sur des fichiers ou sur le Web, créant des assistants d’IA plus efficaces.

“Le robot apprend à utiliser un téléphone” (Qant, M. de R. avec Midjourney)“Le robot apprend à utiliser un téléphone” (Qant, M. de R. avec Midjourney)

OpenAI prépare deux types d’agent IA, selon un scoop du média américain The Information. L’un sera capable d'automatiser des tâches complexes, comme transférer des données d'un document vers un tableur ou remplir automatiquement des notes de frais dans un logiciel comptable. L’autre agira sur le Web, avec la possibilité par exemple de réserver des billets d’avion.

Google et Meta se sont également lancées dans la course aux agents, ainsi que de nombreuses start-ups : Rabbit, dont le R1 a défrayé la chronique pendant le CES (lire Qant du 10 janvier), mais aussi Adept et Imbue, qui ont levé respectivement 430 millions et 200 millions de dollars l’an dernier… Ou encore, moins connues, HyperWrite, Lindy, et les pionniers de l’open source : AutoGPT, AgentGPT, BabyGPT (lire Qant du 28 avril 2023).

Cette nouvelle génération de l’IA, que Bill Gates appelle de ses vœux (lire Qant du 16 novembre 2023), sera donc sans doute opérationnelle cette année. Mais elle devra encore surmonter de nombreux obstacles. 

Êtes-vous prêt à laisser une IA prendre le contrôle de votre téléphone pour faire vos courses à votre place avec votre carte bleue ?

L’INTÉGRALITÉ DE CET ARTICLE EST DISPONIBLE EN FIN DE LETTRE

L’ESSENTIEL : Apple, Boston Dynamics, Brilliant Labs, Google, Microsoft

ROBOTS

Atlas soutenant l’amortisseur

Boston Dynamics met en scène dans une vidéo récente le robot Atlas manipulant des amortisseurs. De quoi relancer la course aux robots utilisés en environnement de travail.

Boston Dynamics vient de publier une vidéo de son robot humanoïde Atlas en train de manipuler avec précision des amortisseurs de voiture, pesant environ 13,6 kilos. L'Atlas prend ces amortisseurs dans une unité de stockage verticale pour les placer horizontalement sur un chariot roulant, ce qui met en évidence sa dextérité et sa capacité à gérer des tâches de manipulation complexes. Le robot semble capable d’évaluer l'environnement et de planifier ses mouvements de manière complexe, notamment en contournant des obstacles et en ajustant sa prise pour ne pas endommager les objets manipulés, en utilisant de la vision par ordinateur et des lidars pour une reconnaissance précise de l'objet.

La compétition entre robots humanoïdes s'intensifie, avec plusieurs entreprises comme Agility Robotics, Apptronik et Figure qui progressent vers l'intégration de leurs robots dans des environnements de travail réels. Le robot Digit d'Agility Robotics est notamment en phase de test chez Amazon et GXO Logistics (lire Qant du 13 juin 2023 et du 20 septembre 2023), tandis que Figure a récemment conclu un accord avec BMW pour explorer les possibilités d'utilisation des robots humanoïdes dans son usine de fabrication en Caroline du Sud (lire Qant du 22 janvier).

Sans oublier l’Optimus de Tesla, qui se pavane dans les usines de son créateur (lire Qant du 5 février et du 14 décembre 2023).

Pour en savoir plus :

RÉALITÉ VIRTUELLE ET AUGMENTÉE

  • Brilliant Labs chausse de nouvelles lunettes Dotées d'un assistant IA multimodal nommé Noa, les nouvelles lunettes AR Frame permettent des commandes vocales avec une capacité de traitement visuel, grâce à l'intégration de plusieurs modèles d'IA, dont Perplexity AI, Stable Diffusion, GPT-4 et le système de reconnaissance vocale Whisper. Lancées par une start-up créée à Singapour par des anciens d’Apple, Brilliant Labs, les lunettes Frame affichent une résolution de 640 x 400 et peuvent par exemple comparer les prix en ligne d'un produit directement dans un centre commercial. Depuis sa création en 2019, Brilliant Labs a reçu un financement total de 6 millions de dollars, incluant des investisseurs notables tels que John Hanke, le CEO de Niantic (Pokémon Go) ou le co-fondateur d'Oculus, Brendan Iribe (lire Qant du 7 juillet 2023).
    Pour en savoir plus: Axios, Techcrunch,Forbes

INTELLIGENCE ARTIFICIELLE

  • L’IA d’Apple joue à Photoshop • Apple a publié un article de recherche sur un nouveau modèle de retouche d'images alimenté par l'IA, Mgie (MLLM-Guided Image Editing). Développé en collaboration avec l'université de Californie, ce modèle permet aux utilisateurs de modifier des photos en décrivant simplement en langage naturel les changements souhaités, sans avoir à utiliser de logiciel de retouche photo. Mgie peut effectuer des tâches d'édition simples et complexes, comme le recadrage, le redimensionnement, l'ajout de filtres, ou encore modifier la forme d'objets spécifiques dans une photo pour les rendre plus lumineux. Apple a rendu Mgie disponible au téléchargement via GitHub. Elle a également publié une démo web sur Hugging Face Spaces, bien que l’évolution du modèle au-delà de la recherche n'ait pas été précisée.
    Pour en savoir plus:
    The Verge

  • Gemini, nouveau nom de scène de Bard • Google vient d'annoncer le rebranding du chatbot et assistant IA Bard qui s'appelle désormais Gemini, comme ses modèles de fondation. Cette nouvelle identité marketing coïncide avec le lancement d'une application dédiée pour Android et diverses options d'abonnement. Les utilisateurs d'iPhone peuvent eux accéder à Gemini via l'application Google sur iOS. Google introduit également une option d'abonnement IA pour les utilisateurs avancés souhaitant accéder à Gemini Ultra 1.0, le modèle AI le plus puissant de Google, au prix de 19,99 $ par mois via Google One. Ce service est disponible dans plus de 150 pays et territoires, en anglais pour le moment, avec des plans d'expansion pour inclure le japonais, le coréen et d'autres langues​​.
    Pour en savoir plus:
    CNBC

  • Copilot expulse Bing du cockpit • Le 12 février prochain, à l'occasion de la finale du championnat de football américain, grand rendez-vous connu comme “Super Bowl”, Microsoft montrera une publicité pour l'assistant d’IA Copilot, sans référence au moteur de recherche boosté à l'IA Bing, qui disparaît petit à petit de la communication.  La publicité montre des utilisateurs utilisant Copilot pour différentes tâches créatives comme générer des images pour un scénario ou écrire du code pour un jeu 3D.
    Pour en savoir plus:
    The Verge

MONNAIES NUMÉRIQUES ET BLOCKCHAINS

  • La loi américaine sur les stablecoins a encore des chances • Après des mois de négociations, la Chambre des représentants est sur le point de conclure un accord sur un projet de loi très attendu concernant les stablecoins, d’après la rapporteuse de la commission. Maxine Waters, une élue démocrate (et donc minoritaire) a souligné l'importance pour la Fed de pouvoir superviser ces jetons indexés sur le dollar, à mi-chemin entre monnaie privée et fonds monétaires. La pression en ce sens monte de la part des milieux financiers : la première banque des États-Unis, JP Morgan, et la secrétaire au Trésor Janet Yellen ont toutes deux récemment fait des déclarations en ce sens (lire Qant du 5 février et du 7 février). Même un média crypto, Cryptoslate, a pris position en faveur de la régulation des stablecoins plutôt que l’émission d’un dollar numérique, à laquelle Donald Trump et les extrémistes républicains s’opposent bruyamment. Si les républicains de la chambre, la partie la plus agitée du Congrès, trouvent un accord avec les démocrates, ce consensus pourrait propulser le projet de loi au sénat avant le couperet électoral de novembre.
    Pour en savoir plus: Politico, Cointelegraph, Cryptoslate

  • L’Inde veut étendre partout la roupie numérique • La Reserve Bank of India (RBI) envisage des solutions hors ligne pour favoriser l'adoption de la roupie numérique dans les zones reculées du pays, avec un accès limité à Internet. Le gouverneur de la RBI, Shaktikanta Das, a annoncé que plusieurs solutions seront évaluées dans des environnements ruraux, urbains et montagneux. Ces fonctionnalités seront progressivement introduites via des pilotes. Actuellement, le système permet des transactions de personne à personne (P2P) et de personne à commerçant (P2M), utilisant des portefeuilles numériques fournis par les banques pilotes.
    Pour en savoir plus:
    Cointelegraph 

ÉDITION PREMIUM

En exclusivité pour les abonnés :

  • La vision de Bill Gates sur la multiplication des agents d’IA est en train de devenir réalité. OpenAI est entrée dans la course, ainsi que Google, Meta, et de nombreuses start-ups. Après l’IA générative, voici la prochaine génération d’IA.

...