Qant: Révolution cognitive et Avenir du numérique

Chaque jour, les tendances de la tech et l'IA par Jean Rognetta et Maurice de Rambuteau

image_author_QANT:_Révolution cognitive et Avenir du numérique
Par QANT: Révolution cognitive et Avenir du numérique
21 févr. · 6 mn à lire
Partager cet article :

La lutte pour la vidéo IA a commencé

OpenAI rejoint Google et menace les start-up de la vidéo IA • Nvidia lance un supercalculateur de plus de 18 exaflops • Apple prépare (enfin) des lancements d’IA • Samsung court (encore) après le Vision Pro • HelloRobot veut entrer (un jour) sur le marché des robots domestiques • Bienvenue sur Qant, lundi 19 février.

« Le progrès est devant nous, à condition de dépasser sa propagande » Paul Virilio

Chaque jour, les journalistes de Qant illustrent les tendances de fond qui animent la tech. Ils s’appuient sur Kessel Média et utilisent l’IA générative depuis mars 2022.

L’ÉVÉNEMENT

OpenAI rejoint le ciel de la vidéo IA

Après Runway, Synthesia, et surtout Google, OpenAI relève le gant des vidéos générées à partir d’un simple texte, en lançant Sora (“ciel”, en japonais). La bagarre de la “multimodalité” continue ainsi de s’étendre, mais le succès de ChatGPT ne sera pas facile à imiter.

“Un nouveau robot derrière la caméra” (Qant, M. de R. avec Midjourney)“Un nouveau robot derrière la caméra” (Qant, M. de R. avec Midjourney)

Sora. C'est le nom du nouveau modèle d'intelligence artificielle dévoilé par OpenAI, capable de transformer des instructions textuelles en vidéos photoréalistes jusqu'à une minute de long. Elles peuvent inclure des scènes complexes avec plusieurs personnages, différents types de mouvements, et un souci du détail pour les sujets comme pour les arrière-plans. Sora, qui tire son nom du mot japonais signifiant “ciel”, est également capable de générer des vidéos à partir d'une image fixe, compléter ou prolonger des vidéos existantes. 

La puissance médiatique que ChatGPT a donnée à OpenAI fait que depuis vendredi, on ne parle plus que de Sora. Pourtant, le modèle arrive sur un marché déjà encombré, que dominent Pika et Runway. C’est sans doute avec Runway et Midjourney qu’a été réalisé en mars dernier le spot de Coca-Cola, qui reste la référence pour l’instant en matière de vidéo d’IA.

Pika a attiré en novembre un tour A de 55 millions de dollars mené par LightSpeed Ventures ;  Runway pour sa part a levé au total 236 millions de dollars, et Synthesia 156 millions (lire Qant du 16 juin 2023). Cependant, ce segment de l’IA a vite fini par attirer l’attention des grands. Stability AI a lancé en novembre dernier Stable Video Diffusion, puis Google a présenté Lumière en janvier (lire Qant du 23 novembre 2023 et du 24 janvier).  

Voici maintenant le plus grand, OpenAI. La rivalité des grands modèles s’étend désormais à toutes les facettes de la multimodalité : texte, images, sons, voix, vidéos...

L’INTÉGRALITÉ DE CET ARTICLE EST DISPONIBLE EN FIN DE LETTRE

L’ESSENTIEL : Apple, Hello Robot, Informatics Service Corporation, JP Morgan, Microsoft, Nvidia, Samsung, Tether

ROBOTS

Stretch se lance à la poursuite de Roomba

La dernière création d’Hello Robot présente des capacités le rapprochant d’un assistant domestique.

La start-up californienne de robotique Hello Robot vient d'annoncer le lancement de Stretch 3, la dernière version de son manipulateur mobile. Ce robot, doté d'une base à roues et d'un préhenseur réglable en hauteur, est présenté dans des vidéos de démonstration effectuant des tâches ménagères comme faire les lits et vider le lave-vaisselle. D’après le fabricant, la version 3 de Stretch améliore considérablement l'autonomie du robot et sa capacité à être dirigé à distance. Elle intègre également un poignet permettant une manipulation dextre et une caméra Intel Realsense D405 positionnée derrière le préhenseur. 

Avec un prix de 24 950 dollars, le robot reste essentiellement une plateforme de recherche, quoiqu’il soit également utilisé pour l'assistance aux personnes en situation de handicap. Toutefois, la vision à long terme de HelloRobot est d'intégrer Stretch dans les foyers, pour y effectuer des tâches quotidiennes telles que la vaisselle ou la lessive. 

La start-up entre ainsi dans la quête d'un successeur à l’aspirateur robotisé Roomba, en crise depuis l’échec du rachat par Amazon (lire Qant du 29 novembre 2023).  Hello Robot explore une voie médiane entre les robots simples, à usage unique, et les robots humanoïdes complexes, en montrant qu'une forme non humanoïde peut exécuter une grande variété de tâches domestiques de manière convaincante.

Pour en savoir plus :

INTELLIGENCE ARTIFICIELLE

  • Pour rattraper son retard, Appel se hâte lentementApple intensifie le développement d'outils d'intelligence artificielle pour son logiciel de programmation Xcode et explore l'utilisation de l'IA générative dans des produits destinés aux consommateurs, comme la création automatique de playlists dans Apple Music et des fonctionnalités de recherche similaires à celles d'un chatbot IA pour la recherche Spotlight. Cette mise à jour de recherche permettrait aux utilisateurs d'iOS et de macOS de faire des demandes en langage naturel pour obtenir des rapports météo ou utiliser des fonctionnalités spécifiques des applications. Les nouvelles fonctionnalités d'IA d'Apple, y compris celles pour Xcode, devraient être présentées lors de l'événement annuel WWDC pour développeurs​​, en juin prochain. Ce qui les mettra tout de même moins en retard que le casque Vision Pro, lancé après la fin du métavers.
    Pour en savoir plus:
    Bloomberg, The Verge

  • Des fakes vocaux au service des victimes Les parents d'une victime de la fusillade de Parkland en 2018 ont lancé "The Shotline". Le projet, soutenu notamment par ElevenLabs, utilise l'IA pour recréer les voix d'enfants tués par des armes à feu et les faire entendre aux législateurs américains pour exiger des lois plus strictes sur le contrôle des armes. Plus de 8 000 appels IA utilisant la voix de six victimes de la fusillade ont été envoyés aux législateurs américains via le site.
    Pour en savoir plus:
    Wall Street Journal

  • Microsoft mise sur l’Allemagne • Microsoft prévoit d'investir 3,2 milliards d'euros en Allemagne au cours des deux prochaines années, principalement dans le domaine de l'intelligence artificielle, marquant le plus gros investissement de l'entreprise aux États-Unis en Allemagne depuis 40 ans. Cet investissement vise à doubler la capacité de son infrastructure IA et de centres de données dans le pays et à étendre ses programmes de formation.
    Pour en savoir plus:
    Reuters

  • 18,4 exaflops pour Éos de Nvidia Nvidia vient de présenter Éos, un superordinateur destiné à accélérer le développement de l'intelligence artificielle. Équipé de 576 systèmes Nvidia DGX H100, combinés à un réseau Quantum-2 InfiniBand, il fournit une performance totale de 18,4 exaflops. Conçu sur la base de l'expérience acquise avec les architectures de superordinateurs antérieures de Nvidia, comme Saturn V et Selene, Éos (la déesse grecque de l’aurore) prendra en charge des charges de travail importantes pour l'entraînement de modèles de langage volumineux, de systèmes de recommandation IA et d'analyses à grande échelle. Son 'architecture est optimisée pour une latence ultra-faible, avec des vitesses de transfert de données allant jusqu'à 400GB/s. Le superordinateur intègre également des logiciels comme Base Command pour la gestion de flux de travail IA et AI Enterprise, une plateforme cloud-native pour accélérer le développement et le déploiement d'applications d’IA.
    Pour en savoir plus:
    Silicon Angle

MONNAIES NUMÉRIQUES ET BLOCKCHAINS

  • JP Morgan pousse l’attaque contre Tether • D’après la presse crypto américaine, JP Morgan a indiqué dans une nouvelle note d’analyse la semaine dernière que les régulateurs américains pouvaient exercer un certain contrôle sur l'utilisation à l'étranger de Tether, via l'Office of Foreign Assets Control (Ofac). JP Morgan a également souligné que la future réglementation des stablecoins aux États-Unis et en Europe pourrait diminuer l'attractivité de Tether, connue pour son manque de transparence et de conformité. Début février, JP Morgan avait exprimé des préoccupations concernant la position dominante de Tether, une position qualifiée “d'hypocrite" par le CEO de Tether Paolo Ardoino (lire Qant du 5 février).
    Pour en savoir plus:
    The Block, Coindesk 

  • Washington veut priver Téhéran de monnaie numérique • Les États-Unis ont sanctionné Informatics Services Corporation (ISC), une filiale de la Banque centrale iranienne responsable du développement de la monnaie numérique iranienne et d'autres systèmes de paiement. Deux entreprises, à Dubaï et en Turquie, ont également été sanctionnées pour avoir acquis de la technologie au nom d'ISC. Ces sanctions interviennent alors que l'Iran envisage d'utiliser sa monnaie numérique pour contourner les sanctions américaines. La Russie et l'Iran ont également exploré l'utilisation d'une monnaie adossée à l'or pour les échanges commerciaux, et l'Iran a entamé la phase pilote de sa CBDC en 2022, en utilisant Hyperledger Fabric.
    Pour en savoir plus:
    Ledger Insights

JEUX ET MÉTAVERS

  • Samsung met le paquet contre le Vision Pro • Samsung vient de créer une équipe interne dédiée pour le développement de son premier casque de réalité étendue (XR). Opérant sous la division Mobile Experience (MX) de Samsung, l'équipe "Immersive Team" a récemment été élargie à plus de 100 personnes, dans le but d'accélérer le développement et de lancer le casque cette année. Samsung prévoit de dévoiler son casque au second semestre 2024, parallèlement aux lancements des téléphones Galaxy Z Flip 6 et Z Fold 6. Le casque devrait intégrer deux micro-affichages OLED de 1,03 pouce de Samsung eMagin. Il utilisera le processeur Snapdragon XR2+ Gen 2 de Qualcomm. Son système d'exploitation serait une version d'Android développée par Google spécifiquement pour la réalité mixte, intégrée avec l'écosystème de Samsung.
    Pour en savoir plus:
    Hankyung, IOT Tech News

ÉDITION PREMIUM

En exclusivité pour les abonnés :

  • OpenAI présente Sora, un modèle de text-to-video, trois semaines après Lumiere de Google Research. Après le texte et l’image, les guerres multimodales entre Google, Meta et OpenAI sont prêtes à s’étendre à la vidéo. Les start-up ont-elles encore une chance ?

...