Mieux simuler le monde réel

Gemini Robotics, Gemma 3 : Google embarque ses IA dans le réel • Toujours plus : les cryptos demandent un renforcement de la réserve en bitcoin • Une approche unifiée des modèles génératifs pour mieux simuler le monde réel • Dexterity accélère dans l’automatisation des entrepôts • Bienvenue dans Qant, jeudi 13 mars 2025.

« Le progrès est devant nous, à condition de dépasser sa propagande » Paul Virilio

Les trois nouveaux modèles de Deepmind nicheront dans les téléphones et les robots

Google Deepmind, qui vient de lancer Gemma 3, s’apprête à présenter une nouvelle série dédiée aux robots, Gemini Robotics.

  • Hier, Google Deepmind a annoncé le lancement prochain de Gemini Robotics, une déclinaison de son modèle phare pour l’IA embarquée.

  • Apptronik, Agile Robots et Boston Dynamics testent déjà Gemini Robotics-ER, pour aider les constructeurs à doter les robots d’IA avec une compréhension de l’espace autour d’eux.

Google Deepmind et Apptronik présentent les capacités de Gemini Robotics

  • La filiale d’Alphabet a également lancé Gemma 3, la nouvelle version de son modèle d’IA open source, en quatre versions de 1 à 27 milliards de paramètres. 

  • Google affirme que ce modèle est le plus performant sur une seule GPU, surpassant Llama, DeepSeek et OpenAI en termes de performances dans ces contraintes, typiques de l’IA embarquée.

  • Cela permet de l’embarquer sur de petits objets, comme des téléphones.

  • La vision de Gemma 3 est améliorée, avec un encodeur prenant en charge les images haute résolution et non carrées, ainsi qu’un classificateur de sécurité, ShieldGemma 2, conçu pour filtrer les contenus explicites ou dangereux.

  • Le modèle prend désormais en charge 140 langues, un contexte élargi à 128K tokens et la possibilité d’analyser du texte, des images et des vidéos courtes. 

Les premières versions de Gemma ont été téléchargées plus de 100 millions de fois, d’après Google Deepmind

  • À SURVEILLER : Google et les communautés. Avec Gemma-3 et Gemini Robotics, Alphabet tente de répéter son succès avec Androïd et les constructeurs de téléphones mobiles. Des doutes subsistent toutefois sur les restrictions de la licence open source de Gemma-3 ; Gemini Robotics semble lui destiné à rester propriétaire.

Simuler le monde réel : une approche unifiée des modèles génératifs multimodaux

Une équipe de chercheurs de Hong Kong propose une synthèse inédite sur les modèles génératifs multimodaux, intégrant 2D, vidéo, 3D et 4D pour une simulation plus réaliste du monde réel.

Une nouvelle manière de simuler le monde • Qant, M. de R. avec Midjourney

Les modèles génératifs multimodaux représentent une avancée majeure dans la simulation du monde réel, avec des applications potentielles en réalité virtuelle, jeux vidéo, robotique et conduite autonome. Les initiatives de développement de world models (des modèles d'intelligence spatiales) se multiplient depuis l'année dernière, de Niantic – qui vient de céder Pokemon go et ses autres jeux pour se concentrer sur les world models – à World Labs, la start-up notamment fondée par Fei-Fei Li, de l’université Stanford, en passant bien sûr par DeepMind

Ces modèles doivent pouvoir comprendre et raisonner sur la structure et le fonctionnement du monde en trois dimensions, ce qui est essentiel pour des applications comme la réalité augmentée, la réalité virtuelle et la robotique. Cependant, la fragmentation des approches actuelles, qui traitent séparément les dimensions 2D, 3D et temporelles, limite la compréhension et la reproductibilité des mécanismes sous-jacents à ces simulations. Dans un article de synthèse, une équipe de chercheurs hongkongais propose une vision synoptique des modèles de génération visuelle, analysant leur progression depuis les images 2D jusqu'à la modélisation dynamique en 4D.

Anthropic, Meta, Salesforce

  • La culture française contre Meta • Les syndicats français des éditeurs et auteurs (SNE, SGDL, SNAC) ont saisi le tribunal judiciaire de Paris, accusant Meta d’avoir utilisé, sans autorisation, des œuvres protégées pour entraîner son IA Llama. Jusqu’en 2023, la société aurait exploité Books3, une base contenant 200 000 livres, dont certains en français, en violation du droit d’auteur. En savoir plus… 

  • Anthropic perce le plafond de verre • Anthropic a atteint un chiffre d’affaires annualisé de 1,4 milliard de dollars début mars, en hausse de 40 % par rapport à fin 2024, selon The Information. À ce rythme, l’entreprise pourrait générer entre 2 et 4 milliards de dollars en 2025. La start-up, valorisée 61,5 milliards de dollars, a récemment levé 3,5 milliards lors d’un tour de financement en mars. Google détient 14% de ses actions, mais sans droit de vote ni présence au conseil. En savoir plus… 

  • Salesforce mise sur Singapour • Salesforce va investir 1 milliard de dollars à Singapour sur cinq ans pour accélérer l’adoption de l’IA. Cet investissement vise à soutenir le déploiement d’Agentforce, l'outil d’IA de Salesforce destiné aux entreprises. Salesforce, qui opère à Singapour depuis 25 ans, développe également des technologies avancées dans son centre de recherche local. En savoir plus…

Le sommet de la Maison-Blanche relance le lobbying crypto

Après le sommet crypto de vendredi, des parlementaires américains présentent un projet de renforcement de la réserve en bitcoin.

  • Le Bitcoin Act, présenté avant-hier par six sénateurs républicains menés par Cynthia Lummis, propose que le gouvernement américain achète un million de bitcoins sur cinq ans, pour un coût estimé à 80 milliards de dollars, afin de renforcer la réserve en bitcoin annoncée pour le sommet de vendredi à la Maison-Blanche.

  • Un projet similaire sera présenté à la Chambre des représentants pour appuyer le projet de loi par Nick Begich, représentant républicain d’Alaska.

  • Si le projet est approuvé, le financement des achats proviendra des revenus nets de la Réserve fédérale, ainsi que de la réévaluation des certificats d’or détenus par le Trésor. 

  • La réserve sera stockée dans un réseau décentralisé de wallets sécurisés à travers les États-Unis.

  • Les bitcoins devront être conservés au moins 20 ans avant toute revente.

Trump présente la réserve en bitcoin au sommet crypto à la Maison-Blanche vendredi 7 mars.

  • EN FILIGRANE : Prudence initiale. Le décret exécutif signé par Trump la semaine dernière pour donner du relief au sommet crypto de vendredi à la Maison-Blanche repose uniquement sur les bitcoins saisis lors de procédures judiciaires. Tout achat supplémentaire doit être budgétairement neutre. 

  • À SURVEILLER : Le prix du soutien financier. L’un des sénateurs qui soutiennent le projet de loi, Bernie Moreno, ne l’a emporté dans l’Ohio que grâce aux 40 millions de dollars apportés par Fairshake, un comité de soutien aux cryptos. On estime que les plateformes comme Coinbase et les investisseurs comme a16z constituent le deuxième soutien de Trump, après l’industrie pétrolière. Ils commencent à demander leur livre de chair.

La dextérité de la licorne

La start-up américaine Dexterity, spécialisée dans la robotique industrielle, lève un nouveau tour de table pour accélérer le développement de ses robots autonomes dotés d'intelligence artificielle.

Les robots de Dexterity chargent un camion avec des boîtes dissemblables

Il n’y en a pas que pour les robots humanoïdes. La californienne Dexterity, qui conçoit des robots industriels équipés d’intelligence artificielle et capables d’une manipulation d’objets avec une dextérité fine, vient de lever 95 millions de dollars, portant sa valorisation à 1,65 milliard, contre 1,4 Md$ au tour précédent en 2021.

Pony AI, Waymo

  • Le lys de Waymo court dans la Valley… • Le service de robotaxis Waymo couvre désormais la plus grande partie de la Silicon Valley, de San Francisco au siège de Google à Mountain View, via Palo Alto, Los Altos et une partie de Sunnyvale. L’application Waymo One, encore sur invitation, permet à ses utilisateurs de réserver un trajet à l’instar d’Uber, avec qui par ailleurs Waymo a établi un partenariat à Austin au Texas. Le service s’étendra jusqu’à Atlanta, en Géorgie, cette année. Mais une inconnue reste sur les capacités des robotaxis dans des régions aux cieux moins cléments. En savoir plus…

  • Et Pony AI s’ébroue en Chine • La start-up chinoise Pony AI, qui opère 300 robotoaxis à Pékin, Shanghai, Shenzen et Guangzhou, prévoit de passer à 1 000 véhicules cette année et 10 000 dans trois ans. Elle deviendra ensuite rentable en 2029. Des partenariats avec Toyota et deux constructeurs chinois, Beijing Automotive Group et Guangzhou Automobile Group, lui permettront de baisser le coût des véhicules à 270 000 yuan, soit environ 40 000 euros. En savoir plus…

Wayma mais pas Tesla : le cofondateur de Pony AI James Peng s’exprime sur le marché naissant des robotaxis


EN EXCLUSIVITÉ POUR LES ABONNÉS :

• La fusion des modèles 2D, 3D et temporels ouvre de nouvelles perspectives pour la simulation et la réalité virtuelle.

• Dexterity lève 95 millions de dollars pour développer ses robots industriels autonomes et renforcer l’IA en logistique.

Simuler le monde réel avec des modèles génératifs multimodaux

Une équipe de chercheurs de Hong Kong propose une synthèse inédite sur les modèles génératifs multimodaux, intégrant 2D, vidéo, 3D et 4D pour une simulation plus réaliste du monde réel.

Feuille de route de la croissance dimensionnelle des images 2D au contenu vidéo, 3D et 4D dans la simulation du monde réel • Source : Yuqi Hu et al.

Les modèles génératifs multimodaux représentent une avancée majeure dans la simulation du monde réel, avec des applications potentielles en réalité virtuelle, jeux vidéo, robotique et conduite autonome. Les initiatives de développement de world models (des modèles d'intelligence spatiales) se multiplient depuis l'année dernière, de Niantic – qui vient de céder Pokemon go et ses autres jeux pour se concentrer sur les world models – à World Labs, la start-up notamment fondée par Fei-Fei Li, de l’université Stanford, en passant par DeepMind

Une approche dimensionnelle de la génération de contenu

...

Qant: Révolution cognitive et Avenir du numérique

Qant: Révolution cognitive et Avenir du numérique

Par QANT: Révolution cognitive et Avenir du numérique

Jean Rognetta

Binational franco-italien, économiste de formation, Jean devient journaliste au milieu des années 1990, après avoir fait ses premiers pas dans l’édition et la technologie. Il débute sa carrière au groupe Tests, leader de la presse informatique, puis se spécialise en financement de l’innovation et des PME. Il couvre le sujet pour Les Echos et Capital Finance de 2000 à 2015. En 2016, il rejoint le magazine Forbes et devient directeur de la rédaction de l’édition française.
Pendant la crise financière, il lance l’association PME Finance, à l’origine notamment du PEA-PME et de l’amortissement du corporate venture, ainsi que partiellement de la libéralisation du crowdfunding. Elle fusionne en 2015 avec le groupement d’entrepreneurs Croissance Plus.
Depuis 2020, Jean a lancé la revue SAY, édition française de Project Syndicate, dont il reste contributing editor, le supplément Corporate Finance du Nouvel Économiste et la collection Demain! aux Editions Hermann.

Maurice de Rambuteau

Diplômé du Centre de Formation des Journalistes (CFJ Paris) et de l'Ecole Supérieure de Commerce de Paris (ESCP BS), Maurice de Rambuteau a fait ses premières armes de journaliste dans le sport, pour le site et le magazine SoFoot, puis au sein de la rédaction football de L'Equipe. Il s'est ensuite tourné vers le journalisme économique au sein de la rédaction de La Croix, avant de donner libre cours à sa passion pour la technologie en rejoignant Qant en juin 2022 pour un premier tour d’horizon de l’IA générative. Depuis, il a percé les mystères des blockchains et du métavers et, surtout, passé des dizaines de modèles d’IA au banc d’essai.

Les derniers articles publiés