Gemini Robotics, Gemma 3 : Google embarque ses IA dans le réel • Toujours plus : les cryptos demandent un renforcement de la réserve en bitcoin • Une approche unifiée des modèles génératifs pour mieux simuler le monde réel • Dexterity accélère dans l’automatisation des entrepôts • Bienvenue dans Qant, jeudi 13 mars 2025.
« Le progrès est devant nous, à condition de dépasser sa propagande » Paul Virilio
Hier, Google Deepmind a annoncé le lancement prochain de Gemini Robotics, une déclinaison de son modèle phare pour l’IA embarquée.
Apptronik, Agile Robots et Boston Dynamics testent déjà Gemini Robotics-ER, pour aider les constructeurs à doter les robots d’IA avec une compréhension de l’espace autour d’eux.
Google Deepmind et Apptronik présentent les capacités de Gemini Robotics
La filiale d’Alphabet a également lancé Gemma 3, la nouvelle version de son modèle d’IA open source, en quatre versions de 1 à 27 milliards de paramètres.
Google affirme que ce modèle est le plus performant sur une seule GPU, surpassant Llama, DeepSeek et OpenAI en termes de performances dans ces contraintes, typiques de l’IA embarquée.
Cela permet de l’embarquer sur de petits objets, comme des téléphones.
La vision de Gemma 3 est améliorée, avec un encodeur prenant en charge les images haute résolution et non carrées, ainsi qu’un classificateur de sécurité, ShieldGemma 2, conçu pour filtrer les contenus explicites ou dangereux.
Le modèle prend désormais en charge 140 langues, un contexte élargi à 128K tokens et la possibilité d’analyser du texte, des images et des vidéos courtes.
À SURVEILLER : Google et les communautés. Avec Gemma-3 et Gemini Robotics, Alphabet tente de répéter son succès avec Androïd et les constructeurs de téléphones mobiles. Des doutes subsistent toutefois sur les restrictions de la licence open source de Gemma-3 ; Gemini Robotics semble lui destiné à rester propriétaire.
Une nouvelle manière de simuler le monde • Qant, M. de R. avec Midjourney
Les modèles génératifs multimodaux représentent une avancée majeure dans la simulation du monde réel, avec des applications potentielles en réalité virtuelle, jeux vidéo, robotique et conduite autonome. Les initiatives de développement de world models (des modèles d'intelligence spatiales) se multiplient depuis l'année dernière, de Niantic – qui vient de céder Pokemon go et ses autres jeux pour se concentrer sur les world models – à World Labs, la start-up notamment fondée par Fei-Fei Li, de l’université Stanford, en passant bien sûr par DeepMind.
Ces modèles doivent pouvoir comprendre et raisonner sur la structure et le fonctionnement du monde en trois dimensions, ce qui est essentiel pour des applications comme la réalité augmentée, la réalité virtuelle et la robotique. Cependant, la fragmentation des approches actuelles, qui traitent séparément les dimensions 2D, 3D et temporelles, limite la compréhension et la reproductibilité des mécanismes sous-jacents à ces simulations. Dans un article de synthèse, une équipe de chercheurs hongkongais propose une vision synoptique des modèles de génération visuelle, analysant leur progression depuis les images 2D jusqu'à la modélisation dynamique en 4D.
La culture française contre Meta • Les syndicats français des éditeurs et auteurs (SNE, SGDL, SNAC) ont saisi le tribunal judiciaire de Paris, accusant Meta d’avoir utilisé, sans autorisation, des œuvres protégées pour entraîner son IA Llama. Jusqu’en 2023, la société aurait exploité Books3, une base contenant 200 000 livres, dont certains en français, en violation du droit d’auteur. En savoir plus…
Anthropic perce le plafond de verre • Anthropic a atteint un chiffre d’affaires annualisé de 1,4 milliard de dollars début mars, en hausse de 40 % par rapport à fin 2024, selon The Information. À ce rythme, l’entreprise pourrait générer entre 2 et 4 milliards de dollars en 2025. La start-up, valorisée 61,5 milliards de dollars, a récemment levé 3,5 milliards lors d’un tour de financement en mars. Google détient 14% de ses actions, mais sans droit de vote ni présence au conseil. En savoir plus…
Salesforce mise sur Singapour • Salesforce va investir 1 milliard de dollars à Singapour sur cinq ans pour accélérer l’adoption de l’IA. Cet investissement vise à soutenir le déploiement d’Agentforce, l'outil d’IA de Salesforce destiné aux entreprises. Salesforce, qui opère à Singapour depuis 25 ans, développe également des technologies avancées dans son centre de recherche local. En savoir plus…
Le Bitcoin Act, présenté avant-hier par six sénateurs républicains menés par Cynthia Lummis, propose que le gouvernement américain achète un million de bitcoins sur cinq ans, pour un coût estimé à 80 milliards de dollars, afin de renforcer la réserve en bitcoin annoncée pour le sommet de vendredi à la Maison-Blanche.
Un projet similaire sera présenté à la Chambre des représentants pour appuyer le projet de loi par Nick Begich, représentant républicain d’Alaska.
Si le projet est approuvé, le financement des achats proviendra des revenus nets de la Réserve fédérale, ainsi que de la réévaluation des certificats d’or détenus par le Trésor.
La réserve sera stockée dans un réseau décentralisé de wallets sécurisés à travers les États-Unis.
Les bitcoins devront être conservés au moins 20 ans avant toute revente.
Trump présente la réserve en bitcoin au sommet crypto à la Maison-Blanche vendredi 7 mars.
EN FILIGRANE : Prudence initiale. Le décret exécutif signé par Trump la semaine dernière pour donner du relief au sommet crypto de vendredi à la Maison-Blanche repose uniquement sur les bitcoins saisis lors de procédures judiciaires. Tout achat supplémentaire doit être budgétairement neutre.
À SURVEILLER : Le prix du soutien financier. L’un des sénateurs qui soutiennent le projet de loi, Bernie Moreno, ne l’a emporté dans l’Ohio que grâce aux 40 millions de dollars apportés par Fairshake, un comité de soutien aux cryptos. On estime que les plateformes comme Coinbase et les investisseurs comme a16z constituent le deuxième soutien de Trump, après l’industrie pétrolière. Ils commencent à demander leur livre de chair.
Les robots de Dexterity chargent un camion avec des boîtes dissemblables
Il n’y en a pas que pour les robots humanoïdes. La californienne Dexterity, qui conçoit des robots industriels équipés d’intelligence artificielle et capables d’une manipulation d’objets avec une dextérité fine, vient de lever 95 millions de dollars, portant sa valorisation à 1,65 milliard, contre 1,4 Md$ au tour précédent en 2021.
Le lys de Waymo court dans la Valley… • Le service de robotaxis Waymo couvre désormais la plus grande partie de la Silicon Valley, de San Francisco au siège de Google à Mountain View, via Palo Alto, Los Altos et une partie de Sunnyvale. L’application Waymo One, encore sur invitation, permet à ses utilisateurs de réserver un trajet à l’instar d’Uber, avec qui par ailleurs Waymo a établi un partenariat à Austin au Texas. Le service s’étendra jusqu’à Atlanta, en Géorgie, cette année. Mais une inconnue reste sur les capacités des robotaxis dans des régions aux cieux moins cléments. En savoir plus…
… Et Pony AI s’ébroue en Chine • La start-up chinoise Pony AI, qui opère 300 robotoaxis à Pékin, Shanghai, Shenzen et Guangzhou, prévoit de passer à 1 000 véhicules cette année et 10 000 dans trois ans. Elle deviendra ensuite rentable en 2029. Des partenariats avec Toyota et deux constructeurs chinois, Beijing Automotive Group et Guangzhou Automobile Group, lui permettront de baisser le coût des véhicules à 270 000 yuan, soit environ 40 000 euros. En savoir plus…
Wayma mais pas Tesla : le cofondateur de Pony AI James Peng s’exprime sur le marché naissant des robotaxis
Feuille de route de la croissance dimensionnelle des images 2D au contenu vidéo, 3D et 4D dans la simulation du monde réel • Source : Yuqi Hu et al.
Les modèles génératifs multimodaux représentent une avancée majeure dans la simulation du monde réel, avec des applications potentielles en réalité virtuelle, jeux vidéo, robotique et conduite autonome. Les initiatives de développement de world models (des modèles d'intelligence spatiales) se multiplient depuis l'année dernière, de Niantic – qui vient de céder Pokemon go et ses autres jeux pour se concentrer sur les world models – à World Labs, la start-up notamment fondée par Fei-Fei Li, de l’université Stanford, en passant par DeepMind.
...