Safe SuperIntelligence attire regards et convoitises • En Israël, le shekel numérique séduit • La londonienne Humanoid présente le premier robot humanoïde européen • Un premier benchmark pour évaluer le raisonnement en chaîne des modèles multimodaux • Bienvenue dans Qant, mercredi 19 février 2025.
« Le progrès est devant nous, à condition de dépasser sa propagande » Paul Virilio
Les indiscrétions se multiplient sur la nouvelle levée de fonds de Safe Superintelligence (SSI), une start-up consacrée à l’élaboration de modèles d’IA supérieurs à l’intelligence humaine.
Fondée par Ilya Sutskever en juin 2024 après son départ d’OpenAI (lire Qant du 21 juin 2024), SSI avait levé un milliard de dollars sur une valorisation de 5 milliards dès le mois de septembre, auprès de VCs prestigieux comme a16z et Sequoia Capital.
Moins de 6 mois plus tard, sa valorisation s’étage entre 20 milliards selon Reuters, il y a dix jours, et 30 milliards de dollars selon Bloomberg cette semaine.
Greenoaks Capital Partners, déjà impliqué dans Scale AI et Databricks, mènerait l’opération en misant 500 millions de dollars sur le milliard supplémentaire recherché.
À SURVEILLER : La course à l’échelle. Cet engouement devrait permettre à SSI de ne commercialiser aucun produit avant d’avoir atteint l’AGI/ASI dans de bonnes conditions, ainsi qu’elle s’y est engagée. Les sommes engagées, quoiqu’importantes, sont très loin des dizaines de milliards de ceux qui sont engagés dans la course à la taille, notamment OpenAI et xAI. Si Ilya Sutskever, qui a proclamé “the end of scale”, la fin de la course à l’échelle, arrive à proposer des intelligences artificielles supérieures à l’homme avec cette relative économie de moyens, cela pourrait avoir l’effet d’une bombe.
Faut-il prendre au sérieux les menaces commerciales de Donald Trump ? Les Européens sont-ils armés pour y répondre ? Que penser de l’accord de libre-échange UE-Mercosur ?
Pour y voir plus clair sur ces sujets complexes d’une brûlante actualité, nous vous recommandons chaudement de vous abonner à BLOCS, la première newsletter francophone dédiée au commerce international. Chaque mercredi, cette lettre préparée par trois jeunes journalistes forts d'une expérience de plusieurs années de correspondance à Bruxelles, offre gratuitement un condensé utile, digeste et départi de toute considération idéologique de l’actualité des échanges mondiaux.
Mistral souffle vers l’Orient • La start-up française Mistral AI lance Mistral Saba, un modèle d’IA entraîné spécifiquement pour les langues et cultures du monde arabe. Doté de 24 milliards de paramètres, il vise à offrir des interactions plus naturelles en arabe et montre aussi de bonnes performances avec certaines langues d’origine indienne comme le tamil et le malayalam. Disponible via API et en déploiement local, ce modèle marque une stratégie d’expansion vers le Moyen-Orient, où Mistral pourrait attirer de nouveaux investisseurs. En savoir plus…
Une nouvelle licorne de l’IA en Israël • La start-up israélienne Dream, spécialisée dans la cybersécurité assistée par l’IA pour les gouvernements et infrastructures critiques, a levé 100 millions de dollars, ce qui porte sa valorisation à 1,1 milliard de dollars. Fondée en 2023 par Gil Dolev, Shalev Hulio et l’ancien chancelier autrichien Sebastian Kurz, Dream prévoit 100 M$ de revenus récurrents annuels en 2025. Le tour de table a été mené par Bain Capital Ventures, avec la participation de Group 11, Tru Arrow Partners et Tau Capital. En savoir plus…
250 millions pour la documentation clinique par IA • La start-up Abridge, basée à Pittsburgh et spécialisée dans l'IA générative pour la documentation médicale, a levé 250 millions de dollars en série D, portant sa valorisation à 2,75 milliards de dollars. L’entreprise étend son déploiement à plus de 100 établissements de santé américains, dont le Johns Hopkins Medicine, la Mayo Clinic et le centre de cancérologie Memorial Sloan Kettering. Son nouvel outil d’IA vise à optimiser la facturation et la documentation clinique. En savoir plus…
La truffe augmentée • Qant, M. de R. avec Midjourney
Canaery, start-up en neurotechnologie, et le Lawrence Livermore National Laboratory (LLNL), laboratoire du département de l’Énergie des États-Unis, conçoivent un implant capable de décoder les odeurs perçues par les animaux.
Déjà testé sur des rats, le dispositif détecte drogues, explosifs et toxines environnementales.
L’implant, placé sur le bulbe olfactif, capte et traduit les signaux neuronaux liés aux odeurs, permettant une identification instantanée sans apprentissage spécifique.
À SURVEILLER : Neuralink pour les chiens. Un développement est prévu pour les chiens, ce qui devrait en faire des assistants de police meilleurs encore.
L'importance des différentes caractéristiques d'un shekel numérique • Banque d'Israël
51 % des répondants déclarent un intérêt moyen ou élevé pour le shekel numérique, selon une enquête réalisée en deux phases.
L’intérêt croît avec l’âge, passant de 43 % chez les 18-29 ans à 64 % chez les plus de 60 ans. Les hommes et les personnes technologiquement averties sont également plus enclins à soutenir cette monnaie.
Parmi les fonctionnalités les plus plébiscitées figurent la protection contre la fraude (49 %) et la possibilité d’un taux d’intérêt de 3,5 % sur les avoirs en shekels numériques, bien que cette option ait été jugée peu probable au lancement.
Les principaux avantages cités sont la facilité d’utilisation, tandis que les préoccupations majeures portent sur le risque de cyberattaques et une accessibilité potentiellement limitée pour les personnes âgées.
À SURVEILLER : Le contexte international. L’orientation de la Banque d’Israël sur le shekel numérique dépendra de l’évolution des monnaies numériques en Europe et aux États-Unis.
La Guinée se tourne vers Tether • L’émetteur de stablecoins Tether a signé un protocole d’accord avec la République de Guinée afin d’explorer l’adoption des technologies blockchain et de développer des programmes éducatifs sur le sujet. L’accord vise à partager des bonnes pratiques en matière d’innovation et de technologies durables. Tether s’engage notamment à soutenir le projet guinéen "Innovation City", dédié à la recherche technologique. En savoir plus…
Selon l’institut ABI Research, le marché mondial des robots humanoïdes double en taille chaque année, et il devrait atteindre 6,5 milliards de dollars d’ici à 2030. Les principaux acteurs se trouvent aux Etats-Unis et en Chine, mais les premiers acteurs européens commencent à apparaître.
Fondée en 2024 à Londres par l’entrepreneur de Dubaï Artem Sokolov, la start-up Humanoid.ai ambitionne de rendre les robots humanoïdes accessibles à grande échelle. Elle a présenté la semaine dernière le premier d’entre eux, HMND1.
Chaîne de pensée et arbre de décision des LLM • Qant, M. de R. avec Midjourney
L'évaluation des performances des LLM n’est pas une science exacte, mais celle du raisonnement en chaîne (chain-of-thought ou CoT) dans les modèles multimodaux reste une question particulièrement ouverte. Or, c’est précisément vers les CoT que convergent les modèles avancés.
Une équipe de chercheurs vient de proposer MME-CoT, un benchmark spécialisé analysant la qualité, la robustesse et l'efficacité du raisonnement dans les LMM. Un test d'envergure qui révèle des tendances inattendues sur la performance des modèles.
Performance de la chaîne de pensée des principaux LMMs dans le benchmark MME-CoT • Source : Dongzhi Jiang et al.
L'émergence des modèles de langage multimodaux (LMM) a ouvert de nouvelles perspectives dans la compréhension et le traitement des données visuelles et textuelles. Pourtant, leur capacité à raisonner efficacement reste insuffisamment explorée. C’est l’objectif du benchmark MME-CoT, qui évalue pour la première fois la performance des LMMs en chaîne de raisonnement (« Chain-of-Thought » ou CoT). Cette approche consiste à structurer la réflexion des modèles en plusieurs étapes logiques avant d’aboutir à une réponse.
MME-CoT comprend 1130 questions pour tester les LMM dans six domaines distincts : mathématiques, science, reconnaissance optique des caractères (OCR), logique, espace-temps et scènes générales. Plutôt que de se contenter d’un simple résultat final, l'évaluation décompose les réponses en plusieurs métriques : la qualité du raisonnement (à travers la précision et le rappel des étapes-clé), la robustesse (à savoir si CoT améliore la compréhension sans nuire aux tâches de perception), et l'efficacité (évaluant si les réflexions intermédiaires sont réellement pertinentes).
...