L'AGI et l'ASI, mais moins cher

« Le progrès est devant nous, à condition de dépasser sa propagande » Paul Virilio

Dans Qant aujourd'hui, 30% du contenu est gratuit. Abonnez-vous pour profiter de toute la lettre.

Dépasser l’intelligence humaine, mais avec parcimonie

La valorisation de Safe Superintelligence, la nouvelle start-up du cofondateur d'OpenAI Ilya Sutskever, s’envole. Mais pas les montants que la start-up veut lever.

Les indiscrétions se multiplient sur la nouvelle levée de fonds de Safe Superintelligence (SSI), une start-up consacrée à l’élaboration de modèles d’IA supérieurs à l’intelligence humaine.
Fondée par Ilya Sutskever en juin 2024 après son départ d’OpenAI (lire Qant du 21 juin 2024), SSI avait levé un milliard de dollars sur une valorisation de 5 milliards dès le mois de septembre, auprès de VCs prestigieux comme a16z et Sequoia Capital.
Moins de 6 mois plus tard, sa valorisation s’étage entre 20 milliards selon Reuters, il y a dix jours, et 30 milliards de dollars selon Bloomberg cette semaine.
Greenoaks Capital Partners, déjà impliqué dans Scale AI et Databricks, mènerait l’opération en misant 500 millions de dollars sur le milliard supplémentaire recherché.
À SURVEILLER : La course à l’échelle. Cet engouement devrait permettre à SSI de ne commercialiser aucun produit avant d’avoir atteint l’AGI/ASI dans de bonnes conditions, ainsi qu’elle s’y est engagée. Les sommes engagées, quoiqu’importantes, sont très loin des dizaines de milliards de ceux qui sont engagés dans la course à la taille, notamment OpenAI et xAI. Si Ilya Sutskever, qui a proclamé “the end of scale”, la fin de la course à l’échelle, arrive à proposer des intelligences artificielles supérieures à l’homme avec cette relative économie de moyens, cela pourrait avoir l’effet d’une bombe.

PARTENARIAT

Faut-il prendre au sérieux les menaces commerciales de Donald Trump ? Les Européens sont-ils armés pour y répondre ? Que penser de l’accord de libre-échange UE-Mercosur ?

Pour y voir plus clair sur ces sujets complexes d’une brûlante actualité, nous vous recommandons chaudement de vous abonner à BLOCS, la première newsletter francophone dédiée au commerce international. Chaque mercredi, cette lettre préparée par trois jeunes journalistes forts d'une expérience de plusieurs années de correspondance à Bruxelles, offre gratuitement un condensé utile, digeste et départi de toute considération idéologique de l’actualité des échanges mondiaux.

Abridge, Dream, Mistral

Mistral souffle vers l’Orient • La start-up française Mistral AI lance Mistral Saba, un modèle d’IA entraîné spécifiquement pour les langues et cultures du monde arabe. Doté de 24 milliards de paramètres, il vise à offrir des interactions plus naturelles en arabe et montre aussi de bonnes performances avec certaines langues d’origine indienne comme le tamil et le malayalam. Disponible via API et en déploiement local, ce modèle marque une stratégie d’expansion vers le Moyen-Orient, où Mistral pourrait attirer de nouveaux investisseurs. En savoir plus…
Une nouvelle licorne de l’IA en Israël • La start-up israélienne Dream, spécialisée dans la cybersécurité assistée par l’IA pour les gouvernements et infrastructures critiques, a levé 100 millions de dollars, ce qui porte sa valorisation à 1,1 milliard de dollars. Fondée en 2023 par Gil Dolev, Shalev Hulio et l’ancien chancelier autrichien Sebastian Kurz, Dream prévoit 100 M$ de revenus récurrents annuels en 2025. Le tour de table a été mené par Bain Capital Ventures, avec la participation de Group 11, Tru Arrow Partners et Tau Capital. En savoir plus…
250 millions pour la documentation clinique par IA • La start-up Abridge, basée à Pittsburgh et spécialisée dans l'IA générative pour la documentation médicale, a levé 250 millions de dollars en série D, portant sa valorisation à 2,75 milliards de dollars. L’entreprise étend son déploiement à plus de 100 établissements de santé américains, dont le Johns Hopkins Medicine, la Mayo Clinic et le centre de cancérologie Memorial Sloan Kettering. Son nouvel outil d’IA vise à optimiser la facturation et la documentation clinique. En savoir plus…

Une puce pour améliorer le flair des chiens

Une start-up américaine développe un implant neuronal qui permet aux chiens de détecter drogues, explosifs et maladies sans entraînement.

La truffe augmentée • Qant, M. de R. avec Midjourney

Canaery, start-up en neurotechnologie, et le Lawrence Livermore National Laboratory (LLNL), laboratoire du département de l’Énergie des États-Unis, conçoivent un implant capable de décoder les odeurs perçues par les animaux.
Déjà testé sur des rats, le dispositif détecte drogues, explosifs et toxines environnementales.
L’implant, placé sur le bulbe olfactif, capte et traduit les signaux neuronaux liés aux odeurs, permettant une identification instantanée sans apprentissage spécifique.
À SURVEILLER : Neuralink pour les chiens. Un développement est prévu pour les chiens, ce qui devrait en faire des assistants de police meilleurs encore.

Intérêt marqué pour le shekel numérique en Israël

Une enquête de la Banque d’Israël révèle un intérêt significatif pour la monnaie numérique.

L'importance des différentes caractéristiques d'un shekel numérique • Banque d'Israël

51 % des répondants déclarent un intérêt moyen ou élevé pour le shekel numérique, selon une enquête réalisée en deux phases.
L’intérêt croît avec l’âge, passant de 43 % chez les 18-29 ans à 64 % chez les plus de 60 ans. Les hommes et les personnes technologiquement averties sont également plus enclins à soutenir cette monnaie.
Parmi les fonctionnalités les plus plébiscitées figurent la protection contre la fraude (49 %) et la possibilité d’un taux d’intérêt de 3,5 % sur les avoirs en shekels numériques, bien que cette option ait été jugée peu probable au lancement.
Les principaux avantages cités sont la facilité d’utilisation, tandis que les préoccupations majeures portent sur le risque de cyberattaques et une accessibilité potentiellement limitée pour les personnes âgées.
À SURVEILLER : Le contexte international. L’orientation de la Banque d’Israël sur le shekel numérique dépendra de l’évolution des monnaies numériques en Europe et aux États-Unis.

Tether, Conakry

La Guinée se tourne vers Tether • L’émetteur de stablecoins Tether a signé un protocole d’accord avec la République de Guinée afin d’explorer l’adoption des technologies blockchain et de développer des programmes éducatifs sur le sujet. L’accord vise à partager des bonnes pratiques en matière d’innovation et de technologies durables. Tether s’engage notamment à soutenir le projet guinéen "Innovation City", dédié à la recherche technologique. En savoir plus…

Le robot portera un chapeau melon

La start-up londonienne Humanoid a présenté la semaine dernière son premier robot, le HMND 01.

Selon l’institut ABI Research, le marché mondial des robots humanoïdes double en taille chaque année, et il devrait atteindre 6,5 milliards de dollars d’ici à 2030. Les principaux acteurs se trouvent aux Etats-Unis et en Chine, mais les premiers acteurs européens commencent à apparaître.

Fondée en 2024 à Londres par l’entrepreneur de Dubaï Artem Sokolov, la start-up Humanoid.ai ambitionne de rendre les robots humanoïdes accessibles à grande échelle. Elle a présenté la semaine dernière le premier d’entre eux, HMND1.

L'intégralité de cet article est disponible dans l'édition Premium en fin de lettre. Vous pouvez soutenir QANT: et mettre à niveau votre abonnement pour moins de 10 euros par mois.

Étalonner le raisonnement

Les “modèles de raisonnement” se multiplient : OpenAI o1, DeepSeek R1, Grok3 Reasoning… mais comment en évaluer la performance ?

Chaîne de pensée et arbre de décision des LLM • Qant, M. de R. avec Midjourney

L'évaluation des performances des LLM n’est pas une science exacte, mais celle du raisonnement en chaîne (chain-of-thought ou CoT) dans les modèles multimodaux reste une question particulièrement ouverte. Or, c’est précisément vers les CoT que convergent les modèles avancés.

Une équipe de chercheurs vient de proposer MME-CoT, un benchmark spécialisé analysant la qualité, la robustesse et l'efficacité du raisonnement dans les LMM. Un test d'envergure qui révèle des tendances inattendues sur la performance des modèles.

La suite de cet article est réservé aux abonnés premium

EN EXCLUSIVITÉ POUR LES ABONNÉS :

• Un nouveau benchmark révèle les limites des chaînes de raisonnement des LLM.

• La start-up londonienne Humanoid dévoile HMND 01, un robot humanoïde conçu pour le travail collaboratif.

Ces approfondissements sont réservés aux abonnés. Vous pouvez soutenir QANT: et mettre à niveau votre abonnement pour moins de 10 euros par mois !

Étalonner le raisonnement

Les “modèles de raisonnement” se multiplient : OpenAI o1, DeepSeek R1, Grok3 Reasoning… mais comment en évaluer la performance ?

Performance de la chaîne de pensée des principaux LMMs dans le benchmark MME-CoT • Source : Dongzhi Jiang et al.

L'émergence des modèles de langage multimodaux (LMM) a ouvert de nouvelles perspectives dans la compréhension et le traitement des données visuelles et textuelles. Pourtant, leur capacité à raisonner efficacement reste insuffisamment explorée. C’est l’objectif du benchmark MME-CoT, qui évalue pour la première fois la performance des LMMs en chaîne de raisonnement (« Chain-of-Thought » ou CoT). Cette approche consiste à structurer la réflexion des modèles en plusieurs étapes logiques avant d’aboutir à une réponse.

MME-CoT comprend 1130 questions pour tester les LMM dans six domaines distincts : mathématiques, science, reconnaissance optique des caractères (OCR), logique, espace-temps et scènes générales. Plutôt que de se contenter d’un simple résultat final, l'évaluation décompose les réponses en plusieurs métriques : la qualité du raisonnement (à travers la précision et le rappel des étapes-clé), la robustesse (à savoir si CoT améliore la compréhension sans nuire aux tâches de perception), et l'efficacité (évaluant si les réflexions intermédiaires sont réellement pertinentes).

...

Jean Rognetta

Binational franco-italien, économiste de formation, Jean devient journaliste au milieu des années 1990, après avoir fait ses premiers pas dans l’édition et la technologie. Il débute sa carrière au groupe Tests, leader de la presse informatique, puis se spécialise en financement de l’innovation et des PME. Il couvre le sujet pour Les Echos et Capital Finance de 2000 à 2015. En 2016, il rejoint le magazine Forbes et devient directeur de la rédaction de l’édition française.
Pendant la crise financière, il lance l’association PME Finance, à l’origine notamment du PEA-PME et de l’amortissement du corporate venture, ainsi que partiellement de la libéralisation du crowdfunding. Elle fusionne en 2015 avec le groupement d’entrepreneurs Croissance Plus.
Depuis 2020, Jean a lancé la revue SAY, édition française de Project Syndicate, dont il reste contributing editor, le supplément Corporate Finance du Nouvel Économiste et la collection Demain! aux Editions Hermann.

Maurice de Rambuteau

Diplômé du Centre de Formation des Journalistes (CFJ Paris) et de l'Ecole Supérieure de Commerce de Paris (ESCP BS), Maurice de Rambuteau a fait ses premières armes de journaliste dans le sport, pour le site et le magazine SoFoot, puis au sein de la rédaction football de L'Equipe. Il s'est ensuite tourné vers le journalisme économique au sein de la rédaction de La Croix, avant de donner libre cours à sa passion pour la technologie en rejoignant Qant en juin 2022 pour un premier tour d’horizon de l’IA générative. Depuis, il a percé les mystères des blockchains et du métavers et, surtout, passé des dizaines de modèles d’IA au banc d’essai.