La volonté des géants du cloud de desserrer le monopole de Nvidia donne leur chance aux start-up • Softbank mise 9 milliards sur l’IA • L’IA permet d’isoler une voix dans une foule • L’image d’OpenAI continue de se troubler • Bienvenue dans Qant, mardi 28 mai 2024.
« Le progrès est devant nous, à condition de dépasser sa propagande » Paul Virilio
Chaque jour, les journalistes de Qant illustrent les tendances de fond qui animent la tech. Ils s’appuient sur Kessel Média et utilisent l’IA générative depuis mars 2022.
“Les puces IA du futur” (Qant, M. de R. avec Midjourney)
La semaine dernière, le cours de l’action Nvidia a passé le seuil symbolique des 1 000 dollars, portant la capitalisation du leader des puces d’IA à plus de 2 000 milliards de dollars (1 838 Md€). Cette puissance financière, qui se confirme d’un trimestre à l’autre (lire Qant du 22 février), dérive d’une véritable emprise sur le marché des puces d’IA : les ventes des GPU de Nvidia ont triplé en un an, à 26 milliards de dollars (24 Md€), portées par le marché des datacenters, qui quintuple de taille. Les trois leaders mondiaux du cloud, Amazon (AWS), Microsoft Azure et Google (GCS), ont généré à eux seuls 10 milliards de dollars (9,2 Md€) de chiffre d’affaires au trimestre dernier.
Il n’est pas étonnant qu’ils tentent de desserrer la prise. Microsoft a annoncé qu’elle offrirait à ses clients d’entraîner leurs modèles avec les GPU d’AMD et non plus seulement de Nvidia. AMD prévoit ainsi d’engranger cette année, grâce à ses nouvelles GPU, un chiffre d’affaires de 4 milliards de dollars. Intel pour sa part vient juste de présenter des puces graphiques et prévoit de réaliser un chiffre d’affaires initial de 500 millions de dollars. La britannique ARM, reine des téléphones mobiles, a investi massivement pour attaquer le marché des datacenters, avec l’aide de start-up comme la française SiPearl.
De plus, Google entraîne ses propres modèles, comme Gemini, sur des TPU (tensor processing units) produites en partenariat avec l’électronicien Broadcom. Ce dernier génère, sur cette seule activité, plus d’1 milliard de dollars (920 M€) de marge brute chaque trimestre. Microsoft et Amazon produisent leurs propres puces pour l’inférence (Cobalt et Graviton, respectivement), les calculs qui suivent l’entraînement. Elles semblent prêtes à suivre l’exemple de Google et lancer la fabrication de leurs propres puces d’entraînement – ou à racheter une start-up pour ce faire.
Cela donne espoir à une nouvelle génération de start-up : les américaines Cerebras, Groq, MatX et Sambanova Systems, notamment, ainsi que l’israélienne Hailo (lire Qant du 4 avril, du 22 févrierdu 30 novembre 2022). Cela pourrait aider à desserrer le marché, notamment si l’architecture des transformers, qui est celle de tous les LLM aujourd’hui, laisse la place à une nouvelle génération, comme celle des SSM (lire Qant du 16 avril).
L’INTÉGRALITÉ DE CET ARTICLE EST DISPONIBLE EN FIN DE LETTRE
Une équipe de chercheurs de l'université de Washington vient de partager sur Github un système qui permet d'isoler la voix d'un unique interlocuteur dans un environnement bruyant. Ce système utilise des écouteurs ordinaires équipés de microphones et d'une intelligence artificielle capable d'isoler une voix spécifique.
Les aides auditives actuelles utilisent des technologies de réduction de bruit, mais elles ne peuvent pas éliminer complètement le bruit de fond. Le système, baptisé « target speech hearing » (THS), consiste en deux écouteurs dotés de deux microphones, un sur chaque oreillette. Lorsque l'utilisateur souhaite écouter une personne en particulier, il suffit de regarder cette personne et d'appuyer sur un bouton sur le côté des écouteurs pendant trois à cinq secondes. Les ondes sonores de la voix de l'interlocuteur atteignent simultanément les microphones, et un logiciel de machine learning analyse les motifs vocaux de la personne. La voix ciblée est alors isolée et transmise à travers les écouteurs, filtrant le bruit ambiant.
Lors des tests, les chercheurs ont constaté que leur système avait une latence de bout en bout de 18,24 millisecondes, ce qui signifie qu'il n'y a pratiquement aucun décalage entre le moment où l'utilisateur regarde la personne qu'il veut écouter et celui où il entend sa voix dans les écouteurs.
Vingt-et-une personnes ont testé le système THS dans divers environnements intérieurs et extérieurs et elles ont noté la suppression du bruit fournie par les écouteurs. En moyenne, les sujets ont considéré que la clarté de la voix de l'interlocuteur était presque deux fois plus élevée que lorsqu'elle n'était pas traitée par le système.
Le système THS s'appuie sur une technologie de "semantic hearing" que les chercheurs de l'université de Washington avaient déjà développée. Cette technologie utilisait un algorithme d'IA fonctionnant sur un smartphone connecté sans fil à des écouteurs à réduction de bruit et pouvait identifier des sons spécifiques comme le chant des oiseaux ou des alarmes.
Actuellement, le système ne peut filtrer qu'un seul interlocuteur à la fois et uniquement en l'absence d'autres voix fortes provenant de la même direction. Si la qualité sonore n'est pas satisfaisante, l'utilisateur peut rééchantillonner la voix de l'interlocuteur pour améliorer la clarté. Les chercheurs travaillent à l'adaptation de leur système pour les écouteurs intra-auriculaires et les aides auditives.
Pour en savoir plus :
Bandhav Veluri et al., Look Once to Hear: Target Speech Hearing with Noisy Examples, ACM Digital Library, 2024
SoftBank met le paquet sur l’IA • SoftBank prévoit d'investir près de 9 milliards de dollars (8,3 milliards d'euros) dans l'intelligence artificielle dans les douze mois à venir, doublant ainsi ses engagements en un an, selon le Financial Times. Le directeur financier de SoftBank, Yoshimitsu Goto, a annoncé que l'entreprise augmentera ses investissements dans les sociétés d'IA pour rester compétitive face à des géants technologiques comme Microsoft et Amazon, qui ont déjà investi plus de 40 milliards de dollars (36,8 milliards d'euros) dans des projets liés à l'IA et aux centres de données à travers le monde cette année.
Pour en savoir plus : Financial Times, Pymnts
La nécessité de réguler l’IA commence par OpenAI • Deux anciennes membres du conseil d'administration d'OpenAI, Helen Toner et Tasha McCauley, ont affirmé dans une tribune pour The Economist que les entreprises d'intelligence artificielle ne peuvent pas s'auto-réguler et nécessitent une intervention gouvernementale. Celles qui ont quitté l'entreprise au moment du licenciement chaotique de son CEO en novembre dernier (lire Qant du 20, du 21, du 22 et du 23 novembre) soulignent les préoccupations liées à la sécurité après le retour de Sam Altman à la tête d'OpenAI, citant une culture de travail toxique. Elles appellent à des cadres réglementaires efficaces pour garantir que les entreprises d'IA soient tenues responsables de leurs actions. Ses déclarations s’inscrivent dans un contexte mouvementé pour OpenAI, qui a d’abord vu Ilya Sutskever et Jan Leike quitter l’entreprise (lire Qant du 15 mai), avant d’être fortement critiquée pour avoir mis en place des procédures baillons menaçant les employés démissionnaires de perdre des actions acquises en cas de critique envers OpenAI.
Pour en savoir plus : The Economist, Business Insider
L’Europe cherche le rendez-vous de la blockchain et de l’IA • L'Observatoire et Forum Européen de la Blockchain, une initiative de la Commission européenne, vient de publier un rapport sur les développements de la blockchain en Europe. L’Observatoire conseille à l’Europe de se préparer à l'intégration de la blockchain et de l'intelligence artificielle. Il souligne que cette convergence peut améliorer la sécurité des données et les contrats intelligents dans des secteurs comme la santé et la finance. Le rapport anticipe également une croissance continue des protocoles de finance décentralisée.
Pour en savoir plus : Cointelegraph
La société chinoise LimX Dynamics vient de mettre en scène son robot quadrupède W1, capable de se tenir debout, de marcher et de rouler sur ses pattes arrière. Inspiré par le robot Swiss-Mile conçu par l'ETH Zurich, le W1 est équipé de quatre pattes avec des roues motorisées à leurs extrémités. Pour se déplacer sur des surfaces lisses comme les routes, les trottoirs et les sols, le W1 roule sur ses roues, maximisant ainsi sa vitesse et son efficacité énergétique. Cependant, lorsqu'il doit franchir des obstacles, traverser des terrains accidentés ou monter et descendre des escaliers, il verrouille ses roues et les utilise comme des pieds, adoptant alors une démarche de marche quadrupède.
La nouveauté du W1 réside dans sa capacité à se transformer et à se tenir debout sur ses pattes arrière pour accomplir des tâches spécifiques, comme la livraison ou la réception de colis, ce qui le rapproche de la forme humaine. En se tenant debout, le W1 peut également effectuer des rotations de 360 degrés sur place, effectuer des virages à 90 degrés, se faufiler entre des obstacles tels que des étagères et se redresser rapidement après des collisions.
Avec une hauteur de 152 cm une fois debout, le W1 peut passer du mode quadrupède au mode bipède en moins d'une seconde. Sa vitesse de déplacement en mode roulant quadrupède atteint jusqu'à 36 km/h. Bien que LimX n'ait pas précisé la vitesse de déplacement en mode bipède, les capacités démontrées par le W1 dans une vidéo récemment publiée montrent son aptitude à marcher sur deux pieds sur un sol lisse, laissant présager des performances prometteuses dans des environnements industriels comme les entrepôts.
Le W1 intègre une perception en temps réel de l'environnement, permettant une locomotion agile et perceptive pour surmonter des terrains difficiles. Grâce à ses multiples actionneurs de haute performance, le W1 exploite pleinement son potentiel de mobilité polyvalente. Avec une vitesse de mouvement sur roues pouvant atteindre 10 m/s et une autonomie stable de 4 heures, le W1 offre une solution de mobilité tout-terrain remarquable. LimX Dynamics a également indiqué que le W1 pourrait, à l'avenir, accomplir des tâches plus complexes, comme saisir des objets avec ses pattes avant tout en se tenant debout.
Pour en savoir plus :
En exclusivité pour les abonnés :
Cinq start-up sont aujourd’hui bien placées pour desserrer, à terme, l’emprise de Nvidia sur l’entraînement des modèles d’IA. Ou pour être rachetées par l’un des hyperscalers qui tente de lutter contre l’emprise du monopole.
“Le futur des puces IA” (Qant, M. de R. avec Midjourney)
Longtemps, on a pensé que l’inférence allait prendre le relais de l’entraînement des modèles d’IA, offrant aux fabricants de CPU comme Intel et AMD la possibilité de prendre leur revanche. ARM a même basé sur cette idée son offensive vers le marché des datacenters.
Las, l’enthousiasme vers l’entraînement ou le réentraînement (“fine-tuning”) de modèles ne faiblit pas depuis début 2023, au contraire. Et Nvidia détient au moins les quatre cinquièmes de ce marché – sans doute plus encore, pour ce qui est des datacenters.
...