Qant: Révolution cognitive et Avenir du numérique

Chaque jour, les tendances de la tech et l'IA par Jean Rognetta et Maurice de Rambuteau

image_author_QANT:_Révolution cognitive et Avenir du numérique
Par QANT: Révolution cognitive et Avenir du numérique
17 nov. · 6 mn à lire
Partager cet article :

Trouver sa voix avec l'IA

Pendant que Youtube achète à des chanteurs les droits pour laisser leurs fans recréer leurs voix, Meta s'apprête à démocratiser la création de vidéos par IA et Singapour s'ouvre aux stablecoins. Bienvenue dans Qant, qui fait le point sur l'IA et les armes biologiques, ce vendredi 17 novembre 2023.

« Le progrès est devant nous, à condition de dépasser sa propagande » Paul Virilio

Chaque jour, les journalistes de Qant illustrent les tendances de fond qui animent la tech. Ils s’appuient sur Kessel Média et utilisent l’IA générative depuis mars 2022.

L’ÉVÉNEMENT

Un karaoké avec la voix d’un autre

Dream Track, le nouvel outil de Youtube développé avec DeepMind, permet à n’importe qui de chanter avec la voix de son chanteur préféré. Et la bénédiction de ce dernier. Au moins pour l’instant : le respect du droit d’auteur aura du mal à tenir face à la généralisation de la technologie.

“Demi Lovato chante avec le robot” (Qant, M. de R. avec Midjourney)“Demi Lovato chante avec le robot” (Qant, M. de R. avec Midjourney)

YouTube vient de présenter un nouvel outil d'intelligence artificielle baptisé "Dream Track", qui se promet de révolutionner la création musicale sur sa plateforme. Développé avec la collaboration de neuf artistes, ce dispositif permet de générer automatiquement des pistes musicales de 30 secondes avec la voix de ces artistes, simplement à partir d'une invite textuelle ou d'un air fredonné. Le service génère ensuite des paroles, une piste d'accompagnement et une voix artificielle très proche de celle de l'artiste. Outre Demi Lovato et Charlie Puth, on trouve dans le groupe Alec Benjamin, Charli XCX, John Legend, Papoose, Sia, T-Pain et Troye Sivan. 

Le choix de la durée, à travers la plate-forme Shorts de Youtube, permet à la filiale de Google de venir marcher sur les plates-bandes de TikTok. YouTube a également présenté d'autres outils d'IA qui permettent de construire des pistes sans utiliser d'instrument : elles transforment un fredonnement en solo de saxophone ou un beatboxing en boucle de batterie.

Ces outils d'IA sont propulsés par le modèle de génération musicale "Lyria" de DeepMind, filiale de Google. Ils portent un filigrane "SynthID" inaudible à l'oreille nue, préservé même après modification du fichier audio, permettant d'identifier son origine artificielle. 

La révélation de ces outils intervient peu après l'annonce par YouTube de nouvelles directives de contenu sur les deepfakes, qui visent à protéger ses partenaires dans l'industrie musicale. C’est eux qui pourront transformer le pilote en filon. Depuis la rentrée, Youtube a présenté plusieurs fonctionnalités basées sur l'IA générative, allant d'outils de conversation à des fonctionnalités pour les créateurs, comme des arrière-plans photo et vidéo (lire Qant du 25 septembre et du 8 novembre).

Haute tension

Or, l’annonce de Youtube arrive dans un contexte de plus en plus tendu. Par exemple, le responsable audio de Stability AI, Ed Newton-Rex, vient de démissionner. Le compositeur et pionnier de l’IA musicale (lire Qant du vendredi 25 août) fait état de désaccords avec la start-up britannique, qui propose des modèles de diffusion en open source, sur l'utilisation de matériel soumis au droit d’auteur. 

Ed Newton-Rex a souligné sur Twitter que les données utilisées pour entraîner les modèles d'IA peuvent concurrencer les œuvres originales, remettant en question la légitimité de leur utilisation. La perspective de modèles open source capables d’imiter la voix de quiconque aggrave évidemment la question. Mais le problème s’étend bien au-delà.

La victoire des populistes pro-russes aux élections slovaques en octobre a par exemple été attribuée, au moins partiellement, à un deepfake audio qui circulait sur les réseaux sociaux (lire Qant du 12 octobre). D’autres utilisations de la technologie, plus prosaïques, sont tout aussi menaçantes. “Le directeur financier d’une banque nous a soumis récemment le cas d’un message avec la voix de son président, lui demandant d’envoyer un virement à un compte particulier” confiait récemment à Qant Derek Manky, vice-président et Chief Security Strategist de la société de cybersécurité Fortinet.  

Vin vieux, chanson nouvelle.

Pour en savoir plus :

L’ESSENTIEL : Apple, Circle, Inkbit, Meta, Paxos, Spotify, Tencent, United Healthcare

ROBOTS

Robotique jusqu’à l’os

Une main robotique dite “douce”, produite par une équipe de chercheurs, présente des os, des ligaments et des tendons artificiels.

Un groupe de chercheurs de l'ETH Zurich et une start-up née au MIT, Inkbit, sont parvenus à imprimer une main robotique imprimée en 3D dotée d'os, de ligaments et de tendons artificiels. Leur technique utilise un scanner laser et un apprentissage par retour d'information pour imprimer avec des polymères à durcissement lent. 

Cette méthode diffère des imprimantes 3D traditionnelles qui se limitent aux plastiques à durcissement rapide, comme les polyacrylates. La technique de balayage en trois dimensions permet d'ajuster en temps réel la quantité de matériaux nécessaire, surmontant ainsi les limites de flexibilité et de forme des méthodes conventionnelles. 

Les robots dits "souples” présentent moins de risques de blesser les humains qui travaillent à leurs côtés ; ils sont également mieux adaptés pour manipuler des objets fragiles que des robots métalliques traditionnels. 

Pour en savoir plus : Popular Science

INTELLIGENCE ARTIFICIELLE

  • Meta, Emu par la vidéo… : Le modèle générateur d’images Emu, que Meta a présenté en septembre (lire Qant du 28 septembre), peut désormais être utilisé pour créer des vidéos : un premier prompt génère des images et un deuxième les anime. Sans préciser de date, Meta annonce qu’elle compte à terme mettre à disposition sur ses réseaux sociaux Emu Video, l’outil qui en sera tiré, ce qui permettra aux presque 4 milliards d’utilisateurs de ses plates-formes (notamment Facebook, Instagram et WhatsApp) de libérer leur créativité. Ils pourront bénéficier également d’Emu Edit, un outil de retouche IA comparable au Magic Editor de Google Photos ou aux fonctionnalités de remplissage de l’arrière-plan par IA sur Adobe Photoshop. 
    Pour en savoir plus:
    The Verge

  • … Et Google par les podcasts : Spotify utilisera les outils d'IA de Google Cloud pour améliorer la découverte de contenu et les recommandations personnalisées pour ses podcasts et livres audio, en analysant et augmentant les métadonnées de sa vaste bibliothèque. Elle compte ainsi affiner les suggestions de podcasts et de livres audio, pour améliorer l'expérience des utilisateurs de ses offres non musicales. Cette initiative, qui s'inscrit dans le cadre d’un partenariat plus vaste entre la start-up d’origine suédoise et Google Cloud, vise également à identifier le contenu sensible ou dangereux.
    Pour en savoir plus:
    The Verge

  • L’IA de l’assurance en procès : La compagnie d'assurance-santé américaine UnitedHealthcare, qui compte 46 millions de clients, est poursuivie pour avoir refusé des demandes de remboursement de soins de santé de personnes âgées sur la base d'un modèle d'IA défectueux, avec une erreur estimée à 90% dans les recommandations de soins post-aigus. L'entreprise est accusée d'utiliser ce modèle d'IA pour réduire le nombre de paiements, affectant négativement le traitement des patients âgés.
    Pour en savoir plus:
    The Register

  • Tencent compte ses puces : Les récentes restrictions américaines sur les ventes de puces d’IA à la Chine  (lire Qant du 26 octobre) inquiètent le géant chinois Tencent. Son président Martin Lau a déclaré dans des propos rapportés par Reuters que l'entreprise devra utiliser ses puces actuelles plus efficacement et chercher des alternatives produites localement, tout en mentionnant un impact sur les services cloud. De son côté, Baidu a récemment annoncé faire appel à Huawei pour ses puces(lire Qant du 8 novembre).
    Pour en savoir plus:
    Reuters, Bloomberg

BLOCKCHAINS

  • Les orchidées de Singapour : Deux semaines après la Grande-Bretagne, l’Autorité monétaire de Singapour (MAS) vient de présenter le projet Orchid, pour structurer la future réglementation de la monnaie numérique sur l’île, qui est devenue depuis l’an dernier la première place financière d’Asie, supplantant Hong-Kong, et la troisième mondiale après New-York et Londres (lire Qant du 9 novembre). L’élaboration des normes prendra sans doute au moins un an mais, dans l’immédiat, la MAS vient d’accorder des licences à Paxos et StraitsX, qui lanceront de nouvelles quasi-monnaies numériques arrimées au dollar. Paxos est déjà l’opérateur du stablecoin-dollar de PayPal mais, sous la pression des autorités financières américaines, elle a dû passer la main en début d’année pour celui de Binance, le BUSD (lire Qant du 25 septembre, 11 août et 14 février). StraitsX pour sa part émet déjà des stablecoins indexés au dollar singapourien et à la roupie indonésienne.
    Pour en savoir plus: Bloomberg,
    Ledger Insights

  • USDC mise sur Sei…  : Circle Ventures, la branche de capital-risque de l'émetteur de stablecoin Circle, a réalisé un investissement non divulgué dans la blockchain Sei, avec pour objectif d'y intégrer le stablecoin USDC. Sei se targue d'être la plus rapide des solutions Level-1. L’opération s'inscrit dans une série d'actions entreprises par Circle pour renforcer son écosystème USDC, incluant des partenariats stratégiques et des mises à jour techniques visant à optimiser la sécurité et l'efficacité des transactions.
    Pour en savoir plus:
    Fortune

  • …Et Astana parie sur les CBDC : La Banque Nationale du Kazakhstan a lancé un projet pilote de monnaie numérique de banque centrale (CBDC), avec un premier paiement de détail utilisant le tenge numérique. Ce pilote, qui utilise une plateforme alimentée par la technologie blockchain et des contrats intelligents automatisés pour les règlements, s'inscrit dans le cadre d'un projet plus large visant à mettre en œuvre le tenge numérique d'ici la fin de 2025 (lire Qant du 19 septembre).
    Pour en savoir plus:
    Coin Desk

AR-VR-XR

  • Lorgner et grimacer dans un casque : Des vidéos internes divulguées par le site 9to5mac montrent comment naviguer avec le casque de réalité mixte Apple Vision Pro, qui devrait être disponible au début de l'année prochaine. Le casque réagit aux mouvements des yeux et des mains, permettant aux utilisateurs de sélectionner des éléments en fixant du regard et en tapotant des doigts, ainsi que de faire défiler en pinçant et en lançant les doigts, avec un processus de configuration incluant l'enregistrement des expressions faciales. (Lire notamment Qant du 6 juin et du 13 juin)
    Pour en savoir plus: 9to5mac, The Messenger

EXPERT

L’IA, le bioterrorisme et le souvenir de la pandémie

Le risque d’une utilisation de l’IA par des groupes terroristes pour se doter d’armes biologiques revient le plus souvent parmi les menaces que l’IA pose à l’avenir de l’humanité. Les recherches en la matière, issues de Rand et d’Oxford, sont alarmantes.

“Une attaque bio-terroriste organisée par l’IA” (Qant, M. de R. avec Midjourney)“Une attaque bio-terroriste organisée par l’IA” (Qant, M. de R. avec Midjourney)

...