Trouver sa voix avec l'IA

« Le progrès est devant nous, à condition de dépasser sa propagande » Paul Virilio

Chaque jour, les journalistes de Qant illustrent les tendances de fond qui animent la tech. Ils s’appuient sur Kessel Média et utilisent l’IA générative depuis mars 2022.

ABONNEZ-VOUS GRATUITEMENT POUR UN MOIS

L’ÉVÉNEMENT

Un karaoké avec la voix d’un autre

Dream Track, le nouvel outil de Youtube développé avec DeepMind, permet à n’importe qui de chanter avec la voix de son chanteur préféré. Et la bénédiction de ce dernier. Au moins pour l’instant : le respect du droit d’auteur aura du mal à tenir face à la généralisation de la technologie.

“Demi Lovato chante avec le robot” (Qant, M. de R. avec Midjourney)

YouTube vient de présenter un nouvel outil d'intelligence artificielle baptisé "Dream Track", qui se promet de révolutionner la création musicale sur sa plateforme. Développé avec la collaboration de neuf artistes, ce dispositif permet de générer automatiquement des pistes musicales de 30 secondes avec la voix de ces artistes, simplement à partir d'une invite textuelle ou d'un air fredonné. Le service génère ensuite des paroles, une piste d'accompagnement et une voix artificielle très proche de celle de l'artiste. Outre Demi Lovato et Charlie Puth, on trouve dans le groupe Alec Benjamin, Charli XCX, John Legend, Papoose, Sia, T-Pain et Troye Sivan.

Le choix de la durée, à travers la plate-forme Shorts de Youtube, permet à la filiale de Google de venir marcher sur les plates-bandes de TikTok. YouTube a également présenté d'autres outils d'IA qui permettent de construire des pistes sans utiliser d'instrument : elles transforment un fredonnement en solo de saxophone ou un beatboxing en boucle de batterie.

Ces outils d'IA sont propulsés par le modèle de génération musicale "Lyria" de DeepMind, filiale de Google. Ils portent un filigrane "SynthID" inaudible à l'oreille nue, préservé même après modification du fichier audio, permettant d'identifier son origine artificielle.

La révélation de ces outils intervient peu après l'annonce par YouTube de nouvelles directives de contenu sur les deepfakes, qui visent à protéger ses partenaires dans l'industrie musicale. C’est eux qui pourront transformer le pilote en filon. Depuis la rentrée, Youtube a présenté plusieurs fonctionnalités basées sur l'IA générative, allant d'outils de conversation à des fonctionnalités pour les créateurs, comme des arrière-plans photo et vidéo (lire Qant du 25 septembre et du 8 novembre).

Haute tension

Or, l’annonce de Youtube arrive dans un contexte de plus en plus tendu. Par exemple, le responsable audio de Stability AI, Ed Newton-Rex, vient de démissionner. Le compositeur et pionnier de l’IA musicale (lire Qant du vendredi 25 août) fait état de désaccords avec la start-up britannique, qui propose des modèles de diffusion en open source, sur l'utilisation de matériel soumis au droit d’auteur.

Ed Newton-Rex a souligné sur Twitter que les données utilisées pour entraîner les modèles d'IA peuvent concurrencer les œuvres originales, remettant en question la légitimité de leur utilisation. La perspective de modèles open source capables d’imiter la voix de quiconque aggrave évidemment la question. Mais le problème s’étend bien au-delà.

La victoire des populistes pro-russes aux élections slovaques en octobre a par exemple été attribuée, au moins partiellement, à un deepfake audio qui circulait sur les réseaux sociaux (lire Qant du 12 octobre). D’autres utilisations de la technologie, plus prosaïques, sont tout aussi menaçantes. “Le directeur financier d’une banque nous a soumis récemment le cas d’un message avec la voix de son président, lui demandant d’envoyer un virement à un compte particulier” confiait récemment à Qant Derek Manky, vice-président et Chief Security Strategist de la société de cybersécurité Fortinet.

Vin vieux, chanson nouvelle.

Pour en savoir plus :

Des bancs d'essais, tous les business cases, l'état de l'art de la recherche : abonnez-vous pour ne rien manquer !

L’ESSENTIEL : Apple, Circle, Inkbit, Meta, Paxos, Spotify, Tencent, United Healthcare

ROBOTS

Robotique jusqu’à l’os

Une main robotique dite “douce”, produite par une équipe de chercheurs, présente des os, des ligaments et des tendons artificiels.

Un groupe de chercheurs de l'ETH Zurich et une start-up née au MIT, Inkbit, sont parvenus à imprimer une main robotique imprimée en 3D dotée d'os, de ligaments et de tendons artificiels. Leur technique utilise un scanner laser et un apprentissage par retour d'information pour imprimer avec des polymères à durcissement lent.

Cette méthode diffère des imprimantes 3D traditionnelles qui se limitent aux plastiques à durcissement rapide, comme les polyacrylates. La technique de balayage en trois dimensions permet d'ajuster en temps réel la quantité de matériaux nécessaire, surmontant ainsi les limites de flexibilité et de forme des méthodes conventionnelles.

Les robots dits "souples” présentent moins de risques de blesser les humains qui travaillent à leurs côtés ; ils sont également mieux adaptés pour manipuler des objets fragiles que des robots métalliques traditionnels.

Pour en savoir plus : Popular Science

INTELLIGENCE ARTIFICIELLE

Meta, Emu par la vidéo… : Le modèle générateur d’images Emu, que Meta a présenté en septembre (lire Qant du 28 septembre), peut désormais être utilisé pour créer des vidéos : un premier prompt génère des images et un deuxième les anime. Sans préciser de date, Meta annonce qu’elle compte à terme mettre à disposition sur ses réseaux sociaux Emu Video, l’outil qui en sera tiré, ce qui permettra aux presque 4 milliards d’utilisateurs de ses plates-formes (notamment Facebook, Instagram et WhatsApp) de libérer leur créativité. Ils pourront bénéficier également d’Emu Edit, un outil de retouche IA comparable au Magic Editor de Google Photos ou aux fonctionnalités de remplissage de l’arrière-plan par IA sur Adobe Photoshop.
Pour en savoir plus: The Verge
… Et Google par les podcasts : Spotify utilisera les outils d'IA de Google Cloud pour améliorer la découverte de contenu et les recommandations personnalisées pour ses podcasts et livres audio, en analysant et augmentant les métadonnées de sa vaste bibliothèque. Elle compte ainsi affiner les suggestions de podcasts et de livres audio, pour améliorer l'expérience des utilisateurs de ses offres non musicales. Cette initiative, qui s'inscrit dans le cadre d’un partenariat plus vaste entre la start-up d’origine suédoise et Google Cloud, vise également à identifier le contenu sensible ou dangereux.
Pour en savoir plus: The Verge
L’IA de l’assurance en procès : La compagnie d'assurance-santé américaine UnitedHealthcare, qui compte 46 millions de clients, est poursuivie pour avoir refusé des demandes de remboursement de soins de santé de personnes âgées sur la base d'un modèle d'IA défectueux, avec une erreur estimée à 90% dans les recommandations de soins post-aigus. L'entreprise est accusée d'utiliser ce modèle d'IA pour réduire le nombre de paiements, affectant négativement le traitement des patients âgés.
Pour en savoir plus: The Register
Tencent compte ses puces : Les récentes restrictions américaines sur les ventes de puces d’IA à la Chine (lire Qant du 26 octobre) inquiètent le géant chinois Tencent. Son président Martin Lau a déclaré dans des propos rapportés par Reuters que l'entreprise devra utiliser ses puces actuelles plus efficacement et chercher des alternatives produites localement, tout en mentionnant un impact sur les services cloud. De son côté, Baidu a récemment annoncé faire appel à Huawei pour ses puces(lire Qant du 8 novembre).
Pour en savoir plus: Reuters, Bloomberg

BLOCKCHAINS

Les orchidées de Singapour : Deux semaines après la Grande-Bretagne, l’Autorité monétaire de Singapour (MAS) vient de présenter le projet Orchid, pour structurer la future réglementation de la monnaie numérique sur l’île, qui est devenue depuis l’an dernier la première place financière d’Asie, supplantant Hong-Kong, et la troisième mondiale après New-York et Londres (lire Qant du 9 novembre). L’élaboration des normes prendra sans doute au moins un an mais, dans l’immédiat, la MAS vient d’accorder des licences à Paxos et StraitsX, qui lanceront de nouvelles quasi-monnaies numériques arrimées au dollar. Paxos est déjà l’opérateur du stablecoin-dollar de PayPal mais, sous la pression des autorités financières américaines, elle a dû passer la main en début d’année pour celui de Binance, le BUSD (lire Qant du 25 septembre, 11 août et 14 février). StraitsX pour sa part émet déjà des stablecoins indexés au dollar singapourien et à la roupie indonésienne.
Pour en savoir plus: Bloomberg, Ledger Insights
USDC mise sur Sei… : Circle Ventures, la branche de capital-risque de l'émetteur de stablecoin Circle, a réalisé un investissement non divulgué dans la blockchain Sei, avec pour objectif d'y intégrer le stablecoin USDC. Sei se targue d'être la plus rapide des solutions Level-1. L’opération s'inscrit dans une série d'actions entreprises par Circle pour renforcer son écosystème USDC, incluant des partenariats stratégiques et des mises à jour techniques visant à optimiser la sécurité et l'efficacité des transactions.
Pour en savoir plus: Fortune
…Et Astana parie sur les CBDC : La Banque Nationale du Kazakhstan a lancé un projet pilote de monnaie numérique de banque centrale (CBDC), avec un premier paiement de détail utilisant le tenge numérique. Ce pilote, qui utilise une plateforme alimentée par la technologie blockchain et des contrats intelligents automatisés pour les règlements, s'inscrit dans le cadre d'un projet plus large visant à mettre en œuvre le tenge numérique d'ici la fin de 2025 (lire Qant du 19 septembre).
Pour en savoir plus: Coin Desk

AR-VR-XR

Lorgner et grimacer dans un casque : Des vidéos internes divulguées par le site 9to5mac montrent comment naviguer avec le casque de réalité mixte Apple Vision Pro, qui devrait être disponible au début de l'année prochaine. Le casque réagit aux mouvements des yeux et des mains, permettant aux utilisateurs de sélectionner des éléments en fixant du regard et en tapotant des doigts, ainsi que de faire défiler en pinçant et en lançant les doigts, avec un processus de configuration incluant l'enregistrement des expressions faciales. (Lire notamment Qant du 6 juin et du 13 juin)
Pour en savoir plus: 9to5mac, The Messenger

Pour faire partie des 1% les mieux informés sur l’IA et la tech : abonnez-vous !

EXPERT

L’IA, le bioterrorisme et le souvenir de la pandémie

Le risque d’une utilisation de l’IA par des groupes terroristes pour se doter d’armes biologiques revient le plus souvent parmi les menaces que l’IA pose à l’avenir de l’humanité. Les recherches en la matière, issues de Rand et d’Oxford, sont alarmantes.

“Une attaque bio-terroriste organisée par l’IA” (Qant, M. de R. avec Midjourney)

Cet article est réservé aux abonnés.

...

Jean Rognetta

Binational franco-italien, économiste de formation, Jean devient journaliste au milieu des années 1990, après avoir fait ses premiers pas dans l’édition et la technologie. Il débute sa carrière au groupe Tests, leader de la presse informatique, puis se spécialise en financement de l’innovation et des PME. Il couvre le sujet pour Les Echos et Capital Finance de 2000 à 2015. En 2016, il rejoint le magazine Forbes et devient directeur de la rédaction de l’édition française.
Pendant la crise financière, il lance l’association PME Finance, à l’origine notamment du PEA-PME et de l’amortissement du corporate venture, ainsi que partiellement de la libéralisation du crowdfunding. Elle fusionne en 2015 avec le groupement d’entrepreneurs Croissance Plus.
Depuis 2020, Jean a lancé la revue SAY, édition française de Project Syndicate, dont il reste contributing editor, le supplément Corporate Finance du Nouvel Économiste et la collection Demain! aux Editions Hermann.

Maurice de Rambuteau

Diplômé du Centre de Formation des Journalistes (CFJ Paris) et de l'Ecole Supérieure de Commerce de Paris (ESCP BS), Maurice de Rambuteau a fait ses premières armes de journaliste dans le sport, pour le site et le magazine SoFoot, puis au sein de la rédaction football de L'Equipe. Il s'est ensuite tourné vers le journalisme économique au sein de la rédaction de La Croix, avant de donner libre cours à sa passion pour la technologie en rejoignant Qant en juin 2022 pour un premier tour d’horizon de l’IA générative. Depuis, il a percé les mystères des blockchains et du métavers et, surtout, passé des dizaines de modèles d’IA au banc d’essai.