Données, donnez-moi

« Le progrès est devant nous, à condition de dépasser sa propagande » Paul Virilio

Chaque jour, Jean Rognetta et Maurice de Rambuteau, les journalistes de Qant illustrent les tendances de fond qui animent la tech. Ils s’appuient sur Kessel Média et utilisent l’IA générative depuis mars 2022.

ABONNEZ-VOUS GRATUITEMENT POUR UN MOIS

L’ÉVÉNEMENT

La guerre des Robots.txt

Outre-Atlantique, la révolte des médias et des éditeurs de contenus gronde contre la collecte de leurs données par les créateurs de modèles d’IA. Google tente de se montrer conciliant en permettant de désactiver la fonction d’IA de son crawler à partir du fichier Robots.txt du Robot Exclusion Protocol.

"L'IA avale des données sans interruption" (Midjourney, M. de R.)

En fin de semaine dernière, Google a permis aux éditeurs de sites web de refuser que leurs données soient utilisées pour entraîner les modèles d'intelligence artificielle de Google tout en restant accessibles via Google Search. Cet outil, nommé "Google-Extended", est accessible via le fichier Robots.txt et permet aux sites d'être indexés par les robots de Google sans que leurs données ne soient utilisées pour le développement de l'IA.

Certains grands sites, comme le New York Times, avaient déjà bloqué d'autres robots, notamment ceux d’OpenAI, pour éviter d'être utilisés comme données d'entraînement. Mais refuser les crawlers de Google, c’était courir le risque de devenir invisible dans les recherches. Google déclare avoir changé la donne au nom de la transparence, pour donner aux éditeurs plus de contrôle sur leurs données, tout en les conjurant de ne pas utiliser le nouvel outil et promettant bientôt de nouvelles options.

Vingt-six des 100 premiers sites américains et 242 des mille premiers ont déjà bloqué le chatbot d’OpenAI, depuis son lancement le 7 août, d’après la plate-forme Originality.ai, qui édite par ailleurs un outil pour détecter si un contenu a été créé par un humain ou produit par une IA.

Part des 1000 premiers sites mondiaux bloquant les crawlers d'IA (source : Originality AI)

Les premiers à bloquer GPTBot d’OpenAI avaient été, en août, Amazon et le New York Times. CNN, Shutterstock et Quora leur avaient rapidement emboîté le pas et leur exemple a porté. La plupart des médias américains refusent désormais d’entraîner OpenAI: Bloomberg, Business Insider, CBS, CNBC, ESPN, NBC, NPR, The Guardian, Reuters, USA Today, The Washington Post… La plateforme de publication en ligne Medium a indiqué la semaine dernière qu’elle était en discussion avec plusieurs grandes organisations pour former une coalition pour l’utilisation équitable des contenus.

Dans l'Hexagone, Radio France, TF1 et Publihebdos avaient bloqué GPTBot dès cet été. Le Groupement des éditeurs de services et de contenus en ligne (Geste) s'est exprimé en faveur d’un blocage préventif en attendant la négociation de licences (lire Qant du 18 septembre), mais via des métatags plutôt que le fichier Robots.txt.

Face à ce phénomène naissant, Google a donc jugé bon de lâcher du lest. Le géant mise peut-être sur l’inégale adoption des mesures de blocage : un site sur 4 bloque OpenAI mais deux seulement, Reuters et Il Corriere della Sera, refusent le scrapping d’Anthropic. La raison tient vraisemblablement au déficit de notoriété de Claude, comparé à ChatGPT, ou peut-être à la taille des fichiers Robots.txt des sites les plus importants.

Les géants et les autres

Google se déclare prêt à “collaborer avec les communautés du web et de l'intelligence artificielle afin d'explorer de nouvelles approches en matière de choix et de contrôle pour les éditeurs de sites web”. La consultation a été lancée début juillet. Bingbot se trouvera sans doute bientôt contraint de suivre l’exemple de Googlebot. Mais le phénomène ne sera pas universel. Pour d’autres géants, les données servant à entraîner les modèles d’IA sont disponibles “à domicile”. C'est par exemple le cas de Meta, qui utilise pour entraîner ses modèles les publications de ses 3 milliards d’utilisateurs.

D’autres, plus petits, peuvent aisément faire fi du Robots Exclusion Protocol et des fichiers Robots.txt, pour récupérer les données des sites et les revendre. C’est une accusation lancée récemment contre Brave par le consultant britannique Pierre Far, mais à laquelle bien des “petits” modèles, open source ou non, pourraient prêter le flanc.

Pour en savoir plus :

CRÉER LES CHAMPIONS DE L'IA : la première matinée-débat de Qant, jeudi 12 octobre de 9h à 11h, au palais Brongniart à Paris. Demandez votre invitation !

L’ESSENTIEL : Amazon, BlockFold, Buenos-Aires, ChapsVision, Fireblocks, NSA, PsiQuantum, SEC

ROBOTS

Robot à bord !

La marine indienne teste un robot capable de détecter les incendies, puis de les éteindre. Ce dernier est actuellement à l’essai sur un porte-avions de la flotte.

Un robot pompier conçu par Swadeshi Empresa pour la marine indienne a été testé sur le porte-avions INS Vikrant. Ce robot détecte les incendies et les éteint à l'aide d'eau, de mousse ou de spray. Il a été développé dans le cadre de l'initiative indienne Sprint, qui vise à encourager l'innovation en matière de défense. Il s'agit d'un projet collaboratif mené par la Naval Innovation and Indigenisation (NIIO) de l'Inde, en partenariat avec l'Organisation d'innovation de défense (DIO) et la Cellule d'accélération du développement technologique (TDAC).

Pour en savoir plus: Marine Insight

IA

Bibi craint l’IA : Le Premier ministre israélien, Benjamin Netanyahu, s'est inquiété lors de son discours à l'Assemblée générale des Nations Unies d'une potentielle révolution de l'intelligence artificielle qui pourrait soit propulser les nations vers une ère prospère, soit conduire à une destruction totale alimentée par des guerres technologiques dévastatrices.
Pour en savoir plus: Fox News
Amazon sort du bois : Amazon World Services (AWS) vient d'annoncer la disponibilité générale de Bedrock, un service lancé mi-avril (lire Qant du 17 avril) qui propose une sélection de modèles d'IA générative via une API et permet à ses clients de développer leurs propres applications basées sur les modèles d’AI21 Labs, Cohere, Stability AI mais surtout Anthropic, dans laquelle Amazon vient d’annoncer un investissement allant jusqu’à 4 milliards de dollars (lire Qant du 26 septembre). Il intégrera prochainement Llama 2, le modèle open source de Meta.
Pour en savoir plus: Tech Crunch
La NSA lance un centre de sécurité en IA : L'Agence de sécurité nationale américaine, la NSA, vient d'annoncer le lancement d'un centre de sécurité en intelligence artificielle, étant donné l'intégration croissante des capacités d'IA dans les systèmes de défense et de renseignement américains. Le directeur sortant de l'agence, le général Paul Nakasone, a annoncé que ce centre serait intégré au Cybersecurity Collaboration Center de la NSA pour renforcer la base industrielle de défense des États-Unis contre les menaces, notamment de la Chine et de la Russie.
Pour en savoir plus: Associated Press
En Chine, les artistes défendent leurs droits face à l’IA : Selon CNN, de nombreux artistes chinois ont lancé un mouvement de boycott de la grande plateforme de médias sociaux Xiaohongshu suite à des plaintes concernant son outil de génération d'images par IA. Le conflit a éclaté après qu'une illustratrice, Snow Fish, a accusé Xiaohongshu d'utiliser son travail pour former son outil IA, Trik AI, sans sa permission. En réaction, des centaines d'artistes ont posté des bannières sur Xiaohongshu s'opposant aux images générées par IA, tandis qu'un hashtag associé a été vu plus de 35 millions de fois sur Weibo, une plateforme similaire à Twitter en Chine.
Pour en savoir plus: Wion
ChapsVision regarde vers Palantir : Après avoir réuni 100 millions d’euros en 2022 pour créer un acteur français du traitement massif de données hétérogènes comme l’américain Palantir, la start-up française ChapsVision vient de réaliser une levée de fonds complémentaire de 90 millions d'euros, menée par Qualium Investissement, avec des participants tels que Geneo, Tikehau Capital et Bpifrance. En quatre ans, l'entreprise a réalisé quinze acquisitions, emploie 600 personnes, sert 500 clients, principalement dans le secteur public, et vise un chiffre d'affaires de 250 millions d'euros d'ici fin 2024. Il lui reste, comme Palantir, à passer de la donnée vers l’IA : 90 millions ne seront pas de trop.
Pour en savoir plus: Les Echos

BLOCKCHAINS

La blockchain et l’état-civil, suite : La ville de Buenos Aires va intégrer la technologie blockchain pour délivrer des identités numériques dès octobre, permettant aux résidents d'accéder à des documents tels que les actes de naissance et de mariage via un portefeuille numérique. Ce projet, réalisé en collaboration avec l'entreprise Web3 Extrimian, intervient alors que le voisin brésilien vient d’annoncer utiliser la blockchain pour soutenir la création de nouvelles cartes d’identité (lire Qant du 29 septembre).
Pour en savoir plus: Fortune
BlockFold dans le giron de Fireblocks : La société de sécurité blockchain Fireblocks a acquis la startup australienne BlockFold, spécialisée dans le développement de contrats intelligents pour la tokenisation avancée destinée aux institutions financières. Pour un montant estimé de 10 millions de dollars, cette acquisition permettra à Fireblocks de fournir à ses clients une gamme complète de services, incluant le conseil, la personnalisation des tokens, l'orchestration et la distribution.
Pour en savoir plus: Bloomberg
Les ETF Bitcoin se font désirer : La Securities and Exchange Commission (SEC) a reporté ses décisions sur plusieurs propositions d'ETF Bitcoin, notamment celles de BlackRock, Valkyrie et Bitwise, quelques jours après avoir reporté les décisions pour Ark 21Shares et GlobalX jusqu'en janvier.
Pour en savoir plus: Bloomberg

AR-VR-XR

Un grand mois pour les jeux : UploadVR recense 35 lancements en octobre de jeux de réalité virtuelle, mixte ou augmentée. Les développeurs se sont bien sûr basés sur le lancement prochain du casque Quest 3 (lire Qant du 28 septembre), mais les plates-formes rivales en bénéficient aussi : Pico 4 et la VR sur PC, mais surtout PSVR 2 de Sony.
Pour en savoir plus: UploadVR

QUANTUM

Psiquantum voit grand : En partenariat avec le département de l'Énergie des États-Unis, la start-up californienne Psiquantum va tenter de construire un ordinateur quantique commercial d’un million de qubits dans une ferme cryogénique publique à Menlo Park. Si le test s’avère concluant, elle prévoit de livrer son premier ordinateur quantique commercial dans moins de six ans. En partenariat avec Global Foundries, la start-up – qui a levé 700 millions de dollars depuis sa création en 2015 – a développé des processeurs quantiques photoniques, dont seuls les récepteurs de photons demandent à être refroidis à une température proche du zéro absolu.
Pour en savoir plus: Reuters

Pour faire partie des 1% les mieux informés sur l’IA et la tech : abonnez-vous !

BANC D’ESSAI

Créer des infographies avec l’IA

Qant continue son tour des utilisations professionnelles de l’IA, en testant trois outils permettant de créer des infographies en quelques clics : Canva Pro, ChatGPT Plus, et Graphmaker.ai. Pour un résultat mitigé.

"L'IA apprend à réaliser des graphiques" (Midjourney, M. de R.)

Cet article est réservé aux abonnés.

...

Jean Rognetta

Binational franco-italien, économiste de formation, Jean devient journaliste au milieu des années 1990, après avoir fait ses premiers pas dans l’édition et la technologie. Il débute sa carrière au groupe Tests, leader de la presse informatique, puis se spécialise en financement de l’innovation et des PME. Il couvre le sujet pour Les Echos et Capital Finance de 2000 à 2015. En 2016, il rejoint le magazine Forbes et devient directeur de la rédaction de l’édition française.
Pendant la crise financière, il lance l’association PME Finance, à l’origine notamment du PEA-PME et de l’amortissement du corporate venture, ainsi que partiellement de la libéralisation du crowdfunding. Elle fusionne en 2015 avec le groupement d’entrepreneurs Croissance Plus.
Depuis 2020, Jean a lancé la revue SAY, édition française de Project Syndicate, dont il reste contributing editor, le supplément Corporate Finance du Nouvel Économiste et la collection Demain! aux Editions Hermann.

Maurice de Rambuteau

Diplômé du Centre de Formation des Journalistes (CFJ Paris) et de l'Ecole Supérieure de Commerce de Paris (ESCP BS), Maurice de Rambuteau a fait ses premières armes de journaliste dans le sport, pour le site et le magazine SoFoot, puis au sein de la rédaction football de L'Equipe. Il s'est ensuite tourné vers le journalisme économique au sein de la rédaction de La Croix, avant de donner libre cours à sa passion pour la technologie en rejoignant Qant en juin 2022 pour un premier tour d’horizon de l’IA générative. Depuis, il a percé les mystères des blockchains et du métavers et, surtout, passé des dizaines de modèles d’IA au banc d’essai.