Les développeurs d’IA s’appuient sur la collecte de grandes quantités de données extraites de diverses sources pour créer de grands modèles linguistiques. C'est la technologie derrière les chatbots comme ChatGPT d'OpenAI et Claude, le concurrent d'Anthropic.
Anthropic a été fondée par un groupe d’anciens chercheurs d’OpenAI avec la promesse de développer des systèmes d’IA « responsables ».
Cependant, Matt Barrie, PDG de Freelancer.com, a accusé la société basée à San Francisco d'avoir piraté le portail des journalistes indépendants, qui reçoit des millions de visiteurs par jour.
Anthropic a créé certains des chatbots les plus avancés au monde, rivalisant avec ChatGPT d'OpenAI. Photo : Jakub Porzycki
Selon les données partagées avec le Financial Times, Freelancer.com a reçu 3,5 millions de visites d'un « robot d'exploration » Web lié à Anthropic en quatre heures.
Barrie a ajouté que le trafic provenant de ces robots a continué d'augmenter même après que Freelancer.com a tenté de refuser les demandes d'accès, en utilisant des protocoles Web standard pour guider les robots d'exploration. Barrie a alors décidé de bloquer complètement le trafic provenant des adresses Internet d'Anthropic.
Kyle Wiens, PDG d'iFixit.com, a déclaré que son site de réparation électronique avait reçu 1 million de visites de robots anthropiques en 24 heures. « Nous avons beaucoup d’alarmes (en raison du trafic élevé) », a-t-il déclaré.
Wiens a déclaré que les conditions de service d'iFixit interdisent l'utilisation de leurs données à des fins d'apprentissage automatique. « Mon premier message à Anthropic est le suivant : utiliser ces données pour entraîner votre modèle est illégal. Mon deuxième message est le suivant : ce n'est pas un comportement poli sur Internet », a-t-il déclaré.
La collecte de données n’est pas une activité nouvelle, mais elle a considérablement augmenté au cours des deux dernières années en raison de la course à l’IA. Cela a entraîné de nouveaux coûts pour les sites Web.
La décision du réseau social X de collecter automatiquement les données des utilisateurs pour former des chatbots pourrait violer les règles européennes de confidentialité. Photo : Reuters
L'autorité européenne de protection des données enquête sur la décision du réseau social X d'autoriser l'alimentation automatique des données des utilisateurs à la startup d'intelligence artificielle xAI.
Plus précisément, le 26 juillet, les utilisateurs de X ont découvert qu'ils avaient accidentellement autorisé l'utilisation de leurs publications et interactions avec le chatbot Grok pour « former et affiner » les systèmes de xAI.
Cette opération a été effectuée sans le consentement explicite de l’utilisateur pour partager des données. Les paramètres ne peuvent pas être modifiés sur l'application mobile X, uniquement sur la version de bureau.
Les experts en confidentialité se demandent si la décision de X viole les règles du règlement général sur la protection des données de l'UE, qui oblige les entreprises qui collectent ou utilisent des données personnelles à obtenir au préalable le consentement d'une personne et à divulguer les raisons pour lesquelles elles le font. Si le régulateur irlandais ouvre une enquête, X pourrait être confronté à des amendes ou à des pénalités.
Le mois dernier, Meta a suspendu ses projets de formation de l'IA sur les données des plateformes Facebook et Instagram en Europe après avoir reçu une demande du DPC irlandais concernant des problèmes de conformité au RGPD. Cela marque « un pas en arrière pour l’innovation et la compétitivité européennes dans le développement de l’IA », a déclaré Meta.
Ngoc Anh (selon le FT)
Source : https://www.congluan.vn/hang-loat-cong-ty-ai-bi-cao-buoc-thu-thap-du-lieu-trai-phep-post305394.html
Comment (0)