Plusieurs sociétés d'IA ignoreraient l'exclusion des robots point txt et supprimeraient le contenu sans autorisation : rapport

Plusieurs sociétés d'IA contournent le protocole d'exclusion des robots (robots.txt) pour extraire le contenu des sites Web sans autorisation, selon TollBit, une startup de licences de contenu, rapporte Reuters. Ce problème a donné lieu à des différends entre les sociétés d'IA et les éditeurs, Forbes accusant Perplexity de plagier son contenu.

La lettre de TollBit aux éditeurs, obtenue par Reuters, révèle que de nombreux agents d'IA ignorent la norme robots.txt, qui est utilisée pour empêcher l'exploration de certaines parties d'un site. Les analyses de l'entreprise indiquent un schéma de non-conformité généralisé, car diverses IA utilisent des données pour s'entraîner sans autorisation. La startup de recherche d'IA Perplexity, en particulier, a été accusée par Forbes d'utiliser ses articles d'enquête dans des résumés générés par l'IA sans attribution ou autorisation appropriée. Perplexity n’a pas commenté ces allégations.

Laisser un commentaire