Dans une analyse distincte menée cette semaine, le journaliste Ben Welsh a découvert qu’un peu plus d’un quart des sites d’information qu’il a interrogés (294 sur 1 167 publications en anglais aux États-Unis) bloquent Applebot-Extended. À titre de comparaison, Welsh a constaté que 53 % des sites d’information de son échantillon interdisaient le robot OpenAI. Google a présenté son robot IA, Google-Extended, en septembre dernier ; Il a été bloqué par environ 43 % de ces sites, ce qui indique qu’Applebot-Extended est peut-être encore sous le radar. Comme Welsh le dit à WIRED, le nombre « a progressivement augmenté » depuis qu’il a commencé ses recherches.
La langue galloise a Projet en cours « Il y a eu quelques divergences parmi les éditeurs de presse quant à savoir s’ils veulent ou non interdire ces robots », dit-il. « Je n’ai pas de réponse quant à la raison pour laquelle chaque agence de presse a pris sa décision. Évidemment, nous pouvons lire que beaucoup d’entre eux concluent des accords de licence, où ils sont payés pour laisser entrer des robots – c’est peut-être un facteur. »
L’année dernière, le New York Times a publié Il a été rapporté En 2011, Apple tentait de conclure des accords avec des éditeurs en matière d’IA. Depuis lors, des sociétés rivales comme OpenAI et Perplexity ont annoncé des partenariats avec divers médias, plateformes sociales et autres sites Web populaires. « Il est clair que bon nombre des plus grands éditeurs du monde adoptent une approche stratégique », déclare John Gillham, fondateur d’Originality AI. « Je pense que dans certains cas, une stratégie commerciale est impliquée, comme la rétention de données jusqu’à un accord de partenariat. est en place. »
Il existe certaines preuves à l’appui de la théorie de Gillham. Par exemple, les sites Web de Condé Nast bloquaient les robots d’exploration d’OpenAI. Après que la société a annoncé un partenariat avec OpenAI la semaine dernière, elle a levé l’interdiction frappant les robots d’exploration de la société. (Condé Nast a refusé de commenter ce rapport.) Pendant ce temps, la porte-parole de BuzzFeed, Juliana Clifton, a déclaré à Wired que la société, qui interdit actuellement le robot Extended d’Apple, mettait tous les robots d’exploration Web IA qu’elle peut identifier sur sa liste de blocage, à moins que son propriétaire ne conclue un partenariat payant, généralement – avec la société, ce qui est généralement le cas. possède également le Huffington Post.
Étant donné que le fichier robots.txt doit être modifié manuellement et que de nombreux nouveaux agents IA font leurs débuts, il peut être difficile de maintenir une liste d’interdictions à jour. « Les gens ne savent pas quoi bloquer », déclare Gavin King, fondateur de Dark Visitors. Dark Visitors propose un service gratuit qui met automatiquement à jour le fichier robots.txt du site d’un client, et King affirme que les éditeurs représentent une grande partie de ses clients en raison de problèmes de droits d’auteur.
Robots.txt peut sembler être le domaine obscur des webmasters, mais étant donné son importance pour les éditeurs de contenu numérique à l’ère de l’intelligence artificielle, il est désormais le domaine des dirigeants des médias. WIRED a appris que deux PDG de grandes sociétés de médias décident directement quels robots doivent être interdits.
Certains médias ont explicitement déclaré qu’ils interdisaient les outils d’exploration de données d’IA parce qu’ils n’avaient actuellement aucun partenariat avec leurs propriétaires. « Nous interdisons Applebot-Extended sur toutes les propriétés de Fox Media, comme nous l’avons fait avec de nombreux autres outils d’exploration de données d’IA lorsque nous n’avions pas d’accord commercial avec l’autre partie », déclare Lauren Stark, vice-présidente senior des communications chez Fox Media. . En protégeant la valeur de nos œuvres publiées.
More Stories
Apple annonce l’expansion de Vision Pro dans deux pays supplémentaires
Nintendo lance une application musicale avec des thèmes de Mario et Zelda et, plus important encore, une chaîne Wii Shop
C’est le journal que personne n’a lu avant d’annoncer la disparition de la cryptographie moderne.