GPTBot, le robot développé par OpenAI, a été bloqué par 15 % des 100 sites les plus consultés au monde. Il est reproché au robot d'indexation de collecter sans autorisation le contenu de certaines pages Web.

Un ras-le-bol contre GPTBot. Dévoilé le 8 août dernier par OpenAI, déjà à l'origine de ChatGPT, GPTBot est un robot d'indexation de plus en plus critiqué. Au point où il est désormais bloqué par 15 % des 100 sites les plus consultés au monde, selon une enquête menée par Originality.ai.

L'étude menée par le site a démontré que 9,2 % des 1.000 sites web les plus visités au monde ont bloqué GPTBot au cours de ses deux premières semaines d’utilisation. Un pourcentage qui monte à 15 % pour les 100 sites les plus consultés sur le Web.

Les médias internationaux bloquent l'accès à GPTBot

Plusieurs médias ont pris l'initiative de bloquer l'accès à leur site pour protéger leur contenu. À l'instar du Guardian, CNN, ou de l'agence de presse Reuters, le New York Times a bloqué l'accès de GPTBot à son site depuis le 17 août, après avoir revu ses conditions d'utilisation, qui interdisent l'usage de son contenu aux modèles d'intelligence artificielle.

Les médias français se sont également inquiétés de la présence du robot sur leurs sites. Radio France a bloqué l'accès à GPTBot, tout comme les groupes TF1, France Médias Monde et le site actu.fr.

«Il n'entre pas dans nos missions de servir gratuitement de nourriture aux algorithmes. En indexant des sites dont les informations ont un réel coût de production, les bots se créent de la valeur pour eux-mêmes à coût nul», a dénoncé dans Les Echos Laurent Frisch, directeur du numérique et de la stratégie d'innovation de Radio France.

Les géants du web opposés à GPTbot

Les médias généralistes ne sont pas les seuls à interdire l'accès au robot d'indexation d'OpenAI. Amazon, Shutterstock, WikiHow, Quora, Airbnb ou encore Ikea font partie des géants du Web à avoir restreint les accès de GPTBot à leurs sites.

Plusieurs médias envisagent d’intenter des poursuites contre OpenAI pour atteinte au droit d’auteur. D’autres explorent la possibilité de céder leurs données à des entreprises spécialisées dans l’intelligence artificielle en échange d’une compensation financière.

Selon l'entreprise OpenAI, le but de ce robot était d'«aider ses modèles d'intelligence artificielle à devenir plus précis»