Une étude publiée en juillet 2024 sur le site Nature a mis en relief le risque d’effondrement pesant sur le modèle d’intelligence artificielle générative, en raison de la présence toujours plus grande de contenus générés par ces mêmes modèles sur Internet.

Une boucle sans fin de consanguinité numérique. La démocratisation du modèle d’intelligence artificielle générative, dont le système d’apprentissage repose en partie sur les contenus accessibles sur Internet via des processus automatisés comme le «web scraping» et autres techniques d’acquisition de données, permettent aux modèles de bâtir une base de données, de faire des correspondances entre les divers éléments accessibles, et de générer à son tour du contenu (image, texte, vidéo) à la demande des utilisateurs.

Et c’est justement là que réside le problème. À mesure que l’utilisation de l’intelligence artificielle générative se généralise, aussi bien auprès des particuliers que dans la sphère professionnelle, les modèles d’IA se retrouvent confrontés à un «cannibalisme» numérique, où ils consomment de plus en plus de contenus générés, non pas par des humains, mais par d’autres IA.

Selon un article publié sur le site Nature, cette «consanguinité» menace de provoquer l’effondrement des modèles d’intelligence artificielle générative dont les résultats deviennent de plus en plus biaisés, homogènes, appauvris et inexacts. «Le modèle est auto-empoisonné par sa propre projection de la réalité», peut-on lire.

Une création humaine indispensable

Aujourd’hui, de plus en plus de sites internet – textes, images, vidéos – utilisent des éléments générés par l’intelligence artificielle (et qui ne sont pas identifiés comme telle). Ce qui ne fait qu’accentuer le risque d’effondrement des modèles d’IA générative. Seule la production de contenus originaux d’origine humaine permet de freiner le processus baptisé GIGO – pour «Garbage In/Garbage Out» – utilisé pour décrire la problématique des modèles d’IA générative dont l’utilisation massive par le grand public menace de provoquer leur perte, tel un serpent avalant sa propre queue.

Les sociétés spécialisées dans les IA génératives pourront-elles trouver la parade en parvenant à contourner – ou limiter – l’exploitation de contenus créés par d’autres modèle d’IA, tout en produisant une quantité suffisante d’éléments créés par des êtres humains, et ainsi éviter cette boucle infernale qui menacent leurs modèles ? La curation humaine peut-elle être une solution, bien que limitée, pour atténuer cette problématique ? L’évolution à grande vitesse des IA génératives peut-elle être freinée pour éviter l’effondrement ? De la réponse à ces différentes questions semble dépendre la survie d’une révolution annoncée plus fragile qu’on ne l’aurait imaginé.

«Nous allons investir de plus en plus dans l’IA, jusqu’au moment où l’effondrement du modèle frappera durement le secteur et où les réponses générées par l’IA seront si mauvaises que même un PDG bête à manger du foin ne pourra pas l’ignorer», avait lancé le journaliste Steven Vaughn-Nichols dans un édito publié sur le site The Register en mai dernier.