L’intelligence artificielle est anthropophage, mais pas cannibale : c’est la conclusion d’une récente étude. Si, à la place de s’entraîner avec des données d’origine humaine, une IA digère des contenus générés par une autre IA, elle connaît une inévitable et spectaculaire dégradation de ses performances. Mais alors qu’Internet est envahi par les contenus artificiels, la donnée humaine se raréfie et cette pénurie met en péril les progrès de l’IA.

L’intelligence artificielle (IA) ne supporte pas de dévorer ses propres créations. C’est à cette conclusion étrange mais cruciale pour l’avenir d’Internet que sont parvenus six chercheurs des universités d’Oxford, de Cambridge, de Londres et de Toronto, dans un article de mai 2023.

Pour comprendre cette information, il faut avoir à l’esprit que les modèles de langage comme GPT-4 ou de génération d’images comme Stable Diffusion font reposer leurs performances sur un processus d’entraînement (le fameux machine learning) qui implique la digestion de quantités considérables de données. Pour générer des images de chats satisfaisantes, Stable Diffusion doit avoir vu beaucoup de vrais félins, de couleurs et de tailles différentes, dans des positions infiniment variées, afin de pouvoir prédire ce que nous entendons par ce mot.

Le terrain d’entraînement de la machine, c’est bien sûr Internet lui-même, qui regorge de données à collecter. Sauf que, depuis le lancement du très populaire ChatGPT en novembre 2022, chacun s’est saisi de ces puissants outils pour générer des textes et des images qui viennent ensuite inonder Internet. Autrement dit, le garde-manger qui permet aux IA de se nourrir de données d’origine humaine est progressivement envahi par leurs propres émanations.

 

Machine cannibale démente

Que se passe-t-il, alors, lorsqu’une IA absorbe le fruit de sa propre chair statistique ? Selon les auteurs de cette étude, pire qu’une indigestion : « l’effondrement du modèle », ni plus, ni moins. « Lorsque l’on utilise des données synthétiques pour entraîner le modèle, nous explique Ilia Shumailov, chercheur à Oxford, il va inévitablement aggraver la part de ses erreurs et ses incompréhensions jusqu’à délirer complètement ». Les légers biais…

Il vous reste 75% à lire
Profitez de 7 jours gratuits sans engagement ou abonnez-vous
Abonnez-vous pour accéder à l'intégralité des contenus du site et rejoindre la communauté des Philonomistes. Découvrir les offres d’abonnement
Abonnement gratuit 7 jours
(sans coordonnées bancaires)
Accédez gratuitement à l'intégralité du site.

Votre entreprise vous a abonné(e) à Philonomist ?
Cliquez sur le bouton ci-dessous.