Qui fabrique vraiment les IA que nous utilisons ?

Les outils d’intelligence artificielle dont nous nous emparons dans nos organisations ont une chaîne de production. Et cette chaîne passe souvent par des travailleurs précaires, payés quelques dollars de l’heure pour entraîner des modèles qu’ils n’utiliseront jamais. DoorDash vient de lancer “Tasks”, une application qui recrute des livreurs et autres travailleurs de la gig economy pour filmer leur lessive, cuisiner des oeufs sur le plat, ou simplement marcher dans un parc - le tout pour alimenter des bases de données d’entraînement IA. Un journaliste de Wired a testé l’application et parle de “l’avenir sombre du travail IA précaire”. Ce n’est pas un détail technique. C’est notre problème.

La news décryptée

DoorDash, la plateforme américaine de livraison, a lancé “Tasks” - une surcouche à son application principale qui permet de monétiser les travailleurs gig au-delà de la simple livraison. Ces travailleurs accomplissent des micro-tâches banales - enregistrer une vidéo en faisant la cuisine, se filmer en train de marcher, trier des images - pour produire les données d’entraînement dont les grands modèles de langage et les systèmes de vision ont besoin.

Le journaliste de Wired qui a testé l’application décrit une expérience déroutante : des tâches répétitives, une rémunération opaque, et le sentiment diffus de contribuer à construire quelque chose qui, à terme, pourrait remplacer les travailleurs eux-mêmes.

Ce modèle n’est pas nouveau. Il est la face cachée de l’industrie IA depuis ses débuts. Scale AI, Appen, Remotasks, ou encore Sama - anciennement Samasource - ont bâti des empires sur l’annotation de données réalisée par des travailleurs au Kenya, en Ouganda, aux Philippines, en Inde. Une enquête de Time Magazine publiée en 2023 avait déjà révélé que des sous-traitants kenyans travaillant pour OpenAI gagnaient moins de 2 dollars de l’heure pour classifier des contenus parmi les plus violents et traumatisants imaginables.

Ce que DoorDash normalise, c’est l’industrialisation de cette logique : transformer n’importe quel travailleur précaire en fournisseur de données IA, à la demande, sans transparence sur l’usage final.

L’IA ne tombe pas du ciel. Elle est construite, pièce par pièce, par des travailleurs invisibles.

Ce que ça change pour notre secteur

Pour les ONG, les organisations de développement et les chercheurs qui adoptent des outils IA dans leur travail, cette news pose une question directe : savons-nous d’où vient l’intelligence de nos outils ?

La question n’est pas abstraite. Elle a plusieurs dimensions concrètes.

Dimension éthique et cohérence institutionnelle. Beaucoup d’organisations du développement ont des politiques de chaîne d’approvisionnement éthique pour leurs achats de café, de matériel informatique, de textiles. Ces mêmes organisations adoptent des outils IA sans se poser la question des conditions de production des données d’entraînement. C’est une incohérence qui mérite d’être nommée. Si votre mission inclut le travail décent ou l’équité économique, cette question vous concerne directement.

Dimension régionale. L’Afrique de l’Ouest et l’Afrique de l’Est sont des zones de production de données IA importante. Des milliers de travailleurs annotent des images, transcrivent des conversations, classifient des contenus pour nourrir des modèles utilisés dans le monde entier. Ce travail crée de l’emploi - souvent dans des zones urbaines avec peu d’alternatives. Mais les conditions varient énormément d’un sous-traitant à l’autre, et la valeur captée reste massivement dans les pays développeurs.

Dimension politique. L’Union Africaine et plusieurs États africains travaillent sur leurs politiques IA. La question du travail de données - qui le fait, pour combien, dans quelles conditions - devrait être au coeur de ces discussions. Aujourd’hui, elle est largement absente des débats, dominés par les questions de gouvernance des algorithmes et de souveraineté des données.

Dimension pratique pour les chercheurs. Si vous utilisez des outils de transcription automatique, d’analyse d’image, ou de traitement du langage pour vos terrains en Afrique, vos données contribuent potentiellement à l’entraînement de modèles commerciaux. Les conditions générales d’utilisation de la plupart de ces outils le permettent par défaut. Lire les CGU n’est plus optionnel.

La vraie question pour notre secteur n’est pas “comment utiliser l’IA” mais “dans quels systèmes économiques notre adoption de l’IA nous inscrit-elle ?”

Ce que vous pouvez faire dès lundi

Voici quatre actions concrètes, réalisables cette semaine :

1. Auditez vos outils IA actuels. Pour chaque outil que vous utilisez - transcription, résumé, analyse d’image - vérifiez les conditions d’utilisation des données. Est-ce que vos données servent à l’entraînement ? Est-ce explicitement exclu ? Des alternatives comme Whisper d’OpenAI en local, ou des outils open source auto-hébergés, permettent de garder le contrôle.

2. Cherchez des fournisseurs avec une politique de travail transparente. Scale AI publie désormais des informations sur ses pratiques. Sama, malgré ses défauts documentés, a un modèle qui inclut des formations et une progression. Quand vous choisissez un outil, poser la question au fournisseur - “Qui annote vos données d’entraînement ?” - n’est pas naïf, c’est du due diligence.

3. Introduisez la question dans vos discussions IA internes. Si votre organisation a un groupe de travail IA, ou simplement une réunion d’équipe sur l’adoption des outils, mettez ce sujet à l’ordre du jour. Pas pour bloquer l’adoption, mais pour la rendre consciente.

4. Explorez les initiatives de données éthiques. Des projets comme Masakhane pour les langues africaines, ou des initiatives de données ouvertes gérées communautairement, montrent qu’une autre logique est possible. Y contribuer, même marginalement, c’est peser sur la direction du secteur.

La question qui reste

Le modèle DoorDash Tasks n’est probablement qu’une étape. D’autres plateformes vont suivre, transformant des centaines de milliers de travailleurs précaires en producteurs de données IA sans qu’ils comprennent vraiment ce qu’ils construisent. Est-ce que nos organisations - ONG, instituts de recherche, agences de développement - sont prêtes à articuler une position claire sur ce système ? Ou allons-nous continuer à nous concentrer sur nos propres usages de l’IA en laissant d’autres décider des conditions de sa fabrication ?