Comment dit-on «algorithme» en kiswahili?

Cet article a été co-écrit par Mercy Musya et Grace Kamau du Centre d'économie comportementale de Busara à Nairobi, au Kenya, avec la contribution de Dan Bjorkegren de l'Université Brown et de Joshua Blumenstock de UC Berkeley et CEGA.

Crédit: Centre d'économie comportementale de Busara

Les algorithmes prennent de plus en plus de décisions, qu’il s’agisse d’accorder un prêt, de diagnostiquer une maladie ou même de prendre une commande au restaurant. Si certaines de ces décisions sont triviales, d’autres relatives aux finances personnelles ne le sont pas, ce qui laisse craindre que, si des algorithmes sont utilisés pour prendre des décisions importantes, ils devraient préciser comment ces décisions sont prises. L’Union européenne, par exemple, a réclamé un «droit d’explication» pour les décisions numériques. Mais comment devrions-nous expliquer les décisions basées sur des modèles complexes? Est-il possible d'expliquer les décisions à toutes les personnes concernées, même à celles qui ont très peu d'expérience préalable de la technologie et des algorithmes?

Nous avons examiné ces questions dans le contexte du prêt numérique, l’une des applications les plus réussies de l’apprentissage automatique dans les sociétés en développement.

Qu'est-ce que le prêt numérique?

Un Kenyans sur quatre a contracté un prêt numérique (Gubbins et Totolo, 2018). Le crédit numérique a donné à plus de 6 millions de Kenyans une cote de crédit basée sur la manière dont ils utilisent leur téléphone (Björkegren et Grissen 2015), leur donnant ainsi accès au crédit.

En règle générale, les utilisateurs téléchargent une application de crédit numérique à partir de la boutique Google Play et permettent à l'application d'accéder à leurs données de médias sociaux, données GPS, listes de contacts, SMS, journaux d'appels, etc. L'application analyse ensuite les données et utilise des algorithmes pour déterminer le pointage de crédit et la taille du prêt.

Crédit: M-Pesa

Les gens comprennent-ils le concept d'un «algorithme»?

Ce processus soulève toutefois la question suivante: ces utilisateurs comprennent-ils vraiment le fonctionnement de ces algorithmes et comment leur activité peut-elle les qualifier ou les exclure des prêts? Et si non, est-il possible de communiquer la nature des algorithmes aux pauvres? Et ce faisant, quelle quantité d'informations est-il approprié de fournir?

Une série de six groupes de discussion a été consacrée à la compréhension générale des Kenyans sur les algorithmes de crédit numérique déterminant l’éligibilité des prêts. Les FGD ont eu lieu au Centre d'économie comportementale de Busara à Nairobi, où 50 personnes ont été invitées: un groupe diversifié de résidents de Kibera et de Kawangware appartenant au groupe de répondants à faible revenu de Busara, qui possédaient des smartphones et avaient au moins une certaine expérience antérieure d'une certaine forme de communication numérique. crédit. Seuls 64% des participants avaient atteint le niveau secondaire. Les participants ont ensuite été invités à expliquer leur compréhension du processus d'approbation de crédit numérique, se sont fait expliquer le processus d'algorithme simple, puis ont été présentés à une série d'exercices hypothétiques pour déterminer s'ils comprenaient les algorithmes.

Presque tous les participants connaissaient ou comprenaient peu les algorithmes utilisés par les outils de crédit numériques.

Nombre d’entre elles ont opté pour des processus formels plus traditionnels pour définir le processus qu’elles pensaient utiliser pour évaluer leur admissibilité aux prêts, c’est-à-dire l’épargne, les principales sources de revenus, les garants de prêts et / ou les transactions MPESA. Les participants moins familiers avec les approches algorithmiques ont supposé qu'il existait une collusion plus large entre toutes les institutions financières pour partager des informations sur les applications qui seraient utilisées collectivement pour évaluer l'éligibilité.

«Je pense qu'ils [le prêteur numérique, par exemple] vont vérifier auprès d'autres institutions prêteuses, [les télécoms, par exemple Safaricom et le bureau de référence du crédit CRB] pour obtenir plus d'informations sur le fait que je sois un bon emprunteur ou non. ”

Toutefois, les participants ont généralement estimé qu’il était possible de déterminer certaines caractéristiques des personnes à partir de l’utilisation du téléphone.

Les données d'utilisation du téléphone sur les appels, les messages SMS, les applications installées, les habitudes de charge de la batterie et les connexions WiFi, entre autres activités, pourraient définir avec plaisir différentes caractéristiques démographiques. En règle générale, les répondants des groupes de discussion ont été en mesure de comprendre comment certaines données pouvaient identifier les bons ou les mauvais emprunteurs. Certains ont même segmenté leur comportement en se concentrant sur les interactions professionnelles quotidiennes:

«Les hommes d’affaires sont plus susceptibles de recevoir plus d’appels des mêmes numéros de téléphone et leur GPS leur indiquerait qu’ils se déplacent un peu car ils ont besoin de s’occuper de leurs clients en ligne ou en personne.»

La confidentialité est importante, mais l'anonymisation répond à de nombreuses préoccupations.

La plupart des participants n'étaient pas clairs quant au but des autorisations accordées sur ces applications. Lorsque les données recueillies par ces applications leur ont été décrites de manière distincte, les participants ont exprimé des préoccupations quant à leur vie privée, les enregistrements d'appels et le contenu des SMS étant les sujets de préoccupation les plus sensibles. Mais ils étaient beaucoup plus à l’aise avec la collecte de données anonymisées, c’est-à-dire les numéros de téléphone avec hachage, tant qu’aucun contenu n’était collecté.

Un langage simple et agréable est crucial pour une communication efficace des spécifications de l’algorithme.

Busara a essayé d'expliquer des algorithmes en utilisant différentes approches, par exemple: équations mathématiques ou illustrations graphiques. La plupart des participants ont eu du mal à comprendre les algorithmes lorsqu'ils sont présentés sous forme d'équations mathématiques, alors que la représentation sous forme de diagramme des algorithmes était plus facile à saisir par les participants. L'utilisation d'un graphique à secteurs pour expliquer les proportions a été le plus efficace.

Les terminologies simplifiées conviennent au niveau d’éducation de cette population et à la langue de tous les jours (principalement l’argot). Des termes tels que «proportion accrue» ou «déduire» pourraient être remplacés par «plus de» et «soustraire» respectivement. Les emprunteurs souhaitent comprendre ces règles de décision, mais seulement dans la mesure où elles sont simplifiées pour en saisir le concept général.

Qu'est-ce que cela signifie pour une communication basée sur un algorithme?

Le débat mondial se poursuit sur la question de savoir si la transparence des algorithmes devrait être légalement mandatée pour assurer la protection des consommateurs. Un projet en cours dirigé par Joshua Blumenstock et Daniel Björkegren au Centre Busara, soutenu par la Fondation Bill & Melinda Gates par le biais de l'Observatoire du crédit numérique (DCO) de CEGA, cherche à déterminer comment les algorithmes pourraient être correctement communiqués, même si le crédit numérique continue de s'étendre .