Qu’est-ce que l’apprentissage antagoniste ?

L’apprentissage antagoniste explore les vulnérabilités des modèles d’intelligence artificielle et les moyens de s’en défendre. Quelques explications à l’heure du Sommet pour l’action sur l’intelligence artificielle.


Peut-on manipuler une intelligence artificielle (IA) pour qu’elle accomplisse l’inverse de ce pour quoi elle a été conçue ? C’est l’objectif de l’apprentissage antagoniste, une discipline qui explore à la fois les vulnérabilités des modèles d’IA et les moyens de s’en défendre. Que ce soit pour contourner un filtre antispam ou échapper à la reconnaissance faciale, les exemples abondent.

Mais quelles sont ces attaques qui ciblent les modèles d’IA, et comment fonctionnent-elles ? Explorons l’envers du décor.

Le contournement antispam est l’un des exemples les plus simples et anciens d’apprentissage antagoniste. Pour éviter que leurs messages soient automatiquement supprimés, les auteurs de spams vont dissimuler les mots suspects dans leurs textes en les déformant à travers des fautes d’orthographe ou des caractères spéciaux (« cadeau » deviendrait « ƈąɗẹąս »). Ainsi, ignorant les mots inconnus, les algorithmes ne verront que les « bons » mots et passeront à côté des termes douteux.

Les contournements d’IA ne passent pas que par des moyens numériques. Par exemple, il existe des vêtements ingénieux spécialement conçus pour déjouer les outils de reconnaissance faciale et se rendre en quelque sorte invisible, échappant à la surveillance de masse.

Pour comprendre l’apprentissage antagoniste, revenons rapidement sur la manière dont une IA apprend.

Tout commence avec un jeu de données qui représentent des exemples de la tâche à accomplir : pour créer un détecteur de spam, il faut donc de vrais spams et des courriels normaux. Ensuite s’exécute une phase où un modèle mathématique va apprendre à les distinguer et à exécuter la tâche….

La suite est à lire sur: theconversation.com
Auteur: Julien Romero, Maître de conférences en Intelligence Artificielle, Télécom SudParis – Institut Mines-Télécom

Pour l’actu indépendante

🌍 Soutenez l’info libre. Gardez OnePlanète vivant et sans pub
→ ko-fi.com/oneplanetecom

Buy Me a Coffee at ko-fi.com