Intelligence artificielle dans la cybersécurité•December 20, 2025•By 3L3C

Derrière l’IA de surveillance, il y a souvent des humains. Voici comment réduire les risques privacy et sécurité avec transparence, contrôles et audit.

IACybersécuritéVie privéeSurveillanceGouvernance des donnéesGestion des risques fournisseurs

Featured image for IA de surveillance : l’angle mort humain et la confiance

IA de surveillance : l’angle mort humain et la confiance

Une fuite “accidentelle” a mis en lumière un détail que beaucoup d’organisations préfèrent garder hors champ : derrière certaines IA de surveillance, il y a des personnes qui regardent, trient et étiquettent des images. Dans le cas de Flock — un acteur qui déploie des caméras dans des milliers de communautés aux États-Unis — des travailleurs aux Philippines auraient été mobilisés pour réviser et classer des séquences vidéo afin d’entraîner et d’améliorer le système.

Le débat se limite souvent à « IA vs vie privée ». C’est trop court. Le vrai sujet, surtout dans une série sur l’intelligence artificielle dans la cybersécurité, c’est le chaînon humain : qui voit quoi, quand, depuis où, et avec quelles garanties ? Quand une IA “voit” la rue, un parking ou l’entrée d’un immeuble, elle fabrique aussi des données sensibles — exploitables, corrélables, et parfois ré-identifiables.

Ce billet part de cette révélation pour tirer des leçons concrètes, côté cybersécurité et gouvernance : transparence, minimisation des données, contrôles d’accès, et audits. Parce que la confiance ne se décrète pas : elle s’industrialise.

Ce que révèle l’affaire Flock : l’IA « autonome » ne l’est pas

Le point clé est simple : beaucoup de systèmes d’IA reposent sur du travail humain pour apprendre (annotation), corriger (validation), et maintenir la qualité (revue de faux positifs/faux négatifs). Quand la fuite évoque des gig workers à l’étranger qui classent des images, elle met en évidence une réalité opérationnelle : l’IA n’est pas qu’un modèle, c’est une chaîne de production.

Dans une IA de surveillance, cette chaîne inclut typiquement :

Collecte (caméras, capteurs, flux vidéo)
Prétraitement (floutage, recadrage, extraction de plaques/objets)
Inférence (détection, suivi, correspondance)
Revue humaine (contrôle qualité, correction d’étiquettes, cas ambigus)
Boucle d’amélioration (ré-entraînement, ajustement des seuils)

Le risque majeur ? Si la revue humaine est sous-traitée, parfois à l’étranger, vous multipliez les surfaces d’attaque et les points de non-conformité : accès distants, outils tiers, mauvaises pratiques, et surtout écart entre promesse marketing (“automatisé”) et réalité (“semi-manuel”).

Pourquoi l’annotation vidéo est si sensible

Classer des images de rue peut sembler banal. En pratique, ces images peuvent contenir des éléments hautement identifiants : visages, plaques d’immatriculation, habitudes de passage, visiteurs réguliers, horaires. Une base d’images annotées constitue souvent une matière première idéale pour :

des recoupements (où et quand une personne apparaît)
des abus internes (curiosité, surveillance ciblée)
des fuites (captures d’écran, exports, partages)

Une phrase qui résume bien le problème :

Dès qu’un humain peut voir une donnée, il faut gérer ce risque comme un accès administrateur.

Le vrai pont avec la cybersécurité : la confidentialité est une “attaque”, pas un débat

Dans les entreprises, on traite volontiers la cybersécurité comme un sujet d’attaques externes (ransomware, phishing). Mais dans des systèmes d’IA, la menace est souvent interne ou supply chain : prestataires, sous-traitants, plateformes d’annotation, comptes partagés, environnements cloud mal cloisonnés.

Une IA de surveillance n’est pas seulement un outil “sécu”. C’est aussi :

un système de collecte massive,
une base de données temporelle,
un moteur de recherche sur des événements du réel.

Si cette base est mal gouvernée, vous créez une cible à haute valeur. Et le scénario n’a rien de théorique : un simple accès trop large à des outils d’annotation peut suffire à exfiltrer des séquences.

Menaces typiques quand des annotateurs interviennent

Voici ce que j’ai vu fonctionner (et échouer) dans des projets IA orientés sécurité :

Sur-collecte : on conserve “au cas où” des flux bruts au lieu de ne garder que des signaux nécessaires.
Accès permanents : des comptes prestataires restent ouverts des mois après la fin d’un lot d’annotation.
Exfiltration silencieuse : captures écran, exports JSON/CSV d’étiquettes, ou duplication de jeux de données.
Ré-identification : même après floutage, des indices contextuels (lieux, horaires, vêtements) peuvent suffire.
Dérive d’usage : un outil prévu pour “sécurité” devient un outil de surveillance généralisée.

Ce n’est pas “anti-IA”. C’est de la gestion du risque. Une IA utile en cybersécurité doit être traçable et auditée, sinon elle ajoute un problème au lieu d’en résoudre.

Transparence et éthique : ce n’est pas de la com’ (c’est de l’architecture)

La transparence n’est pas un paragraphe dans un PDF. C’est un ensemble de choix techniques et contractuels qui rendent les abus plus difficiles et les audits plus simples.

Quand une entreprise utilise des travailleurs à l’étranger pour annoter de la vidéo, les questions clés sont concrètes :

Où les données sont-elles stockées et traitées ?
Qui a un accès, et à quel niveau (flux brut vs données anonymisées) ?
Combien de temps conserve-t-on les images et les annotations ?
Comment prouve-t-on qu’une demande d’effacement a été exécutée ?
Quels contrôles empêchent la copie (DLP, watermarking, environnements verrouillés) ?

“Humain dans la boucle” : utile, mais à conditions strictes

En cybersécurité, l’humain dans la boucle est souvent nécessaire : validation d’alertes, triage, investigations. Pour l’IA de surveillance, c’est pareil. Le problème n’est pas l’existence d’une revue humaine ; c’est l’opacité et l’absence de garde-fous.

Un modèle pragmatique :

Les annotateurs ne voient que des extraits minimaux (quelques secondes, zone rognée), pas des flux longs.
Les accès sont éphémères (just-in-time), avec MFA et enregistrement.
Les environnements de travail sont contrôlés (navigation restreinte, pas d’export, pas de copier-coller).
Les données sont pseudonymisées et séparées des métadonnées de localisation quand c’est possible.

La phrase à garder :

L’éthique se mesure à ce que le système empêche, pas à ce qu’il promet.

Comment réduire le risque : une check-list opérationnelle pour les responsables sécu

Si vous achetez, déployez ou interconnectez des solutions d’IA (surveillance, détection d’intrusion, fraude, SOC), voici un socle de contrôles réalistes. L’objectif : bénéficier de l’IA sans devenir un collecteur incontrôlé.

1) Cartographier la chaîne de sous-traitance (et la documenter)

Exigez une vue claire des acteurs : éditeur, hébergeur, plateforme d’annotation, support, prestataires. Si la réponse tient sur une diapo vague, c’est un mauvais signe.

À demander noir sur blanc :

pays de traitement,
catégories de données,
sous-traitants de rang 2 (et 3),
conditions de suppression/retour des données.

2) Minimiser les données (vraiment)

Réduire le volume réduit le risque. Trois règles simples :

Ne stockez pas le flux brut si un événement suffit.
Diminuez la durée de rétention (ex. 7–30 jours plutôt que 180).
Préférez des features (empreintes, vecteurs) quand c’est possible, tout en évaluant le risque de ré-identification.

3) Cloisonner les accès comme si c’était un coffre-fort

Traitez l’accès aux images annotées comme un accès à des secrets :

RBAC strict, least privilege
journaux immuables (audit trails)
sessions enregistrées pour les opérations sensibles
alertes sur extraction anormale (volume, horaires, pattern)

4) Mettre des “preuves” de conformité, pas des promesses

Deux éléments font la différence lors d’un incident :

preuves d’accès (qui a vu quoi)
preuves de suppression (ce qui a été effacé, quand, et où)

Sans ces preuves, vous serez coincés entre communication de crise et incertitude technique.

5) Tester les dérives : faux positifs, biais, et usages secondaires

L’IA de surveillance peut amplifier des biais (conditions de nuit, angles, quartiers) et générer des faux positifs qui poussent à “sur-investiguer”. Dans une logique cybersécurité, ça ressemble à un SOC noyé sous les alertes.

Un bon rituel trimestriel :

audit d’échantillons (qualité d’annotation, cohérence)
analyse de faux positifs (quels contextes, quelles caméras)
revue des accès (qui a réellement utilisé la donnée)

Questions qu’on me pose souvent (et des réponses nettes)

Une IA peut-elle fonctionner sans annotateurs ?

Rarement. Même avec des modèles pré-entraînés, il faut presque toujours de la validation, de la correction et des jeux de données spécifiques au contexte (pays, éclairage, capteurs). La question n’est pas “zéro humain”, mais “humain sous contrôle”.

Sous-traiter à l’étranger est-il forcément problématique ?

Non. Le problème, c’est la combinaison opacité + données sensibles + accès faibles. Un prestataire peut être très rigoureux, et une équipe interne peut être laxiste. La différence se joue sur les contrôles, l’auditabilité et les responsabilités.

Quel lien avec l’IA en cybersécurité “classique” (SOC, EDR, anti-fraude) ?

Le même : les modèles ingèrent des données sensibles (logs, identifiants, comportements) et peuvent impliquer des revues humaines (support éditeur, triage, labelling). Si vous n’auditez pas la chaîne humaine, vous laissez une porte ouverte.

Ce que j’en retiens pour votre stratégie “IA + cybersécurité” en 2026

L’affaire Flock met un projecteur sur un angle mort : l’IA qui protège peut aussi exposer si sa chaîne de fabrication est opaque. En 2026, les organisations qui gagneront la confiance ne seront pas celles qui annoncent “tout automatique”, mais celles qui savent expliquer — simplement — qui a accès, pourquoi, et comment c’est contrôlé.

Si vous déployez des outils d’IA dans la cybersécurité, faites un choix clair : soit vous traitez la donnée comme un actif critique (gouvernance, cloisonnement, audit), soit vous acceptez un risque de réputation, de conformité et d’incident. J’ai rarement vu un entre-deux tenir longtemps.

Vous voulez évaluer vos outils actuels (ou un futur projet) sous l’angle transparence + confidentialité + chaîne humaine ? Commencez par une seule question, très concrète : si un prestataire externe peut voir vos données, pouvez-vous le prouver, le limiter, et le révoquer en moins d’une heure ?