Comparatif
Local ou cloud : le même test.
Quatre détecteurs indépendants, mesurés sur les mêmes 60 documents juridiques français synthétiques (run du 12 juin 2026). Même règle, graine fixée. Les chiffres se rejouent à l’identique.
Sur le banc
| Système | Rappel strict | Fuites évitées | Faux positifs |
|---|---|---|---|
| Anoni (modèles + règles) | 89,0 % | 99,0 % | 15 |
| openai/privacy-filter (brut) | 69,7 % | 93,8 % | 64 |
| Microsoft Presidio (fr) | 65,7 % | 83,1 % | 104 |
| AInonymizer | 64,7 % | 68,4 % | 40 |
Run du 12 juin 2026. « Rappel strict » : la donnée est trouvée avec la bonne catégorie (recouvrement ≥ 66 %). « Fuites évitées » : part des caractères sensibles couverts par une détection, toutes catégories confondues. Mêmes documents, même règle.
Local vs cloud
Traitement
Anoni traite tout sur votre poste. Un anonymiseur en ligne envoie le texte à un serveur distant.
Données qui sortent
Avec Anoni, rien ne sort après le premier téléchargement du moteur. Coupez le Wi-Fi : l’anonymisation tourne toujours.
Réversibilité
La correspondance faux nom / vraie donnée reste dans un coffre chiffré AES-256-GCM, sur votre machine. Personne d’autre n’y accède.
Modèles de détection
Les modèles qui lisent vos documents sont ouverts (Apache-2.0, MIT). Cela concerne la détection seulement. L’application, elle, ne l’est pas.
Microsoft Presidio
Microsoft Presidio est une bibliothèque open source de Microsoft, à intégrer soi-même.
Validé aussi sur des données indépendantes
Anoni est aussi mesuré sur un corpus indépendant, ai4privacy OpenPII : de la donnée personnelle française réelle, annotée à la main, sous licence libre (CC-BY). Sur 500 documents que nous n’avons pas écrits : 92,7 % de rappel strict et 97,1 % des caractères sensibles couverts.
Voir aussi : benchmark · conformité · télécharger.