Lexique
Les données personnelles qu’Anoni détecte.
Chaque type ci-dessous est repéré et remplacé en local, par les modèles français ou par des règles.
- Personne
- Les noms, prénoms et civilités des personnes physiques. Détecté par le modèle français CamemBERT. Anoni remplace chaque nom par un pseudonyme crédible, réversible depuis le coffre.
- Organisation
- Les raisons sociales et les formes juridiques : SARL, SAS, SCI et les autres. Anoni masque le nom de la société et garde la lecture du document fluide.
- Lieu
- Les villes, les régions et les autres noms de lieux. Anoni les remplace pour qu’aucune localisation ne reste lisible.
- Adresse
- Les adresses postales françaises : rue, avenue, code postal. Anoni repère l’adresse complète et la remplace d’un bloc.
- Courriel
- Les adresses e-mail. Anoni les détecte par règle et les remplace par un faux courriel.
- Téléphone
- Les numéros de téléphone, français et internationaux. Anoni les repère par règle, y compris les formats espacés ou groupés.
- NIR
- Le numéro de sécurité sociale. Détecté par règle, avec contrôle de cohérence. Anoni le masque entier, clé comprise, sans le confondre avec un autre identifiant.
- SIRET / SIREN
- L’identifiant d’une entreprise. Détecté par contrôle de longueur et de clé. Anoni valide la clé avant de remplacer, pour éviter les faux positifs.
- IBAN
- Un compte bancaire. L’IBAN français commence par FR et se vérifie par sa clé. Anoni détecte l’IBAN par règle et le remplace en entier.
- URL
- Les adresses web. Anoni les repère par règle et les remplace quand elles portent une donnée.
- Date
- Les dates, y compris celles écrites en toutes lettres. Anoni les détecte par règle et les remplace par une fausse date.
- Secret
- Les clés et jetons techniques présents dans un document. Anoni les repère par règle et les masque pour qu’ils ne fuitent pas.
- Personnalisé
- Le dictionnaire que vous ajoutez vous-même : clients, références internes. Anoni remplace chaque entrée de votre liste, en plus de ses détections.
Comment Anoni s’y prend
Les identifiants formatés viennent de règles : NIR, IBAN, SIRET, téléphone, courriel. Les entités sémantiques viennent du modèle : personnes, organisations, lieux. C’est ce mélange qui couvre le plus. Le modèle lit le sens, la règle vérifie la forme et la clé.
Une limite honnête : la détection automatique ne remplace pas une relecture. Sur un document sensible, repassez derrière l’outil. Il aide, il ne décide pas à votre place.
Voir les chiffres sur le benchmark de détection, le guide pour anonymiser avant l’IA et la page pour télécharger Anoni.