Anoni

Lexique

Les données personnelles qu’Anoni détecte.

Chaque type ci-dessous est repéré et remplacé en local, par les modèles français ou par des règles.

Personne
Les noms, prénoms et civilités des personnes physiques. Détecté par le modèle français CamemBERT. Anoni remplace chaque nom par un pseudonyme crédible, réversible depuis le coffre.
Organisation
Les raisons sociales et les formes juridiques : SARL, SAS, SCI et les autres. Anoni masque le nom de la société et garde la lecture du document fluide.
Lieu
Les villes, les régions et les autres noms de lieux. Anoni les remplace pour qu’aucune localisation ne reste lisible.
Adresse
Les adresses postales françaises : rue, avenue, code postal. Anoni repère l’adresse complète et la remplace d’un bloc.
Courriel
Les adresses e-mail. Anoni les détecte par règle et les remplace par un faux courriel.
Téléphone
Les numéros de téléphone, français et internationaux. Anoni les repère par règle, y compris les formats espacés ou groupés.
NIR
Le numéro de sécurité sociale. Détecté par règle, avec contrôle de cohérence. Anoni le masque entier, clé comprise, sans le confondre avec un autre identifiant.
SIRET / SIREN
L’identifiant d’une entreprise. Détecté par contrôle de longueur et de clé. Anoni valide la clé avant de remplacer, pour éviter les faux positifs.
IBAN
Un compte bancaire. L’IBAN français commence par FR et se vérifie par sa clé. Anoni détecte l’IBAN par règle et le remplace en entier.
URL
Les adresses web. Anoni les repère par règle et les remplace quand elles portent une donnée.
Date
Les dates, y compris celles écrites en toutes lettres. Anoni les détecte par règle et les remplace par une fausse date.
Secret
Les clés et jetons techniques présents dans un document. Anoni les repère par règle et les masque pour qu’ils ne fuitent pas.
Personnalisé
Le dictionnaire que vous ajoutez vous-même : clients, références internes. Anoni remplace chaque entrée de votre liste, en plus de ses détections.

Comment Anoni s’y prend

Les identifiants formatés viennent de règles : NIR, IBAN, SIRET, téléphone, courriel. Les entités sémantiques viennent du modèle : personnes, organisations, lieux. C’est ce mélange qui couvre le plus. Le modèle lit le sens, la règle vérifie la forme et la clé.

Une limite honnête : la détection automatique ne remplace pas une relecture. Sur un document sensible, repassez derrière l’outil. Il aide, il ne décide pas à votre place.

Voir les chiffres sur le benchmark de détection, le guide pour anonymiser avant l’IA et la page pour télécharger Anoni.