Le répertoire anonymisation fournit une méthode, des outils et des références sur l'anonymisation des données à caractère personnel.
Ce projet a pour objectif :
- D'introduire l'utilisateur et le producteur de données aux enjeux de l'anonymisation, d'un point de vue juridique, scientifique et technique.
- De construire un espace collaboratif autour de ce thème.
- De proposer une méthode robuste et testée de k-anonymisation de données.
Plus précisément, cet espace est constitué :
- D'un wiki qui détaille la démarche, les outils et l'exemple de Transparence Santé.
- Du code qui formalise le traitement de k-anonymisation.
- De deux exemples d'application à Transparence Santé et à Équides.
Les données exploitées pour tester notre algorithme peuvent être téléchargées aux endroits suivants :
- Transparence Santé (data.gouv.fr)
- Données INSEE pour l'enrichissement des données (INSEE)
- Fichier des équidés (data.gouv.fr)
pip install anonymizer
Pour l'application des exemples, pensez à bien renseigner vos répertoires de travail dans le fichiers config-anonymizer.ini selon l'exemple de config_anonymizer.ini.exemple.