S'abonner

Chaînage de bases de données anonymisées pour les études épidémiologiques multicentriques nationales et internationales : proposition d’un algorithme cryptographique - 09/02/09

Doi : 10.1016/j.respe.2008.10.010 
C. Quantin a, b, , M. Fassa b, G. Coatrieux c, B. Riandey d, G. Trouessin e, F.A. Allaert f, 1
a Inserm U 866, université de Bourgogne, Dijon, France 
b Service de biostatistique et informatique médicale, CHU de Dijon, BP 77908, 21079 Dijon cedex, France 
c Inserm U650, LaTIM, institut Télécom, Télécom Bretagne, France 
d Institut national d’études démographiques (Ined), Paris, France 
e OPPIDA Sud, Toulouse, France 
f Chaire d’evaluation médicale Ceren Esc, Dijon, France 

Auteur correspondant.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
Article gratuit.

Connectez-vous pour en bénéficier!

Abstract

Background

Compiling individual records which come from different sources remains very important for multicenter epidemiological studies, but at the same time European directives or other national legislations concerning nominal data processing have to be respected. These legal aspects can be satisfied by implementing mechanisms that allow anonymization of patient data (such as hashing techniques). Moreover, for security reasons, official recommendations suggest using different cryptographic keys in combination with a cryptographic hash function for each study. Unfortunately, such an anonymization procedure is in contradiction with the common requirement in public health and biomedical research as it becomes almost impossible to link records from separate data collections where the same entity is not referenced in the same way. Solving this paradox by using methodology based on the combination of hashing and enciphering techniques is the main aim of this article.

Methods

The method relies on one of the best known hashing functions (the secure hash algorithm) to ensure the anonymity of personal information while providing greater resistance to dictionary attacks, combined with encryption techniques. The originality of the method relies on the way the combination of hashing and enciphering techniques is performed: like in asymmetric encryption, two keys are used but the private key depends on the patient’s identity.

Results

The combination of hashing and enciphering techniques provides a great improvement in the overall security of the proposed scheme.

Conclusion

This methodology makes the stored data available for use in the field of public health for the benefit of patients, while respecting legal security requirements.

Le texte complet de cet article est disponible en PDF.

Résumé

Position du problème

Pour conduire des études épidémiologiques multicentriques nationales ou internationales, il est souvent nécessaire de rapprocher des informations d’un même patient, provenant de plusieurs sources. En Europe, le chaînage des fichiers nominatifs, dans le cadre de la recherche médicale, est soumis à la directive européenne du 24 octobre 1995, qui requiert que l’information soit rendue anonyme avant son utilisation à des fins de chaînage. La méthodologie du hachage permet de résoudre le problème de l’anonymisation des données, notamment en santé. Par ailleurs, pour des raisons de sécurité, il est recommandé d’utiliser des clés différentes pour chaque étude. Malheureusement, cette recommandation est en contradiction avec les besoins de chaînage. L’objectif de cet article est de proposer une méthodologie innovante pour répondre à la fois aux exigences en matière de sécurité des informations médicales, tout en permettant le chaînage des données relatives à un même patient et leur exploitation statistique.

Méthodes

La méthode repose sur l’utilisation, pour le hachage, de la fonction secure hash algorithm (SHA), qui permet d’assurer l’anonymat des données personnelles, qui est combinée avec des techniques de chiffrement. L’originalité de la méthode réside dans la manière dont le hachage et le chiffrement sont combinés : comme dans les méthodes de chiffrement asymétrique, nous proposons l’utilisation de deux clés, mais avec une différence fondamentale puisqu’une des deux clés va dépendre de l’identité du patient.

Résultats

La combinaison du hachage et des techniques cryptographiques assure une amélioration importante dans la sécurité des données, tout en permettant le chaînage des données multicentriques.

Conclusion

Cette méthode rend disponibles les informations rendues anonymes et stockées dans des bases de données multicentriques nationales et internationales, pour une exploitation à des fins épidémiologiques et de recherche clinique. Cela, en respectant les exigences de sécurité imposées par les lois nationales et européennes.

Le texte complet de cet article est disponible en PDF.

Keywords : Security, Patient identification, Encryption, Hashing, Linkage, Multicenter studies, Anonymized data

Mots clés : Sécurité, Identification du patient, Chiffrement, Hachage, Chaînage de données, Études multicentriques, Chaînage, Données anonymisées


Plan


© 2008  Elsevier Masson SAS. Tous droits réservés.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 57 - N° 1

P. 33-39 - février 2009 Retour au numéro
Article précédent Article précédent
  • Étude Schizophrenia Outpatient Health Outcomes (SOHO) France : étude observationnelle à 36 mois d’une cohorte de patients schizophrènes ambulatoires traités par antipsychotiques
  • I. Gasquet, F. Chartier, S. Tcherny-Lessenot, J.-P. Lépine
| Article suivant Article suivant
  • Linking anonymous databases for national and international multicenter epidemiological studies: A cryptographic algorithm
  • C. Quantin, M. Fassa, G. Coatrieux, B. Riandey, G. Trouessin, F.A. Allaert

Bienvenue sur EM-consulte, la référence des professionnels de santé.

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.