Chaînage de bases de données anonymisées pour les études épidémiologiques multicentriques nationales et internationales : proposition d’un algorithme cryptographique - 09/02/09
Abstract |
Background |
Compiling individual records which come from different sources remains very important for multicenter epidemiological studies, but at the same time European directives or other national legislations concerning nominal data processing have to be respected. These legal aspects can be satisfied by implementing mechanisms that allow anonymization of patient data (such as hashing techniques). Moreover, for security reasons, official recommendations suggest using different cryptographic keys in combination with a cryptographic hash function for each study. Unfortunately, such an anonymization procedure is in contradiction with the common requirement in public health and biomedical research as it becomes almost impossible to link records from separate data collections where the same entity is not referenced in the same way. Solving this paradox by using methodology based on the combination of hashing and enciphering techniques is the main aim of this article.
Methods |
The method relies on one of the best known hashing functions (the secure hash algorithm) to ensure the anonymity of personal information while providing greater resistance to dictionary attacks, combined with encryption techniques. The originality of the method relies on the way the combination of hashing and enciphering techniques is performed: like in asymmetric encryption, two keys are used but the private key depends on the patient’s identity.
Results |
The combination of hashing and enciphering techniques provides a great improvement in the overall security of the proposed scheme.
Conclusion |
This methodology makes the stored data available for use in the field of public health for the benefit of patients, while respecting legal security requirements.
El texto completo de este artículo está disponible en PDF.Résumé |
Position du problème |
Pour conduire des études épidémiologiques multicentriques nationales ou internationales, il est souvent nécessaire de rapprocher des informations d’un même patient, provenant de plusieurs sources. En Europe, le chaînage des fichiers nominatifs, dans le cadre de la recherche médicale, est soumis à la directive européenne du 24 octobre 1995, qui requiert que l’information soit rendue anonyme avant son utilisation à des fins de chaînage. La méthodologie du hachage permet de résoudre le problème de l’anonymisation des données, notamment en santé. Par ailleurs, pour des raisons de sécurité, il est recommandé d’utiliser des clés différentes pour chaque étude. Malheureusement, cette recommandation est en contradiction avec les besoins de chaînage. L’objectif de cet article est de proposer une méthodologie innovante pour répondre à la fois aux exigences en matière de sécurité des informations médicales, tout en permettant le chaînage des données relatives à un même patient et leur exploitation statistique.
Méthodes |
La méthode repose sur l’utilisation, pour le hachage, de la fonction secure hash algorithm (SHA), qui permet d’assurer l’anonymat des données personnelles, qui est combinée avec des techniques de chiffrement. L’originalité de la méthode réside dans la manière dont le hachage et le chiffrement sont combinés : comme dans les méthodes de chiffrement asymétrique, nous proposons l’utilisation de deux clés, mais avec une différence fondamentale puisqu’une des deux clés va dépendre de l’identité du patient.
Résultats |
La combinaison du hachage et des techniques cryptographiques assure une amélioration importante dans la sécurité des données, tout en permettant le chaînage des données multicentriques.
Conclusion |
Cette méthode rend disponibles les informations rendues anonymes et stockées dans des bases de données multicentriques nationales et internationales, pour une exploitation à des fins épidémiologiques et de recherche clinique. Cela, en respectant les exigences de sécurité imposées par les lois nationales et européennes.
El texto completo de este artículo está disponible en PDF.Keywords : Security, Patient identification, Encryption, Hashing, Linkage, Multicenter studies, Anonymized data
Mots clés : Sécurité, Identification du patient, Chiffrement, Hachage, Chaînage de données, Études multicentriques, Chaînage, Données anonymisées
Esquema
Vol 57 - N° 1
P. 33-39 - février 2009 Regresar al númeroBienvenido a EM-consulte, la referencia de los profesionales de la salud.