Utilisation de l’algorithme EM pour estimer les paramètres du chaînage probabiliste d’enregistrements - 07/08/14
Résumé |
Introduction |
Le chaînage probabiliste d’enregistrements formalisé par Fellegi et Sunter est un des algorithmes les plus utilisés pour le chaînage par des traits d’identification nominatifs. Dans cet algorithme, à chaque trait est attribué un poids de concordance et un poids de discordance. La somme des poids de chaque trait permet de quantifier l’éventualité qu’un couple d’enregistrements concerne une même personne (à l’aide d’un seuil de décision). L’estimation de paramètres pour le calcul des poids (et du seuil) est rarement détaillée dans la littérature. Nous décrivons dans cette étude cette estimation par l’algorithme espérance maximisation (EM) ainsi que son évaluation.
Méthodes |
Les paramètres sont estimés par l’algorithme EM que nous avons implémenté sous R. Sur données simulées, nous avons comparé les paramètres observés et estimés, ainsi que les poids et le seuil calculés en utilisant ces deux types de paramètres. L’influence d’un éventuel biais sur la décision de chaînage a aussi été évaluée.
Résultats |
La simulation a été répétée 100 fois, les différences moyennes entre les valeurs estimées et observées correspondantes sont relativement mineures, elles vont de 2,05e-7 à 0,0092. L’utilisation de poids calculés par les paramètres observés ou estimés aboutit à la même décision de chaînage ; le choix du seuil de décision de chaînage est très légèrement perfectible.
Discussion |
L’estimation des paramètres est une étape cruciale pour le processus de chaînage probabiliste d’enregistrements, mais la méthode d’estimation est rarement décrite en détail. Cette étude permet de fournir dans le détail la méthodologie du chaînage probabiliste d’enregistrements.
Le texte complet de cet article est disponible en PDF.Mots clés : Chaînage probabiliste d’enregistrements, Algorithme EM, Traits d’identification, Estimation de paramètres, Simulation de données
Plan
Vol 62 - N° S5
P. S196 - septembre 2014 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?