Conception d’un algorithme permettant de détecter l’hésitation vaccinale anti-papillomavirus humain au sein de messages issus des réseaux sociaux - 15/09/20
Résumé |
Objectifs |
La France est un des pays où l’hésitation vaccinale anti-papillomavirus humain (HPV) est la plus forte au monde. Cette hésitation s’observe particulièrement sur les réseaux sociaux, où les internautes peuvent s’exprimer librement sur leur santé. L’amélioration de l’acceptabilité vaccinale anti-HPV passe par la compréhension des déterminants de l’hésitation. Un algorithme d’analyse sémantique capable d’identifier les messages exprimés sur les réseaux sociaux contenant une hésitation vaccinale anti-HPV permettrait d’analyser et de comprendre ce phénomène.
Méthode |
Dans le cadre du développement d’un outil de surveillance sanitaire de la vaccination sur les réseaux sociaux, appelé Evanex©, des messages associés à la vaccination anti-HPV ont été extraits à partir de 23 forums francophones entre 2006 et 2019. Une annotation binaire de ces messages (présence ou non d’hésitation) a été effectuée par trois annotateurs qui disposaient d’une charte d’annotation basée sur la définition de l’hésitation vaccinale de l’OMS. Le gold standard (GS) ainsi créé a été réparti en deux jeux de données : entraînement et validation. À partir du jeu d’entraînement, plusieurs variables ont été déterminées à l’aide de séquences de mots issues des messages (N-grams), de la présence des mots de champs lexicaux spécifiques (anti-vaccin, pro-vaccin, etc.) et du « word embedding » (représentation contextuelle des mots). Par la suite, pour mettre en place le modèle le plus performant quant à la détection de l’hésitation vaccinale, une recherche de la meilleure combinaison entre les différentes variables identifiées précédemment et différents classifieurs (« Support Vector Classification, Logistic Regression, Random Forest », etc.) a été effectuée. Le meilleur modèle a ensuite été validé par une prédiction de l’hésitation vaccinale sur le jeu de données de validation.
Résultats |
Au total, 1370 messages contenant une mention de vaccination anti-HPV ont été extraits et annotés : 497 présentaient une hésitation vaccinale et 891 une perception positive, négative ou neutre de la vaccination. Les jeux de données d’entraînement et de validation étaient composés respectivement de 1164 et 206 messages. Parmi les variables identifiées, 300 séquences différentes ont été retenues comme associés à une présence d’hésitation. Ces séquences sont composées d’un mot unique ou d’associations de deux ou trois mots telles que “savoir” ; “mère veut” ; “être vierge” ; “rapports sexuels”. Suite aux tests, le modèle choisi est un classifieur binaire « Random Forest » capable de prédire l’hésitation. Les messages classés par l’algorithme comme évocateur d’hésitation vaccinale exprime une réelle hésitation dans 91 % des cas (valeur prédictive positive) ; 84 % des messages d’hésitation vaccinale sont détectés par notre modèle (sensibilité).
Conclusion |
Développer un algorithme d’analyse sémantique capable d’identifier une hésitation vaccinale anti-HPV au sein de messages issus des réseaux sociaux pourrait se révéler être un nouvel outil d’aide à l’identification des déterminants de l’hésitation. Les performances de l’algorithme sur de nouvelles données démontrent que ce type d’outil est efficace pour identifier puis analyser les messages d’internautes exprimant une hésitation vaccinale anti-HPV. Ceci pourrait ouvrir la voie à l’instauration d’outils de monitoring de la vaccination sur les réseaux sociaux dans un objectif de santé publique.
Le texte complet de cet article est disponible en PDF.Plan
Vol 68 - N° S2
P. S75-S76 - septembre 2020 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.