Les données massives et le RMISP

RMTC

Volume 41-9, le 3 septembre 2015 : Données massives

Aperçu

Les données massives et le Réseau mondial d'information en santé publique (RMISP)

Dion M1, AbdelMalik P2, Mawudeku A2*

Affiliations

1 Schulich School of Family Medicine and Dentistry, Université de Western Ontario, London (Ontario)

2 Centre de mesures et d'interventions d'urgence, Agence de la santé publique du Canada, Ottawa (Ontario)

Correspondance

Abla.Mawudeku@phac-aspc.gc.ca

DOI

https://doi.org/10.14745/ccdr.v41i09a02f

Résumé

Contexte : La mondialisation et le risque de propagation rapide des maladies infectieuses émergentes ont rendu de plus en plus nécessaires la surveillance continue et la détection précoce de ces maladies. Le Réseau mondial d'information en santé publique (RMISP) a été établi pour améliorer la connaissance de la situation et accroître la capacité de détection précoce des événements de santé publique émergents.

Objectif : Décrire comment le RMISP utilise les données massives comme technique efficace de détection précoce des éclosions de maladies infectieuses et déterminer les orientations futures possibles pour le RMISP.

Constatations : Chaque jour, le RMISP analyse plus de 20 000 nouvelles en ligne (provenant de plus de 30 000 sources) en neuf langues dans le monde entier. Un programme sur Internet compile les données à partir d'un algorithme qui repère les signaux potentiels d'événements de santé publique émergents, lesquels sont ensuite examinés par une équipe multilingue et pluridisciplinaire. Une alerte est envoyée si un risque potentiel est détecté. Ce processus a fait ses preuves durant l'éclosion du syndrome respiratoire aigu sévère (SRAS) et a été adopté peu après par un certain nombre de pays afin de satisfaire au nouveau Règlement sanitaire international, qui exige que chaque pays soit capable de détecter et de signaler de façon précoce les maladies. Le RMISP a repéré l'éclosion précoce de SRAS en Chine, s'est vu attribuer le mérite de la première détection du coronavirus du syndrome respiratoire du Moyen-Orient (CoV-SRMO), et a joué un rôle important dans le suivi de l'éclosion du virus Ebola en Afrique occidentale. De futures évolutions sont envisagées pour faire progresser la capacité du RMISP à tirer parti d'autres sources de données massives, telles que les médias sociaux, ainsi que sa capacité analytique en matière d'élaboration d'algorithmes.

Conclusion : L'adoption précoce des données massives par le RMISP a permis d'accroître la capacité mondiale à détecter les éclosions internationales de maladies infectieuses et les autres événements de santé publique. L'intégration de sources supplémentaires de données massives et les progrès en matière de capacité analytique pourraient renforcer encore davantage la capacité du RMISP à détecter les maladies et à lancer l'alerte rapidement.

Introduction

Avec l'avancée de la mondialisation, les maladies transmissibles et les événements de santé publique émergents se propagent de plus en plus rapidement. Par conséquent, leur surveillance continue et leur détection précoce sont encore plus importantes pour prévenir ou atténuer la propagation internationale des maladies infectieuses et pour laisser aux pays le temps nécessaire pour s'y préparer et y faire face. Les données massives désignent des ensembles de données extrêmement volumineux provenant de sources telles que les médias sociaux ou les journaux, qui nécessitent des méthodes de calcul puissantes pour révéler des tendances, des schémas ou des prédictions de probabilité d'un événementNote de bas de page 1Note de bas de page 2. Les données massives sont utilisées pour optimiser les processus de vente et d'affaires, orienter les échanges de joueurs entre les équipes sportives, ou encore améliorer l'urbanisme. Elles deviennent rapidement essentielles à divers aspects de la santé, allant de l'administration des soins de santé à l'application Suivi de la grippe de Google et à la pharmacosurveillanceNote de bas de page 3.

Le Canada a été l'un des premiers à adopter les données massives pour le repérage initial des infections émergentes, et ce, dès 1997 avec la mise en place du Réseau mondial d'information en santé publique (RMISP), fruit d'un effort de coopération entre (à l'époque) Santé Canada et l'Organisation mondiale de la Santé (OMS)Note de bas de page 4Note de bas de page 5. Le RMISP continue à être géré par l'Agence de la santé publique du Canada (l'Agence) et rassemble un réseau mondial de professionnels de la santé publique et d'organisations (p. ex. ministres de la Santé) dans une optique de connaissance de la situation et de détection précoce des événements de santé publique émergents. Le RMISP s'appuie sur un système automatique sur Internet qui parcourt les journaux et les autres communications dans le monde entier pour repérer les indicateurs potentiels (ou « signaux ») d'éclosions, qui sont ensuite analysés et rapidement évalués par une équipe multilingue et pluridisciplinaire à l'Agence. Lorsqu'un risque est détecté, les analystes diffusent les renseignements pertinents et alertent les hauts fonctionnaires et les intervenants pour que ceux-ci prennent une décision. Bien qu'il ait été initialement conçu pour repérer les éclosions de maladies transmissibles, le système est également utilisé pour surveiller les dangers chimiques et radionucléaires potentielsNote de bas de page 4Note de bas de page 6.

Le présent article a pour objectif de décrire le fonctionnement du RMISP dans le contexte des données massives, de l'illustrer par des exemples récents du RMISP en action et d'explorer les possibles orientations futures.

Le RMISP et les données massives

Les données massives sont définies par trois V : volume, vitesse et variétéNote de bas de page 7Note de bas de page 8. Le volume décrit la quantité de données recueillies, la vitesse correspond à la fréquence à laquelle les données sont recueillies et diffusées, et la variété désigne la multiplicité des sources utilisées pour compiler les donnéesNote de bas de page 7.

Le volume et la variété du RMISP sont illustrés par l'utilisation de fonctions de recherche et d'agrégateurs de nouvelles (sociétés donnant accès à des milliers de sources d'actualité dont le contenu est automatiquement indexé) qui rassemblent de grandes quantités d'ensembles de données provenant de multiples sources différentes. Une application sur Internet du système du RMISP balaye et analyse en continu les sources de nouvelles acquises en neuf langues (arabe, anglais, persan, français, portugais, russe, chinois simplifié, espagnol et chinois traditionnel)Note de bas de page 4. La quantité de données générées dépend des critères, des variables et des algorithmes définis pour les agrégateursNote de bas de page 6. Ces algorithmes repèrent les signaux potentiels d'événements de santé publique émergents et filtrent les données non pertinentes considérées comme du « bruit » (Figure 1)Note de bas de page 7. Chaque jour, en moyenne, le RMISP traite 3 000 nouvellesNote de bas de page 9. Le volume augmente lorsque les sources d'actualité élargissent leur couverture des événements de santé publique émergents, comme dans le cas de la récente éclosion du virus Ebola en Afrique occidentale.

Figure 1 : Le flux d'information dans le processus du RMISP

Figure 1 : Le flux d'information dans le processus du RMISP

Description textuelle : Figure 1

Figure 1 : Le flux d'information dans le processus du RMISP

Ce diagramme décrit le flux d'information dans le processus du RMISP. Il y a trois encarts verticaux sur le côté gauche du diagramme. Le premier encart comporte la mention « Collecte des données ». À droite de cet encart se trouve une image contenant de nombreux mots, tels que « nouvelles-chocs, médias et gros titres », qui rentrent dans le haut d'un entonnoir. Le deuxième encart comporte la mention « Traitement des données et évaluation par les analystes ». À droite de cet encart, en dessous des nombreux mots, est représenté un grand entonnoir à l'extérieur duquel est inscrit « Élimination de la duplication, métadonnées, catégorisation, traduction et pertinence ». Le troisième encart comporte la mention « Transformation des renseignements en avis d'alerte ». À droite de cet encart, en dessous de l'entonnoir, se trouvent trois piles de papiers.


Le RMISP dispose d'une abondante variété de sources de données. Les agrégateurs de nouvelles du RMISP s'appuient sur une grande diversité de journaux nationaux et locaux et de bulletins d'information provenant du monde entierNote de bas de page 4Note de bas de page 6. Les journaux et bulletins d'information locaux sont balayés, car les événements émergents peuvent être un phénomène localisé et sont souvent mentionnés dans les publications communautaires. Diverses rubriques des publications d'actualité (sports, voyages et finances) sont également surveillées, car elles peuvent signaler un événement de santé publique émergent. Une lecture en plusieurs langues est effectuée afin de repérer les événements de santé publique qui ne sont pas signalés dans les nouvelles en anglaisNote de bas de page 10.

Après application des algorithmes au sein du système du RMISP, environ 60 % des données (1 800 nouvelles) sont considérées comme des événements de santé publique pertinents aux fins d'évaluation. Les analystes du RMISP parcourent ces actualités pour repérer les événements pouvant avoir des répercussions et émettre des alertes aux fins de prise de décision par les intervenants. Ont accès au système du RMISP les organismes qui ont la responsabilité de surveiller, contrer et/ou atténuer les menaces de santé publique émergentes. Le RMISP réunit des ministères de la santé, d'autres ministères et organismes gouvernementaux, des organisations internationales et non gouvernementales, ainsi que des sociétés privées.

La capacité du RMISP sur le plan de la vitesse est impressionnante. Il fonctionne en temps quasi réel, 24 heures sur 24 et 7 jours sur 7Note de bas de page 4. Le système du RMISP récupère des données pertinentes auprès des agrégateurs de nouvelles toutes les 15 minutes et est capable d'achever le traitement (y compris la traduction) des données en moins d'une minuteNote de bas de page 9.

Le RMISP en action

Détection précoce

Le RMISP s'est avéré une ressource efficace pour la détection précoce des éclosions de maladies infectieuses. Son utilité a été initialement démontrée pendant l'éclosion du syndrome respiratoire aigu sévère (SRAS) en 2003, lorsque les premières alertes ont été lancées dans les actualités des journaux chinois. La première nouvelle en anglais concernant une éclosion atypique en Chine a été mentionnée par une société pharmaceutique dans la rubrique financière d'un journal qui avait fait état d'une hausse des ventes de médicaments antivirauxNote de bas de page 11. Cela a permis non seulement de signaler l'émergence de l'éclosion, mais également de fournir des renseignements supplémentaires sur l'utilisation locale des antiviraux pour contenir la propagation du virus.

À la suite de l'éclosion de SRAS, l'importance de l'utilisation des médias d'actualité en complément des systèmes nationaux de surveillance de santé publique plus traditionnels a été reconnue par l'OMS et ses États membresNote de bas de page 12Note de bas de page 13. L'éclosion de SRAS a abouti à des révisions du Règlement sanitaire international (RSI)Note de bas de page 14 exigeant que les pays signalent et contrôlent les éclosions potentiellement préoccupantes au niveau international afin de renforcer la sécurité mondiale en matière de santé publique. Le Règlement note que l'OMS peut tenir compte de rapports émanant de sources autres que les notifications et les consultations officielles dans son évaluation d'un événement de santé publique potentiel émergentNote de bas de page 14. Après l'éclosion de SRAS, de nombreux pays ont adopté le RMISP dans le but d'élargir leur capacité de surveillanceNote de bas de page 4Note de bas de page 15.

Au fil des ans, le RMISP a continué à détecter les signaux précoces d'éclosions préoccupantes à l'échelle internationale, comme la grippe pandémique pH1N1 en 2009Note de bas de page 16. Les premiers rapports en espagnol à ce sujet faisaient état d'une éclosion d'une maladie respiratoire inhabituelle dans l'État de Veracruz, au Mexique, qui avait provoqué deux décès.

En avril 2012, le RMISP a repéré huit cas d'une maladie respiratoire inconnue et un décès en Jordanie. Le RMISP a envoyé une alerte pour informer ses partenaires, incluant l'OMS, de ces cas. Suite à une enquête plus poussée et les résultats d'une analyse rétrospective de laboratoire, une éclosion du coronavirus du syndrome respiratoire du Moyen-Orient (désormais appelé CoV-SRMO) fut confirmée. Un avis du RSI fut publié en novembre 2012. Le RMISP s'est vu attribuer le mérite d'avoir été le premier à détecter ce virus.

Surveillance en continu

Le RMISP s'est avéré utile aussi bien pour la détection précoce que pour la surveillance en continu. La surveillance en continu des événements est cruciale pour bien connaître la situation, en ce qui concerne l'évolution d'une éclosion et les stratégies d'intervention et d'atténuation mises en œuvre par les communautés locales, nationales et internationales. Parmi les exemples de connaissance de la situation en matière de stratégies d'atténuation, on peut citer la capacité du RMISP à repérer les annulations de vols ou de croisières, les nouveaux avis aux voyageurs, les procédures de dépistage sanitaire aux frontières ou les interdictions commerciales. Ce processus a été beaucoup plus efficace que de communiquer individuellement avec les sociétés de transport commercial, les agences de voyage et les aéroports.

Par exemple, pendant la grippe pandémique H1N1, le RMISP a été utilisé comme source de renseignements par l'Organisation mondiale du commerce afin de surveiller l'ampleur et l'effet des interdictions commercialesNote de bas de page 17. De même, durant l'intervention récente contre l'éclosion du virus Ebola en Afrique occidentale, le RMISP a permis de connaître la situation sur le plan des annulations de vol, des avis aux voyageurs et des procédures de dépistage sanitaire aux frontières.

Prochaines étapes

Nouvelles sources de données potentielles

Internet, le courrier électronique, les téléphones intelligents et les médias sociaux se sont développés rapidement depuis la création du RMISP. Par conséquent, de nouvelles sources potentielles de données massives ont émergé qui peuvent être analysées pour détecter les signaux précoces d'éclosions de maladies infectieuses. Les médias sociaux (tels que Twitter et Facebook) ont enregistré une croissance exponentielle au cours des dix dernières années, et ces plateformes créent d'énormes quantités de contenu et de données générés par les utilisateursNote de bas de page 18.

Ces divers médias sociaux constituent de nouvelles sources de données potentielles pour le RMISP. De plus, d'autres organisations ont commencé à exploiter les ressources des médias sociaux pour améliorer la surveillance des maladiesNote de bas de page 18. Par exemple, l'application Suivi de la grippe de Google surveille les comportements de recherche en ligne pour détecter des signes précurseurs de la grippeNote de bas de page 19 des chercheurs ont utilisé Facebook pour contribuer à prévoir les résultats en matière de santé au niveau de la population localeNote de bas de page 20 Twitter a été utilisé comme une vaste source de données pour surveiller les tendances de la santé pendant une éclosion de grippe aviaireNote de bas de page 21 et les téléphones cellulaires ont servi à mesurer les schémas de mobilité humaine dans le contexte de la transmission du paludisme dans les pays en développementNote de bas de page 22.

Les médias sociaux ont contribué à l'amélioration des interventions d'urgence en permettant de saisir des données en temps réel sur la santé des communautésNote de bas de page 23 et la réaction du public à un événementNote de bas de page 24. Par exemple, l'utilisation de téléphones intelligents et de Twitter au Nigeria pendant l'éclosion d'Ebola en Afrique occidentale a aidé à repérer une éclosion dans une nouvelle région trois jours avant qu'elle soit annoncée par l'OMSNote de bas de page 25.

Au nombre des autres nouvelles applications figurent les systèmes d'externalisation à grande échelle, qui saisissent les symptômes soumis de façon volontaire par le grand public à l'aide d'Internet ou des réseaux de téléphone cellulaire et qui les compilent rapidement et fournissent un retour sur ces données en temps quasi réel. Ces systèmes ont été utilisés par des applications participatives de surveillance des maladies infectieuses telles que Flu Near YouNote de bas de page 26 et DoctorMeNote de bas de page 27.

Cependant, l'utilisation des médias sociaux comme sources de données pose quelques problèmes inhérents. L'une des principales difficultés associées aux données massives en général et au contenu des médias sociaux en particulier est le « rapport signal/bruit » qui peut augmenter considérablement le nombre potentiel de faux positifs et de faux négatifs. Avec l'abondance de discussions et de gazouillis autour de l'éclosion du virus Ebola en Afrique occidentale, par exemple, il était difficile de faire la distinction entre les véritables signaux préoccupants et la pléthore de messages à laquelle on pourrait autrement s'attendre pendant un tel événement. En outre, certains médias sociaux, notamment les gazouillis qui sont limités à 140 caractères, peuvent ne pas fournir assez d'information contextuelle pour permettre de repérer un signal fiableNote de bas de page 28.

Une autre difficulté associée à l'utilisation des médias sociaux est la représentativité. Tout le monde n'a pas accès à un téléphone intelligent et, par conséquent, les données des plateformes de médias sociaux ne peuvent refléter que la partie de la population qui en utilise unNote de bas de page 28. La technologie mobile se répand considérablement, ce qui pourrait contribuer à résoudre les préoccupations relatives à la représentativitéNote de bas de page 29.

Enfin, l'utilisation des médias sociaux soulève des considérations éthiques associées aux droits des individus, notamment des problèmes liés à la protection des renseignements personnelsNote de bas de page 2.

Amélioration de l'analyse des données

Le RMISP pourrait non seulement élargir ses sources de données, mais également faire progresser ses capacités d'analyse des données. Des méthodes avancées de calcul et de vérification pour améliorer la sensibilité et la spécificité des signaux détectés sont actuellement envisagéesNote de bas de page 30. La question de savoir si un meilleur traitement des données pourrait réduire la nécessité d'avoir recours à une équipe multilingue et pluridisciplinaire est également à l'étude. Le RMISP évalue et perfectionne en permanence les agrégateurs et les algorithmes utilisés, ce qui pourrait potentiellement aboutir à des formes plus avancées d'intelligence artificielle. La poursuite de l'amélioration de la capacité analytique du RMISP permettra la gestion, l'intégration, l'analyse et l'interprétation solides de volumes de données de plus en plus importants et complexesNote de bas de page 31.

Conclusion

Le Réseau mondial d'information en santé publique du Canada a été parmi les premiers à adopter les données massives et, en tant que ressource mondiale en continu, il aide les pays à satisfaire les exigences en matière de capacité de surveillance des événements pour la détection précoce et le signalement des éclosions de maladies infectieuses et des autres événements préoccupants à l'échelle internationale. Les progrès continus des données massives, notamment l'utilisation des médias sociaux et des téléphones intelligents, ainsi que les améliorations de la capacité d'analyse constituent des occasions de renforcer encore davantage le RMISP. Dans l'ensemble, les approches fondées sur les données massives sont devenues une composante essentielle des efforts en matière de santé publique à l'échelle locale, nationale et internationale pour détecter, signaler et contrôler les éclosions émergentes.

Remerciements

Nous souhaitons remercier toute l'équipe du RMISP. Le Réseau doit son succès à leur travail assidu, à leur dévouement et à leur constante collaboration. Leur soutien et leurs conseils ont été grandement appréciés et ont fortement contribué à la rédaction de cet article.

Conflit d’intérêts

Aucun.

Financement

Le RMISP est financé par l'Agence de la santé publique du Canada.

Détails de la page

Date de modification :