SlideShare une entreprise Scribd logo
ÉCOLE NATIONALE D’ADMINISTRATION PUBLIQUE
L’UTILISATION DES DONNÉES DE SANTÉ EN RECHERCHE AU QUÉBEC À L’ÈRE DU
NUMÉRIQUE : RÉFLEXIONS SUR LA NOTION DE DONNÉES DE SANTÉ ET SUR LE
BESOIN DE POLITIQUES INFORMATIONNELLES
TRAVAIL PRÉSENTÉ À MONSIEUR DANIEL J. CARON
COMME EXIGENCE PARTIELLE DU COURS
ENP7834 – DESIGN INFORMATIONNEL, ADMINISTRATION PUBLIQUE
ET NUMÉRIQUE
PAR
CATHERINE ARMAND
GENEVIEVE DAVID
VALÉRIE SIRARD
23 AVRIL 2018
2
TABLE DES MATIÈRES
1. INTRODUCTION ..............................................................................................................3
2. PROBLÉMATIQUE...........................................................................................................4
3. ÉLÉMENTS DE CHANGEMENT AVEC L’ARRIVÉE DU NUMÉRIQUE ..................5
4. ENJEUX DE CES CHANGEMENTS FACE AU NUMÉRIQUE ....................................6
4.1. Enjeux de qualité.........................................................................................................7
4.2. Enjeux de quantité.......................................................................................................9
4.3. Enjeux d’interprétabilité............................................................................................10
4.4. Enjeux de protection des renseignements personnels et de la vie privée..................11
5. RÉPERCUSSIONS SUR NOTRE FONCTIONNEMENT INSTITUTIONNEL ET PISTES
DE SOLUTION .......................................................................................................................12
5.1. Pistes de solution sur les enjeux de qualité ...............................................................13
5.2. Pistes de solution sur les enjeux de quantité .............................................................14
5.3. Pistes de solution sur les enjeux d’interprétabilité ....................................................15
6. CONCLUSION.................................................................................................................16
7. RÉFÉRENCES .................................................................................................................17
8. ANNEXES........................................................................................................................20
9. NOTES .............................................................................................................................24
3
1. INTRODUCTION
Selon le Comité d’experts sur l’accès en temps opportun aux données sur la santé et sur les
conditions sociales pour la recherche sur la santé et l’innovation du système de santéi : « [l]a
recherche en matière d’innovation, de santé et de bien-être social est essentielle pour que le
système de soins de santé donne les meilleurs résultats possibles » (Conseil des académies
canadiennes, 2016, p. xiii).
La recherche en santé peut avoir de multiples finalités, que ce soit d’améliorer la gestion des
établissements (ex.: évaluer le délai entre un diagnostic et un traitement), ou rehausser la qualité
des décisions cliniques, en plus de favoriser le développement de nouvelles technologies,
notamment l’intelligence artificielle, pouvant faciliter la pose de certains diagnostics et le choix
du traitement le plus approprié.
Se pose alors la question de l’accès aux données de santé, car certains travaux de recherche ne
sont possibles que si les chercheurs ont accès à ces ressources informationnelles à la fois de
qualité, disponibles en quantité suffisante et ne laissant que peu de place à l’interprétation. Le
Canada en général et le Québec en particulier jouissent d’un atout indéniable à cet égard
puisqu’ils sont dotés d’un système de santé public et universel. Par conséquent, la gestion des
données de santé devrait être plus facile à encadrer puisque les actes médicaux sont pour la
plupart colligés dans les registres de l’État.
Des données de santé sont générées à chaque interaction entre un usager du système de la santé
et un professionnel (médecin, infirmière, technicien de laboratoire, pharmacien, etc.).
Traditionnellement, ces données étaient colligées dans des dossiers sur support papier détenus
par les différents professionnels et entreposés aux archives d’un hôpital ou d’un bureau privé.
Avec l’arrivée de certaines technologies comme l’ordinateur de bureau et la numérisation, ces
mêmes dossiers ont parfois été transférés sur un support électronique. Dans tous les cas, la
finalité recherchée était le suivi d’un usager en particulier et non la création de données de santé
dans un format permettant une utilisation secondaire de celles-ci à des fins de recherche. Mêmes
dans les initiatives récentes, l’accent est mis sur le suivi de l’usager, comme en témoigne le
4
Dossier Santé Québec (DSQ), qui a été implanté progressivement depuis 2013 au Québec
(Ministère de la Santé et des Services sociaux, 2013)ii.
Bien que la visée du DSQ soit essentiellement une prise en charge et un suivi des usagers plus
efficaces par les professionnels de la santé, n’aurait-il pas été opportun lors de son
développement de penser à l’utilisation secondaire des données collectées à des fins de
recherche? En effet, ce type d’usage secondaire des données ne semble pas avoir été considéré
dans ce projet de virage technologique.
Dans un contexte numérique, la nature des données de santé ne change pas, mais la façon de les
créer et de les consigner subit des transformations majeures qui pourraient multiplier les
capacités d’exploitation de ces données à des fins de recherche.
Le présent travail aura pour objet les enjeux et possibilités liés à la création des données de santé
dans un contexte numérique dans l’optique de faciliter leur exploitation en matière de recherche.
Par ailleurs, il ne visera pas les procédures d’accès aux données de santé à des fins de recherche,
processus souvent dénoncés parce qu’étant longs et complexes. Enfin, bien que ce soit un enjeu
incontournable, le présent travail ne fera que survoler les questions relatives à la protection des
renseignements personnels et de la vie privée dans le contexte de la recherche en santé puisque
cela aurait pu être un sujet d’étude en soi.
2. PROBLÉMATIQUE
La recherche en santé, que ce soit pour l’amélioration des traitements offerts aux patients ou pour
augmenter l’efficience du système de santé, requiert des données brutes de qualité. Toutefois, la
disponibilité des données et la qualité de celles-ci sont problématiques et représentent un enjeux
de taille pour les chercheurs (Maroun, Durand-Zaleski, Nachbaur, Maunoury, & Benjamin,
2016). À défaut d’avoir accès à des données individuelles car l’accès est difficile, certains
chercheurs ont recours aux données agrégées, particulièrement au Québec où les établissements
québécois n’ont accès qu’à leurs propres données, ne permettant pas de comparaison avec
d’autres établissements québécois ou canadiens (Conseil des académies canadiennes, 2016). De
5
plus, les données médico-administratives sont difficilement accessibles tel que dénoncé par
plusieurs chercheurs et institutions (Beaulieu & Roy, 2018).
Les développements technologiques permettent la création d’outils novateurs offrant de
nouvelles possibilités en termes d’utilisation et d’exploitation des données. Dans le domaine
médical, le numérique s’est bien implanté comme le démontrent les récents dossiers de santé
électroniques maintenant généralement utilisés. Toutefois, il importe de faire les bons choix afin
d’exploiter au maximum cette technologie afin qu’elle soit réellement créatrice de plus-value,
notamment en matière de création et d’accessibilité des données de santé à des fins de recherche.
3. ÉLÉMENTS DE CHANGEMENT AVEC L’ARRIVÉE DU NUMÉRIQUE
L’arrivée du numérique entraîne des changements majeurs, notamment au niveau de la quantité
des données disponibles et des capacités de traitement accrues de celles-ci (Hall & Pesenti,
2017). En effet, le numérique et ses développements récents ont mené à la création d’une
quantité incalculable de données, que l’on définit d’ailleurs dorénavant en terme de
mégadonnées (big data en anglais). L’accroissement de la population et l’augmentation du
nombre d’examens effectués, et leurs données propres particulièrement en imagerie médicale,
augmentent de manière exponentielle la quantité de données générées et à gérer.
Par ailleurs, si les capacités de traitement de l’information se sont accrues, les multiples formats
des données les rendent parfois difficilement utilisables, notamment lorsqu’il s’agit de formats
ou de supports que la technologie actuelle ne permet plus d'utiliser (Gauthier, 2006). La
recherche en santé requiert dans certains cas la mise en commun de plusieurs ensembles de
données afin d'obtenir des résultats statistiquement valables. Par exemple, certaines recherches
visent à cerner le rôle de divers facteurs sur la santé des individus, ce qui nécessite le partage de
plusieurs sources d’information et la collaboration de plusieurs acteurs de différents milieux (ex:
étude sur l’impact de l’utilisation des transports en commun sur le poids et l’obésité). Ces
éléments doivent amener les organisations à revoir leurs pratiques entourant la gestion de
l’information, et ce dans un contexte présentant divers enjeux comme la quantité, la qualité et
l’interprétabilité des données de santé.
6
4. ENJEUX DE CES CHANGEMENTS FACE AU NUMÉRIQUE
Au regard de ces changements, il appert que la création des données de santé, qu’elles soient
individuelles ou médico-administratives, est un enjeu crucial permettant d’effectuer, par une
utilisation secondaire, des recherches de qualité. En effet, les données de santé sont les
ressources informationnelles essentielles qui, si elles sont de qualité et en quantité suffisante,
permettent aux chercheurs d’effectuer un travail efficace. Il importe d’abord de bien définir en
quoi consistent ces ressources informationnelles. Selon les Instituts de recherche en santé du
Canada, celles-ci, compte tenu de leurs sources et de leurs formes multiples, se déclinent en
plusieurs catégories (nous ne retenons que les pertinentes pour la présente étude):
● “Données de la recherche en santé : S'entendent des données découlant d'études scientifiques menées
dans tous les domaines de la recherche en santé et requises pour valider les résultats. Cela comprend tant
les données humaines (p. ex. issues d'essais contrôlés randomisés) que non humaines.
● Données sur le système de santé : S'entendent des données concernant l'état de santé officiel des
personnes (p. ex. le bien-être et les problèmes de santé), le fonctionnement du système de santé (p. ex. son
accessibilité et son efficacité) et les caractéristiques du système de santé. Les données administratives, les
données cliniques et les données sur la santé des populations en sont des exemples.
● Données sur la santé des populations : Un type de données sur le système de santé qui comprend les
données sur les facteurs sociaux, culturels et environnementauxqui influent sur la santé des populations et
que permettent de recueillir des enquêtes sur la santé, des systèmes de surveillance de la santé publique et
des études longitudinales.
● Données liées à la santé : Données sur les déterminants non médicaux de la santé tels que les
comportements, les conditions de vie et de travail, les ressources personnelles et les facteurs
environnementaux.
● Données sur les sciences sociales : Un type de données liées à la santé qui comprend les données sur la
société humaine et les relations sociales telles que les comportements par rapport à la santé, les conditions
de vie et de travail, les ressources personnelles et les facteurs environnementaux.” (Gouvernement du
Canada, 2017).
Au regard de ces définitions, les enjeux de qualité, de quantité et d’interprétabilité de ces
ressources informationnelles seront analysés à la lumière des finalités de la recherche
scientifique. L’enjeu de la protection de la vie privée, qui impose des contraintes à tous les
niveaux de traitement des données (collecte, utilisation, couplage, etc.), sera brièvement abordé
7
en fin de chapitre. En effet, bien que cet enjeu soit primordial, il aurait pu faire l’objet d’une
analyse en soi vu sa complexité et les questions éthiques et juridiques qu’il pose.
4.1. Enjeux de qualité
Selon le Comité d’experts en santé, la recherche en matière de santé « dépend de la disponibilité
de données de grande qualité » (Conseil des académies canadiennes, 2016). Il est en effet
incontestable que dans un contexte de recherche scientifique qui exige des résultats probants, la
qualité des données utilisées dans le processus soit très importante. La qualité des données revêt
plusieurs attributs, notamment la fiabilité, la pertinence, la représentativité, l’utilisabilité et
l’accessibilité en temps opportun.
D’abord, les données doivent être fiables, car leur utilisation viendra directement influencer les
résultats de la recherche. La fiabilité des données dépend à la fois de la personne qui les consigne
et de la façon dont elle le fait. Puisqu’il n’est pas question ici d’aborder la déontologie des
acteurs du secteur de la santé, il faut donc plutôt s’attarder aux normes qui encadrent (ou pas) la
création des données. Par exemple, nous pouvons nous demander quelles données doivent être
collectées, sous quelle forme, pour quelle période, etc. À certains égards, la configuration même
des systèmes informatiques pourra influencer la fiabilité des données comme les autorisations
d’accès, de partage, d’édition, etc.
En deuxième lieu, il importe que les données de santé soient pertinentes au moment de la
collecte et dans le futur. À cette fin, une réflexion préalable, devant continuellement être mise à
jour, s’impose. En fait, la pertinence des données s’évalue au regard des finalités de recherche
poursuivies dans l’espace présent et dans les hypothèses que nous nous faisons du futur. Il
importe donc de se questionner sur les angles de recherche qui seront explorés et d’anticiper la
survenance de certaines problématiques. Par exemple, il sera extrêmement difficile pour les
chercheurs d’évaluer aujourd’hui l’incidence des néonicotinoïdes (« pesticides tueurs
d’abeilles ») sur la santé humaine si cette problématique n’a jamais été appréhendée et qu’aucune
donnée permettant d’évaluer cette relation n’a été consignée au cours des années précédentes.
8
Ensuite, l’enjeu de la représentativité des données se pose. En effet, les moyens technologiques,
les compétences et la volonté d’utiliser à meilleur escient les nouvelles technologies ne sont pas
les mêmes partout. Il est donc important que cette utilisation inégale de la technologie ne vienne
pas fausser la fiabilité des données de santé au regard de leur représentativité. Par exemple, si
une région du Québec accuse du retard au niveau du déploiement du dossier de santé
électronique et que par conséquent, certaines données de cette région ne sont pas colligées, cela
pourrait avoir un impact direct sur la qualité des données globales et le portrait de la situation qui
sera dressé.
En ce qui concerne l’utilisabilité des données, cet enjeu se pose au regard du grand nombre de
données disparates et devant l’absence de standards encadrant la forme que celles-ci doivent
prendre. Le Comité d’experts en santé soulignait dans son rapport qu’il existe deux types de
données: les données structurées et les non structurées. Les données structurées consistent en des
« données élémentaires [qui] peuvent être facilement entrées dans des formats standards et
manipulées par des bases de données automatisées » (Conseil des académies canadiennes, 2016).
Pour leur part, les données non structurées « ne possèdent pas de structure commune
identifiable » (Conseil des académies canadiennes, 2016). Les renseignements qui se retrouvent
par exemple consignés à la main dans des dossiers papier ou sur des formulaires, bien que
pouvant être extrêmement utiles, sont très difficiles à exploiter à grande échelle. Beaucoup de
temps et d’argent doivent être consacrés à l’examen des dossiers afin que ces données puissent
être utilisables à des fins de recherche. La question de l’utilisabilité des données, plutôt technique
parce que faisant référence à des concepts technologiques, est néanmoins essentielle pour
permettre l’exploitation des données à un coût qui ne soit pas rédhibitoire.
Enfin, les données de santé ne pourront pas être de qualité si elles ne sont pas accessibles en
temps opportun. En effet, l’accès aux données de santé en temps opportun est un facteur essentiel
permettant une utilisation efficiente de celles-ci. Le Comité d’experts en santé mentionnait
d’ailleurs à ce sujet que « les longs retards dans l’accès aux données peuvent nuire à l’efficacité
de la recherche et à la pertinence des conclusions et, en fin de compte, se traduire par la perte
d’occasions de créer des bienfaits pour le public » (Conseil des académies canadiennes, 2016).
Sur la scène internationale, pensons notamment aux épidémies récentes de maladies comme la
9
maladie à virus Ebola qui ont requis la mobilisation de la communauté scientifique internationale
afin de mener rapidement des études sur des vaccins ou autre remèdes efficaces. Ici comme
ailleurs, l’accès en temps opportun aux données se heurte aux multiples procédures d’accès et
d’échange d’information qui peuvent parfois s’avérer longues et complexes, notamment au
Québeciii.
4.2. Enjeux de quantité
Chaque interaction entre un usager du système de santé et un professionnel produit des données.
Toutefois, les progrès technologiques ont fait exploser leur volume et leur variété (Thiebaut,
2016). Ce problème relié à la quantité de données disponibles se pose en santéiv, mais également
dans d’autres domaines comme la sociologie, les sciences sociales ou environnementalesv.
Selon le rapport du Comité d’experts en santé, « la quantité mondiale d’information numérique
devrait augmenter de 300 fois entre 2005 et 2020, passant de 130 à 40 000 exaoctets (ou 5 200
gigaoctets pour chaque habitant de la planète), avec un doublement tous les deux ans (Conseil
des académies canadiennes, 2016). » Selon ce même comité, le tiers de ces données pourraient
être analysées et corrélées avec des données médicales, sociologiques ou tirées d’études
distinctes pour générer de nouveaux résultats intéressants. Toutefois, il appert que les données
complémentaires aux données de santé, comme par exemple les données environnementales ou
administratives, sont encore plus dispersées et variées que les données de santé, ce qui représente
un double défi pour la recherche (Conseil des académies canadiennes, 2016).
Pour exploiter ces données disparates, non harmonisées et sous-utilisées, les chercheurs font
appel à des outils (algorithmes) d’analyse des mégadonnées, c’est-à-dire, les données non
structurées appelées également « données massives ». Le big data, littéralement « grosses
données », se définit par Gartner comme suit: « Big data is high-volume, high-velocity and/or
high-variety information assets that demand cost-effective, innovative forms of information
processing that enable enhanced insight, decision making, and process automation » (Gartner,
2018).
10
Parmi les mégadonnées se trouvent les données provenant des bases médico-administrativesvi,
fiables et facilement utilisables, les données provenant de cohortes (Thiebaut, 2016)vii, les
données d’études cliniques (données recueillies lors du développement de vaccins par exemple),
et celles provenant des objets de santé connectés. Ces dernières sont stockées dans le nuage par
des organismes publics, mais aussi par des géants de l’industrie du sport ou par des
multinationales du GAFAMviii et autres. Ces quantités astronomiques et sans cesse grandissantes
de données disparates nécessitent des outils et des techniques standardisées pour être interprétées
et utilisées scientifiquement (Chen, 2012).
L’analyse des mégadonnées est fréquente dans certains domaines comme la finance ou la
politique, mais moins fréquente dans le domaine de la santé, plus particulièrement pour des
raisons éthique et de sécurité des données (anonymisation des données, enjeux de sécurité
résultant du partage de ces données). Mais ces défis liés à la sécurité ne doivent pas, pour
certains, constituer un frein à la recherche car l’étude de sources diverses permettrait de dégager
des corrélations pertinentes qu’il serait impossible d'obtenir autrement (Hilali, 2017; Marcoux,
2015; Thiebaut, 2016). Elle pourrait également jouer un rôle dans la prévention en permettant
d’identifier les facteurs de risque de certaines maladies, de développer des outils d’aide au
diagnostic, de vérifier l’efficacité d’un traitement et de prédire les épidémies. Des outils comme
Healthmap, GLEAMviz et Sentinelle sont des exemples de ce que l’étude et le croisement de
données offrent comme possibilitésix.
4.3. Enjeux d’interprétabilité
Les données de santé présentent également un enjeu au niveau de leur interprétabilité. En effet,
la ressource informationnelle acquiert un sens via une interprétation qui pourra être faite par
différentes sources comme l’auteur, la donnée en elle-même et le lecteur tel que le suggère Eco
(Eco, 1992). Ici, nous nous intéressons plus précisément au sens que donnera le lecteur, c’est-à-
dire le chercheur, aux ressources informationnelles. L’interprétation que fera le chercheur de ces
données sera teintée de ses expériences antérieures (Blais & Martineau, 2006) qui se déroulent
dans un environnement à la fois cadré et divergeant. En effet, Zarifan propose une distinction
entre signification, héritée et appropriée par une communauté ayant une compréhension
commune et donc d’une certaine façon conventionnelle et cadrée, et sens qui échappe à cet ordre
11
de la convention et tentera de discriminer et de créer une cohésion (Barbier & Galatanu, 2001).
Ainsi, c’est dans le sens que donnera le chercheur à la ressource informationnelle, et parce
qu’elle s’inscrit également dans une signification commune de la communauté, que nous
pouvons espérer dégager une avancée de la connaissance ou une découverte scientifique
novatrice. Toutefois, il est important de bien distinguer le sens qui sera donné à l’information de
celui donné aux données brutes. En effet, la donnée brute est la plus petite unité de ressource
informationnelle tandis que l’information est composée de plusieurs données brutes (Lavrakas,
2008). Ainsi, dans le cas des ressources informationnelles en santé qui seraient utilisées à des
fins de recherche, le but visé est de réduire au minimum l’interprétabilité de la donnée brute afin
que la signification soit la même pour tous les chercheurs. Ceci étant dit, la faisabilité de
l’atteinte de cette signification commune demeure plus probable pour les données quantitatives
que qualitatives. En effet, les données brutes quantitatives laissent moins de place à une
signification autre au sein de la communauté comme les résultats de tests de laboratoire, le
nombre d’hospitalisation et la maladie du patient, tandis que les données brutes qualitatives
acquièrent leur sens par l’interprétation comme les notes qui se trouvent au dossier médical du
patient.
4.4. Enjeux de protection des renseignements personnels et de la vie privée
Les enjeux de protection des renseignements personnels et de la vie privée sont omniprésents et
constituent « le défi principal et primordial » (Conseil des académies canadiennes, 2016) dans le
contexte de l’utilisation des données de santé à des fins de recherche. Bien que ne faisant pas
l’objet de ce travail, nous nous devons d’en esquisser les grandes lignes pour éventuellement en
tenir compte lors de l’élaboration des pistes de solution.
Au Québec, la protection des données de santé est clairement encadrée par la Loi sur les services
de santé et les services sociaux et la Loi concernant le partage de certains renseignements de
santé (Éditeur officiel du Québec, 2018b, 2018a, 2018c). En résumé, soulignons que ces données
sont confidentielles sauf si la personne concernée consent à ce qu’un tiers y ait accès. Les
renseignements personnels ne peuvent être utilisés qu’à la seule fin prévue et annoncée lors de
leur collecte et ils ne peuvent être communiqués qu’avec le consentement de la personne
concernée.
12
Dans un contexte de recherche, il est important de maintenir un haut niveau de sécurité des
données et de s’assurer du respect des règles existantes (ou de les modifier), par exemple, en
mettant en place des mécanismes permettant d’obtenir un consentement libre et éclairé des
usagers face à l’utilisation de leurs données à des fins de recherche. Aussi, les techniques
d’anonymisation des données doivent être améliorées de façon constante afin de réduire le plus
possible les risques de réidentification.
5. RÉPERCUSSIONS SUR NOTRE FONCTIONNEMENT INSTITUTIONNEL ET
PISTES DE SOLUTION
De ces constats émerge la question suivante: comment favoriser la création de données de santé
qui soient réellement pertinentes et utilisables à des fins de recherche ? Un élément de réponse à
cette question semble aller de soi: il importe de revoir les normes encadrant la production
documentaire en matière de santé (ou d’en créer), de façon à répondre aux enjeux relatifs aux
trois dimensions de ces ressources informationnelles, telles que définies précédemment en terme
de qualité, de quantité et d’interprétabilité. En somme, il s’agit de repenser la gouvernance de
l’information en matière de santé au moyen de normes et de politiques administratives afin de
faciliter le partage et l’utilisation des données de santé en recherche. Tel que l’énonce l’auteur
Smallwood: « And there also is the high-value benefit of basing decisions on better, cleaner
data, which can come about only through rigid, enforced information governance (IG) policies
that reduce information glut » (Smallwood, 2014).
Les données de santé ne doivent plus être perçues comme des objets statiques qui ne servent qu’à
une fin : le suivi d’un patient. Pour améliorer les résultats de la recherche en santé, les données
doivent, à la base, être appréhendées comme pouvant servir à cette fin, dans un système de flux
informationnel permettant leur utilisation secondaire et prévoyant les critères à respecter afin de
le faire en toute légalité.
Dans le cadre de cette recherche, nous nous intéressons particulièrement à l’étape de la création
des données dans tout le spectre de la gouvernance de l’information dans le domaine de la santé.
Bien d’autres enjeux, qu’il n’est pas possible d’aborder ici, devraient également être évalués:
procédures d’accès aux données, partage et couplage de données, enjeux de protection des
13
renseignements personnels, enjeux de sécurité, etc. Dans les prochaines sections, nous nous
concentrerons à proposer des pistes de solution normatives pour les enjeux de qualité, de quantité
et d’interprétabilité des données de santé.
5.1. Pistes de solution sur les enjeux de qualité
Les enjeux de qualité réfèrent directement à la gouvernance des données. En effet, « data
governance focuses on information quality from the ground up at the lowest or root level, so that
subsequent reports, analyses, and conclusions are based on clean, reliable, trusted data (or
records) in database tables » (Smallwood, 2014). Tel que mentionné précédemment, la qualité
des données réfère à leur fiabilité, pertinence, représentativité, utilisabilité et accessibilité en
temps opportun. La gouvernance des données par des normes ou politiques devrait donc viser à
assurer que les données créées satisfassent ces attributs.
À l’égard de la fiabilité des données, les normes mises en place devraient notamment prévoir
quelles données doivent être créées, sous quelle forme, pour quelle période, etc. Aussi, ces
normes devraient encadrer la configuration des systèmes informatiques, susceptibles d’influencer
la fiabilité des données, comme les autorisations d’accès, de partage, d’édition, etc.
En ce qui concerne la pertinence des données, celle-ci s’évalue au regard des finalités de
recherche poursuivies. Ainsi, il importe que les normes documentaires imposent une réflexion en
continu quant aux besoins informationnels dans le secteur de la recherche en santé. Bien
identifier les besoins en matière de recherche en amont permettra de créer la bonne information
afin de pouvoir l’exploiter.
En matière de représentativité des données, il importe de s’assurer que de manière générale, tous
les profils d’individus et toutes les régions d’un territoire donné soient représentés. L’imposition
d’une même norme (et l’accès aux mêmes ressources) à tous les acteurs du domaine de la santé
sera de nature à favoriser cet élément.
14
Au regard de l’utilisabilité des données, les normes pourront permettre d’instaurer une cohérence
et une uniformisation en matière de saisie de données, notamment quant à leur format. À cet
égard, le Comité d’experts en santé s’exprime ainsi:
Le plein potentiel des données canadiennes sur la santé et données connexes ne peut être exploité que
si ces données sont prêtes à analyser. [...] Pour pouvoir être comparées ou combinées, et faire l’objet
d’analyses statistiques significatives, les données doivent être harmonisées. Une démarche idéale
d’harmonisation comporte la standardisation de la terminologie, des questionnaires, des mesures et
protocoles normalisés (c’est-à-dire pour l’harmonisation prospective) (Conseil des académies
canadiennes, 2016).
Enfin, en ce qui concerne l’accessibilité en temps opportun des données, cet aspect ne relève pas
de l’étape de la création documentaire, mais plutôt d’une étape subséquente concernant les règles
d’accessibilité et de partage des données. Tel qu’annoncé au début de cette section, la présente
recherche ne vise pas toutes les facettes de la gouvernance de l’information dans le domaine de
la santé, bien que chacune soit essentielle.
5.2. Pistes de solution sur les enjeux de quantité
Pour que les données soient directement utilisables à des fins de recherche, il faut tout d’abord
effectuer un travail d’harmonisation et réfléchir les systèmes à venir pour un partage dans un
objectif de recherche (Conseil des académies canadiennes, 2016). Il est souhaitable que les
façons de faire et les formats des données soient uniformisées et qu’il y ait une meilleure
interconnexion entre les dispositifs et l’Internet des objets, ces objets connectés, responsables de
l’explosion des données à l’origine des mégadonnées (Helbing & Pournaras, 2015). Il va de soi
que l'harmonisation n’est pas toujours possible et la démarche peut être coûteuse en temps et en
main-d’œuvre. Aussi, il se peut que certaines manières de faire ou de définir les données ne
puissent pas donner lieu à un consensus (Conseil des académies canadiennes, 2016).
Pour que le partage des données puisse se faire efficacement, il faut également simplifier les
normes et uniformiser les législations car ceux qui ont besoin d’accéder aux données doivent
naviguer dans un « milieu complexe d’entités hétérogènes comprenant souvent de nombreux
dépositaires de données, bureaux de protection de la vie privée et comités d’éthique de la
15
recherche, dont la gouvernance et les méthodes de fonctionnement ne constituent pas un système
bien défini et cohérent. » (Conseil des académies canadiennes, 2016)
Dans notre système de santé public, la partage des données de santé à des fins de recherche
implique d'amener les professionnels à travailler différemment. Adopter une méthode de
travail novatrice dans un système surchargé implique évidemment de sensibiliser et d’éduquer
les travailleurs à tous les niveaux de la hiérarchie du système de santé. Toutefois, cette
transformation des méthodes de travail ne peut se faire qu’accompagnée de règles strictes de
gouvernance.
Finalement, afin de ne pas nourrir davantage et inutilement ce big data, il serait important de ne
conserver que les données pertinentes en tenant compte des besoins actuels et des recherches à
venir. C’est pourquoi une bonne gouvernance devrait non seulement inclure l’élaboration de
normes sur la saisie des données, mais également des dispositions sur la destruction de ces
données le temps venu.
5.3. Pistes de solution sur les enjeux d’interprétabilité
Nous pouvons nous demander comment s’assurer que l'interprétation de la donnée brute soit la
même pour tous. Dans le domaine de la recherche, quelques pistes de solutions existent comme
accompagner les données brutes d’un dictionnaire des variables qui permettra de comprendre le
contexte de collecte et de classification des données brutes (SHARE Project, 2018). Ces
dictionnaires peuvent donc être considérés comme des métadonnées concernant les données
brutes et les normes misent en place devraient également définir ce qu’est une métadonnée dans
le contexte de cette norme.
En recherche qualitative, l’accent est mis sur la capacité du chercheur de donner un sens aux
données brutes (Savoie-Zajc & Karsenti, 2000). Vouloir en extraire un sens, c’est aller au-delà de
la donnée brute (Denzin & Lincoln, 2005). Donc, là où il est souhaitable que l’interprétabilité se
produise c’est au niveau de l’analyse des données brutes (donnée 0), pour leur donner un sens
qui pourra ou non être accepté par la communauté de pairs. Ce sens attribué par le chercheur se
produit a posteriori de la collecte dans le cycle de vie de la ressource informationnelle (voir
16
Annexe Figure 5.1)(Blais & Martineau, 2006). Ainsi, nous pouvons nous demander à qui revient
la responsabilité de garantir une signification commune de la donnée brute en santé. Si nous
faisons appel aux diverses sources d’interprétations (auteur, donnée, lecteur/utilisateur) inspiré
de Eco, nous suggérons que chacun d’eux ait une certaine responsabilité quant à la signification
de la donnée brute, mais que la responsabilité se situe plus particulièrement chez l’auteur, c’est-
à-dire la personne qui crée ou collecte la donnée brute. Finalement, bien que nous suggérons que
la responsabilité de l’interprétabilité des données brutes se situe au niveau de l’auteur, nous
devrons également planifier dans une norme documentaire le partage et l’utilisation des données
où l'interprétation peut se faire à différents moments et par différents acteurs (voir Annexe
Figures 5.2 et 5.3). Ainsi, l’auteur des données brutes (données 0) pourra partager ses données
avec le lecteur 1. Lorsque le lecteur 1 utilisera les données, il en fera une interprétation pour lui
donner un sens et ces données pourront prendre une nouvelle forme (donnée 1) pour devenir de
l’information. Ce processus de partage et d’utilisation peut, mais ce n’est pas obligatoire, se faire
à l’infini à l’intérieur ou à l’extérieur de l’organisation.
6. CONCLUSION
En conclusion, nous sommes d’avis que des normes, sinon canadiennes du moins québécoises,
devraient être créées et misent en œuvre afin d’encadrer de façon cohérente la création des
données de santé afin que celles-ci puissent être plus facilement accessibles et utilisables à des
fins de recherche. Ces normes devraient servir à valoriser ces ressources informationnelles et à
s’assurer qu’elles répondent adéquatement aux enjeux de qualité, de quantité et d’interprétabilité
tel que détaillés précédemment. Le contexte actuel est favorable, alors que des dossiers de santé
informatiques tel que le DSQ sont progressivement implantés un peu partout au Canada. Il
importe toutefois de faire vite puisque l’utilisation secondaire des données de santé à des fins de
recherche devrait idéalement être pensée dès la conception de ces systèmes de consignation
numérique des données, afin d’éviter des délais, coûts supplémentaires et même dans certains cas
la non-exploitation de ces données en recherche en raison du découragement des chercheurs. À
cet égard, il est intéressant de noter qu’une initiative visant à faciliter l’accès à certains
renseignementsx aux fins de recherche a été annoncée dans le dernier budget du Québec
(Gouvernement du Québec, 2018). Nous ne pouvons qu’espérer qu’il s’agit là d’un premier pas
vers l’encadrement normatif de la création et de la gestion des données de santé dans la province.
17
7. RÉFÉRENCES
Barbier, J.-M., & Galatanu, O. (2001). Signification, sens, formation. Consulté le 30 mars 2018,
à l’adresse http://www.persee.fr/doc/rfp_0556-7807_2001_num_134_1_2782_t1_0169_0000_3
Beaulieu, M.-D., & Roy, D. (2018). Utilisation des données cliniques issues des dossiers
médicaux électroniques à des fins de recherche et d’amélioration continue de la qualité des soins
et services de première ligne. Consulté le 17 avril 2018, à l’adresse
https://www.inesss.qc.ca/fileadmin/doc/INESSS/Rapports/SoinsPremiereLigne/INESSS_Utilisat
ion_donnees_cliniques.pdf
Blais, & Martineau. (2006). L’analyse inductive générale : description d’une démarche visant à
donner un sens à des données brutes. Recherches qualitatives, 26(2), 1‑18.
Caron, D. J. (2017). Chapitre 26 La production documentaire dans les administrations publiques :
enjeux et pistes de solution. In Secrets d’États? 2e édition — Presses de l’Université du Québec.
Consulté à l’adresse http://www.puq.ca/catalogue/livres/secrets-etats-edition-3280.html
Chen, C. (2012). Making Sense of Mobile Health Data: An Open Architecture to Improve
Individual- and Population-Level Health. Journal of Medical Internet Research. Consulté à
l’adresse http://www.jmir.org/2012/4/e112/
Conseil des académies canadiennes. (2016). L’accès aux données sur la santé et aux données
connexes au Canada | CCA | Conseil des académies canadiennes. Consulté le 17 avril 2018, à
l’adresse
http://sciencepourlepublic.ca/uploads/fr/assessments%20and%20publications%20and%20news%
20releases/health-data/healthdata_fullreport_fr.pdf
Denzin, & Lincoln. (2005). The Sage Handbook of Qualitative Research (3rd edition). Consulté
le 30 mars 2018, à l’adresse
https://www.researchgate.net/publication/280196510_The_Sage_Handbook_of_Qualitative_Res
earch_3rd_edition2006138Edited_by_Norman_K_Denzin_and_Yvonna_S_Lincoln_The_Sage_
Handbook_of_Qualitative_Research_3rd_edition_Thousand_Oaks_CA_and_London_Sage_Publ
ic
Eco, U. (1992). Les limites de l’interprétation. Grasset.
Éditeur officiel du Québec. (2018a, février 1). A-2.1 - Loi sur l’accès aux documents des
organismes publics et sur la protection des renseignements personnels. Consulté le 20 avril 2018,
à l’adresse http://legisquebec.gouv.qc.ca/fr/ShowDoc/cs/A-2.1
Éditeur officiel du Québec. (2018b, février 1). Loi sur les services de santé et les services
sociaux. Consulté le 20 avril 2018, à l’adresse http://legisquebec.gouv.qc.ca/en/showDoc/cs/S-
4.2?langCont=fr
Éditeur officiel du Québec. (2018c, février 1). P-9.0001 - Loi concernant le partage de certains
renseignements de santé. Consulté le 20 avril 2018, à l’adresse
http://legisquebec.gouv.qc.ca/fr/ShowDoc/cs/P-9.0001
18
Gartner. (2018). What Is Big Data? - Gartner IT Glossary - Big Data. Consulté le 8 avril 2018, à
l’adresse https://www.gartner.com/it-glossary/big-data
Gauthier, F. (2006). Impact du numerique sur les normes et les supports traditionnels de
preservation - Revue Archvies 37-2. Consulté le 30 mars 2018, à l’adresse
https://archivistes.qc.ca/cora/afficheFic.php?fic=vol37_2/Gauthier.htm&usager_id=
Gouvernement du Canada, I. de recherche en santé du C. (2017, mai 11). Données de recherche
en santé : nouvelles et activités - IRSC. Consulté le 18 mars 2018, à l’adresse http://www.cihr-
irsc.gc.ca/f/50182.html
Gouvernement du Québec. (2018). Le plan économique du Québec. Consulté à l’adresse
http://www.budget.finances.gouv.qc.ca/budget/2018-2019/fr/documents/PlanEconomique_18-
19.pdf
Hall, W., & Pesenti, J. (2017, octobre). Growing the artificial intelligence industry in the UK -
GOV.UK. Consulté le 8 avril 2018, à l’adresse
https://assets.publishing.service.gov.uk/government/uploads/system/uploads/attachment_data/file
/652097/Growing_the_artificial_intelligence_industry_in_the_UK.pdf
Helbing, D., & Pournaras, E. (2015). Society: Build digital democracy. Nature News, 527(7576),
33. https://doi.org/10.1038/527033a
Hilali, I. (2017, juin 27). « MoiPatient » : exemple d’un projet Big Data porté par les patients.
Consulté le 18 avril 2018, à l’adresse https://healthcaredatainstitute.com/2017/06/27/moipatient-
exemple-dun-projet-big-data-porte-par-les-patients/
Lavrakas, P. (Éd.). (2008). Raw Data. In Encyclopedia of Survey Research Methods. 2455 Teller
Road, Thousand Oaks California 91320 United States of America: Sage Publications, Inc.
https://doi.org/10.4135/9781412963947.n447
Marcoux, F. (2015, février 20). L’utilisation du Big Data en santé. Consulté le 17 avril 2018, à
l’adresse http://polyfinances.ca/blog/2015/02/20/lutilisation-du-big-data-en-sante/
Maroun, R., Durand-Zaleski, I., Nachbaur, G., Maunoury, F., & Benjamin, L. (2016).
L’importance et les difficultés de l’accès aux données de santé pour l’évaluation médico-
économique : illustration par des travaux de recherche doctorale sur l’impact de l’utilisation de
différentes sources de données sur l’évaluation médico-économique dans le cancer du rein et le
mélanome. Revue d’Épidémiologie et de Santé Publique, 64, S275.
https://doi.org/10.1016/j.respe.2016.04.016
Ministère de la Santé et des Services Sociaux. (2013). Accueil - Dossier de santé - Ministère de
la Santé et des Services sociaux. Consulté le 26 février 2018, à l’adresse
http://www.dossierdesante.gouv.qc.ca/
Savoie-Zajc, L., & Karsenti, T. (2000). La recherche qualitative/interprétative. In Introduction à
la recherche en éducation (p. pp.171-198). Éditions du CRP.
19
SHARE Project. (2018). The Survey of Health, Ageing and Retirement in Europe (SHARE):
Data Documentation. Consulté le 30 mars 2018, à l’adresse http://www.share-project.org/data-
documentation.html
Smallwood, R. F. (2014). Information Governance: Concepts, Strategies, and Best Practices.
John Wiley & Sons.
Thiebaut, R. (2016, juillet 1). Big data en santé. Consulté le 18 avril 2018, à l’adresse
https://www.inserm.fr/information-en-sante/dossiers-information/big-data-en-sante
20
8. ANNEXES
Tableau 5.1 : Résumé des pistes de solutions selon les enjeux informationnels
Enjeux Qualité Quantité Interprétabilité
Pistes de solution.
Créer une norme
comprenant :
- Définir quelles
données doivent être
créées, sous quelle
forme, pour quelle
période, etc.
- Encadrer la
configuration des
systèmes
informatiques
- Obliger la réflexion
en continu quant aux
besoins
informationnels
- Représenter les
différents profils
d’individus et toutes
les régions
- Cohérence et
uniformisation en
matière de saisie de
données
- Harmoniser les
données
- Simplifier les
normes et clarifier
les législations
- Sensibiliser les
professionnels à
travailler
différemment
- Créer d’un
dictionnaire des
variables, en quelque
sorte des
métadonnées
renseignant sur le
contexte de collecte
et de classification
des données brutes
- Définir la
métadonnée
- Responsabiliser
l’auteur qui crée ou
collecte la donnée
brute pour
l’interprétation juste
de celle-ci
- Responsabiliser
l’utilisateur pour le
partage et
l’utilisation des
données
21
Figure 5.1: Cycle de vie de l’information. Adapté de Caron (Caron, 2017). La donnée a comme
attributs la qualité, la quantité et l’interprétabilité. Les attributs de qualité et de quantité seront
principalement présents au début du cycle de vie, au niveau de la création et collecte, tandis que
l’interprétabilité pourrait se faire à différentes moment du cycle. Ce cycle est non chronologique
une fois la donnée créée, c’est-à-dire, que dans une organisation A la donnée peut être collectée,
classée et partagée avec une organisation B, et cette organisation B pourra la classer et l’utiliser
différemment par exemple. La figure 5.2 explique plus en détails le partage et l’utilisation des
données dans une ou plusieurs organisations.
22
Figure 5.2: Modèle suggéré de partage et d’utilisation des données.
L’auteur collectera ou créera la donnée brute (donnée 0). Nous suggérons que cette donnée ne
subira aucune interprétation à cette étape. L’auteur des données brutes pourra par la suite
partager ses données avec le lecteur 1 ou interpréter lui-même ses données. Lorsque le lecteur 1
utilisera les données brutes, il en fera une interprétation pour lui donner un sens et ces données
pourront prendre une nouvelle forme (donnée 1). Ce processus de partage et d’utilisation peut,
mais ce n’est pas obligatoire, se faire à l’infini à l’intérieur ou à l’extérieur de l’organisation.
23
Figure 5.3 : Modèle suggéré de cycles d’interprétation des données.
Les technologies du numérique amènent des changements dans l’interprétation des données. La
donnée brute (donnée 0) peut être interprétée par l’humain via un raisonnement logique acquis
par l’expérience et divers savoirs (information) ou par le robot via des algorithmes.
L’information, que ce soit des métadonnées ou d’autres données jumelées aux données brutes à
analyser, affecte l’interprétation que nous aurons d’elles qui acquièrent un sens se situant sur un
continuum. La quantité et la qualité de l’information affectent la position du sens donné à la
donnée brute sur ce continuum et qui deviendra alors une nouvelle donnée (donnée 1). Ceci
représente un cycle d’interprétation possible. Une multitude de cycles d’interprétation pourront
se faire par la suite à l’intérieur ou à l’extérieur d’une organisation ayant créé la donnée brute.
L’humain, en plus de pouvoir interpréter directement, peut interpréter la donnée brute par un
algorithme créé par l’humain. Donc, l’humain pourra teinter l’interprétation que le robot se fera
des données brutes. L’intelligence artificielle de type forte (strong AI) permettra un
apprentissage autonome qui pourra alimenter la logique propre au robot.
24
9. NOTES
i Comité d’experts constitué par le Conseil des académies canadiennes et mandaté par les
Instituts de recherche en santé du Canada afin de mener une vaste étude sur le sujet de la
recherche en santé au Canada (ci-après le Comité d’experts en santé).
ii Le Dossier Santé Québec (DSQ) est un outil qui permet aux médecins et à d’autres
professionnels de la santé d’avoir accès à des renseignements jugés essentiels pour intervenir
rapidement et assurer un suivi de qualité auprès de leurs patients.
iii Cette situation est fréquemment dénoncée par les chercheurs québécois, voir notamment:
Étienne Plamondon Emond, “Paralysie dans l’accès aux données en santé”, dans Le Devoir,
édition du 17 février 2018, p. E1-2.
iv Dossiers de santé, imagerie médicale, dépistage génétique, etc.
v Données sur l’activité physique, l’obésité, le salaire annuel moyen, la pollution de l’air, etc.
vi Les données de la RAMQ par exemple.
vii Voir par exemple l’étude de Sandra Gauthier sur Les maladies autosomales récessives au
Saguenay-Lac-St-Jean, Université Laval, 1992 (http://constellation.uqac.ca/1448/)
viii GAFAM : Google, Apple, Facebook, Amazon, Microsoft, etc
ix Healthmap (http://www.healthmap.org/fr), GLEAMviz (http://www.gleamviz.org) et
Sentinelle (https://websenti.u707.jussieu.fr/sentiweb)
x Cette mesure ne concerne pas uniquement les données de santé, mais aussi celles détenues par
plusieurs ministères et organismes.

Contenu connexe

Tendances

Mémoire de fin d'études : Créer de l'engagement sur les réseaux sociaux
Mémoire de fin d'études : Créer de l'engagement sur les réseaux sociauxMémoire de fin d'études : Créer de l'engagement sur les réseaux sociaux
Mémoire de fin d'études : Créer de l'engagement sur les réseaux sociaux
Nina Mangeot
 
Reporting pilier 3 - Solvabilité 2 - Production QRT
Reporting pilier 3 - Solvabilité 2 - Production QRT Reporting pilier 3 - Solvabilité 2 - Production QRT
Reporting pilier 3 - Solvabilité 2 - Production QRT
Julien Sac
 
Rapport de stage genie logiciel awoufack tedem adeline encadreur kamleu nou...
Rapport de stage genie logiciel awoufack tedem adeline encadreur   kamleu nou...Rapport de stage genie logiciel awoufack tedem adeline encadreur   kamleu nou...
Rapport de stage genie logiciel awoufack tedem adeline encadreur kamleu nou...
Emeric Kamleu Noumi
 
pfe les déCISION DE FINANCEMENT ACOURT TERME.pdf
pfe les déCISION DE FINANCEMENT ACOURT TERME.pdfpfe les déCISION DE FINANCEMENT ACOURT TERME.pdf
pfe les déCISION DE FINANCEMENT ACOURT TERME.pdf
yassinmadraste
 
Cahier des charges site internet AXOM
Cahier des charges site internet AXOMCahier des charges site internet AXOM
Cahier des charges site internet AXOM
Jeremy ABDILLA
 
Profession Community Manager
Profession Community ManagerProfession Community Manager
Profession Community Manager
Ambre_M
 
Le crowdfunding
Le crowdfundingLe crowdfunding
Le crowdfunding
Chiraz Chebbi
 
Rapport stage
Rapport stageRapport stage
Rapport stage
Louise Bessieres
 
La communication interne en entreprise
La communication interne en entrepriseLa communication interne en entreprise
La communication interne en entreprise
PRECILIA KASSA
 
cours marketing digital
cours marketing digital cours marketing digital
cours marketing digital
Yann Drumare
 
Les mécanismes de financement des startups et tpme au maroc
Les mécanismes de financement des startups et tpme au marocLes mécanismes de financement des startups et tpme au maroc
Les mécanismes de financement des startups et tpme au maroc
SoukDesEntrepreneurs
 
Montages financiers-khl-consulting
Montages financiers-khl-consultingMontages financiers-khl-consulting
Montages financiers-khl-consultingLahcen Aoussar
 
Réaliser son business plan en 48 heures.pdf
Réaliser son business plan en 48 heures.pdfRéaliser son business plan en 48 heures.pdf
Réaliser son business plan en 48 heures.pdf
HassanBakhouch5
 
Rapport problématisé de stage : penser l'ergonomie et l'expérience utilisat...
Rapport problématisé de stage : penser l'ergonomie et l'expérience utilisat...Rapport problématisé de stage : penser l'ergonomie et l'expérience utilisat...
Rapport problématisé de stage : penser l'ergonomie et l'expérience utilisat...
Camille Perazzi
 
Exposfinal convention fiscal
Exposfinal convention fiscalExposfinal convention fiscal
Exposfinal convention fiscal
Med Ben
 
Ludivine Caron | Rapport de stage | Licence 3 | Agence de communication multi...
Ludivine Caron | Rapport de stage | Licence 3 | Agence de communication multi...Ludivine Caron | Rapport de stage | Licence 3 | Agence de communication multi...
Ludivine Caron | Rapport de stage | Licence 3 | Agence de communication multi...
Ludivine Caron
 
Rapport de stage IAE
Rapport de stage IAERapport de stage IAE
Rapport de stage IAE
Nam Phạm
 
Etude RH et digitalisation de l’entreprise
Etude RH et digitalisation de l’entrepriseEtude RH et digitalisation de l’entreprise
Etude RH et digitalisation de l’entreprise
BPI group
 

Tendances (20)

Mémoire de fin d'études : Créer de l'engagement sur les réseaux sociaux
Mémoire de fin d'études : Créer de l'engagement sur les réseaux sociauxMémoire de fin d'études : Créer de l'engagement sur les réseaux sociaux
Mémoire de fin d'études : Créer de l'engagement sur les réseaux sociaux
 
Reporting pilier 3 - Solvabilité 2 - Production QRT
Reporting pilier 3 - Solvabilité 2 - Production QRT Reporting pilier 3 - Solvabilité 2 - Production QRT
Reporting pilier 3 - Solvabilité 2 - Production QRT
 
Rapport de stage genie logiciel awoufack tedem adeline encadreur kamleu nou...
Rapport de stage genie logiciel awoufack tedem adeline encadreur   kamleu nou...Rapport de stage genie logiciel awoufack tedem adeline encadreur   kamleu nou...
Rapport de stage genie logiciel awoufack tedem adeline encadreur kamleu nou...
 
pfe les déCISION DE FINANCEMENT ACOURT TERME.pdf
pfe les déCISION DE FINANCEMENT ACOURT TERME.pdfpfe les déCISION DE FINANCEMENT ACOURT TERME.pdf
pfe les déCISION DE FINANCEMENT ACOURT TERME.pdf
 
Cahier des charges site internet AXOM
Cahier des charges site internet AXOMCahier des charges site internet AXOM
Cahier des charges site internet AXOM
 
L'analyse financière
L'analyse financière  L'analyse financière
L'analyse financière
 
Profession Community Manager
Profession Community ManagerProfession Community Manager
Profession Community Manager
 
Le crowdfunding
Le crowdfundingLe crowdfunding
Le crowdfunding
 
Rapport stage
Rapport stageRapport stage
Rapport stage
 
La communication interne en entreprise
La communication interne en entrepriseLa communication interne en entreprise
La communication interne en entreprise
 
cours marketing digital
cours marketing digital cours marketing digital
cours marketing digital
 
Les mécanismes de financement des startups et tpme au maroc
Les mécanismes de financement des startups et tpme au marocLes mécanismes de financement des startups et tpme au maroc
Les mécanismes de financement des startups et tpme au maroc
 
Montages financiers-khl-consulting
Montages financiers-khl-consultingMontages financiers-khl-consulting
Montages financiers-khl-consulting
 
Réaliser son business plan en 48 heures.pdf
Réaliser son business plan en 48 heures.pdfRéaliser son business plan en 48 heures.pdf
Réaliser son business plan en 48 heures.pdf
 
Rapport problématisé de stage : penser l'ergonomie et l'expérience utilisat...
Rapport problématisé de stage : penser l'ergonomie et l'expérience utilisat...Rapport problématisé de stage : penser l'ergonomie et l'expérience utilisat...
Rapport problématisé de stage : penser l'ergonomie et l'expérience utilisat...
 
Mythes de l'entrpreneuriat
Mythes de l'entrpreneuriatMythes de l'entrpreneuriat
Mythes de l'entrpreneuriat
 
Exposfinal convention fiscal
Exposfinal convention fiscalExposfinal convention fiscal
Exposfinal convention fiscal
 
Ludivine Caron | Rapport de stage | Licence 3 | Agence de communication multi...
Ludivine Caron | Rapport de stage | Licence 3 | Agence de communication multi...Ludivine Caron | Rapport de stage | Licence 3 | Agence de communication multi...
Ludivine Caron | Rapport de stage | Licence 3 | Agence de communication multi...
 
Rapport de stage IAE
Rapport de stage IAERapport de stage IAE
Rapport de stage IAE
 
Etude RH et digitalisation de l’entreprise
Etude RH et digitalisation de l’entrepriseEtude RH et digitalisation de l’entreprise
Etude RH et digitalisation de l’entreprise
 

Similaire à L’UTILISATION DES DONNÉES DE SANTÉ EN RECHERCHE AU QUÉBEC À L’ÈRE DU NUMÉRIQUE : RÉFLEXIONS SUR LA NOTION DE DONNÉES DE SANTÉ ET SUR LE BESOIN DE POLITIQUES INFORMATIONNELLES - Genevieve David

Masterclass, exploiter les données publiques de santé @HealthDataHub
Masterclass, exploiter les données publiques de santé @HealthDataHubMasterclass, exploiter les données publiques de santé @HealthDataHub
Masterclass, exploiter les données publiques de santé @HealthDataHub
FrenchTechCentral
 
Les systèmes DSQ, DMÉ, DCI, et DPÉ font-ils partie des solutions pour amélior...
Les systèmes DSQ, DMÉ, DCI, et DPÉ font-ils partie des solutions pour amélior...Les systèmes DSQ, DMÉ, DCI, et DPÉ font-ils partie des solutions pour amélior...
Les systèmes DSQ, DMÉ, DCI, et DPÉ font-ils partie des solutions pour amélior...
Colloque "La communication au coeur de la e-santé"
 
Données de santé : rapport sur la plateforme d'exploitation commune Health Da...
Données de santé : rapport sur la plateforme d'exploitation commune Health Da...Données de santé : rapport sur la plateforme d'exploitation commune Health Da...
Données de santé : rapport sur la plateforme d'exploitation commune Health Da...
Société Tripalio
 
La santé numérique, les compétences informatiques et les programmes de format...
La santé numérique, les compétences informatiques et les programmes de format...La santé numérique, les compétences informatiques et les programmes de format...
La santé numérique, les compétences informatiques et les programmes de format...
Centre de pédagogie appliquée aux sciences de la santé (CPASS)
 
Strategie e sante-2020
Strategie e sante-2020Strategie e sante-2020
Strategie e sante-2020
Market iT
 
Information en santé, gestion documentaire et science infirmière_F_Ott_C_LH...
Information en santé, gestion  documentaire et science  infirmière_F_Ott_C_LH...Information en santé, gestion  documentaire et science  infirmière_F_Ott_C_LH...
Information en santé, gestion documentaire et science infirmière_F_Ott_C_LH...
COSSI UMCS
 
Communiquer les données probantes pour soutenir l'implantation des dossiers m...
Communiquer les données probantes pour soutenir l'implantation des dossiers m...Communiquer les données probantes pour soutenir l'implantation des dossiers m...
Communiquer les données probantes pour soutenir l'implantation des dossiers m...
Colloque "La communication au coeur de la e-santé"
 
Les TIC au service de l'évaluation et de la qualité des soins. Le projet Rése...
Les TIC au service de l'évaluation et de la qualité des soins. Le projet Rése...Les TIC au service de l'évaluation et de la qualité des soins. Le projet Rése...
Les TIC au service de l'évaluation et de la qualité des soins. Le projet Rése...
Colloque "La communication au coeur de la e-santé"
 
Avis du Haut conseil pour l’avenir de l’assurance maladie - Innovations et sy...
Avis du Haut conseil pour l’avenir de l’assurance maladie - Innovations et sy...Avis du Haut conseil pour l’avenir de l’assurance maladie - Innovations et sy...
Avis du Haut conseil pour l’avenir de l’assurance maladie - Innovations et sy...
France Stratégie
 
TLM n° 103 Les enjeux de l'open data en santé
TLM n° 103 Les enjeux de l'open data en santéTLM n° 103 Les enjeux de l'open data en santé
TLM n° 103 Les enjeux de l'open data en santé
TLM
 
L'Accord Science Internationale sur les données ouvertues dans un monde des d...
L'Accord Science Internationale sur les données ouvertues dans un monde des d...L'Accord Science Internationale sur les données ouvertues dans un monde des d...
L'Accord Science Internationale sur les données ouvertues dans un monde des d...
Academy of Science of South Africa (ASSAf)
 
Poster - SIDIIEF 2015
Poster - SIDIIEF 2015Poster - SIDIIEF 2015
Poster - SIDIIEF 2015
François Marcoux
 
Le figaro 13_20190708220000
Le figaro 13_20190708220000Le figaro 13_20190708220000
Le figaro 13_20190708220000
A N
 
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
Lesticetlart Invisu
 
Définir les politiques facilitant l’implantation et l’utilisation des dossier...
Définir les politiques facilitant l’implantation et l’utilisation des dossier...Définir les politiques facilitant l’implantation et l’utilisation des dossier...
Définir les politiques facilitant l’implantation et l’utilisation des dossier...
ComSanté
 
Une vision éclairée par des données probantes concernant l’établissement ...
Une vision éclairée par des données probantes concernant l’établissement ...Une vision éclairée par des données probantes concernant l’établissement ...
Une vision éclairée par des données probantes concernant l’établissement ...
The National Collaborating Centre for Methods and Tools
 
Futur et santé
Futur et santéFutur et santé
Futur et santé
Les Propulseurs
 
Big Data ete learning Analytics
Big Data ete learning AnalyticsBig Data ete learning Analytics
Big Data ete learning Analytics
Mokhtar Ben Henda
 
6ème Journée Innov'Asso
6ème Journée Innov'Asso6ème Journée Innov'Asso
6ème Journée Innov'Asso
Innov'Asso
 

Similaire à L’UTILISATION DES DONNÉES DE SANTÉ EN RECHERCHE AU QUÉBEC À L’ÈRE DU NUMÉRIQUE : RÉFLEXIONS SUR LA NOTION DE DONNÉES DE SANTÉ ET SUR LE BESOIN DE POLITIQUES INFORMATIONNELLES - Genevieve David (20)

Mesure prioritaire 1
Mesure prioritaire 1Mesure prioritaire 1
Mesure prioritaire 1
 
Masterclass, exploiter les données publiques de santé @HealthDataHub
Masterclass, exploiter les données publiques de santé @HealthDataHubMasterclass, exploiter les données publiques de santé @HealthDataHub
Masterclass, exploiter les données publiques de santé @HealthDataHub
 
Les systèmes DSQ, DMÉ, DCI, et DPÉ font-ils partie des solutions pour amélior...
Les systèmes DSQ, DMÉ, DCI, et DPÉ font-ils partie des solutions pour amélior...Les systèmes DSQ, DMÉ, DCI, et DPÉ font-ils partie des solutions pour amélior...
Les systèmes DSQ, DMÉ, DCI, et DPÉ font-ils partie des solutions pour amélior...
 
Données de santé : rapport sur la plateforme d'exploitation commune Health Da...
Données de santé : rapport sur la plateforme d'exploitation commune Health Da...Données de santé : rapport sur la plateforme d'exploitation commune Health Da...
Données de santé : rapport sur la plateforme d'exploitation commune Health Da...
 
La santé numérique, les compétences informatiques et les programmes de format...
La santé numérique, les compétences informatiques et les programmes de format...La santé numérique, les compétences informatiques et les programmes de format...
La santé numérique, les compétences informatiques et les programmes de format...
 
Strategie e sante-2020
Strategie e sante-2020Strategie e sante-2020
Strategie e sante-2020
 
Information en santé, gestion documentaire et science infirmière_F_Ott_C_LH...
Information en santé, gestion  documentaire et science  infirmière_F_Ott_C_LH...Information en santé, gestion  documentaire et science  infirmière_F_Ott_C_LH...
Information en santé, gestion documentaire et science infirmière_F_Ott_C_LH...
 
Communiquer les données probantes pour soutenir l'implantation des dossiers m...
Communiquer les données probantes pour soutenir l'implantation des dossiers m...Communiquer les données probantes pour soutenir l'implantation des dossiers m...
Communiquer les données probantes pour soutenir l'implantation des dossiers m...
 
Les TIC au service de l'évaluation et de la qualité des soins. Le projet Rése...
Les TIC au service de l'évaluation et de la qualité des soins. Le projet Rése...Les TIC au service de l'évaluation et de la qualité des soins. Le projet Rése...
Les TIC au service de l'évaluation et de la qualité des soins. Le projet Rése...
 
Avis du Haut conseil pour l’avenir de l’assurance maladie - Innovations et sy...
Avis du Haut conseil pour l’avenir de l’assurance maladie - Innovations et sy...Avis du Haut conseil pour l’avenir de l’assurance maladie - Innovations et sy...
Avis du Haut conseil pour l’avenir de l’assurance maladie - Innovations et sy...
 
TLM n° 103 Les enjeux de l'open data en santé
TLM n° 103 Les enjeux de l'open data en santéTLM n° 103 Les enjeux de l'open data en santé
TLM n° 103 Les enjeux de l'open data en santé
 
L'Accord Science Internationale sur les données ouvertues dans un monde des d...
L'Accord Science Internationale sur les données ouvertues dans un monde des d...L'Accord Science Internationale sur les données ouvertues dans un monde des d...
L'Accord Science Internationale sur les données ouvertues dans un monde des d...
 
Poster - SIDIIEF 2015
Poster - SIDIIEF 2015Poster - SIDIIEF 2015
Poster - SIDIIEF 2015
 
Le figaro 13_20190708220000
Le figaro 13_20190708220000Le figaro 13_20190708220000
Le figaro 13_20190708220000
 
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
 
Définir les politiques facilitant l’implantation et l’utilisation des dossier...
Définir les politiques facilitant l’implantation et l’utilisation des dossier...Définir les politiques facilitant l’implantation et l’utilisation des dossier...
Définir les politiques facilitant l’implantation et l’utilisation des dossier...
 
Une vision éclairée par des données probantes concernant l’établissement ...
Une vision éclairée par des données probantes concernant l’établissement ...Une vision éclairée par des données probantes concernant l’établissement ...
Une vision éclairée par des données probantes concernant l’établissement ...
 
Futur et santé
Futur et santéFutur et santé
Futur et santé
 
Big Data ete learning Analytics
Big Data ete learning AnalyticsBig Data ete learning Analytics
Big Data ete learning Analytics
 
6ème Journée Innov'Asso
6ème Journée Innov'Asso6ème Journée Innov'Asso
6ème Journée Innov'Asso
 

Plus de Geneviève David

Dédommagement financier des patients partenaires en recherche
Dédommagement financier des patients partenaires en rechercheDédommagement financier des patients partenaires en recherche
Dédommagement financier des patients partenaires en recherche
Geneviève David
 
Patient Partnership in research
Patient Partnership in researchPatient Partnership in research
Patient Partnership in research
Geneviève David
 
La recherche axée sur le patient : exemple d'un projet pour la santé des jeunes
La recherche axée sur le patient : exemple d'un projet pour la santé des jeunesLa recherche axée sur le patient : exemple d'un projet pour la santé des jeunes
La recherche axée sur le patient : exemple d'un projet pour la santé des jeunes
Geneviève David
 
Évaluation du partenariat patient au sein de l’Unité de soutien SRAP du Québe...
Évaluation du partenariat patient au sein de l’Unité de soutien SRAP du Québe...Évaluation du partenariat patient au sein de l’Unité de soutien SRAP du Québe...
Évaluation du partenariat patient au sein de l’Unité de soutien SRAP du Québe...
Geneviève David
 
La participation citoyenne dans le projet de reconstruction de l’échangeur T...
La participation citoyenne dans le projet de reconstruction  de l’échangeur T...La participation citoyenne dans le projet de reconstruction  de l’échangeur T...
La participation citoyenne dans le projet de reconstruction de l’échangeur T...
Geneviève David
 
LA POLITIQUE QUÉBÉCOISE EN MATIÈRE D’IMMIGRATION, DE PARTICIPATION ET D’INCLU...
LA POLITIQUE QUÉBÉCOISE EN MATIÈRE D’IMMIGRATION, DE PARTICIPATION ET D’INCLU...LA POLITIQUE QUÉBÉCOISE EN MATIÈRE D’IMMIGRATION, DE PARTICIPATION ET D’INCLU...
LA POLITIQUE QUÉBÉCOISE EN MATIÈRE D’IMMIGRATION, DE PARTICIPATION ET D’INCLU...
Geneviève David
 
L’INTELLIGENCE ARTIFICIELLE : POTENTIALITÉS POUR LE SYSTÈME DE SANTÉ ET ENJEU...
L’INTELLIGENCE ARTIFICIELLE : POTENTIALITÉS POUR LE SYSTÈME DE SANTÉ ET ENJEU...L’INTELLIGENCE ARTIFICIELLE : POTENTIALITÉS POUR LE SYSTÈME DE SANTÉ ET ENJEU...
L’INTELLIGENCE ARTIFICIELLE : POTENTIALITÉS POUR LE SYSTÈME DE SANTÉ ET ENJEU...
Geneviève David
 
Le leadership de l’enseignant
Le leadership de l’enseignantLe leadership de l’enseignant
Le leadership de l’enseignant
Geneviève David
 
L'éthique dans les recommandations médicales des tests de diagnostic prénatal...
L'éthique dans les recommandations médicales des tests de diagnostic prénatal...L'éthique dans les recommandations médicales des tests de diagnostic prénatal...
L'éthique dans les recommandations médicales des tests de diagnostic prénatal...
Geneviève David
 
Le locus 1q32 : susceptibilité aux maladies inflammatoires de l’intestin et r...
Le locus 1q32 : susceptibilité aux maladies inflammatoires de l’intestin et r...Le locus 1q32 : susceptibilité aux maladies inflammatoires de l’intestin et r...
Le locus 1q32 : susceptibilité aux maladies inflammatoires de l’intestin et r...
Geneviève David
 
Revue des recommandations éthiques dans le contexte des études génomiques
Revue des recommandations éthiques dans le contexte des études génomiquesRevue des recommandations éthiques dans le contexte des études génomiques
Revue des recommandations éthiques dans le contexte des études génomiques
Geneviève David
 
Etude sur la population consultante en diagnostic prédictif
Etude sur la population consultante en diagnostic prédictifEtude sur la population consultante en diagnostic prédictif
Etude sur la population consultante en diagnostic prédictif
Geneviève David
 

Plus de Geneviève David (12)

Dédommagement financier des patients partenaires en recherche
Dédommagement financier des patients partenaires en rechercheDédommagement financier des patients partenaires en recherche
Dédommagement financier des patients partenaires en recherche
 
Patient Partnership in research
Patient Partnership in researchPatient Partnership in research
Patient Partnership in research
 
La recherche axée sur le patient : exemple d'un projet pour la santé des jeunes
La recherche axée sur le patient : exemple d'un projet pour la santé des jeunesLa recherche axée sur le patient : exemple d'un projet pour la santé des jeunes
La recherche axée sur le patient : exemple d'un projet pour la santé des jeunes
 
Évaluation du partenariat patient au sein de l’Unité de soutien SRAP du Québe...
Évaluation du partenariat patient au sein de l’Unité de soutien SRAP du Québe...Évaluation du partenariat patient au sein de l’Unité de soutien SRAP du Québe...
Évaluation du partenariat patient au sein de l’Unité de soutien SRAP du Québe...
 
La participation citoyenne dans le projet de reconstruction de l’échangeur T...
La participation citoyenne dans le projet de reconstruction  de l’échangeur T...La participation citoyenne dans le projet de reconstruction  de l’échangeur T...
La participation citoyenne dans le projet de reconstruction de l’échangeur T...
 
LA POLITIQUE QUÉBÉCOISE EN MATIÈRE D’IMMIGRATION, DE PARTICIPATION ET D’INCLU...
LA POLITIQUE QUÉBÉCOISE EN MATIÈRE D’IMMIGRATION, DE PARTICIPATION ET D’INCLU...LA POLITIQUE QUÉBÉCOISE EN MATIÈRE D’IMMIGRATION, DE PARTICIPATION ET D’INCLU...
LA POLITIQUE QUÉBÉCOISE EN MATIÈRE D’IMMIGRATION, DE PARTICIPATION ET D’INCLU...
 
L’INTELLIGENCE ARTIFICIELLE : POTENTIALITÉS POUR LE SYSTÈME DE SANTÉ ET ENJEU...
L’INTELLIGENCE ARTIFICIELLE : POTENTIALITÉS POUR LE SYSTÈME DE SANTÉ ET ENJEU...L’INTELLIGENCE ARTIFICIELLE : POTENTIALITÉS POUR LE SYSTÈME DE SANTÉ ET ENJEU...
L’INTELLIGENCE ARTIFICIELLE : POTENTIALITÉS POUR LE SYSTÈME DE SANTÉ ET ENJEU...
 
Le leadership de l’enseignant
Le leadership de l’enseignantLe leadership de l’enseignant
Le leadership de l’enseignant
 
L'éthique dans les recommandations médicales des tests de diagnostic prénatal...
L'éthique dans les recommandations médicales des tests de diagnostic prénatal...L'éthique dans les recommandations médicales des tests de diagnostic prénatal...
L'éthique dans les recommandations médicales des tests de diagnostic prénatal...
 
Le locus 1q32 : susceptibilité aux maladies inflammatoires de l’intestin et r...
Le locus 1q32 : susceptibilité aux maladies inflammatoires de l’intestin et r...Le locus 1q32 : susceptibilité aux maladies inflammatoires de l’intestin et r...
Le locus 1q32 : susceptibilité aux maladies inflammatoires de l’intestin et r...
 
Revue des recommandations éthiques dans le contexte des études génomiques
Revue des recommandations éthiques dans le contexte des études génomiquesRevue des recommandations éthiques dans le contexte des études génomiques
Revue des recommandations éthiques dans le contexte des études génomiques
 
Etude sur la population consultante en diagnostic prédictif
Etude sur la population consultante en diagnostic prédictifEtude sur la population consultante en diagnostic prédictif
Etude sur la population consultante en diagnostic prédictif
 

L’UTILISATION DES DONNÉES DE SANTÉ EN RECHERCHE AU QUÉBEC À L’ÈRE DU NUMÉRIQUE : RÉFLEXIONS SUR LA NOTION DE DONNÉES DE SANTÉ ET SUR LE BESOIN DE POLITIQUES INFORMATIONNELLES - Genevieve David

  • 1. ÉCOLE NATIONALE D’ADMINISTRATION PUBLIQUE L’UTILISATION DES DONNÉES DE SANTÉ EN RECHERCHE AU QUÉBEC À L’ÈRE DU NUMÉRIQUE : RÉFLEXIONS SUR LA NOTION DE DONNÉES DE SANTÉ ET SUR LE BESOIN DE POLITIQUES INFORMATIONNELLES TRAVAIL PRÉSENTÉ À MONSIEUR DANIEL J. CARON COMME EXIGENCE PARTIELLE DU COURS ENP7834 – DESIGN INFORMATIONNEL, ADMINISTRATION PUBLIQUE ET NUMÉRIQUE PAR CATHERINE ARMAND GENEVIEVE DAVID VALÉRIE SIRARD 23 AVRIL 2018
  • 2. 2 TABLE DES MATIÈRES 1. INTRODUCTION ..............................................................................................................3 2. PROBLÉMATIQUE...........................................................................................................4 3. ÉLÉMENTS DE CHANGEMENT AVEC L’ARRIVÉE DU NUMÉRIQUE ..................5 4. ENJEUX DE CES CHANGEMENTS FACE AU NUMÉRIQUE ....................................6 4.1. Enjeux de qualité.........................................................................................................7 4.2. Enjeux de quantité.......................................................................................................9 4.3. Enjeux d’interprétabilité............................................................................................10 4.4. Enjeux de protection des renseignements personnels et de la vie privée..................11 5. RÉPERCUSSIONS SUR NOTRE FONCTIONNEMENT INSTITUTIONNEL ET PISTES DE SOLUTION .......................................................................................................................12 5.1. Pistes de solution sur les enjeux de qualité ...............................................................13 5.2. Pistes de solution sur les enjeux de quantité .............................................................14 5.3. Pistes de solution sur les enjeux d’interprétabilité ....................................................15 6. CONCLUSION.................................................................................................................16 7. RÉFÉRENCES .................................................................................................................17 8. ANNEXES........................................................................................................................20 9. NOTES .............................................................................................................................24
  • 3. 3 1. INTRODUCTION Selon le Comité d’experts sur l’accès en temps opportun aux données sur la santé et sur les conditions sociales pour la recherche sur la santé et l’innovation du système de santéi : « [l]a recherche en matière d’innovation, de santé et de bien-être social est essentielle pour que le système de soins de santé donne les meilleurs résultats possibles » (Conseil des académies canadiennes, 2016, p. xiii). La recherche en santé peut avoir de multiples finalités, que ce soit d’améliorer la gestion des établissements (ex.: évaluer le délai entre un diagnostic et un traitement), ou rehausser la qualité des décisions cliniques, en plus de favoriser le développement de nouvelles technologies, notamment l’intelligence artificielle, pouvant faciliter la pose de certains diagnostics et le choix du traitement le plus approprié. Se pose alors la question de l’accès aux données de santé, car certains travaux de recherche ne sont possibles que si les chercheurs ont accès à ces ressources informationnelles à la fois de qualité, disponibles en quantité suffisante et ne laissant que peu de place à l’interprétation. Le Canada en général et le Québec en particulier jouissent d’un atout indéniable à cet égard puisqu’ils sont dotés d’un système de santé public et universel. Par conséquent, la gestion des données de santé devrait être plus facile à encadrer puisque les actes médicaux sont pour la plupart colligés dans les registres de l’État. Des données de santé sont générées à chaque interaction entre un usager du système de la santé et un professionnel (médecin, infirmière, technicien de laboratoire, pharmacien, etc.). Traditionnellement, ces données étaient colligées dans des dossiers sur support papier détenus par les différents professionnels et entreposés aux archives d’un hôpital ou d’un bureau privé. Avec l’arrivée de certaines technologies comme l’ordinateur de bureau et la numérisation, ces mêmes dossiers ont parfois été transférés sur un support électronique. Dans tous les cas, la finalité recherchée était le suivi d’un usager en particulier et non la création de données de santé dans un format permettant une utilisation secondaire de celles-ci à des fins de recherche. Mêmes dans les initiatives récentes, l’accent est mis sur le suivi de l’usager, comme en témoigne le
  • 4. 4 Dossier Santé Québec (DSQ), qui a été implanté progressivement depuis 2013 au Québec (Ministère de la Santé et des Services sociaux, 2013)ii. Bien que la visée du DSQ soit essentiellement une prise en charge et un suivi des usagers plus efficaces par les professionnels de la santé, n’aurait-il pas été opportun lors de son développement de penser à l’utilisation secondaire des données collectées à des fins de recherche? En effet, ce type d’usage secondaire des données ne semble pas avoir été considéré dans ce projet de virage technologique. Dans un contexte numérique, la nature des données de santé ne change pas, mais la façon de les créer et de les consigner subit des transformations majeures qui pourraient multiplier les capacités d’exploitation de ces données à des fins de recherche. Le présent travail aura pour objet les enjeux et possibilités liés à la création des données de santé dans un contexte numérique dans l’optique de faciliter leur exploitation en matière de recherche. Par ailleurs, il ne visera pas les procédures d’accès aux données de santé à des fins de recherche, processus souvent dénoncés parce qu’étant longs et complexes. Enfin, bien que ce soit un enjeu incontournable, le présent travail ne fera que survoler les questions relatives à la protection des renseignements personnels et de la vie privée dans le contexte de la recherche en santé puisque cela aurait pu être un sujet d’étude en soi. 2. PROBLÉMATIQUE La recherche en santé, que ce soit pour l’amélioration des traitements offerts aux patients ou pour augmenter l’efficience du système de santé, requiert des données brutes de qualité. Toutefois, la disponibilité des données et la qualité de celles-ci sont problématiques et représentent un enjeux de taille pour les chercheurs (Maroun, Durand-Zaleski, Nachbaur, Maunoury, & Benjamin, 2016). À défaut d’avoir accès à des données individuelles car l’accès est difficile, certains chercheurs ont recours aux données agrégées, particulièrement au Québec où les établissements québécois n’ont accès qu’à leurs propres données, ne permettant pas de comparaison avec d’autres établissements québécois ou canadiens (Conseil des académies canadiennes, 2016). De
  • 5. 5 plus, les données médico-administratives sont difficilement accessibles tel que dénoncé par plusieurs chercheurs et institutions (Beaulieu & Roy, 2018). Les développements technologiques permettent la création d’outils novateurs offrant de nouvelles possibilités en termes d’utilisation et d’exploitation des données. Dans le domaine médical, le numérique s’est bien implanté comme le démontrent les récents dossiers de santé électroniques maintenant généralement utilisés. Toutefois, il importe de faire les bons choix afin d’exploiter au maximum cette technologie afin qu’elle soit réellement créatrice de plus-value, notamment en matière de création et d’accessibilité des données de santé à des fins de recherche. 3. ÉLÉMENTS DE CHANGEMENT AVEC L’ARRIVÉE DU NUMÉRIQUE L’arrivée du numérique entraîne des changements majeurs, notamment au niveau de la quantité des données disponibles et des capacités de traitement accrues de celles-ci (Hall & Pesenti, 2017). En effet, le numérique et ses développements récents ont mené à la création d’une quantité incalculable de données, que l’on définit d’ailleurs dorénavant en terme de mégadonnées (big data en anglais). L’accroissement de la population et l’augmentation du nombre d’examens effectués, et leurs données propres particulièrement en imagerie médicale, augmentent de manière exponentielle la quantité de données générées et à gérer. Par ailleurs, si les capacités de traitement de l’information se sont accrues, les multiples formats des données les rendent parfois difficilement utilisables, notamment lorsqu’il s’agit de formats ou de supports que la technologie actuelle ne permet plus d'utiliser (Gauthier, 2006). La recherche en santé requiert dans certains cas la mise en commun de plusieurs ensembles de données afin d'obtenir des résultats statistiquement valables. Par exemple, certaines recherches visent à cerner le rôle de divers facteurs sur la santé des individus, ce qui nécessite le partage de plusieurs sources d’information et la collaboration de plusieurs acteurs de différents milieux (ex: étude sur l’impact de l’utilisation des transports en commun sur le poids et l’obésité). Ces éléments doivent amener les organisations à revoir leurs pratiques entourant la gestion de l’information, et ce dans un contexte présentant divers enjeux comme la quantité, la qualité et l’interprétabilité des données de santé.
  • 6. 6 4. ENJEUX DE CES CHANGEMENTS FACE AU NUMÉRIQUE Au regard de ces changements, il appert que la création des données de santé, qu’elles soient individuelles ou médico-administratives, est un enjeu crucial permettant d’effectuer, par une utilisation secondaire, des recherches de qualité. En effet, les données de santé sont les ressources informationnelles essentielles qui, si elles sont de qualité et en quantité suffisante, permettent aux chercheurs d’effectuer un travail efficace. Il importe d’abord de bien définir en quoi consistent ces ressources informationnelles. Selon les Instituts de recherche en santé du Canada, celles-ci, compte tenu de leurs sources et de leurs formes multiples, se déclinent en plusieurs catégories (nous ne retenons que les pertinentes pour la présente étude): ● “Données de la recherche en santé : S'entendent des données découlant d'études scientifiques menées dans tous les domaines de la recherche en santé et requises pour valider les résultats. Cela comprend tant les données humaines (p. ex. issues d'essais contrôlés randomisés) que non humaines. ● Données sur le système de santé : S'entendent des données concernant l'état de santé officiel des personnes (p. ex. le bien-être et les problèmes de santé), le fonctionnement du système de santé (p. ex. son accessibilité et son efficacité) et les caractéristiques du système de santé. Les données administratives, les données cliniques et les données sur la santé des populations en sont des exemples. ● Données sur la santé des populations : Un type de données sur le système de santé qui comprend les données sur les facteurs sociaux, culturels et environnementauxqui influent sur la santé des populations et que permettent de recueillir des enquêtes sur la santé, des systèmes de surveillance de la santé publique et des études longitudinales. ● Données liées à la santé : Données sur les déterminants non médicaux de la santé tels que les comportements, les conditions de vie et de travail, les ressources personnelles et les facteurs environnementaux. ● Données sur les sciences sociales : Un type de données liées à la santé qui comprend les données sur la société humaine et les relations sociales telles que les comportements par rapport à la santé, les conditions de vie et de travail, les ressources personnelles et les facteurs environnementaux.” (Gouvernement du Canada, 2017). Au regard de ces définitions, les enjeux de qualité, de quantité et d’interprétabilité de ces ressources informationnelles seront analysés à la lumière des finalités de la recherche scientifique. L’enjeu de la protection de la vie privée, qui impose des contraintes à tous les niveaux de traitement des données (collecte, utilisation, couplage, etc.), sera brièvement abordé
  • 7. 7 en fin de chapitre. En effet, bien que cet enjeu soit primordial, il aurait pu faire l’objet d’une analyse en soi vu sa complexité et les questions éthiques et juridiques qu’il pose. 4.1. Enjeux de qualité Selon le Comité d’experts en santé, la recherche en matière de santé « dépend de la disponibilité de données de grande qualité » (Conseil des académies canadiennes, 2016). Il est en effet incontestable que dans un contexte de recherche scientifique qui exige des résultats probants, la qualité des données utilisées dans le processus soit très importante. La qualité des données revêt plusieurs attributs, notamment la fiabilité, la pertinence, la représentativité, l’utilisabilité et l’accessibilité en temps opportun. D’abord, les données doivent être fiables, car leur utilisation viendra directement influencer les résultats de la recherche. La fiabilité des données dépend à la fois de la personne qui les consigne et de la façon dont elle le fait. Puisqu’il n’est pas question ici d’aborder la déontologie des acteurs du secteur de la santé, il faut donc plutôt s’attarder aux normes qui encadrent (ou pas) la création des données. Par exemple, nous pouvons nous demander quelles données doivent être collectées, sous quelle forme, pour quelle période, etc. À certains égards, la configuration même des systèmes informatiques pourra influencer la fiabilité des données comme les autorisations d’accès, de partage, d’édition, etc. En deuxième lieu, il importe que les données de santé soient pertinentes au moment de la collecte et dans le futur. À cette fin, une réflexion préalable, devant continuellement être mise à jour, s’impose. En fait, la pertinence des données s’évalue au regard des finalités de recherche poursuivies dans l’espace présent et dans les hypothèses que nous nous faisons du futur. Il importe donc de se questionner sur les angles de recherche qui seront explorés et d’anticiper la survenance de certaines problématiques. Par exemple, il sera extrêmement difficile pour les chercheurs d’évaluer aujourd’hui l’incidence des néonicotinoïdes (« pesticides tueurs d’abeilles ») sur la santé humaine si cette problématique n’a jamais été appréhendée et qu’aucune donnée permettant d’évaluer cette relation n’a été consignée au cours des années précédentes.
  • 8. 8 Ensuite, l’enjeu de la représentativité des données se pose. En effet, les moyens technologiques, les compétences et la volonté d’utiliser à meilleur escient les nouvelles technologies ne sont pas les mêmes partout. Il est donc important que cette utilisation inégale de la technologie ne vienne pas fausser la fiabilité des données de santé au regard de leur représentativité. Par exemple, si une région du Québec accuse du retard au niveau du déploiement du dossier de santé électronique et que par conséquent, certaines données de cette région ne sont pas colligées, cela pourrait avoir un impact direct sur la qualité des données globales et le portrait de la situation qui sera dressé. En ce qui concerne l’utilisabilité des données, cet enjeu se pose au regard du grand nombre de données disparates et devant l’absence de standards encadrant la forme que celles-ci doivent prendre. Le Comité d’experts en santé soulignait dans son rapport qu’il existe deux types de données: les données structurées et les non structurées. Les données structurées consistent en des « données élémentaires [qui] peuvent être facilement entrées dans des formats standards et manipulées par des bases de données automatisées » (Conseil des académies canadiennes, 2016). Pour leur part, les données non structurées « ne possèdent pas de structure commune identifiable » (Conseil des académies canadiennes, 2016). Les renseignements qui se retrouvent par exemple consignés à la main dans des dossiers papier ou sur des formulaires, bien que pouvant être extrêmement utiles, sont très difficiles à exploiter à grande échelle. Beaucoup de temps et d’argent doivent être consacrés à l’examen des dossiers afin que ces données puissent être utilisables à des fins de recherche. La question de l’utilisabilité des données, plutôt technique parce que faisant référence à des concepts technologiques, est néanmoins essentielle pour permettre l’exploitation des données à un coût qui ne soit pas rédhibitoire. Enfin, les données de santé ne pourront pas être de qualité si elles ne sont pas accessibles en temps opportun. En effet, l’accès aux données de santé en temps opportun est un facteur essentiel permettant une utilisation efficiente de celles-ci. Le Comité d’experts en santé mentionnait d’ailleurs à ce sujet que « les longs retards dans l’accès aux données peuvent nuire à l’efficacité de la recherche et à la pertinence des conclusions et, en fin de compte, se traduire par la perte d’occasions de créer des bienfaits pour le public » (Conseil des académies canadiennes, 2016). Sur la scène internationale, pensons notamment aux épidémies récentes de maladies comme la
  • 9. 9 maladie à virus Ebola qui ont requis la mobilisation de la communauté scientifique internationale afin de mener rapidement des études sur des vaccins ou autre remèdes efficaces. Ici comme ailleurs, l’accès en temps opportun aux données se heurte aux multiples procédures d’accès et d’échange d’information qui peuvent parfois s’avérer longues et complexes, notamment au Québeciii. 4.2. Enjeux de quantité Chaque interaction entre un usager du système de santé et un professionnel produit des données. Toutefois, les progrès technologiques ont fait exploser leur volume et leur variété (Thiebaut, 2016). Ce problème relié à la quantité de données disponibles se pose en santéiv, mais également dans d’autres domaines comme la sociologie, les sciences sociales ou environnementalesv. Selon le rapport du Comité d’experts en santé, « la quantité mondiale d’information numérique devrait augmenter de 300 fois entre 2005 et 2020, passant de 130 à 40 000 exaoctets (ou 5 200 gigaoctets pour chaque habitant de la planète), avec un doublement tous les deux ans (Conseil des académies canadiennes, 2016). » Selon ce même comité, le tiers de ces données pourraient être analysées et corrélées avec des données médicales, sociologiques ou tirées d’études distinctes pour générer de nouveaux résultats intéressants. Toutefois, il appert que les données complémentaires aux données de santé, comme par exemple les données environnementales ou administratives, sont encore plus dispersées et variées que les données de santé, ce qui représente un double défi pour la recherche (Conseil des académies canadiennes, 2016). Pour exploiter ces données disparates, non harmonisées et sous-utilisées, les chercheurs font appel à des outils (algorithmes) d’analyse des mégadonnées, c’est-à-dire, les données non structurées appelées également « données massives ». Le big data, littéralement « grosses données », se définit par Gartner comme suit: « Big data is high-volume, high-velocity and/or high-variety information assets that demand cost-effective, innovative forms of information processing that enable enhanced insight, decision making, and process automation » (Gartner, 2018).
  • 10. 10 Parmi les mégadonnées se trouvent les données provenant des bases médico-administrativesvi, fiables et facilement utilisables, les données provenant de cohortes (Thiebaut, 2016)vii, les données d’études cliniques (données recueillies lors du développement de vaccins par exemple), et celles provenant des objets de santé connectés. Ces dernières sont stockées dans le nuage par des organismes publics, mais aussi par des géants de l’industrie du sport ou par des multinationales du GAFAMviii et autres. Ces quantités astronomiques et sans cesse grandissantes de données disparates nécessitent des outils et des techniques standardisées pour être interprétées et utilisées scientifiquement (Chen, 2012). L’analyse des mégadonnées est fréquente dans certains domaines comme la finance ou la politique, mais moins fréquente dans le domaine de la santé, plus particulièrement pour des raisons éthique et de sécurité des données (anonymisation des données, enjeux de sécurité résultant du partage de ces données). Mais ces défis liés à la sécurité ne doivent pas, pour certains, constituer un frein à la recherche car l’étude de sources diverses permettrait de dégager des corrélations pertinentes qu’il serait impossible d'obtenir autrement (Hilali, 2017; Marcoux, 2015; Thiebaut, 2016). Elle pourrait également jouer un rôle dans la prévention en permettant d’identifier les facteurs de risque de certaines maladies, de développer des outils d’aide au diagnostic, de vérifier l’efficacité d’un traitement et de prédire les épidémies. Des outils comme Healthmap, GLEAMviz et Sentinelle sont des exemples de ce que l’étude et le croisement de données offrent comme possibilitésix. 4.3. Enjeux d’interprétabilité Les données de santé présentent également un enjeu au niveau de leur interprétabilité. En effet, la ressource informationnelle acquiert un sens via une interprétation qui pourra être faite par différentes sources comme l’auteur, la donnée en elle-même et le lecteur tel que le suggère Eco (Eco, 1992). Ici, nous nous intéressons plus précisément au sens que donnera le lecteur, c’est-à- dire le chercheur, aux ressources informationnelles. L’interprétation que fera le chercheur de ces données sera teintée de ses expériences antérieures (Blais & Martineau, 2006) qui se déroulent dans un environnement à la fois cadré et divergeant. En effet, Zarifan propose une distinction entre signification, héritée et appropriée par une communauté ayant une compréhension commune et donc d’une certaine façon conventionnelle et cadrée, et sens qui échappe à cet ordre
  • 11. 11 de la convention et tentera de discriminer et de créer une cohésion (Barbier & Galatanu, 2001). Ainsi, c’est dans le sens que donnera le chercheur à la ressource informationnelle, et parce qu’elle s’inscrit également dans une signification commune de la communauté, que nous pouvons espérer dégager une avancée de la connaissance ou une découverte scientifique novatrice. Toutefois, il est important de bien distinguer le sens qui sera donné à l’information de celui donné aux données brutes. En effet, la donnée brute est la plus petite unité de ressource informationnelle tandis que l’information est composée de plusieurs données brutes (Lavrakas, 2008). Ainsi, dans le cas des ressources informationnelles en santé qui seraient utilisées à des fins de recherche, le but visé est de réduire au minimum l’interprétabilité de la donnée brute afin que la signification soit la même pour tous les chercheurs. Ceci étant dit, la faisabilité de l’atteinte de cette signification commune demeure plus probable pour les données quantitatives que qualitatives. En effet, les données brutes quantitatives laissent moins de place à une signification autre au sein de la communauté comme les résultats de tests de laboratoire, le nombre d’hospitalisation et la maladie du patient, tandis que les données brutes qualitatives acquièrent leur sens par l’interprétation comme les notes qui se trouvent au dossier médical du patient. 4.4. Enjeux de protection des renseignements personnels et de la vie privée Les enjeux de protection des renseignements personnels et de la vie privée sont omniprésents et constituent « le défi principal et primordial » (Conseil des académies canadiennes, 2016) dans le contexte de l’utilisation des données de santé à des fins de recherche. Bien que ne faisant pas l’objet de ce travail, nous nous devons d’en esquisser les grandes lignes pour éventuellement en tenir compte lors de l’élaboration des pistes de solution. Au Québec, la protection des données de santé est clairement encadrée par la Loi sur les services de santé et les services sociaux et la Loi concernant le partage de certains renseignements de santé (Éditeur officiel du Québec, 2018b, 2018a, 2018c). En résumé, soulignons que ces données sont confidentielles sauf si la personne concernée consent à ce qu’un tiers y ait accès. Les renseignements personnels ne peuvent être utilisés qu’à la seule fin prévue et annoncée lors de leur collecte et ils ne peuvent être communiqués qu’avec le consentement de la personne concernée.
  • 12. 12 Dans un contexte de recherche, il est important de maintenir un haut niveau de sécurité des données et de s’assurer du respect des règles existantes (ou de les modifier), par exemple, en mettant en place des mécanismes permettant d’obtenir un consentement libre et éclairé des usagers face à l’utilisation de leurs données à des fins de recherche. Aussi, les techniques d’anonymisation des données doivent être améliorées de façon constante afin de réduire le plus possible les risques de réidentification. 5. RÉPERCUSSIONS SUR NOTRE FONCTIONNEMENT INSTITUTIONNEL ET PISTES DE SOLUTION De ces constats émerge la question suivante: comment favoriser la création de données de santé qui soient réellement pertinentes et utilisables à des fins de recherche ? Un élément de réponse à cette question semble aller de soi: il importe de revoir les normes encadrant la production documentaire en matière de santé (ou d’en créer), de façon à répondre aux enjeux relatifs aux trois dimensions de ces ressources informationnelles, telles que définies précédemment en terme de qualité, de quantité et d’interprétabilité. En somme, il s’agit de repenser la gouvernance de l’information en matière de santé au moyen de normes et de politiques administratives afin de faciliter le partage et l’utilisation des données de santé en recherche. Tel que l’énonce l’auteur Smallwood: « And there also is the high-value benefit of basing decisions on better, cleaner data, which can come about only through rigid, enforced information governance (IG) policies that reduce information glut » (Smallwood, 2014). Les données de santé ne doivent plus être perçues comme des objets statiques qui ne servent qu’à une fin : le suivi d’un patient. Pour améliorer les résultats de la recherche en santé, les données doivent, à la base, être appréhendées comme pouvant servir à cette fin, dans un système de flux informationnel permettant leur utilisation secondaire et prévoyant les critères à respecter afin de le faire en toute légalité. Dans le cadre de cette recherche, nous nous intéressons particulièrement à l’étape de la création des données dans tout le spectre de la gouvernance de l’information dans le domaine de la santé. Bien d’autres enjeux, qu’il n’est pas possible d’aborder ici, devraient également être évalués: procédures d’accès aux données, partage et couplage de données, enjeux de protection des
  • 13. 13 renseignements personnels, enjeux de sécurité, etc. Dans les prochaines sections, nous nous concentrerons à proposer des pistes de solution normatives pour les enjeux de qualité, de quantité et d’interprétabilité des données de santé. 5.1. Pistes de solution sur les enjeux de qualité Les enjeux de qualité réfèrent directement à la gouvernance des données. En effet, « data governance focuses on information quality from the ground up at the lowest or root level, so that subsequent reports, analyses, and conclusions are based on clean, reliable, trusted data (or records) in database tables » (Smallwood, 2014). Tel que mentionné précédemment, la qualité des données réfère à leur fiabilité, pertinence, représentativité, utilisabilité et accessibilité en temps opportun. La gouvernance des données par des normes ou politiques devrait donc viser à assurer que les données créées satisfassent ces attributs. À l’égard de la fiabilité des données, les normes mises en place devraient notamment prévoir quelles données doivent être créées, sous quelle forme, pour quelle période, etc. Aussi, ces normes devraient encadrer la configuration des systèmes informatiques, susceptibles d’influencer la fiabilité des données, comme les autorisations d’accès, de partage, d’édition, etc. En ce qui concerne la pertinence des données, celle-ci s’évalue au regard des finalités de recherche poursuivies. Ainsi, il importe que les normes documentaires imposent une réflexion en continu quant aux besoins informationnels dans le secteur de la recherche en santé. Bien identifier les besoins en matière de recherche en amont permettra de créer la bonne information afin de pouvoir l’exploiter. En matière de représentativité des données, il importe de s’assurer que de manière générale, tous les profils d’individus et toutes les régions d’un territoire donné soient représentés. L’imposition d’une même norme (et l’accès aux mêmes ressources) à tous les acteurs du domaine de la santé sera de nature à favoriser cet élément.
  • 14. 14 Au regard de l’utilisabilité des données, les normes pourront permettre d’instaurer une cohérence et une uniformisation en matière de saisie de données, notamment quant à leur format. À cet égard, le Comité d’experts en santé s’exprime ainsi: Le plein potentiel des données canadiennes sur la santé et données connexes ne peut être exploité que si ces données sont prêtes à analyser. [...] Pour pouvoir être comparées ou combinées, et faire l’objet d’analyses statistiques significatives, les données doivent être harmonisées. Une démarche idéale d’harmonisation comporte la standardisation de la terminologie, des questionnaires, des mesures et protocoles normalisés (c’est-à-dire pour l’harmonisation prospective) (Conseil des académies canadiennes, 2016). Enfin, en ce qui concerne l’accessibilité en temps opportun des données, cet aspect ne relève pas de l’étape de la création documentaire, mais plutôt d’une étape subséquente concernant les règles d’accessibilité et de partage des données. Tel qu’annoncé au début de cette section, la présente recherche ne vise pas toutes les facettes de la gouvernance de l’information dans le domaine de la santé, bien que chacune soit essentielle. 5.2. Pistes de solution sur les enjeux de quantité Pour que les données soient directement utilisables à des fins de recherche, il faut tout d’abord effectuer un travail d’harmonisation et réfléchir les systèmes à venir pour un partage dans un objectif de recherche (Conseil des académies canadiennes, 2016). Il est souhaitable que les façons de faire et les formats des données soient uniformisées et qu’il y ait une meilleure interconnexion entre les dispositifs et l’Internet des objets, ces objets connectés, responsables de l’explosion des données à l’origine des mégadonnées (Helbing & Pournaras, 2015). Il va de soi que l'harmonisation n’est pas toujours possible et la démarche peut être coûteuse en temps et en main-d’œuvre. Aussi, il se peut que certaines manières de faire ou de définir les données ne puissent pas donner lieu à un consensus (Conseil des académies canadiennes, 2016). Pour que le partage des données puisse se faire efficacement, il faut également simplifier les normes et uniformiser les législations car ceux qui ont besoin d’accéder aux données doivent naviguer dans un « milieu complexe d’entités hétérogènes comprenant souvent de nombreux dépositaires de données, bureaux de protection de la vie privée et comités d’éthique de la
  • 15. 15 recherche, dont la gouvernance et les méthodes de fonctionnement ne constituent pas un système bien défini et cohérent. » (Conseil des académies canadiennes, 2016) Dans notre système de santé public, la partage des données de santé à des fins de recherche implique d'amener les professionnels à travailler différemment. Adopter une méthode de travail novatrice dans un système surchargé implique évidemment de sensibiliser et d’éduquer les travailleurs à tous les niveaux de la hiérarchie du système de santé. Toutefois, cette transformation des méthodes de travail ne peut se faire qu’accompagnée de règles strictes de gouvernance. Finalement, afin de ne pas nourrir davantage et inutilement ce big data, il serait important de ne conserver que les données pertinentes en tenant compte des besoins actuels et des recherches à venir. C’est pourquoi une bonne gouvernance devrait non seulement inclure l’élaboration de normes sur la saisie des données, mais également des dispositions sur la destruction de ces données le temps venu. 5.3. Pistes de solution sur les enjeux d’interprétabilité Nous pouvons nous demander comment s’assurer que l'interprétation de la donnée brute soit la même pour tous. Dans le domaine de la recherche, quelques pistes de solutions existent comme accompagner les données brutes d’un dictionnaire des variables qui permettra de comprendre le contexte de collecte et de classification des données brutes (SHARE Project, 2018). Ces dictionnaires peuvent donc être considérés comme des métadonnées concernant les données brutes et les normes misent en place devraient également définir ce qu’est une métadonnée dans le contexte de cette norme. En recherche qualitative, l’accent est mis sur la capacité du chercheur de donner un sens aux données brutes (Savoie-Zajc & Karsenti, 2000). Vouloir en extraire un sens, c’est aller au-delà de la donnée brute (Denzin & Lincoln, 2005). Donc, là où il est souhaitable que l’interprétabilité se produise c’est au niveau de l’analyse des données brutes (donnée 0), pour leur donner un sens qui pourra ou non être accepté par la communauté de pairs. Ce sens attribué par le chercheur se produit a posteriori de la collecte dans le cycle de vie de la ressource informationnelle (voir
  • 16. 16 Annexe Figure 5.1)(Blais & Martineau, 2006). Ainsi, nous pouvons nous demander à qui revient la responsabilité de garantir une signification commune de la donnée brute en santé. Si nous faisons appel aux diverses sources d’interprétations (auteur, donnée, lecteur/utilisateur) inspiré de Eco, nous suggérons que chacun d’eux ait une certaine responsabilité quant à la signification de la donnée brute, mais que la responsabilité se situe plus particulièrement chez l’auteur, c’est- à-dire la personne qui crée ou collecte la donnée brute. Finalement, bien que nous suggérons que la responsabilité de l’interprétabilité des données brutes se situe au niveau de l’auteur, nous devrons également planifier dans une norme documentaire le partage et l’utilisation des données où l'interprétation peut se faire à différents moments et par différents acteurs (voir Annexe Figures 5.2 et 5.3). Ainsi, l’auteur des données brutes (données 0) pourra partager ses données avec le lecteur 1. Lorsque le lecteur 1 utilisera les données, il en fera une interprétation pour lui donner un sens et ces données pourront prendre une nouvelle forme (donnée 1) pour devenir de l’information. Ce processus de partage et d’utilisation peut, mais ce n’est pas obligatoire, se faire à l’infini à l’intérieur ou à l’extérieur de l’organisation. 6. CONCLUSION En conclusion, nous sommes d’avis que des normes, sinon canadiennes du moins québécoises, devraient être créées et misent en œuvre afin d’encadrer de façon cohérente la création des données de santé afin que celles-ci puissent être plus facilement accessibles et utilisables à des fins de recherche. Ces normes devraient servir à valoriser ces ressources informationnelles et à s’assurer qu’elles répondent adéquatement aux enjeux de qualité, de quantité et d’interprétabilité tel que détaillés précédemment. Le contexte actuel est favorable, alors que des dossiers de santé informatiques tel que le DSQ sont progressivement implantés un peu partout au Canada. Il importe toutefois de faire vite puisque l’utilisation secondaire des données de santé à des fins de recherche devrait idéalement être pensée dès la conception de ces systèmes de consignation numérique des données, afin d’éviter des délais, coûts supplémentaires et même dans certains cas la non-exploitation de ces données en recherche en raison du découragement des chercheurs. À cet égard, il est intéressant de noter qu’une initiative visant à faciliter l’accès à certains renseignementsx aux fins de recherche a été annoncée dans le dernier budget du Québec (Gouvernement du Québec, 2018). Nous ne pouvons qu’espérer qu’il s’agit là d’un premier pas vers l’encadrement normatif de la création et de la gestion des données de santé dans la province.
  • 17. 17 7. RÉFÉRENCES Barbier, J.-M., & Galatanu, O. (2001). Signification, sens, formation. Consulté le 30 mars 2018, à l’adresse http://www.persee.fr/doc/rfp_0556-7807_2001_num_134_1_2782_t1_0169_0000_3 Beaulieu, M.-D., & Roy, D. (2018). Utilisation des données cliniques issues des dossiers médicaux électroniques à des fins de recherche et d’amélioration continue de la qualité des soins et services de première ligne. Consulté le 17 avril 2018, à l’adresse https://www.inesss.qc.ca/fileadmin/doc/INESSS/Rapports/SoinsPremiereLigne/INESSS_Utilisat ion_donnees_cliniques.pdf Blais, & Martineau. (2006). L’analyse inductive générale : description d’une démarche visant à donner un sens à des données brutes. Recherches qualitatives, 26(2), 1‑18. Caron, D. J. (2017). Chapitre 26 La production documentaire dans les administrations publiques : enjeux et pistes de solution. In Secrets d’États? 2e édition — Presses de l’Université du Québec. Consulté à l’adresse http://www.puq.ca/catalogue/livres/secrets-etats-edition-3280.html Chen, C. (2012). Making Sense of Mobile Health Data: An Open Architecture to Improve Individual- and Population-Level Health. Journal of Medical Internet Research. Consulté à l’adresse http://www.jmir.org/2012/4/e112/ Conseil des académies canadiennes. (2016). L’accès aux données sur la santé et aux données connexes au Canada | CCA | Conseil des académies canadiennes. Consulté le 17 avril 2018, à l’adresse http://sciencepourlepublic.ca/uploads/fr/assessments%20and%20publications%20and%20news% 20releases/health-data/healthdata_fullreport_fr.pdf Denzin, & Lincoln. (2005). The Sage Handbook of Qualitative Research (3rd edition). Consulté le 30 mars 2018, à l’adresse https://www.researchgate.net/publication/280196510_The_Sage_Handbook_of_Qualitative_Res earch_3rd_edition2006138Edited_by_Norman_K_Denzin_and_Yvonna_S_Lincoln_The_Sage_ Handbook_of_Qualitative_Research_3rd_edition_Thousand_Oaks_CA_and_London_Sage_Publ ic Eco, U. (1992). Les limites de l’interprétation. Grasset. Éditeur officiel du Québec. (2018a, février 1). A-2.1 - Loi sur l’accès aux documents des organismes publics et sur la protection des renseignements personnels. Consulté le 20 avril 2018, à l’adresse http://legisquebec.gouv.qc.ca/fr/ShowDoc/cs/A-2.1 Éditeur officiel du Québec. (2018b, février 1). Loi sur les services de santé et les services sociaux. Consulté le 20 avril 2018, à l’adresse http://legisquebec.gouv.qc.ca/en/showDoc/cs/S- 4.2?langCont=fr Éditeur officiel du Québec. (2018c, février 1). P-9.0001 - Loi concernant le partage de certains renseignements de santé. Consulté le 20 avril 2018, à l’adresse http://legisquebec.gouv.qc.ca/fr/ShowDoc/cs/P-9.0001
  • 18. 18 Gartner. (2018). What Is Big Data? - Gartner IT Glossary - Big Data. Consulté le 8 avril 2018, à l’adresse https://www.gartner.com/it-glossary/big-data Gauthier, F. (2006). Impact du numerique sur les normes et les supports traditionnels de preservation - Revue Archvies 37-2. Consulté le 30 mars 2018, à l’adresse https://archivistes.qc.ca/cora/afficheFic.php?fic=vol37_2/Gauthier.htm&usager_id= Gouvernement du Canada, I. de recherche en santé du C. (2017, mai 11). Données de recherche en santé : nouvelles et activités - IRSC. Consulté le 18 mars 2018, à l’adresse http://www.cihr- irsc.gc.ca/f/50182.html Gouvernement du Québec. (2018). Le plan économique du Québec. Consulté à l’adresse http://www.budget.finances.gouv.qc.ca/budget/2018-2019/fr/documents/PlanEconomique_18- 19.pdf Hall, W., & Pesenti, J. (2017, octobre). Growing the artificial intelligence industry in the UK - GOV.UK. Consulté le 8 avril 2018, à l’adresse https://assets.publishing.service.gov.uk/government/uploads/system/uploads/attachment_data/file /652097/Growing_the_artificial_intelligence_industry_in_the_UK.pdf Helbing, D., & Pournaras, E. (2015). Society: Build digital democracy. Nature News, 527(7576), 33. https://doi.org/10.1038/527033a Hilali, I. (2017, juin 27). « MoiPatient » : exemple d’un projet Big Data porté par les patients. Consulté le 18 avril 2018, à l’adresse https://healthcaredatainstitute.com/2017/06/27/moipatient- exemple-dun-projet-big-data-porte-par-les-patients/ Lavrakas, P. (Éd.). (2008). Raw Data. In Encyclopedia of Survey Research Methods. 2455 Teller Road, Thousand Oaks California 91320 United States of America: Sage Publications, Inc. https://doi.org/10.4135/9781412963947.n447 Marcoux, F. (2015, février 20). L’utilisation du Big Data en santé. Consulté le 17 avril 2018, à l’adresse http://polyfinances.ca/blog/2015/02/20/lutilisation-du-big-data-en-sante/ Maroun, R., Durand-Zaleski, I., Nachbaur, G., Maunoury, F., & Benjamin, L. (2016). L’importance et les difficultés de l’accès aux données de santé pour l’évaluation médico- économique : illustration par des travaux de recherche doctorale sur l’impact de l’utilisation de différentes sources de données sur l’évaluation médico-économique dans le cancer du rein et le mélanome. Revue d’Épidémiologie et de Santé Publique, 64, S275. https://doi.org/10.1016/j.respe.2016.04.016 Ministère de la Santé et des Services Sociaux. (2013). Accueil - Dossier de santé - Ministère de la Santé et des Services sociaux. Consulté le 26 février 2018, à l’adresse http://www.dossierdesante.gouv.qc.ca/ Savoie-Zajc, L., & Karsenti, T. (2000). La recherche qualitative/interprétative. In Introduction à la recherche en éducation (p. pp.171-198). Éditions du CRP.
  • 19. 19 SHARE Project. (2018). The Survey of Health, Ageing and Retirement in Europe (SHARE): Data Documentation. Consulté le 30 mars 2018, à l’adresse http://www.share-project.org/data- documentation.html Smallwood, R. F. (2014). Information Governance: Concepts, Strategies, and Best Practices. John Wiley & Sons. Thiebaut, R. (2016, juillet 1). Big data en santé. Consulté le 18 avril 2018, à l’adresse https://www.inserm.fr/information-en-sante/dossiers-information/big-data-en-sante
  • 20. 20 8. ANNEXES Tableau 5.1 : Résumé des pistes de solutions selon les enjeux informationnels Enjeux Qualité Quantité Interprétabilité Pistes de solution. Créer une norme comprenant : - Définir quelles données doivent être créées, sous quelle forme, pour quelle période, etc. - Encadrer la configuration des systèmes informatiques - Obliger la réflexion en continu quant aux besoins informationnels - Représenter les différents profils d’individus et toutes les régions - Cohérence et uniformisation en matière de saisie de données - Harmoniser les données - Simplifier les normes et clarifier les législations - Sensibiliser les professionnels à travailler différemment - Créer d’un dictionnaire des variables, en quelque sorte des métadonnées renseignant sur le contexte de collecte et de classification des données brutes - Définir la métadonnée - Responsabiliser l’auteur qui crée ou collecte la donnée brute pour l’interprétation juste de celle-ci - Responsabiliser l’utilisateur pour le partage et l’utilisation des données
  • 21. 21 Figure 5.1: Cycle de vie de l’information. Adapté de Caron (Caron, 2017). La donnée a comme attributs la qualité, la quantité et l’interprétabilité. Les attributs de qualité et de quantité seront principalement présents au début du cycle de vie, au niveau de la création et collecte, tandis que l’interprétabilité pourrait se faire à différentes moment du cycle. Ce cycle est non chronologique une fois la donnée créée, c’est-à-dire, que dans une organisation A la donnée peut être collectée, classée et partagée avec une organisation B, et cette organisation B pourra la classer et l’utiliser différemment par exemple. La figure 5.2 explique plus en détails le partage et l’utilisation des données dans une ou plusieurs organisations.
  • 22. 22 Figure 5.2: Modèle suggéré de partage et d’utilisation des données. L’auteur collectera ou créera la donnée brute (donnée 0). Nous suggérons que cette donnée ne subira aucune interprétation à cette étape. L’auteur des données brutes pourra par la suite partager ses données avec le lecteur 1 ou interpréter lui-même ses données. Lorsque le lecteur 1 utilisera les données brutes, il en fera une interprétation pour lui donner un sens et ces données pourront prendre une nouvelle forme (donnée 1). Ce processus de partage et d’utilisation peut, mais ce n’est pas obligatoire, se faire à l’infini à l’intérieur ou à l’extérieur de l’organisation.
  • 23. 23 Figure 5.3 : Modèle suggéré de cycles d’interprétation des données. Les technologies du numérique amènent des changements dans l’interprétation des données. La donnée brute (donnée 0) peut être interprétée par l’humain via un raisonnement logique acquis par l’expérience et divers savoirs (information) ou par le robot via des algorithmes. L’information, que ce soit des métadonnées ou d’autres données jumelées aux données brutes à analyser, affecte l’interprétation que nous aurons d’elles qui acquièrent un sens se situant sur un continuum. La quantité et la qualité de l’information affectent la position du sens donné à la donnée brute sur ce continuum et qui deviendra alors une nouvelle donnée (donnée 1). Ceci représente un cycle d’interprétation possible. Une multitude de cycles d’interprétation pourront se faire par la suite à l’intérieur ou à l’extérieur d’une organisation ayant créé la donnée brute. L’humain, en plus de pouvoir interpréter directement, peut interpréter la donnée brute par un algorithme créé par l’humain. Donc, l’humain pourra teinter l’interprétation que le robot se fera des données brutes. L’intelligence artificielle de type forte (strong AI) permettra un apprentissage autonome qui pourra alimenter la logique propre au robot.
  • 24. 24 9. NOTES i Comité d’experts constitué par le Conseil des académies canadiennes et mandaté par les Instituts de recherche en santé du Canada afin de mener une vaste étude sur le sujet de la recherche en santé au Canada (ci-après le Comité d’experts en santé). ii Le Dossier Santé Québec (DSQ) est un outil qui permet aux médecins et à d’autres professionnels de la santé d’avoir accès à des renseignements jugés essentiels pour intervenir rapidement et assurer un suivi de qualité auprès de leurs patients. iii Cette situation est fréquemment dénoncée par les chercheurs québécois, voir notamment: Étienne Plamondon Emond, “Paralysie dans l’accès aux données en santé”, dans Le Devoir, édition du 17 février 2018, p. E1-2. iv Dossiers de santé, imagerie médicale, dépistage génétique, etc. v Données sur l’activité physique, l’obésité, le salaire annuel moyen, la pollution de l’air, etc. vi Les données de la RAMQ par exemple. vii Voir par exemple l’étude de Sandra Gauthier sur Les maladies autosomales récessives au Saguenay-Lac-St-Jean, Université Laval, 1992 (http://constellation.uqac.ca/1448/) viii GAFAM : Google, Apple, Facebook, Amazon, Microsoft, etc ix Healthmap (http://www.healthmap.org/fr), GLEAMviz (http://www.gleamviz.org) et Sentinelle (https://websenti.u707.jussieu.fr/sentiweb) x Cette mesure ne concerne pas uniquement les données de santé, mais aussi celles détenues par plusieurs ministères et organismes.