JTC 2024 - Réglementation européenne BEA et Transport.pdf
Plateformes génériques pour le partage de données et de traitements : exemple de mise en oeuvre en environnement santé
1. Plateformes génériques pour le partage de
données et de traitements:
Exemple de mise en œuvre en santé-environnement
Jean Christophe Desconnets (IRD - UMR ESPACE-DEV)
Jean-christophe.desconnets@ird.fr
Paris, le 11 Juillet 2016
2. Qui suis-je ?
Ingénieur de recherche à l’IRD
Maison de la Télédétection (Montpellier)
Depuis 2007 : UMR 228 ESPACE-DEV (IRD, UM2, UAG, UR)
3. Mes Compétences
A l’interface entre STIC et sciences environnementales
Architecte des systèmes d’ information géographique
Données et connaissances spatio-temporelles
Doctorat en science de l’eau (Université de Montpellier 2)
DEA en science du sol (Paris VI)
Master d’informatique – spécialisation en géomatique (UM)
4. Recherches interdisciplinaires/
pluridisciplinaires … aux interfaces
…
Du satellite à l’acteur
ESPACE-DEV : « Espace pour le développement »
Equipe MICADO : Modélisation, Ingénierie des Connaissances et Analyse des
Données spatiales
Axe 1 – Science des données spatialisées : modélisation, intégration et l’analyse
des données spatio-temporelles
Axe 2 – Couplage des modélisations symboliques et numériques : l’intégration de
l’approche symbolique à des approches numériques au sens large
8. Systèmes d’information en environnement
Limites
Domaine
A
SIE A
Méthodes
d’accès A
Modèle spécifique A
Domaine
C
SIE C
Méthodes
d’accès C
Modèle spécifique A
Domaine
B
SIE B
Méthodes
d’accès B
Modèle spécifique B
modèle?
méthode?
11. Approche préconisée
Définition d’un cadre conceptuel et technique
Infrastructure de
données spatiales
Représentation partagée
Modèles abstraits
Architecture distribuée
Interoperabilite
12. Spécifications conceptuelles
Modèles abstraits de métadonnées, données et vocabulaires
darwinCore:scientificNameID
ISO19115:keyword
dc:coverage
Dipterocarpus
retusus
forest
Karnataka
Ecological
concept
AreaElement
Ecosystem
Interactions
BioticEntity
AbioticEntity
HumanEntity
Formalisme
Modèles de données spatio-temporelles
Format d’échanges
13. Architecture et Composants
Une architecture distribuée
Service
terminologique
Géoportail
Catalogues
Entrepôts de
données spa3ales
Chaînes de traitements mé3er
Service d’agréga3on et
d’orchestra3on de services
Service de
découverte et
d’accès aux
données (SAD)
Service
d’accès aux
traitements
(SAT)
Transforma3on
SAD
SAT
SAD
14. Exemple de mise en œuvre
GAPAM Sentinela : Observatoire Climat -Santé
de la
ZTGA (Brésil – Guyane)
15. l Au niveau mondial
- 2013 : 198 millions de cas, 584 000 décès en 2013 (OMS, 2014)
- Recule significativement à l'échelle mondiale depuis 2000
58% du taux de mortalité
37% du taux d'incidence
⇒ Élimination d'ici 2030 (Objectifs post-2015 de l'ONU pour le
Développement Durable - ODD)
l Dans la zone transfrontalière Guyane-Amapá
Diminution significative du nombre de cas
⇒ Pré-élimination d'ici 2018 en Guyane (Plan de lutte)
[Wangdi et al., Advances in Parasotology, 2015]
Contexte épidémiologique
16. Contexte transfrontalier
⇒ Situation mal connue, instable, recrudescence possible
l Populations vulnérables
l Zone en mutation
l Protocoles, données, informations,
connaissances peu partagés
l Flux importants de populations
difficiles à suivre et caractériser
(circulation incontrôlée du parasite)
l Pas de mise en commun
opérationnelle des données et
informations
17. Objectifs de la ZTGA
l Construire une vision partagée de la situa3on dans la ZTGA
l Construire des indicateurs spa3o-temporels
l Suivre et an3ciper
l Partager les données et les connaissances (public, chercheurs
et autorité publique )
Besoin d'ac,ons de recherche bilatérales et
inter-disciplinaires
18. Objectifs pour le SI
l Recherche
- MeRre en place les condi3ons d'un recueil régulier et
standardisé de données spa3alisées et mul3disciplinaires de
qualité
- Développer les méthodologies d'intégra3on, d'analyse et
d'interpréta3on des données hétérogènes et
mul3disciplinaires
19. Travaux de recherche
Connaissances
expertes
Représentation partagée
Vision globale et unifiée
(Médiation de données et de
méta-données)
Données
Hétérogènes
Multi-disciplinaires
Utilisateurs
Méthode : Les connaissances multidisciplinaires guident
l'intégration, la recherche, l'analyse et l'interprétation des
données
22. Call H2020-EINFRA-2016-2017
Topic EINFRA-22-2016.1: User driven e-infrastructures innovation - Exploitation of e-
infrastructures for user-driven innovation and pilots responding to community specific
challenges - Societal Challenges : health.
Soumis le 30 mars 2016
Workflow Research e-infrastructure for
Geospatial Environmental Health Studies
23. Situation et Constats
“about a fourth of all global deaths (12.6 millions each year) are linked to the
environment” (WHO) .
Une meilleure compréhension des systèmes éco-épidémiologiques est
crucial pour :
• Suivre et anticiper les situations à risque (indicateurs spatio-temporels),
• Participer à l’élimination de certaines maladies,
Besoin d’une analyse conjointe des facteurs environnementaux,
des dynamiques épidémiologiques et socio-démographiques basée
sur les exper3ses de différentes disciplines (point de vue,
méthodes, modèles, données)
24. Les verrous à lever
• Faible mutualisation des ressources of mutualisation of resources
• Faible réutilisation des plateformes existantes
• Incompatibilité des données liée à l’hétérogénéité à différents
niveaux
• Besoin d’une forte expertise pour réutiliser les algos et modèles
existants
• Manque de connaissance et d’utilisation des données
d’observation de la Terre et climatiques
25. Objectifs
1. Concevoir une plateforme qui fournisse des "services innovants" pour
les "utilisateurs » vers les chercheurs académiques, opérationnels et
les gestionnaires,
2. Amener, favoriser les utilisateurs cibles à réutiliser , développer,
appliquer des traitements de données dans le domaine santé-
environnement.
3. Assurer l’accès à des données ouvertes telles que des données
climatiques, environnementales, d’observation de la Terre,
4. Assurer l’accès et l’utilisation des bibliothèques d’algorithmes et de
modèles statistiques, géo statistiques open source.
5. Assurer sous forme de web services des sorties cartographiques et/ou
temporelles des analyses, pour répondre aux besoins d'analyse, de
surveillance, d'évaluation, de prédiction du risque d'une maladie
comme le paludisme.
26. Notion de workflow
Workflow ou workflow scientifique, modèle de tâches
“est une succession de tâches, souvent décrites par un
diagramme qui permet de représenter graphiquement
l’enchaînement séquentiel ou parallèle des tâches nécessaires
pour obtenir un résultat spécifique à un domaine”
Langage de Workflow : BPMN (Business Process
Modelling Notation) un des standard de description de
workflow
Simple à manipuler et suffisamment riche pour décrire des
workflows scientifiques : combinaison de tâches atomiques et
sous modèles, opérateurs logiques, ….
27. Positionnement de la plateforme
Alert system
service
Environmental Health Community
Academic
researcher
Health Authorithy
manager
SME
Health Authorithy
decision maker
GeoHeaVVen Platform
- Data and models registration
- Data and models discovery
- Shared health vocabularies
- Edition and execution
workflow environment
- Workflow outputs diffusion
Data, Process and Knowledge
- in situ data
- earth observation data
- climate data
- environmental data
- ontologies and vocabularies
- atomic process
- analytic model
Environmental Health innovative
services
mapping
service
surveillance
service
forecasting
service
Health Platforms
Citizen
- Observatories
- Early alert system
- ...
Public health
evaluation
service
28. Vision utilisateur
P1
P4
P2
P3 R1
D1
D2
Workflow
Knowledge
base
Metadata
local
data
local
process
local
data
local
process
local
data
local
process
local
data
local
process
open
EO data
open climate
data
open
Environmental
data
web
innovatives
services
data securely
transferred
workflow
analytics
feedbacks
results securely
returned
UC 1 : Cross border
Malaria transmission
risk
UC 2 : Malaria
outbreaks
UC 4 : Respiratory
diseases
UC 3 : Asthma
disease
build, analyse,
execute workflows
Shared Processing platform for
Environmental Health
Community
Health observatories,
Alert systems ....
Open and Knowledge
data sources
IRI, ...
Sentinel
Landsat
Spot World Heritage
MODIS
ESA
USGS
TerraClass
Open
ontologies and
vocabularies
a) Describe data /single process/
workflow
b) Describe domain processes
constraints
c) Publish data / single process /
workflow
a) Discover data and processes
b) Edit, compose and configure a
new workflow
c) Analyse the workflow
composition
d) Execute a workflow
e) Visualise the outputs of workflow
execution
d) Push outputs outside the platform
29. Vision technique de la plateforme
Metadata
Broker
Data
Broker
OGC
Other
OGC
RDF
OGC
Process
B
Process
A
Data A
Data B
P1
P4
P2
P3 R1
D1
D2
Workflow
editor
P1
P4
P2
P3 R1
D1
D2
WF engine
Workflow validator and adaptator
Data &
Process
discovery
Environment -
Health ontologies
Knowledge
database
Health
informatics
ontologies
Health process
constraints
ontology
validate and adapt
reason with
execute
select
enrich
request
publish outputs
Standardized Web services for
spatio -temporal outputsOGC
request
Catalogue
request
Process
Broker
OGC
Other
Other
Interoperability
layer
Data and Process
layer
Workflow
layer
Knowledge
layer
request
OGC
30. Les scénarii d’utilisation envisagés
IPM : Alerte précoce du paludisme
UJI : Suivi de la Légionelose
CHU Réunion : Maladie congénitales
PLNP : Surveillance du paludisme
UJI : Suivi de maladies respiratoires
IRD : Suivi et évaluation des risques
de transmission du paludisme
IPG : Suivi et évaluation des risques
de transmission arbovirus
FIOCRUZ : Suivi et modélisation
de la diffusion des maladies vectorielles
(Aedes)
33. Positionnement de la plateforme
Alert system
service
Environmental Health Community
Academic
researcher
Health Authorithy
manager
SME
Health Authorithy
decision maker
GeoHeaVVen Platform
- Data and models registration
- Data and models discovery
- Shared health vocabularies
- Edition and execution
workflow environment
- Workflow outputs diffusion
Data, Process and Knowledge
- in situ data
- earth observation data
- climate data
- environmental data
- ontologies and vocabularies
- atomic process
- analytic model
Environmental Health innovative
web services
mapping
service
surveillance
service
forecasting
service
Health Platforms
Citizen
- Observatories
- Early alert system
- ...
Public health
evaluation
service
instance EWS
dépose
décrit
exécute
publie
demande
reçoit
34. - Externaliser pour offrir un environnement de composition et
d'exécution de traitements à des fins expérimentales puis
opérationnelles.
- Capitalisation et partage de l’expertise accumulée en publiant les
algorithmes et modèles dans la plateforme,
- Modularité, généricité et reproductibilité des analyses conçues en
les décomposant sous forme de briques unitaires et en les
recomposant pour construire de nouvelles séquences de
traitements selon le besoin,
- Accès facilité à des données climatiques, environnementales et de
télédétection qui viennent enrichir les analyses sur les données
épidémiologiques, entomologiques,
- Standardisation et publication des résultats produits via le web pour
généraliser leur accès.
En résumé : apports pour un plateforme comme EWS