SlideShare une entreprise Scribd logo
Data Infrastructures : La
gestion de données
distribuées et hétérogènes à
tous les niveaux
Mathieu d’Aquin - @mdaquin
Professor of Informatics / Interim Director
Data Science Institute / Insight Centre for Data Analytics
Pyramide de l’information
“
Information is not
knowledge. Knowledge
is not wisdom.
Wisdom is not truth.
Truth is not beauty.
Beauty is not love.
Love is not music.
Music is the best”
-
- Frank Zappa
Données
Informations
Connais-
sances
Machines
Pyramide de l’information
Données
Informations
Connais-
sances
Machines
stockage
interrogation
traitement
analyse
raisonnement
décision
Pyramide de l’information et le Web (Sémantique)
Données
Informations
Connais-
sances
Machines
Le web sémantique
Réseau de connaissances
Les données liées
Réseau d’information
Le Web
Réseau de documents
Internet
Réseau de machines
Pyramide de l’information et le Web (Sémantique)
Données
Informations
Connais-
sances
Machines
Le web sémantique
Réseau de connaissances
Les données liées
Réseau d’information
Le Web
Réseau de documents
Internet
Réseau de machines
Pyramide de l’information et le Web (Sémantique)
Données
Informations
Connais-
sances
Machines
Le web sémantique
Réseau de connaissances
Les données liées
Réseau d’information
Le Web
Réseau de documents
Internet
Réseau de machines
Pyramide de l’information et le Web (Sémantique)
Données
Informations
Connais-
sances
Machines
Le web sémantique
Réseau de connaissances
Les données liées
Réseau d’information
Le Web
Réseau de documents
Internet
Réseau de machines
Pyramide des implications du traitement de l’information
personne
organisation
communauté
société
Le traitement de l’information touche la
démocratie, la liberté, l’égalité, la
justice, l’éthique, etc.
Le traitement de l’information touche
des groupes sociaux, regroupements
géographiques, etc.
Le traitement de l’information touche
une compagnie, une entreprise, une
institution, etc.
Le traitement de l’information touche
une personne, un individue.
Pyramide des implications du traitement de l’information
personne
organisation
communauté
société
Le traitement de l’information touche la
démocratie, la liberté, l’égalité, la
justice, l’éthique, etc.
Le traitement de l’information touche
des groupes sociaux, regroupements
géographiques, etc.
Le traitement de l’information touche
une compagnie, une entreprise, une
institution, etc.
Le traitement de l’information touche
une personne, un individue.
Pyramide des implications du traitement de l’information
personne
organisation
communauté
société
Le traitement de l’information touche la
démocratie, la liberté, l’égalité, la
justice, l’éthique, etc.
Le traitement de l’information touche
des groupes sociaux, regroupements
géographiques, etc.
Le traitement de l’information touche
une compagnie, une entreprise, une
institution, etc.
Le traitement de l’information touche
une personne, un individue.
Pyramide des implications du traitement de l’information
personne
organisation
communauté
société
Le traitement de l’information touche la
démocratie, la liberté, l’égalité, la
justice, l’éthique, etc.
Le traitement de l’information touche
des groupes sociaux, regroupements
géographiques, etc.
Le traitement de l’information touche
une compagnie, une entreprise, une
institution, etc.
Le traitement de l’information touche
une personne, un individue.
Pyramide des implications du traitement de l’information
personne
organisation
communauté
société
Le traitement de l’information touche la
démocratie, la liberté, l’égalité, la
justice, l’éthique, etc.
Le traitement de l’information touche
des groupes sociaux, regroupements
géographiques, etc.
Le traitement de l’information touche
une compagnie, une entreprise, une
institution, etc.
Le traitement de l’information touche
une personne, un individue.
Des exemples
d’infrastructures de données à
différents niveaux
data.open.ac.uk
personne
organisation
communauté
société
Données
Informations
Connais-
sances
Machines
data.open.ac.uk
owl:sameAs
mlo:offers
mlo:location
http://data.open.ac.uk/course/m366
http://sws.geonames.org/2963597/ (Ireland)
http://data.open.ac.uk/organization/the_open_university
http://education.data.gov.uk/id/school/133849
Data -> Interrogation
Applications
Resource Discovery
Mobile and
Personal
Semantics
ResearchExploration
Social
Au delà d’une
organisation
LinkedUp
LinkedUp
see paper at WebSci 2013
MK:Smart
personne
organisation
communauté
société
Données
Informations
Connais-
sances
Machines
Les données au centre de la ville intelligent
MK Data Hub
MK Data Hub
Analytics
Integration
Curation
Storage
Import
Sensor
Data
Local
Stats
Gov.
Open
Data
...
Mobile
Apps
Dashboards
Business
Intelligence
Social Web
Apps
...
Integre les données temps réel
Autant que les données statique
Au travers d’API intelligentes
Une API centrée entités, qui
intègre les données de plusieurs
sources autour d’un objet/d’une
entité, sur le principe du Linked
Data.
Compile les résultats “à la
demande” (i.e. au moment de la
requête) selon un schema virtuel
(une ontologie) et évolutif.
Et d’un catalogue de données semantique
Représentation explicite et
raisonnement sur les licence de
données…
… ainsi que des flux de données
dans le système
Applications
AFEL
personne
organisation
communauté
société
Données
Informations
Connais-
sances
Machines
Le learning analytics (L’analyse de données
d’apprentissage)
VLE | Website | Library
Assessment | Enrollment
School/University
Typiquement, une université
utilisent les données sur les
étudiants et sur leurs activitées
au travers de leur système
informatique dans le but de
prédire la réussite des étudiants
afin de pouvoir l'améliorer….
Et si on a de la chance, aussi
d'améliorer les enseignements...
Learning Analytics
Mais : Everyday learning
Learner
VLE | Website | Library
Assessment | Enrollment
School/University
Learning Analytics
Mais : Everyday learning
Learner
VLE | Website | Library
Assessment | Enrollment
School/University
Learning Analytics
Learning Analytics
Learning Analytics
see afel-project.eu
Obtenir les données
apprenant
navigateur
apprenant
activités générant des traces et
(des fois, différents) identifiants
navigateur
AFEL Data Platform
Analytics platform
VisualisationAFEL identifier
Analysis
Integrated
personal data
Extension
app
Tracker
Crawler
Crawler
Learning
indicators
Traces and
metadata
AFEL identifier
and local
identifier
AFEL identifier
and local
identifier
AFEL Core Data
Model (based on
schema.org)
Obtenir les données
see afel-project.eu
Exemple: Plugin pour navigateur
see afel-project.eu
Architecture pour l’analyse d’activitées personelles
AFEL Data
PlatformInputAPIs
OutputAPIs
Target
platform
AFEL
Mobile
app
AFEL
Visual
Analytics
AFEL
Rec.
Services
enriched activity
data and
indicators
enriched activity
data and
indicators
recommendations
activity data
resource
text and
metatada
resources
and
activities
see afel-project.eu
Application
see afel-project.eu
Qu’a t’on appris ?
La taille des données et l'hétérogénéité sont
importantes, mais ça on le savait déjà.
La diversité des données et de leurs usages est
toujours un problème.
Qu’a t’on appris ?
Données
Informations
Connais-
sances
Machines
Passer de la à la est
toujours difficile...
see papers from 2006 to 2009
Qu’a t’on appris ?
personne
organisation
communauté
société
Ce niveau la est plus que
jamais un problème !
Qu’a t’on appris ?
personne
organisation
communauté
société
??
Qu’a t’on appris ?
personne
organisation
communauté
société
??
Data Ethics - Comprendre les implications du traitement
des données.
‘Ethics in
Design’ for Data
Science
Dialectic
The process is based on a conversational
approach between data and critical social
scientists throughout the project’s life-cycle.
Reflective
Ethical concerns are not pre-fixed; they may
emanate from any stage of the project; thus,
constant reflexivity on activities and
researchers is needed.
Creative, not disruptive
The objective of this process is to achieve a
positive impact on the research, increase its
value addressing ethics throughout the
project’s life-cycle.
All- encompassing
Ethical concerns appear as much in the
research activities as in their outcomes, their
use and exploitation; the process needs to
expand on all stages.
see paper at AIES 2018
Data Ethics - Comprendre les implications du traitement
des données.
‘Ethics in
Design’ for Data
Science
Dialectic
The process is based on a conversational
approach between data and critical social
scientists throughout the project’s life-cycle.
Reflective
Ethical concerns are not pre-fixed; they may
emanate from any stage of the project; thus,
constant reflexivity on activities and
researchers is needed.
Creative, not disruptive
The objective of this process is to achieve a
positive impact on the research, increase its
value addressing ethics throughout the
project’s life-cycle.
All- encompassing
Ethical concerns appear as much in the
research activities as in their outcomes, their
use and exploitation; the process needs to
expand on all stages.
Design Fiction - utilisation de méthodes de narration
pour extraire and comprendre les implications
possibles des technologies, et pouvoir intégrer des
méthodes préventives dans leur conception. Voir :
Workshop “Re-coding Black Mirror” à The Web
Conference (WWW 2018).
see paper at AIES 2018
Conclusion
On est toujours de plus en plus à la recherche des
éléments d’infrastructure qui permettent de distribuer
et de rendre exploitables les données.
Dans les années 1900, Nicolas Tesla investissait dans la
recherche dédiée à la transmission d’électricité sans fils.
Une des raisons est qu’il ne semblait pas faisable de
construire l’infrastructure globale nécessaire pour
amener l'électricité dans les foyers par des fils.
Concernant les infrastructures de données, peut être
somme nous, de façon similaire, à la fois trop et trop
peu ambitieux...
Merci
mathieu.daquin@insight-centre.org
mdaquin.net
@mdaquin

Contenu connexe

Similaire à Presentation a in ovive montpellier - 26%2 f06%2f2018 (1)

AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoire
noucher
 
Miettes de données - Keynote BDA 2015
Miettes de données - Keynote BDA 2015Miettes de données - Keynote BDA 2015
Miettes de données - Keynote BDA 2015
Amélie Marian
 
Renseignement et information
Renseignement et informationRenseignement et information
Renseignement et information
Nicolae Sfetcu
 
JIES 2014 A. Giordan - Introduction
JIES 2014 A. Giordan - IntroductionJIES 2014 A. Giordan - Introduction
JIES 2014 A. Giordan - Introduction
Groupe Traces
 
Festival Online de la Data 2020 - La data devient l'affaire de tous
Festival Online de la Data 2020 - La data devient l'affaire de tousFestival Online de la Data 2020 - La data devient l'affaire de tous
Festival Online de la Data 2020 - La data devient l'affaire de tous
Alexandra Loria
 
L'émergence d'une nouvelle filière de formation : data science
L'émergence d'une nouvelle filière de formation : data scienceL'émergence d'une nouvelle filière de formation : data science
L'émergence d'une nouvelle filière de formation : data scienceKezhan SHI
 
Valeur de la donnée - David Fayon - Chaire ESSEC stratégie et gouvernance de ...
Valeur de la donnée - David Fayon - Chaire ESSEC stratégie et gouvernance de ...Valeur de la donnée - David Fayon - Chaire ESSEC stratégie et gouvernance de ...
Valeur de la donnée - David Fayon - Chaire ESSEC stratégie et gouvernance de ...
Voir jpperrein Jean-Pascal Perrein
 
Education numérique : thinkdata.ch un outil collaboratif
Education numérique : thinkdata.ch un outil collaboratifEducation numérique : thinkdata.ch un outil collaboratif
Education numérique : thinkdata.ch un outil collaboratif
ThinkData
 
L’évolution du métier de veilleur
L’évolution du métier de veilleur L’évolution du métier de veilleur
L’évolution du métier de veilleur
Camille A
 
Afterwork de la recherche : structuration de la recherche sur les usages et l...
Afterwork de la recherche : structuration de la recherche sur les usages et l...Afterwork de la recherche : structuration de la recherche sur les usages et l...
Afterwork de la recherche : structuration de la recherche sur les usages et l...
La French Tech Rennes St Malo
 
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Gautier Poupeau
 
Presentation 2009 offre Social Computing
Presentation 2009 offre Social ComputingPresentation 2009 offre Social Computing
Presentation 2009 offre Social Computing
Social Computing
 
Système d'aide à l’indexation et à la recherche d’information sur le web
Système d'aide à l’indexation et à la recherche d’information sur le webSystème d'aide à l’indexation et à la recherche d’information sur le web
Système d'aide à l’indexation et à la recherche d’information sur le web
espenel
 
E reputation these doctorat Camille Alloing
E reputation these doctorat Camille AlloingE reputation these doctorat Camille Alloing
E reputation these doctorat Camille Alloing
Amel Miaoulis
 
Processus de veille en PME/ PMI
Processus de veille en PME/ PMIProcessus de veille en PME/ PMI
Processus de veille en PME/ PMIAref Jdey
 
Capitalisation d'expériences pour l'indexation et la recherche d'information ...
Capitalisation d'expériences pour l'indexation et la recherche d'information ...Capitalisation d'expériences pour l'indexation et la recherche d'information ...
Capitalisation d'expériences pour l'indexation et la recherche d'information ...
espenel
 
Portails d'information
Portails d'informationPortails d'information
Portails d'informationSKennel
 
20080911 Intro Conference Yves
20080911 Intro Conference Yves20080911 Intro Conference Yves
20080911 Intro Conference YvesSocial Computing
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Agropolis International
 

Similaire à Presentation a in ovive montpellier - 26%2 f06%2f2018 (1) (20)

AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoire
 
Miettes de données - Keynote BDA 2015
Miettes de données - Keynote BDA 2015Miettes de données - Keynote BDA 2015
Miettes de données - Keynote BDA 2015
 
Renseignement et information
Renseignement et informationRenseignement et information
Renseignement et information
 
JIES 2014 A. Giordan - Introduction
JIES 2014 A. Giordan - IntroductionJIES 2014 A. Giordan - Introduction
JIES 2014 A. Giordan - Introduction
 
Festival Online de la Data 2020 - La data devient l'affaire de tous
Festival Online de la Data 2020 - La data devient l'affaire de tousFestival Online de la Data 2020 - La data devient l'affaire de tous
Festival Online de la Data 2020 - La data devient l'affaire de tous
 
L'émergence d'une nouvelle filière de formation : data science
L'émergence d'une nouvelle filière de formation : data scienceL'émergence d'une nouvelle filière de formation : data science
L'émergence d'une nouvelle filière de formation : data science
 
Valeur de la donnée - David Fayon - Chaire ESSEC stratégie et gouvernance de ...
Valeur de la donnée - David Fayon - Chaire ESSEC stratégie et gouvernance de ...Valeur de la donnée - David Fayon - Chaire ESSEC stratégie et gouvernance de ...
Valeur de la donnée - David Fayon - Chaire ESSEC stratégie et gouvernance de ...
 
Education numérique : thinkdata.ch un outil collaboratif
Education numérique : thinkdata.ch un outil collaboratifEducation numérique : thinkdata.ch un outil collaboratif
Education numérique : thinkdata.ch un outil collaboratif
 
L’évolution du métier de veilleur
L’évolution du métier de veilleur L’évolution du métier de veilleur
L’évolution du métier de veilleur
 
Afterwork de la recherche : structuration de la recherche sur les usages et l...
Afterwork de la recherche : structuration de la recherche sur les usages et l...Afterwork de la recherche : structuration de la recherche sur les usages et l...
Afterwork de la recherche : structuration de la recherche sur les usages et l...
 
SRI
SRISRI
SRI
 
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...
 
Presentation 2009 offre Social Computing
Presentation 2009 offre Social ComputingPresentation 2009 offre Social Computing
Presentation 2009 offre Social Computing
 
Système d'aide à l’indexation et à la recherche d’information sur le web
Système d'aide à l’indexation et à la recherche d’information sur le webSystème d'aide à l’indexation et à la recherche d’information sur le web
Système d'aide à l’indexation et à la recherche d’information sur le web
 
E reputation these doctorat Camille Alloing
E reputation these doctorat Camille AlloingE reputation these doctorat Camille Alloing
E reputation these doctorat Camille Alloing
 
Processus de veille en PME/ PMI
Processus de veille en PME/ PMIProcessus de veille en PME/ PMI
Processus de veille en PME/ PMI
 
Capitalisation d'expériences pour l'indexation et la recherche d'information ...
Capitalisation d'expériences pour l'indexation et la recherche d'information ...Capitalisation d'expériences pour l'indexation et la recherche d'information ...
Capitalisation d'expériences pour l'indexation et la recherche d'information ...
 
Portails d'information
Portails d'informationPortails d'information
Portails d'information
 
20080911 Intro Conference Yves
20080911 Intro Conference Yves20080911 Intro Conference Yves
20080911 Intro Conference Yves
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
 

Plus de Mathieu d'Aquin

A factorial study of neural network learning from differences for regression
A factorial study of neural network learning from  differences for regressionA factorial study of neural network learning from  differences for regression
A factorial study of neural network learning from differences for regression
Mathieu d'Aquin
 
Recentrer l'intelligence artificielle sur les connaissances
Recentrer l'intelligence artificielle sur les connaissancesRecentrer l'intelligence artificielle sur les connaissances
Recentrer l'intelligence artificielle sur les connaissances
Mathieu d'Aquin
 
Data and Knowledge as Commodities
Data and Knowledge as CommoditiesData and Knowledge as Commodities
Data and Knowledge as Commodities
Mathieu d'Aquin
 
Unsupervised learning approach for identifying sub-genres in music scores
Unsupervised learning approach for identifying sub-genres in music scoresUnsupervised learning approach for identifying sub-genres in music scores
Unsupervised learning approach for identifying sub-genres in music scores
Mathieu d'Aquin
 
Is knowledge engineering still relevant?
Is knowledge engineering still relevant?Is knowledge engineering still relevant?
Is knowledge engineering still relevant?
Mathieu d'Aquin
 
A data view of the data science process
A data view of the data science processA data view of the data science process
A data view of the data science process
Mathieu d'Aquin
 
Dealing with Open Domain Data
Dealing with Open Domain DataDealing with Open Domain Data
Dealing with Open Domain Data
Mathieu d'Aquin
 
Web Analytics for Everyday Learning
Web Analytics for  Everyday LearningWeb Analytics for  Everyday Learning
Web Analytics for Everyday Learning
Mathieu d'Aquin
 
Learning Analytics: understand learning and support the learner
Learning Analytics: understand learning and support the learnerLearning Analytics: understand learning and support the learner
Learning Analytics: understand learning and support the learner
Mathieu d'Aquin
 
The AFEL Project
The AFEL ProjectThe AFEL Project
The AFEL Project
Mathieu d'Aquin
 
Assessing the Readability of Policy Documents: The Case of Terms of Use of On...
Assessing the Readability of Policy Documents: The Case of Terms of Use of On...Assessing the Readability of Policy Documents: The Case of Terms of Use of On...
Assessing the Readability of Policy Documents: The Case of Terms of Use of On...
Mathieu d'Aquin
 
Data ethics
Data ethicsData ethics
Data ethics
Mathieu d'Aquin
 
Data for Learning and Learning with Data
Data for Learning and Learning with DataData for Learning and Learning with Data
Data for Learning and Learning with Data
Mathieu d'Aquin
 
Towards an “Ethics in Design” methodology for AI research projects
Towards an “Ethics in Design” methodology  for AI research projects Towards an “Ethics in Design” methodology  for AI research projects
Towards an “Ethics in Design” methodology for AI research projects
Mathieu d'Aquin
 
AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...
AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...
AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...
Mathieu d'Aquin
 
Profiling information sources and services for discovery
Profiling information sources and services for discoveryProfiling information sources and services for discovery
Profiling information sources and services for discovery
Mathieu d'Aquin
 
Analyse de données et de réseaux sociaux pour l’aide à l’apprentissage infor...
Analyse de données et de réseaux sociaux pour  l’aide à l’apprentissage infor...Analyse de données et de réseaux sociaux pour  l’aide à l’apprentissage infor...
Analyse de données et de réseaux sociaux pour l’aide à l’apprentissage infor...
Mathieu d'Aquin
 
From Knowledge Bases to Knowledge Infrastructures for Intelligent Systems
From Knowledge Bases to Knowledge Infrastructures for Intelligent SystemsFrom Knowledge Bases to Knowledge Infrastructures for Intelligent Systems
From Knowledge Bases to Knowledge Infrastructures for Intelligent Systems
Mathieu d'Aquin
 
Data analytics beyond data processing and how it affects Industry 4.0
Data analytics beyond data processing and how it affects Industry 4.0Data analytics beyond data processing and how it affects Industry 4.0
Data analytics beyond data processing and how it affects Industry 4.0
Mathieu d'Aquin
 
Données ouvertes et traces numériques
Données ouvertes et traces numériquesDonnées ouvertes et traces numériques
Données ouvertes et traces numériques
Mathieu d'Aquin
 

Plus de Mathieu d'Aquin (20)

A factorial study of neural network learning from differences for regression
A factorial study of neural network learning from  differences for regressionA factorial study of neural network learning from  differences for regression
A factorial study of neural network learning from differences for regression
 
Recentrer l'intelligence artificielle sur les connaissances
Recentrer l'intelligence artificielle sur les connaissancesRecentrer l'intelligence artificielle sur les connaissances
Recentrer l'intelligence artificielle sur les connaissances
 
Data and Knowledge as Commodities
Data and Knowledge as CommoditiesData and Knowledge as Commodities
Data and Knowledge as Commodities
 
Unsupervised learning approach for identifying sub-genres in music scores
Unsupervised learning approach for identifying sub-genres in music scoresUnsupervised learning approach for identifying sub-genres in music scores
Unsupervised learning approach for identifying sub-genres in music scores
 
Is knowledge engineering still relevant?
Is knowledge engineering still relevant?Is knowledge engineering still relevant?
Is knowledge engineering still relevant?
 
A data view of the data science process
A data view of the data science processA data view of the data science process
A data view of the data science process
 
Dealing with Open Domain Data
Dealing with Open Domain DataDealing with Open Domain Data
Dealing with Open Domain Data
 
Web Analytics for Everyday Learning
Web Analytics for  Everyday LearningWeb Analytics for  Everyday Learning
Web Analytics for Everyday Learning
 
Learning Analytics: understand learning and support the learner
Learning Analytics: understand learning and support the learnerLearning Analytics: understand learning and support the learner
Learning Analytics: understand learning and support the learner
 
The AFEL Project
The AFEL ProjectThe AFEL Project
The AFEL Project
 
Assessing the Readability of Policy Documents: The Case of Terms of Use of On...
Assessing the Readability of Policy Documents: The Case of Terms of Use of On...Assessing the Readability of Policy Documents: The Case of Terms of Use of On...
Assessing the Readability of Policy Documents: The Case of Terms of Use of On...
 
Data ethics
Data ethicsData ethics
Data ethics
 
Data for Learning and Learning with Data
Data for Learning and Learning with DataData for Learning and Learning with Data
Data for Learning and Learning with Data
 
Towards an “Ethics in Design” methodology for AI research projects
Towards an “Ethics in Design” methodology  for AI research projects Towards an “Ethics in Design” methodology  for AI research projects
Towards an “Ethics in Design” methodology for AI research projects
 
AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...
AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...
AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...
 
Profiling information sources and services for discovery
Profiling information sources and services for discoveryProfiling information sources and services for discovery
Profiling information sources and services for discovery
 
Analyse de données et de réseaux sociaux pour l’aide à l’apprentissage infor...
Analyse de données et de réseaux sociaux pour  l’aide à l’apprentissage infor...Analyse de données et de réseaux sociaux pour  l’aide à l’apprentissage infor...
Analyse de données et de réseaux sociaux pour l’aide à l’apprentissage infor...
 
From Knowledge Bases to Knowledge Infrastructures for Intelligent Systems
From Knowledge Bases to Knowledge Infrastructures for Intelligent SystemsFrom Knowledge Bases to Knowledge Infrastructures for Intelligent Systems
From Knowledge Bases to Knowledge Infrastructures for Intelligent Systems
 
Data analytics beyond data processing and how it affects Industry 4.0
Data analytics beyond data processing and how it affects Industry 4.0Data analytics beyond data processing and how it affects Industry 4.0
Data analytics beyond data processing and how it affects Industry 4.0
 
Données ouvertes et traces numériques
Données ouvertes et traces numériquesDonnées ouvertes et traces numériques
Données ouvertes et traces numériques
 

Presentation a in ovive montpellier - 26%2 f06%2f2018 (1)

  • 1. Data Infrastructures : La gestion de données distribuées et hétérogènes à tous les niveaux Mathieu d’Aquin - @mdaquin Professor of Informatics / Interim Director Data Science Institute / Insight Centre for Data Analytics
  • 2. Pyramide de l’information “ Information is not knowledge. Knowledge is not wisdom. Wisdom is not truth. Truth is not beauty. Beauty is not love. Love is not music. Music is the best” - - Frank Zappa Données Informations Connais- sances Machines
  • 4. Pyramide de l’information et le Web (Sémantique) Données Informations Connais- sances Machines Le web sémantique Réseau de connaissances Les données liées Réseau d’information Le Web Réseau de documents Internet Réseau de machines
  • 5. Pyramide de l’information et le Web (Sémantique) Données Informations Connais- sances Machines Le web sémantique Réseau de connaissances Les données liées Réseau d’information Le Web Réseau de documents Internet Réseau de machines
  • 6. Pyramide de l’information et le Web (Sémantique) Données Informations Connais- sances Machines Le web sémantique Réseau de connaissances Les données liées Réseau d’information Le Web Réseau de documents Internet Réseau de machines
  • 7. Pyramide de l’information et le Web (Sémantique) Données Informations Connais- sances Machines Le web sémantique Réseau de connaissances Les données liées Réseau d’information Le Web Réseau de documents Internet Réseau de machines
  • 8.
  • 9. Pyramide des implications du traitement de l’information personne organisation communauté société Le traitement de l’information touche la démocratie, la liberté, l’égalité, la justice, l’éthique, etc. Le traitement de l’information touche des groupes sociaux, regroupements géographiques, etc. Le traitement de l’information touche une compagnie, une entreprise, une institution, etc. Le traitement de l’information touche une personne, un individue.
  • 10. Pyramide des implications du traitement de l’information personne organisation communauté société Le traitement de l’information touche la démocratie, la liberté, l’égalité, la justice, l’éthique, etc. Le traitement de l’information touche des groupes sociaux, regroupements géographiques, etc. Le traitement de l’information touche une compagnie, une entreprise, une institution, etc. Le traitement de l’information touche une personne, un individue.
  • 11. Pyramide des implications du traitement de l’information personne organisation communauté société Le traitement de l’information touche la démocratie, la liberté, l’égalité, la justice, l’éthique, etc. Le traitement de l’information touche des groupes sociaux, regroupements géographiques, etc. Le traitement de l’information touche une compagnie, une entreprise, une institution, etc. Le traitement de l’information touche une personne, un individue.
  • 12. Pyramide des implications du traitement de l’information personne organisation communauté société Le traitement de l’information touche la démocratie, la liberté, l’égalité, la justice, l’éthique, etc. Le traitement de l’information touche des groupes sociaux, regroupements géographiques, etc. Le traitement de l’information touche une compagnie, une entreprise, une institution, etc. Le traitement de l’information touche une personne, un individue.
  • 13. Pyramide des implications du traitement de l’information personne organisation communauté société Le traitement de l’information touche la démocratie, la liberté, l’égalité, la justice, l’éthique, etc. Le traitement de l’information touche des groupes sociaux, regroupements géographiques, etc. Le traitement de l’information touche une compagnie, une entreprise, une institution, etc. Le traitement de l’information touche une personne, un individue.
  • 14. Des exemples d’infrastructures de données à différents niveaux
  • 22. LinkedUp see paper at WebSci 2013
  • 23.
  • 25. Les données au centre de la ville intelligent
  • 26. MK Data Hub MK Data Hub Analytics Integration Curation Storage Import Sensor Data Local Stats Gov. Open Data ... Mobile Apps Dashboards Business Intelligence Social Web Apps ...
  • 27. Integre les données temps réel
  • 28. Autant que les données statique
  • 29. Au travers d’API intelligentes Une API centrée entités, qui intègre les données de plusieurs sources autour d’un objet/d’une entité, sur le principe du Linked Data. Compile les résultats “à la demande” (i.e. au moment de la requête) selon un schema virtuel (une ontologie) et évolutif.
  • 30. Et d’un catalogue de données semantique Représentation explicite et raisonnement sur les licence de données… … ainsi que des flux de données dans le système
  • 33. Le learning analytics (L’analyse de données d’apprentissage) VLE | Website | Library Assessment | Enrollment School/University Typiquement, une université utilisent les données sur les étudiants et sur leurs activitées au travers de leur système informatique dans le but de prédire la réussite des étudiants afin de pouvoir l'améliorer…. Et si on a de la chance, aussi d'améliorer les enseignements... Learning Analytics
  • 34. Mais : Everyday learning Learner VLE | Website | Library Assessment | Enrollment School/University Learning Analytics
  • 35. Mais : Everyday learning Learner VLE | Website | Library Assessment | Enrollment School/University Learning Analytics Learning Analytics Learning Analytics see afel-project.eu
  • 37. apprenant activités générant des traces et (des fois, différents) identifiants navigateur AFEL Data Platform Analytics platform VisualisationAFEL identifier Analysis Integrated personal data Extension app Tracker Crawler Crawler Learning indicators Traces and metadata AFEL identifier and local identifier AFEL identifier and local identifier AFEL Core Data Model (based on schema.org) Obtenir les données see afel-project.eu
  • 38. Exemple: Plugin pour navigateur see afel-project.eu
  • 39. Architecture pour l’analyse d’activitées personelles AFEL Data PlatformInputAPIs OutputAPIs Target platform AFEL Mobile app AFEL Visual Analytics AFEL Rec. Services enriched activity data and indicators enriched activity data and indicators recommendations activity data resource text and metatada resources and activities see afel-project.eu
  • 41. Qu’a t’on appris ? La taille des données et l'hétérogénéité sont importantes, mais ça on le savait déjà. La diversité des données et de leurs usages est toujours un problème.
  • 42. Qu’a t’on appris ? Données Informations Connais- sances Machines Passer de la à la est toujours difficile... see papers from 2006 to 2009
  • 43. Qu’a t’on appris ? personne organisation communauté société Ce niveau la est plus que jamais un problème !
  • 44. Qu’a t’on appris ? personne organisation communauté société ??
  • 45. Qu’a t’on appris ? personne organisation communauté société ??
  • 46. Data Ethics - Comprendre les implications du traitement des données. ‘Ethics in Design’ for Data Science Dialectic The process is based on a conversational approach between data and critical social scientists throughout the project’s life-cycle. Reflective Ethical concerns are not pre-fixed; they may emanate from any stage of the project; thus, constant reflexivity on activities and researchers is needed. Creative, not disruptive The objective of this process is to achieve a positive impact on the research, increase its value addressing ethics throughout the project’s life-cycle. All- encompassing Ethical concerns appear as much in the research activities as in their outcomes, their use and exploitation; the process needs to expand on all stages. see paper at AIES 2018
  • 47. Data Ethics - Comprendre les implications du traitement des données. ‘Ethics in Design’ for Data Science Dialectic The process is based on a conversational approach between data and critical social scientists throughout the project’s life-cycle. Reflective Ethical concerns are not pre-fixed; they may emanate from any stage of the project; thus, constant reflexivity on activities and researchers is needed. Creative, not disruptive The objective of this process is to achieve a positive impact on the research, increase its value addressing ethics throughout the project’s life-cycle. All- encompassing Ethical concerns appear as much in the research activities as in their outcomes, their use and exploitation; the process needs to expand on all stages. Design Fiction - utilisation de méthodes de narration pour extraire and comprendre les implications possibles des technologies, et pouvoir intégrer des méthodes préventives dans leur conception. Voir : Workshop “Re-coding Black Mirror” à The Web Conference (WWW 2018). see paper at AIES 2018
  • 48. Conclusion On est toujours de plus en plus à la recherche des éléments d’infrastructure qui permettent de distribuer et de rendre exploitables les données. Dans les années 1900, Nicolas Tesla investissait dans la recherche dédiée à la transmission d’électricité sans fils. Une des raisons est qu’il ne semblait pas faisable de construire l’infrastructure globale nécessaire pour amener l'électricité dans les foyers par des fils. Concernant les infrastructures de données, peut être somme nous, de façon similaire, à la fois trop et trop peu ambitieux...