SlideShare une entreprise Scribd logo
1  sur  47
Les Systèmes d’Information
Sémantiques
S. Garlatti
Le Google d’aujourd’hui
 Utilisez-vous

Google pour rechercher de l’information

?
• Trouvez-vous toujours ce que vous cherchez ?
• Quels sont les problèmes ?
• Etes-vous satisfait ?

page 2
Problématique
 Requête

: « directeur » « Paul Friedel »

• Intention : On ne veut que le site de Telecom Bretagne !

• XXX 000 résultats : toutes les pages qui contiennent ces
deux termes ou l’un des deux

page 3

Semantic Web in Action
Problématique
 Recherche

d’information de type Google

• Polysémie

• Nombre de résultats très important

page 4

Semantic Web in Action
Le Google d’Hier

=

page 5
Le Google d’Aujourd’hui
 Google

page 6

Now

Semantic Web in Action
Le Google d’Aujourd’hui
 Google

page 7

Now

Semantic Web in Action
Le Google d’Aujourd’hui
 Google

page 8

Now

Semantic Web in Action
Le Google d’Aujourd’hui
 Google

page 9

Now

Semantic Web in Action
Le Google d’Aujourd’hui

page 10

Semantic Web in Action
Quelques

page 11
Le Google d’Aujourd’hui

Knowledge Graph
page 12

Semantic Web in Action
Le Google Intelligent

=

page 13
Quelques exemples
 Facebook

•
•
•
•
•

page 14

: Graph Search
Restaurants londoniens où mes amis sont allés ?
Musique que mes amis aiment ?
Amateurs de cyclisme ?
Photos avant 1990 ?
Photos de mes amis à Philadelphie ?
Le Google Intelligent
Données
&
Services

Recherche
Fils de nouvelles
Syndication
Filtrage
Recommandation

Contenu
Tags
Social
Information

page 15
Le Google Intelligent
 Pourquoi

?
• Offrir de nouveaux services aux entreprises et au grand
public
- Comment : En réutilisant automatiquement le résultat d’une
recherche d’information
– Proposer des visites guidées, proposer de l’aide pour voyager en train,
en avion, en fonction de vos besoins et/ou de vos préférences, etc.
– Rechercher des entreprises ayant les compétences requises pour de
la sous-traitance
– Etc.

page 16
Problématique

Mais pour cela, il faut donner
Du SENS

aux Données !
Problématique

Que voyez-vous ?
Problématique

Que voyez-vous ?
Problématique
Comment attribuons-nous du sens aux données ?

Que voyez-vous ?
Problématique

Que voyez-vous ?
Problématique

Que voyez-vous ?
Problématique

Que voyez-vous ?
Problématique

Que voyez-vous ?
Problématique
Que voyez-vous ?
Problématique
Que voyez-vous ?
Problématique
Que voyez-vous ?
Problématique
Que voyez-vous ?






Shotokan-ryu
Goju-ryu
Wado-ryu
Shito-ryu
Shorin-ryu
Problématique
Problématique


Pour Donner du sens aux données
• Nous utilisons nos Connaissances
dans des Domaines Spécifiques
pour Identifier / Reconnaître ces données

• Connaissances partagées par des
communautés
Problématique

Enjeu principal du Web Sémantique &
Linked Data



• Utiliser ces connaissances pour annoter les ressources
au niveau sémantique
• Pour rechercher, réutiliser et partager, si possible
automatiquement, les informations
Le Google Intelligent
 Démonstration

• Recherche d’informations sur LinkedMDB
- Copie « Intelligente » de IMDB
- Trouver tous les films d’un acteur : Bruce Willis, etc.
- Trouver le ou les acteurs qui ont joué dans un ou des films de deux
producteurs :
– Sofia Coppola Francis Ford Coppola
– Clint Eastwood Buddy Van Horn
– Paul McGuigan Robert Schwentke

page 32
Semantic Web & Linked Data
 Démonstrations

sur LINKEDMDB et Dbpedia

• http://3s-web.enstb.org/Demo_Linked_Data/

page 33
Le Google Intelligent : Comment ?
 Description

des informations dans LinkedMDB
• Des phrases de type :

Sujet Verbe Complément
• Exemple
- Le film « RED » a pour acteur

Bruce Willis

- Le film « Red » a pour page web

http://…..

- Le film « RED » a pour producteur Robert Schwentke

page 34
Le Google Intelligent : Comment ?
 Compréhension

de ces phrases
• Différents contextes : différents termes
- « acteur », « actor », « director » « producteur », …

• Interprétation commune liée à des connaissances
communes
- Utilisation de vocabulaires standards partagés par tous !
- Chaque vocabulaire détermine un sens unique aux verbes, aux
catégories de sujets et de compléments

page 35
Le Google Intelligent : Comment ?
 Plus

formellement, ou presque

- « Red »

movie:actor

« Bruce Willis »

- « Red »

movie:director

« Robert Schwentke »

• « Red »

- « Red »


rdf:type

foaf:page

http://www.freebase…

Question
• Trouver tous les films dont Bruce Willis est acteur ?
- ?Film
- ?Film

page 36

movie:film

movie:actor
rdf:type

« Bruce Willis »
movie:film
Le Google Intelligent : Comment ?
 Site

Linkedmdb
• Film Red
http://data.linkedmdb.org/page/film/97209
• Acteur Bruce Willis
http://data.linkedmdb.org/page/actor/29961

page 37
Freebase Parallax
«

Faceted Semantic Search »
• http://parallax.freebaseapps.com/
• Question
- Which Schools did the Children of Republican Us
Presidents?
– Comment faire avec Wikipédia ?

– Comment fait-on avec Freebase Parallax ?

page 38

Semantic Web in Action
Freebase Parallax
 Question

: comment répondre ?

• US President are Presidents
• US Presidents Belong to a Party
• Republican Party is a Party
• US Presidents have Children

• Children studies in Schools

page 39

Semantic Web in Action
Semantic Web & Linked Data
RDF Graph

http://webofdata.wordpress.com/2010/09/27/linked-enterprise-data-in-a-nutshell/
page 40
Semantic Web & Linked Data

Source 1

Source 3
Source 2

page 41
Semantic Web & Linked Data

page 42
Le Google Intelligent : Comment ?

page 43
Linked Data = ? = Big Data


Une type particulier de Big Data
• DBpedia: Linked Data version of Wikipedia : more than 103 million RDF triples.
• The Bio2RDF project, a Semantic web atlas of post-genomic knowledge about human
and mouse, has published 27 biology-, gene- and medical-related data sets :
altogether 2.3 billion triples
• data.gov official website of the US government making over 1000 US government
datasets available as Linked Data (around 6.4 billion triples).
• GovTrack.us from Joshua Tauberer publishes linked data about members of the U.S.
Congress, as well as bills, committees and votes. 12M triples
• PDB2RDF Projekt making the Protein Data Bank available as Linked Data and via a
SPARQL endpoint (approximately 14 billion triples).

• RDF Book Mashup: Provides bibliographic information, reviews and sales offers for
most books that have a ISBN number. Maps data from Amazon and Google base to
RDF. Size of the data set: Unknown, billions of triples
• Etc.

page 44
Linked Data
 Linked

Open Data
• http://validator.lod-cloud.net/

 Linked

Sciences
• Linked Open Piracy (LOP)
- http://semanticweb.cs.vu.nl/poseidon/ns/home
- http://cliopatria.swiprolog.org/help/source/doc/home/vnc/prolog/src/ClioPatria/web/tuto
rial/Piracy.txt
Linked Data pour le Big Data
 Avantages

• Sémantique unique des entités
• Linked Data
- « A New architectural platform for interconnecting, mapping,
indexing, feeding real-time information from a variety of sources »

• Tim Berners Lee
- Web = « Global Giant Graph »
– Comme une unique base de données globale
– Requêtes complexes sur plusieurs sources
page 46
Linked Data pour le Big Data
 Avantages

• Déduction de nouvelles relations
- Qui pourront être utilisées plus tard pour de nouvelles analyses

• Standards
- SPARQL 1.1, OWL, RDF, RDFS, …..

• Passage à l’échelle

page 47

Contenu connexe

En vedette

Los conflictos de la Globalización: Superpoblación y Pobreza
Los conflictos de la Globalización: Superpoblación y PobrezaLos conflictos de la Globalización: Superpoblación y Pobreza
Los conflictos de la Globalización: Superpoblación y Pobreza
Víctor Velezmoro-Montes
 
Repères historiques 4°
Repères historiques 4°Repères historiques 4°
Repères historiques 4°
Céline Langlet
 
Le château de chaumont sur loire
Le château de chaumont sur loireLe château de chaumont sur loire
Le château de chaumont sur loire
AliSou0154
 
Eventos E-merging Perú y Enight
Eventos E-merging Perú y EnightEventos E-merging Perú y Enight
Eventos E-merging Perú y Enight
Neo Consulting
 
L`enseignement précosse
L`enseignement précosseL`enseignement précosse
L`enseignement précosse
Nusyast
 
La planète mars
La planète mars La planète mars
La planète mars
AliSou0154
 
Trabajo de plástica de los alumnos 4º eso
Trabajo de plástica de los alumnos 4º esoTrabajo de plástica de los alumnos 4º eso
Trabajo de plástica de los alumnos 4º eso
fperbri
 
YEHKRI.COM A.C.C.C Rapport Activites 2012
YEHKRI.COM A.C.C.C  Rapport Activites 2012YEHKRI.COM A.C.C.C  Rapport Activites 2012
YEHKRI.COM A.C.C.C Rapport Activites 2012
YEHKRI.COM A.C.C.
 
Proyecto de vida
Proyecto de vidaProyecto de vida
Proyecto de vida
Aligi321
 
Séminaire formation juges 2011 2012
Séminaire formation juges 2011 2012Séminaire formation juges 2011 2012
Séminaire formation juges 2011 2012
Natacha Pontonnier
 

En vedette (20)

Los conflictos de la Globalización: Superpoblación y Pobreza
Los conflictos de la Globalización: Superpoblación y PobrezaLos conflictos de la Globalización: Superpoblación y Pobreza
Los conflictos de la Globalización: Superpoblación y Pobreza
 
Repères historiques 4°
Repères historiques 4°Repères historiques 4°
Repères historiques 4°
 
Anunciación
AnunciaciónAnunciación
Anunciación
 
Les 10 propositions du réseau commande publique
Les 10 propositions du réseau commande publiqueLes 10 propositions du réseau commande publique
Les 10 propositions du réseau commande publique
 
Cómo entender a la audiencia e internet. SEO & web analytics
Cómo entender a la audiencia e internet. SEO & web analyticsCómo entender a la audiencia e internet. SEO & web analytics
Cómo entender a la audiencia e internet. SEO & web analytics
 
Présentation Job Assistant
Présentation  Job  AssistantPrésentation  Job  Assistant
Présentation Job Assistant
 
Le château de chaumont sur loire
Le château de chaumont sur loireLe château de chaumont sur loire
Le château de chaumont sur loire
 
Sylos conférence_Foro Gaston Piatan et Youssoufa Hassana
Sylos conférence_Foro Gaston Piatan et Youssoufa Hassana Sylos conférence_Foro Gaston Piatan et Youssoufa Hassana
Sylos conférence_Foro Gaston Piatan et Youssoufa Hassana
 
Pvnova
PvnovaPvnova
Pvnova
 
Eventos E-merging Perú y Enight
Eventos E-merging Perú y EnightEventos E-merging Perú y Enight
Eventos E-merging Perú y Enight
 
Transformer / Connaître / Activer / Conquérir sur Facebook
Transformer / Connaître / Activer / Conquérir sur FacebookTransformer / Connaître / Activer / Conquérir sur Facebook
Transformer / Connaître / Activer / Conquérir sur Facebook
 
SISTEMAS DE PARED PARA PLASMA
SISTEMAS DE PARED PARA PLASMASISTEMAS DE PARED PARA PLASMA
SISTEMAS DE PARED PARA PLASMA
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
L`enseignement précosse
L`enseignement précosseL`enseignement précosse
L`enseignement précosse
 
La planète mars
La planète mars La planète mars
La planète mars
 
Trabajo de plástica de los alumnos 4º eso
Trabajo de plástica de los alumnos 4º esoTrabajo de plástica de los alumnos 4º eso
Trabajo de plástica de los alumnos 4º eso
 
YEHKRI.COM A.C.C.C Rapport Activites 2012
YEHKRI.COM A.C.C.C  Rapport Activites 2012YEHKRI.COM A.C.C.C  Rapport Activites 2012
YEHKRI.COM A.C.C.C Rapport Activites 2012
 
Bonnes pratiques entreprises socialement responsables
Bonnes pratiques entreprises socialement responsablesBonnes pratiques entreprises socialement responsables
Bonnes pratiques entreprises socialement responsables
 
Proyecto de vida
Proyecto de vidaProyecto de vida
Proyecto de vida
 
Séminaire formation juges 2011 2012
Séminaire formation juges 2011 2012Séminaire formation juges 2011 2012
Séminaire formation juges 2011 2012
 

Similaire à Le web semantique_2013_2014

Fiche pédagogique 07b internet exercices
Fiche pédagogique 07b internet exercicesFiche pédagogique 07b internet exercices
Fiche pédagogique 07b internet exercices
courgette
 
La recherche documentaire
La recherche documentaireLa recherche documentaire
La recherche documentaire
Lucie Binetti
 
Recherche sur internet
Recherche sur internetRecherche sur internet
Recherche sur internet
courgette
 
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Charles Ruelle
 
Expospierre 1229514527066080-2
Expospierre 1229514527066080-2Expospierre 1229514527066080-2
Expospierre 1229514527066080-2
tomasone
 

Similaire à Le web semantique_2013_2014 (20)

Intelligent google
Intelligent googleIntelligent google
Intelligent google
 
Soirée Informed de septembre 2013 - Facebook
Soirée Informed de septembre 2013 - FacebookSoirée Informed de septembre 2013 - Facebook
Soirée Informed de septembre 2013 - Facebook
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
Erepday 2013-rich-snippets
Erepday 2013-rich-snippetsErepday 2013-rich-snippets
Erepday 2013-rich-snippets
 
Fiche pédagogique 07b internet exercices
Fiche pédagogique 07b internet exercicesFiche pédagogique 07b internet exercices
Fiche pédagogique 07b internet exercices
 
Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)
 
L’usage des réseaux sociaux : comment gérer et maîtriser son image sur la toi...
L’usage des réseaux sociaux : comment gérer et maîtriser son image sur la toi...L’usage des réseaux sociaux : comment gérer et maîtriser son image sur la toi...
L’usage des réseaux sociaux : comment gérer et maîtriser son image sur la toi...
 
Positionnez-vous sur le Web - Plogg
Positionnez-vous sur le Web - Plogg Positionnez-vous sur le Web - Plogg
Positionnez-vous sur le Web - Plogg
 
La recherche documentaire
La recherche documentaireLa recherche documentaire
La recherche documentaire
 
Les clés du référencement
Les clés du référencementLes clés du référencement
Les clés du référencement
 
Utiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet DanimationUtiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet Danimation
 
Recherche sur internet
Recherche sur internetRecherche sur internet
Recherche sur internet
 
Recherche
RechercheRecherche
Recherche
 
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
 
Le Data guide de Data Publica
Le Data guide de Data PublicaLe Data guide de Data Publica
Le Data guide de Data Publica
 
Se positionner sur le Web
Se positionner sur le WebSe positionner sur le Web
Se positionner sur le Web
 
La visibilité des enseignants-chercheurs sur internet
La visibilité des enseignants-chercheurs sur internetLa visibilité des enseignants-chercheurs sur internet
La visibilité des enseignants-chercheurs sur internet
 
Rechercher l'information Internet versus Réseaux Sociaux (PDF)
Rechercher l'information Internet versus Réseaux Sociaux (PDF)Rechercher l'information Internet versus Réseaux Sociaux (PDF)
Rechercher l'information Internet versus Réseaux Sociaux (PDF)
 
Expospierre 1229514527066080-2
Expospierre 1229514527066080-2Expospierre 1229514527066080-2
Expospierre 1229514527066080-2
 
Le Futur des Moteurs de Recherche
Le Futur des Moteurs de RechercheLe Futur des Moteurs de Recherche
Le Futur des Moteurs de Recherche
 

Plus de Serge Garlatti

Les ontologies 2013_2014
Les ontologies 2013_2014Les ontologies 2013_2014
Les ontologies 2013_2014
Serge Garlatti
 
Scenario Convergence SW+2.0+Pervasive
Scenario Convergence SW+2.0+PervasiveScenario Convergence SW+2.0+Pervasive
Scenario Convergence SW+2.0+Pervasive
Serge Garlatti
 

Plus de Serge Garlatti (20)

Seminaire campus lab
Seminaire campus labSeminaire campus lab
Seminaire campus lab
 
ATIEF IA CIEP Février 2019
ATIEF IA CIEP Février 2019ATIEF IA CIEP Février 2019
ATIEF IA CIEP Février 2019
 
Learning Analytics : entre Promesses et Réalité
Learning Analytics : entre Promesses et RéalitéLearning Analytics : entre Promesses et Réalité
Learning Analytics : entre Promesses et Réalité
 
Non Standard Logics & Modal Logics
Non Standard Logics & Modal LogicsNon Standard Logics & Modal Logics
Non Standard Logics & Modal Logics
 
Predicate Calculus
Predicate CalculusPredicate Calculus
Predicate Calculus
 
Modal Logic
Modal LogicModal Logic
Modal Logic
 
Du Calcul des prédicats vers Prolog
Du Calcul des prédicats vers PrologDu Calcul des prédicats vers Prolog
Du Calcul des prédicats vers Prolog
 
Cours intro ia_2015_2016
Cours intro ia_2015_2016Cours intro ia_2015_2016
Cours intro ia_2015_2016
 
Les ontologies 2014_2015
Les ontologies 2014_2015Les ontologies 2014_2015
Les ontologies 2014_2015
 
Sens des donnees_2014_2015
Sens des donnees_2014_2015Sens des donnees_2014_2015
Sens des donnees_2014_2015
 
Sparql
SparqlSparql
Sparql
 
Les ontologies 2013_2014
Les ontologies 2013_2014Les ontologies 2013_2014
Les ontologies 2013_2014
 
Scenario convergence 2013_2014
Scenario convergence 2013_2014Scenario convergence 2013_2014
Scenario convergence 2013_2014
 
Scenario Convergence SW+2.0+Pervasive
Scenario Convergence SW+2.0+PervasiveScenario Convergence SW+2.0+Pervasive
Scenario Convergence SW+2.0+Pervasive
 
Sem info system_2012
Sem info system_2012Sem info system_2012
Sem info system_2012
 
Ontologies 2011 2012
Ontologies 2011 2012Ontologies 2011 2012
Ontologies 2011 2012
 
Social web Ontologies
Social web OntologiesSocial web Ontologies
Social web Ontologies
 
Future Learning Landscapes
Future Learning LandscapesFuture Learning Landscapes
Future Learning Landscapes
 
Social web & linked data
Social web & linked dataSocial web & linked data
Social web & linked data
 
Web 2.0, Web Social
Web 2.0, Web SocialWeb 2.0, Web Social
Web 2.0, Web Social
 

Dernier

Dernier (12)

Bonnes pratiques biomédicales en établissement de soins : Guide
Bonnes pratiques biomédicales en établissement de soins  : GuideBonnes pratiques biomédicales en établissement de soins  : Guide
Bonnes pratiques biomédicales en établissement de soins : Guide
 
Quitter la nuit. pptx
Quitter        la             nuit.   pptxQuitter        la             nuit.   pptx
Quitter la nuit. pptx
 
Cours-Sur-l'-IP-Multiprotocol-Label-SwitchingMPLS
Cours-Sur-l'-IP-Multiprotocol-Label-SwitchingMPLSCours-Sur-l'-IP-Multiprotocol-Label-SwitchingMPLS
Cours-Sur-l'-IP-Multiprotocol-Label-SwitchingMPLS
 
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
 
Nathanaëlle Herbelin.pptx Peintre française
Nathanaëlle Herbelin.pptx Peintre françaiseNathanaëlle Herbelin.pptx Peintre française
Nathanaëlle Herbelin.pptx Peintre française
 
Un petit coin etwinning- Au fil des cultures urbaines
Un petit coin  etwinning- Au fil des cultures urbainesUn petit coin  etwinning- Au fil des cultures urbaines
Un petit coin etwinning- Au fil des cultures urbaines
 
Quitter la nuit. pptx
Quitter          la        nuit.    pptxQuitter          la        nuit.    pptx
Quitter la nuit. pptx
 
rapport de stage gros oeuvre_compressed.pdf
rapport de stage gros oeuvre_compressed.pdfrapport de stage gros oeuvre_compressed.pdf
rapport de stage gros oeuvre_compressed.pdf
 
PowerPoint-de-Soutenance-de-TFE-infirmier.pdf
PowerPoint-de-Soutenance-de-TFE-infirmier.pdfPowerPoint-de-Soutenance-de-TFE-infirmier.pdf
PowerPoint-de-Soutenance-de-TFE-infirmier.pdf
 
Webinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctionsWebinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctions
 
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
 
Les débuts de la collection "Le livre de poche"
Les débuts de la collection "Le livre de poche"Les débuts de la collection "Le livre de poche"
Les débuts de la collection "Le livre de poche"
 

Le web semantique_2013_2014

  • 2. Le Google d’aujourd’hui  Utilisez-vous Google pour rechercher de l’information ? • Trouvez-vous toujours ce que vous cherchez ? • Quels sont les problèmes ? • Etes-vous satisfait ? page 2
  • 3. Problématique  Requête : « directeur » « Paul Friedel » • Intention : On ne veut que le site de Telecom Bretagne ! • XXX 000 résultats : toutes les pages qui contiennent ces deux termes ou l’un des deux page 3 Semantic Web in Action
  • 4. Problématique  Recherche d’information de type Google • Polysémie • Nombre de résultats très important page 4 Semantic Web in Action
  • 6. Le Google d’Aujourd’hui  Google page 6 Now Semantic Web in Action
  • 7. Le Google d’Aujourd’hui  Google page 7 Now Semantic Web in Action
  • 8. Le Google d’Aujourd’hui  Google page 8 Now Semantic Web in Action
  • 9. Le Google d’Aujourd’hui  Google page 9 Now Semantic Web in Action
  • 10. Le Google d’Aujourd’hui page 10 Semantic Web in Action
  • 12. Le Google d’Aujourd’hui Knowledge Graph page 12 Semantic Web in Action
  • 14. Quelques exemples  Facebook • • • • • page 14 : Graph Search Restaurants londoniens où mes amis sont allés ? Musique que mes amis aiment ? Amateurs de cyclisme ? Photos avant 1990 ? Photos de mes amis à Philadelphie ?
  • 15. Le Google Intelligent Données & Services Recherche Fils de nouvelles Syndication Filtrage Recommandation Contenu Tags Social Information page 15
  • 16. Le Google Intelligent  Pourquoi ? • Offrir de nouveaux services aux entreprises et au grand public - Comment : En réutilisant automatiquement le résultat d’une recherche d’information – Proposer des visites guidées, proposer de l’aide pour voyager en train, en avion, en fonction de vos besoins et/ou de vos préférences, etc. – Rechercher des entreprises ayant les compétences requises pour de la sous-traitance – Etc. page 16
  • 17. Problématique Mais pour cela, il faut donner Du SENS aux Données !
  • 20. Problématique Comment attribuons-nous du sens aux données ? Que voyez-vous ?
  • 30. Problématique  Pour Donner du sens aux données • Nous utilisons nos Connaissances dans des Domaines Spécifiques pour Identifier / Reconnaître ces données • Connaissances partagées par des communautés
  • 31. Problématique Enjeu principal du Web Sémantique & Linked Data  • Utiliser ces connaissances pour annoter les ressources au niveau sémantique • Pour rechercher, réutiliser et partager, si possible automatiquement, les informations
  • 32. Le Google Intelligent  Démonstration • Recherche d’informations sur LinkedMDB - Copie « Intelligente » de IMDB - Trouver tous les films d’un acteur : Bruce Willis, etc. - Trouver le ou les acteurs qui ont joué dans un ou des films de deux producteurs : – Sofia Coppola Francis Ford Coppola – Clint Eastwood Buddy Van Horn – Paul McGuigan Robert Schwentke page 32
  • 33. Semantic Web & Linked Data  Démonstrations sur LINKEDMDB et Dbpedia • http://3s-web.enstb.org/Demo_Linked_Data/ page 33
  • 34. Le Google Intelligent : Comment ?  Description des informations dans LinkedMDB • Des phrases de type : Sujet Verbe Complément • Exemple - Le film « RED » a pour acteur Bruce Willis - Le film « Red » a pour page web http://….. - Le film « RED » a pour producteur Robert Schwentke page 34
  • 35. Le Google Intelligent : Comment ?  Compréhension de ces phrases • Différents contextes : différents termes - « acteur », « actor », « director » « producteur », … • Interprétation commune liée à des connaissances communes - Utilisation de vocabulaires standards partagés par tous ! - Chaque vocabulaire détermine un sens unique aux verbes, aux catégories de sujets et de compléments page 35
  • 36. Le Google Intelligent : Comment ?  Plus formellement, ou presque - « Red » movie:actor « Bruce Willis » - « Red » movie:director « Robert Schwentke » • « Red » - « Red »  rdf:type foaf:page http://www.freebase… Question • Trouver tous les films dont Bruce Willis est acteur ? - ?Film - ?Film page 36 movie:film movie:actor rdf:type « Bruce Willis » movie:film
  • 37. Le Google Intelligent : Comment ?  Site Linkedmdb • Film Red http://data.linkedmdb.org/page/film/97209 • Acteur Bruce Willis http://data.linkedmdb.org/page/actor/29961 page 37
  • 38. Freebase Parallax « Faceted Semantic Search » • http://parallax.freebaseapps.com/ • Question - Which Schools did the Children of Republican Us Presidents? – Comment faire avec Wikipédia ? – Comment fait-on avec Freebase Parallax ? page 38 Semantic Web in Action
  • 39. Freebase Parallax  Question : comment répondre ? • US President are Presidents • US Presidents Belong to a Party • Republican Party is a Party • US Presidents have Children • Children studies in Schools page 39 Semantic Web in Action
  • 40. Semantic Web & Linked Data RDF Graph http://webofdata.wordpress.com/2010/09/27/linked-enterprise-data-in-a-nutshell/ page 40
  • 41. Semantic Web & Linked Data Source 1 Source 3 Source 2 page 41
  • 42. Semantic Web & Linked Data page 42
  • 43. Le Google Intelligent : Comment ? page 43
  • 44. Linked Data = ? = Big Data  Une type particulier de Big Data • DBpedia: Linked Data version of Wikipedia : more than 103 million RDF triples. • The Bio2RDF project, a Semantic web atlas of post-genomic knowledge about human and mouse, has published 27 biology-, gene- and medical-related data sets : altogether 2.3 billion triples • data.gov official website of the US government making over 1000 US government datasets available as Linked Data (around 6.4 billion triples). • GovTrack.us from Joshua Tauberer publishes linked data about members of the U.S. Congress, as well as bills, committees and votes. 12M triples • PDB2RDF Projekt making the Protein Data Bank available as Linked Data and via a SPARQL endpoint (approximately 14 billion triples). • RDF Book Mashup: Provides bibliographic information, reviews and sales offers for most books that have a ISBN number. Maps data from Amazon and Google base to RDF. Size of the data set: Unknown, billions of triples • Etc. page 44
  • 45. Linked Data  Linked Open Data • http://validator.lod-cloud.net/  Linked Sciences • Linked Open Piracy (LOP) - http://semanticweb.cs.vu.nl/poseidon/ns/home - http://cliopatria.swiprolog.org/help/source/doc/home/vnc/prolog/src/ClioPatria/web/tuto rial/Piracy.txt
  • 46. Linked Data pour le Big Data  Avantages • Sémantique unique des entités • Linked Data - « A New architectural platform for interconnecting, mapping, indexing, feeding real-time information from a variety of sources » • Tim Berners Lee - Web = « Global Giant Graph » – Comme une unique base de données globale – Requêtes complexes sur plusieurs sources page 46
  • 47. Linked Data pour le Big Data  Avantages • Déduction de nouvelles relations - Qui pourront être utilisées plus tard pour de nouvelles analyses • Standards - SPARQL 1.1, OWL, RDF, RDFS, ….. • Passage à l’échelle page 47