Université de Strasbourg - GreenIvory
           Developer Forum 5
               08 octobre 2009


     Le Web Sémantique



       Benjamin de la Porte des Vaux
        benjamin_delaporte@yahoo.fr



1
Buts de l’exposé

     Tim Berners-Lee




                                       http://commons.wikimedia.org/wiki/Tim_Berners-Lee
     Le Web des données
     RDF, OWL, SPARQL
     Complexité linguistique




2
Plan de l’exposé

     L’évolution du Web
     Le but du Web Sémantique
     Les technologies
     La problématique linguistique
     Quelques exemples d’application




3
L’évolution du Web

     Web                    (1.0)




                                                       http://commons.wikimedia.org/wiki/Tim_Berners-Lee
     Web dynamique          (1.5)
     Web participatif       (2.0)
     Web sémantique         (3.0)
      Web des données
      Giant Global Graph (GGG)




                                     Tim Berners-Lee
4
Le Web des documents

                           WEB




5
Le Web des données

                         WEB




6
Les technologies

     RDF  Graphes de données
     OWL  Ontologies
     SPARQL  Requêtes




7
Resource Description Framework
                    (RDF)

     Ressource  URI
      http://www.exemple.org/tim_berners_lee

     Triplet: Sujet-Prédicat-Objet
                inventeur
         web                tim_berners_lee


      « Le Web a été inventé par Tim Berners-Lee. »
      @prefix ex: <http://www.exemple.org/> .
      ex:web ex:inventeur ex:tim_berners_lee .

8
Giant Global Graph
                             (GGG)

           inventeur                           date_naissance
    web                tim_berners_lee                           « 08/06/1955 »


              épouse                              fille
                                        fils




                               ben_berners_lee
                        fils
                                                          alice_berners_lee
          nancy_berners_lee     fille


9
Web Ontology Language
                (OWL)

                           Etre vivant
                           - Date de naissance




               inventeur
     concept               Humain
                           - Adresse électronique




10
SPARQL Protocol
                And RDF Query Language
                      (SPARQL)
     PREFIX         ex: <http://exemple.org/>
                    owl: <http://ontologie.org/>
     SELECT         ?date_naissance ?adresse_electronique
     FROM           <http://autre_site.org/>
     WHERE {
       ex:tim_berners_lee owl:date_naissance ?date_naissance.
       ex:tim_berners_lee owl:adresse_elec ?adresse_elec
     }
                           date_naissance
        tim_berners_lee                             ?

                           adresse_elec
        tim_berners_lee                             ?
11
Buts de l’exposé

      Tim Berners-Lee




                                        http://commons.wikimedia.org/wiki/Tim_Berners-Lee
      Le Web des données
      RDF, OWL, SPARQL
      Complexité linguistique




12
Le Web des données

                          WEB




13
La chaîne de traitement
      Identifiation de la langue




14
La chaîne de traitement
      Identifiation de la langue
      Tokenisation




       /Paul/aime/les/pommes de terre/./



15
La chaîne de traitement
      Identifiation de la langue
      Tokenisation
      Découpage en phrases




       M. Berners-Lee présente le Web 3.0 sur news.org.



16
La chaîne de traitement
      Identifiation de la langue
      Tokenisation
      Découpage en phrases
      Etiquetage morpho-syntaxique




       Il(pp) livre(verbe) le(déterminant) lit(nom).



17
La chaîne de traitement
      Identifiation de la langue
      Tokenisation
      Découpage en phrases
      Etiquetage morpho-syntaxique
      Découpage en syntagmes




       [Il] [livre [le lit]].
       (SN) (SV) (SN)

18
La chaîne de traitement
      Identifiation de la langue
      Tokenisation
      Découpage en phrases
      Etiquetage morpho-syntaxique
      Découpage en syntagmes
      Analyse des fonctions syntaxiques


       [Il] [livre [le lit]].
       (S) (P)     (C)               RDF: Sujet-Prédicat-Objet

19
La chaîne de traitement
      Identifiation de la langue
      Tokenisation
      Découpage en phrases
      Etiquetage morpho-syntaxique
      Découpage en syntagmes
      Analyse des fonctions syntaxiques
      Résolution des anaphores


       Marie a une voiture. Elle est contente.
       Marie a une voiture. Elle est a des jantes en alu.
20
La chaîne de traitement
      Identifiation de la langue
      Tokenisation
      Découpage en phrases
      Etiquetage morpho-syntaxique
      Découpage en syntagmes
      Analyse des fonctions syntaxiques
      Résolution des anaphores
      Couplage avec une ontologie


       Cet avocat est véreux.
21
Buts de l’exposé

      Tim Berners-Lee




                                        http://commons.wikimedia.org/wiki/Tim_Berners-Lee
      Le Web des données
      RDF, OWL, SPARQL
      Complexité linguistique




22
Le Web des données

                          WEB




23
DBpedia


      http://dbpedia.org/page/Semantic_Web




24
25
                                               Octobre 2007




     http://richard.cyganiak.de/2007/10/lod/
26
                                               Septembre 2008




     http://richard.cyganiak.de/2007/10/lod/
27
                                               Juillet 2009




     http://richard.cyganiak.de/2007/10/lod/
FOAFer


      http://www.foafer.org/
     (FOAF = Friend Of A Friend)




28
Swoogle


      http://swoogle.umbc.edu/
      (Semantic Web Ontology - …ogle)




29
Powerset


      http://www.powerset.com




30
Quelques sites à consulter:

      http://websemantique.org
       Site dédié aux francophones intéressés par le Web
         Sémantique

      http://linkeddata.org/
       Site de la communauté « LinkedData »

      http://www.w3.org/2001/sw/
       Site officiel du Web Sémantique
31

Web sémantique

  • 1.
    Université de Strasbourg- GreenIvory Developer Forum 5 08 octobre 2009 Le Web Sémantique Benjamin de la Porte des Vaux benjamin_delaporte@yahoo.fr 1
  • 2.
    Buts de l’exposé  Tim Berners-Lee http://commons.wikimedia.org/wiki/Tim_Berners-Lee  Le Web des données  RDF, OWL, SPARQL  Complexité linguistique 2
  • 3.
    Plan de l’exposé  L’évolution du Web  Le but du Web Sémantique  Les technologies  La problématique linguistique  Quelques exemples d’application 3
  • 4.
    L’évolution du Web  Web (1.0) http://commons.wikimedia.org/wiki/Tim_Berners-Lee  Web dynamique (1.5)  Web participatif (2.0)  Web sémantique (3.0) Web des données Giant Global Graph (GGG) Tim Berners-Lee 4
  • 5.
    Le Web desdocuments WEB 5
  • 6.
    Le Web desdonnées WEB 6
  • 7.
    Les technologies  RDF  Graphes de données  OWL  Ontologies  SPARQL  Requêtes 7
  • 8.
    Resource Description Framework (RDF)  Ressource  URI http://www.exemple.org/tim_berners_lee  Triplet: Sujet-Prédicat-Objet inventeur web tim_berners_lee « Le Web a été inventé par Tim Berners-Lee. » @prefix ex: <http://www.exemple.org/> . ex:web ex:inventeur ex:tim_berners_lee . 8
  • 9.
    Giant Global Graph (GGG) inventeur date_naissance web tim_berners_lee « 08/06/1955 » épouse fille fils ben_berners_lee fils alice_berners_lee nancy_berners_lee fille 9
  • 10.
    Web Ontology Language (OWL) Etre vivant - Date de naissance inventeur concept Humain - Adresse électronique 10
  • 11.
    SPARQL Protocol And RDF Query Language (SPARQL) PREFIX ex: <http://exemple.org/> owl: <http://ontologie.org/> SELECT ?date_naissance ?adresse_electronique FROM <http://autre_site.org/> WHERE { ex:tim_berners_lee owl:date_naissance ?date_naissance. ex:tim_berners_lee owl:adresse_elec ?adresse_elec } date_naissance tim_berners_lee ? adresse_elec tim_berners_lee ? 11
  • 12.
    Buts de l’exposé  Tim Berners-Lee http://commons.wikimedia.org/wiki/Tim_Berners-Lee  Le Web des données  RDF, OWL, SPARQL  Complexité linguistique 12
  • 13.
    Le Web desdonnées WEB 13
  • 14.
    La chaîne detraitement  Identifiation de la langue 14
  • 15.
    La chaîne detraitement  Identifiation de la langue  Tokenisation /Paul/aime/les/pommes de terre/./ 15
  • 16.
    La chaîne detraitement  Identifiation de la langue  Tokenisation  Découpage en phrases M. Berners-Lee présente le Web 3.0 sur news.org. 16
  • 17.
    La chaîne detraitement  Identifiation de la langue  Tokenisation  Découpage en phrases  Etiquetage morpho-syntaxique Il(pp) livre(verbe) le(déterminant) lit(nom). 17
  • 18.
    La chaîne detraitement  Identifiation de la langue  Tokenisation  Découpage en phrases  Etiquetage morpho-syntaxique  Découpage en syntagmes [Il] [livre [le lit]]. (SN) (SV) (SN) 18
  • 19.
    La chaîne detraitement  Identifiation de la langue  Tokenisation  Découpage en phrases  Etiquetage morpho-syntaxique  Découpage en syntagmes  Analyse des fonctions syntaxiques [Il] [livre [le lit]]. (S) (P) (C)  RDF: Sujet-Prédicat-Objet 19
  • 20.
    La chaîne detraitement  Identifiation de la langue  Tokenisation  Découpage en phrases  Etiquetage morpho-syntaxique  Découpage en syntagmes  Analyse des fonctions syntaxiques  Résolution des anaphores Marie a une voiture. Elle est contente. Marie a une voiture. Elle est a des jantes en alu. 20
  • 21.
    La chaîne detraitement  Identifiation de la langue  Tokenisation  Découpage en phrases  Etiquetage morpho-syntaxique  Découpage en syntagmes  Analyse des fonctions syntaxiques  Résolution des anaphores  Couplage avec une ontologie Cet avocat est véreux. 21
  • 22.
    Buts de l’exposé  Tim Berners-Lee http://commons.wikimedia.org/wiki/Tim_Berners-Lee  Le Web des données  RDF, OWL, SPARQL  Complexité linguistique 22
  • 23.
    Le Web desdonnées WEB 23
  • 24.
    DBpedia  http://dbpedia.org/page/Semantic_Web 24
  • 25.
    25 Octobre 2007 http://richard.cyganiak.de/2007/10/lod/
  • 26.
    26 Septembre 2008 http://richard.cyganiak.de/2007/10/lod/
  • 27.
    27 Juillet 2009 http://richard.cyganiak.de/2007/10/lod/
  • 28.
    FOAFer  http://www.foafer.org/ (FOAF = Friend Of A Friend) 28
  • 29.
    Swoogle  http://swoogle.umbc.edu/ (Semantic Web Ontology - …ogle) 29
  • 30.
    Powerset  http://www.powerset.com 30
  • 31.
    Quelques sites àconsulter:  http://websemantique.org Site dédié aux francophones intéressés par le Web Sémantique  http://linkeddata.org/ Site de la communauté « LinkedData »  http://www.w3.org/2001/sw/ Site officiel du Web Sémantique 31