SlideShare une entreprise Scribd logo
1  sur  40
Télécharger pour lire hors ligne
semantic web


   Luís Cipriani
   talleye.com
   @lfcipriani (twitter, linkedin, github, ...)
   24o. GURU (2012-05-19) - Sao Paulo/Brazil
sexta-feira, 18 de maio de 12
me




                                digital.abril.com.br


sexta-feira, 18 de maio de 12
motivação

                      semântica   “relacionado ao significado de algo”




                                           não ambíguo




sexta-feira, 18 de maio de 12
motivação




                                http://en.wikipedia.org/wiki/DIKW
sexta-feira, 18 de maio de 12
motivação




sexta-feira, 18 de maio de 12
motivação




                           “A Semantic Web is not Artificial Intelligence”
                                                                 Tim Berners-Lee




sexta-feira, 18 de maio de 12
motivação




                            “Semantic Web is all about data integration”
                                                           Programming the Semantic Web
                                                           http://oreilly.com/catalog/9780596153823




sexta-feira, 18 de maio de 12
integração de dados > tabelas


                     restaurante          endereço        especialidade   preço     aberto



                                                                                    ter-dom
                   Rancho fundo         Av Paulista, 42    brasileira      $$
                                                                                  (10h as 15h)




                                                                                    seg-sex
                        Kanikana      Rua Sumidouro, 24     japonesa      $$$
                                                                                  (13h as 23h)




                                ...           ...              ...         ...         ...




sexta-feira, 18 de maio de 12
integração de dados > bases relacionais




sexta-feira, 18 de maio de 12
integração de dados > bases relacionais
     restaurante
           id                    nome            endereço              id_especialidade   preço

            1             Rancho fundo         Av Paulista, 42                2            $$

            2                   Kanikana     Rua Sumidouro, 24                3           $$$


                                                        aberto
                                                        id_restaurante       dia     horario_abre   horario_fecha
     especialidade                                               1           ter          10             15
         id                       nome
                                                                 1           qua          10             15
          1                     tailandesa
                                                                 1           qui          10             14
          2                     brasileira                       2           sex          13             23
          3                      japonesa                        2           sab          13             23

                                                                 2          dom           14             20

                                                                 ...          ...         ...            ...


sexta-feira, 18 de maio de 12
integração de dados > bases relacionais




                                     migração de schema
sexta-feira, 18 de maio de 12
integração de dados > schema flexível




sexta-feira, 18 de maio de 12
integração de dados > schema flexível
     estabelecimento
          id                    nome              endereço

           1          Rancho fundo              Av Paulista, 42   propriedades
                                                                  id_estabelecimento id_campo     valor
           2               Kanikana           Rua Sumidouro, 24
                                                                          1             1       brasileira

                                                                          1             2          $$
            campo
                                                                          1             5          seg
                id                     nome
                                                                          2             1       japonesa
                1                 especialidade
                                                                          2             3        TRUE
                2                      preço
                                                                          2             2         $$$
                3                       dj
                                                                          ...           ...         ...
                4                música ao vivo

                5                       dia

                ...                     ...



sexta-feira, 18 de maio de 12
integração de dados > relacionamento semântico
     estabelecimento
          id                    nome       endereço

           1          Rancho fundo       Av Paulista, 42

           2               Kanikana    Rua Sumidouro, 24


                                                propriedades
                                                 id_estabelecimento      campo          valor
                                                           1          especialidade   brasileira

                                                           1             preço           $$

                                                           1               dia           seg

                                                           2          especialidade   japonesa

                                                           2               dj          TRUE

                                                           2             preço          $$$

                                                           ...             ...            ...


sexta-feira, 18 de maio de 12
expressando significados

              propriedades
                   sujeito       predicado        objeto
                        1       especialidade    brasileira
                        1          preço            $$
                        1            dia            seg
                        2       especialidade    japonesa
                        2            dj           TRUE
                        2          preço           $$$
                        ...          ...             ...




                                             tripla =


sexta-feira, 18 de maio de 12
modelo em grafo dos estabelecimentos




                                IDs únicos




sexta-feira, 18 de maio de 12
modelo em grafo dos estabelecimentos




                                                relacionamentos
                                propriedades = first class objects



sexta-feira, 18 de maio de 12
modelo em grafo dos estabelecimentos




                                inferência




sexta-feira, 18 de maio de 12
modelo em grafo dos estabelecimentos




                                mesclando




sexta-feira, 18 de maio de 12
modelo em grafo dos estabelecimentos




sexta-feira, 18 de maio de 12
Linked Data Cloud




                                http://linkeddata.org/
sexta-feira, 18 de maio de 12
sexta-feira, 18 de maio de 12
formato de grafo comum



                                                               RDF: padrão da W3C




                                <?xml version="1.0"?>
                                <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
                                         xmlns:contact="http://www.w3.org/2000/10/swap/pim/contact#">

                                  <contact:Person rdf:about="http://www.w3.org/People/EM/contact#me">
                                    <contact:fullName>Eric Miller</contact:fullName>
                                    <contact:mailbox rdf:resource="mailto:em@w3.org"/>
                                    <contact:personalTitle>Dr.</contact:personalTitle>
                                  </contact:Person>

                                </rdf:RDF>



sexta-feira, 18 de maio de 12
formato de grafo comum
     N-Triple
            <http://www.w3.org/2001/sw/RDFCore/ntriples/>   <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> ↵
                <http://xmlns.com/foaf/0.1/Document> .
            <http://www.w3.org/2001/sw/RDFCore/ntriples/>   <http://purl.org/dc/terms/title> "N-Triples"@en-US .
            <http://www.w3.org/2001/sw/RDFCore/ntriples/>   <http://xmlns.com/foaf/0.1/maker> _:art .
            <http://www.w3.org/2001/sw/RDFCore/ntriples/>   <http://xmlns.com/foaf/0.1/maker> _:dave .

            _:art <http://www.w3.org/1999/02/22-rdf-syntax-ns#> <http://xmlns.com/foaf/0.1/Person> .
            _:art <http://xmlns.com/foaf/0.1/name> "Art Barstow".

            _:dave <http://www.w3.org/1999/02/22-rdf-syntax-ns#> <http://xmlns.com/foaf/0.1/Person> .
            _:dave <http://xmlns.com/foaf/0.1/name> "Dave Beckett".



                                                                Notation 3 (N3)
                                                                    @prefix dc: <http://purl.org/dc/elements/1.1/>.

                                                                    <http://en.wikipedia.org/wiki/Tony_Benn>
                                                                      dc:title "Tony Benn";
                                                                      dc:publisher "Wikipedia".



           Turtle
                @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
                @prefix dc: <http://purl.org/dc/elements/1.1/> .
                @prefix ex: <http://example.org/stuff/1.0/> .

                <http://www.w3.org/TR/rdf-syntax-grammar>
                  dc:title "RDF/XML Syntax Specification (Revised)" ;
                  ex:editor [
                    ex:fullname "Dave Beckett";
                    ex:homePage <http://purl.org/net/dajobe/>
                  ] .




sexta-feira, 18 de maio de 12
formato de grafo comum (embutidos no HTML)

    RDFa                                                                                         Microformat
      <p xmlns:dc="http://purl.org/dc/elements/1.1/"                                 <div class="vcard">
         about="http://www.example.com/books/wikinomics">                               <div class="fn">Joe Doe</div>
        In his latest book                                                              <div class="org">The Example Company</div>
        <cite property="dc:title">Wikinomics</cite>,                                    <div class="tel">604-555-1234</div>
        <span property="dc:creator">Don Tapscott</span>                                 <a class="url" href="http://example.com/">
        explains deep changes in technology,                                              http://example.com/
        demographics and business.                                                        </a>
        The book is due to be published in                                            </div>
        <span property="dc:date" content="2006-10-01">October 2006</span>.
      </p>




    Microdata
        <section itemscope itemtype="http://data-vocabulary.org/Person">
                Hello, my name is
                <span itemprop="name">John Doe</span>,
                I am a
                <span itemprop="title">graduate research assistant</span>
                at the
                <span itemprop="affiliation">University of Dreams</span>.
                My friends call me
                <span itemprop="nickname">Johnny</span>.
                You can visit my homepage at
                <a href="http://www.JohnnyD.com" itemprop="url">www.JohnnyD.com</a>.
                <section itemprop="address" itemscope itemtype="http://data-vocabulary.org/Address">
                        I live at
                        <span itemprop="street-address">1234 Peach Drive</span>
                        <span itemprop="locality">Warner Robins</span>
                        ,
                        <span itemprop="region">Georgia</span>.
                </section>
        </section>
                                                                             http://manu.sporny.org/2011/uber-comparison-rdfa-md-uf/
sexta-feira, 18 de maio de 12
sexta-feira, 18 de maio de 12
vocabulários comuns



          integração de dados necessita de acordos em:



              • termos
              • categorias utilizadas
              • relacionamentos entre eles


sexta-feira, 18 de maio de 12
vocabulários comuns


           RDFS (Schema)
 extends                        Resource, Class, Literal, domain, range, type, subClassOf, seeAlso, isDefinedBy...



           SKOS (Simple Knowledge Organization System)
                                para vocabulários controlados, thesaurus, taxonomia
                                part-of, instance-of, prefered-label, definition, Concept, example, related, Collection...


           OWL (Web Ontology Language)
                                para definir vocabulários mais complexos, ricos com forte fundação lógica
                                sameAs, equivalentClass, disjointWith, differentFrom


           RIF (Rule Interchange Format)
                                framework genérico para definir regras em termos e dados
                                uma linguagem para ciação de regras (loops, condicionais, ...)



sexta-feira, 18 de maio de 12
vocabulários comuns




                   uma ontologia deve fornecer um
                   vocabulário preciso no qual o
                   conhecimento possa ser representado




sexta-feira, 18 de maio de 12
vocabulários comuns > ontologias famosas


                                FOAF                Dublin Core
                                          rNews

                                                    iCal
                                GoodRelations
                                                           vCard

                                  geonames        UMBEL


sexta-feira, 18 de maio de 12
sexta-feira, 18 de maio de 12
query


         SPARQL (Simple Protocol and RDF Query Language)
               PREFIX
               fb:<http://rdf.freebase.com/ns/>

               SELECT ?who ?film
               WHERE
               {
                   ?film fb:film.film.directed_by ?who .
                   ?film fb:film.film.starring    ?who .
               }


               SELECT distinct ?episode,?chalkboard_gag
               WHERE
               {
                ?episode
                    <http://www.w3.org/2004/02/skos/core#subject>
                    <http://dbpedia.org/resource/Category:The_Simpsons_episodes%2C_season_12> .
                ?episode <http://dbpedia.org/property/blackboard> ?chalkboard_gag .
               }




sexta-feira, 18 de maio de 12
sexta-feira, 18 de maio de 12
aplicações > BBC




sexta-feira, 18 de maio de 12
aplicações > Search


           Best Buy




sexta-feira, 18 de maio de 12
aplicações > Zemanta




                                http://www.zemanta.com/


sexta-feira, 18 de maio de 12
aplicações > Nasa




sexta-feira, 18 de maio de 12
recapitulando




sexta-feira, 18 de maio de 12
sexta-feira, 18 de maio de 12
referências

                                engineering.abril.com.br


    • http://semtech2011.semanticweb.com
    • http://www.w3.org/2001/sw/
    • Information Rules (www.inforules.com)
    • http://www.w3.org/2001/sw/sweo/public/UseCases/

    • Programming the Semantic Web (Oreilly)
    • https://github.com/bendiken/rdf
    • http://en.wikipedia.org/wiki/Triplestore

sexta-feira, 18 de maio de 12

Contenu connexe

Semantic Web Integração Dados

  • 1. semantic web Luís Cipriani talleye.com @lfcipriani (twitter, linkedin, github, ...) 24o. GURU (2012-05-19) - Sao Paulo/Brazil sexta-feira, 18 de maio de 12
  • 2. me digital.abril.com.br sexta-feira, 18 de maio de 12
  • 3. motivação semântica “relacionado ao significado de algo” não ambíguo sexta-feira, 18 de maio de 12
  • 4. motivação http://en.wikipedia.org/wiki/DIKW sexta-feira, 18 de maio de 12
  • 6. motivação “A Semantic Web is not Artificial Intelligence” Tim Berners-Lee sexta-feira, 18 de maio de 12
  • 7. motivação “Semantic Web is all about data integration” Programming the Semantic Web http://oreilly.com/catalog/9780596153823 sexta-feira, 18 de maio de 12
  • 8. integração de dados > tabelas restaurante endereço especialidade preço aberto ter-dom Rancho fundo Av Paulista, 42 brasileira $$ (10h as 15h) seg-sex Kanikana Rua Sumidouro, 24 japonesa $$$ (13h as 23h) ... ... ... ... ... sexta-feira, 18 de maio de 12
  • 9. integração de dados > bases relacionais sexta-feira, 18 de maio de 12
  • 10. integração de dados > bases relacionais restaurante id nome endereço id_especialidade preço 1 Rancho fundo Av Paulista, 42 2 $$ 2 Kanikana Rua Sumidouro, 24 3 $$$ aberto id_restaurante dia horario_abre horario_fecha especialidade 1 ter 10 15 id nome 1 qua 10 15 1 tailandesa 1 qui 10 14 2 brasileira 2 sex 13 23 3 japonesa 2 sab 13 23 2 dom 14 20 ... ... ... ... sexta-feira, 18 de maio de 12
  • 11. integração de dados > bases relacionais migração de schema sexta-feira, 18 de maio de 12
  • 12. integração de dados > schema flexível sexta-feira, 18 de maio de 12
  • 13. integração de dados > schema flexível estabelecimento id nome endereço 1 Rancho fundo Av Paulista, 42 propriedades id_estabelecimento id_campo valor 2 Kanikana Rua Sumidouro, 24 1 1 brasileira 1 2 $$ campo 1 5 seg id nome 2 1 japonesa 1 especialidade 2 3 TRUE 2 preço 2 2 $$$ 3 dj ... ... ... 4 música ao vivo 5 dia ... ... sexta-feira, 18 de maio de 12
  • 14. integração de dados > relacionamento semântico estabelecimento id nome endereço 1 Rancho fundo Av Paulista, 42 2 Kanikana Rua Sumidouro, 24 propriedades id_estabelecimento campo valor 1 especialidade brasileira 1 preço $$ 1 dia seg 2 especialidade japonesa 2 dj TRUE 2 preço $$$ ... ... ... sexta-feira, 18 de maio de 12
  • 15. expressando significados propriedades sujeito predicado objeto 1 especialidade brasileira 1 preço $$ 1 dia seg 2 especialidade japonesa 2 dj TRUE 2 preço $$$ ... ... ... tripla = sexta-feira, 18 de maio de 12
  • 16. modelo em grafo dos estabelecimentos IDs únicos sexta-feira, 18 de maio de 12
  • 17. modelo em grafo dos estabelecimentos relacionamentos propriedades = first class objects sexta-feira, 18 de maio de 12
  • 18. modelo em grafo dos estabelecimentos inferência sexta-feira, 18 de maio de 12
  • 19. modelo em grafo dos estabelecimentos mesclando sexta-feira, 18 de maio de 12
  • 20. modelo em grafo dos estabelecimentos sexta-feira, 18 de maio de 12
  • 21. Linked Data Cloud http://linkeddata.org/ sexta-feira, 18 de maio de 12
  • 22. sexta-feira, 18 de maio de 12
  • 23. formato de grafo comum RDF: padrão da W3C <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:contact="http://www.w3.org/2000/10/swap/pim/contact#"> <contact:Person rdf:about="http://www.w3.org/People/EM/contact#me"> <contact:fullName>Eric Miller</contact:fullName> <contact:mailbox rdf:resource="mailto:em@w3.org"/> <contact:personalTitle>Dr.</contact:personalTitle> </contact:Person> </rdf:RDF> sexta-feira, 18 de maio de 12
  • 24. formato de grafo comum N-Triple <http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> ↵ <http://xmlns.com/foaf/0.1/Document> . <http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://purl.org/dc/terms/title> "N-Triples"@en-US . <http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://xmlns.com/foaf/0.1/maker> _:art . <http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://xmlns.com/foaf/0.1/maker> _:dave . _:art <http://www.w3.org/1999/02/22-rdf-syntax-ns#> <http://xmlns.com/foaf/0.1/Person> . _:art <http://xmlns.com/foaf/0.1/name> "Art Barstow". _:dave <http://www.w3.org/1999/02/22-rdf-syntax-ns#> <http://xmlns.com/foaf/0.1/Person> . _:dave <http://xmlns.com/foaf/0.1/name> "Dave Beckett". Notation 3 (N3) @prefix dc: <http://purl.org/dc/elements/1.1/>. <http://en.wikipedia.org/wiki/Tony_Benn> dc:title "Tony Benn"; dc:publisher "Wikipedia". Turtle @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix dc: <http://purl.org/dc/elements/1.1/> . @prefix ex: <http://example.org/stuff/1.0/> . <http://www.w3.org/TR/rdf-syntax-grammar> dc:title "RDF/XML Syntax Specification (Revised)" ; ex:editor [ ex:fullname "Dave Beckett"; ex:homePage <http://purl.org/net/dajobe/> ] . sexta-feira, 18 de maio de 12
  • 25. formato de grafo comum (embutidos no HTML) RDFa Microformat <p xmlns:dc="http://purl.org/dc/elements/1.1/" <div class="vcard"> about="http://www.example.com/books/wikinomics"> <div class="fn">Joe Doe</div> In his latest book <div class="org">The Example Company</div> <cite property="dc:title">Wikinomics</cite>, <div class="tel">604-555-1234</div> <span property="dc:creator">Don Tapscott</span> <a class="url" href="http://example.com/"> explains deep changes in technology, http://example.com/ demographics and business. </a> The book is due to be published in </div> <span property="dc:date" content="2006-10-01">October 2006</span>. </p> Microdata <section itemscope itemtype="http://data-vocabulary.org/Person"> Hello, my name is <span itemprop="name">John Doe</span>, I am a <span itemprop="title">graduate research assistant</span> at the <span itemprop="affiliation">University of Dreams</span>. My friends call me <span itemprop="nickname">Johnny</span>. You can visit my homepage at <a href="http://www.JohnnyD.com" itemprop="url">www.JohnnyD.com</a>. <section itemprop="address" itemscope itemtype="http://data-vocabulary.org/Address"> I live at <span itemprop="street-address">1234 Peach Drive</span> <span itemprop="locality">Warner Robins</span> , <span itemprop="region">Georgia</span>. </section> </section> http://manu.sporny.org/2011/uber-comparison-rdfa-md-uf/ sexta-feira, 18 de maio de 12
  • 26. sexta-feira, 18 de maio de 12
  • 27. vocabulários comuns integração de dados necessita de acordos em: • termos • categorias utilizadas • relacionamentos entre eles sexta-feira, 18 de maio de 12
  • 28. vocabulários comuns RDFS (Schema) extends Resource, Class, Literal, domain, range, type, subClassOf, seeAlso, isDefinedBy... SKOS (Simple Knowledge Organization System) para vocabulários controlados, thesaurus, taxonomia part-of, instance-of, prefered-label, definition, Concept, example, related, Collection... OWL (Web Ontology Language) para definir vocabulários mais complexos, ricos com forte fundação lógica sameAs, equivalentClass, disjointWith, differentFrom RIF (Rule Interchange Format) framework genérico para definir regras em termos e dados uma linguagem para ciação de regras (loops, condicionais, ...) sexta-feira, 18 de maio de 12
  • 29. vocabulários comuns uma ontologia deve fornecer um vocabulário preciso no qual o conhecimento possa ser representado sexta-feira, 18 de maio de 12
  • 30. vocabulários comuns > ontologias famosas FOAF Dublin Core rNews iCal GoodRelations vCard geonames UMBEL sexta-feira, 18 de maio de 12
  • 31. sexta-feira, 18 de maio de 12
  • 32. query SPARQL (Simple Protocol and RDF Query Language) PREFIX fb:<http://rdf.freebase.com/ns/> SELECT ?who ?film WHERE { ?film fb:film.film.directed_by ?who . ?film fb:film.film.starring ?who . } SELECT distinct ?episode,?chalkboard_gag WHERE {  ?episode <http://www.w3.org/2004/02/skos/core#subject> <http://dbpedia.org/resource/Category:The_Simpsons_episodes%2C_season_12> .  ?episode <http://dbpedia.org/property/blackboard> ?chalkboard_gag . } sexta-feira, 18 de maio de 12
  • 33. sexta-feira, 18 de maio de 12
  • 35. aplicações > Search Best Buy sexta-feira, 18 de maio de 12
  • 36. aplicações > Zemanta http://www.zemanta.com/ sexta-feira, 18 de maio de 12
  • 39. sexta-feira, 18 de maio de 12
  • 40. referências engineering.abril.com.br • http://semtech2011.semanticweb.com • http://www.w3.org/2001/sw/ • Information Rules (www.inforules.com) • http://www.w3.org/2001/sw/sweo/public/UseCases/ • Programming the Semantic Web (Oreilly) • https://github.com/bendiken/rdf • http://en.wikipedia.org/wiki/Triplestore sexta-feira, 18 de maio de 12