SlideShare une entreprise Scribd logo
1  sur  16
Télécharger pour lire hors ligne
Flink 
Semantic Web Technology for the Extraction 
and Analysis of Social Networks 
Peter Mika, 2005 
Junior Grossi && Paloma Diesel 
Dezembro/2013 | PPGCI UFMG
Peter Mika? 
● Yahoo! Research 
(Barcelona, Espanha) 
● Semantic Web, Search, 
Web Mining 
● Flink (2005) - Web - Java 
● Livro "Social Networks and the 
Semantic Web" (2007)
Flink (Origem) 
● Sucesso da Web 
○ Divulgação de informações pessoais 
○ Redes Sociais (Friendster - 5M users [2005]) 
● Redes Sociais 
○ Informações comuns 
entre os sites 
○ Os mesmos dados 
mantidos em sites 
diferentes
Flink (Origem) 
● FOAF Project (www.foaf-project.org) 
○ Iniciativa parte do usuário 
○ Semântica dos dados pessoais 
■ Links nas páginas (meta tag) 
■ rdfs:seeAlso 
Pessoa 
Pessoa 
Pessoa
Flink (Origem) 
● Utilizar FOAF 
○ Formar "Social Intellingence" 
○ Coletar informações pessoais de pesquisadores 
■ Web pages, e-mails, publicações 
○ "FOAF ontology" 
● 608 pesquisadores de Web Semântica 
○ Links de um pesquisador 
■ Informações pessoais 
■ "Rede Social de Pesquisador"
Flink 
● Dados Coletados (cada pesquisador) 
○ Informações pessoais 
○ Localização geográfica 
○ Interesses 
○ Participação em eventos de Web Semântica 
○ Publicações escritas sobre Web Semântica 
● Resultados 
○ 5147 publicações 
○ 8185 mensagens para grupos de discussão
Ontologia (Tópicos de Pesquisa)
Fontes de Dados
Recursos 
● Web mining (Google) 
○ Conferir área de atuação de pesquisador 
■ Crawler 
■ Google Mindshare (#) 
● NP Interesses / NP Pesquisador (>=0) 
● FOAF 
○ Crawler RDF para coletar perfis (scutter) 
○ Análise das triplas com predicados RDF, RDFs
Recursos 
● E-mails 
○ Download POP3 ou IMAP 
○ Header capturado em RDF 
● Publicação 
○ Google Scholar
Armazenamento 
● Sesame Server (http://openrdf.org) 
○ Deploy de RDF 
■ SQL DB, filesystem, in-memory, etc 
○ Suporta SPARQL 
○ Suporta milhões de triplas
Análises 
● Interpretação das Redes 
● Erros / Ambiguidade 
● Ruídos (pequenas falhas)
Trabalhos Relacionados 
● Ontology-based knowledge management 
○ On-To-Knowledge && SEKT Project 
○ Coleta de dados manualmente 
■ Entrevistas e questionários 
● Emails como foco principal 
● FOAF 
○ Paolillo && Wright
Conclusão e Trabalho Futuro 
● Desafios 
1. Extração, representação e agregação de 
informações sociais 
2. Ontologia Social 
■ Classificar relacionamentos 
3. Criação de padrões sociais 
■ Identificar relacionamentos 
■ Utilizando dados eletrônicos 
● + Performance 
● + Escalabilidade Horizontal
Obrigado! 
Perguntas?

Contenu connexe

Similaire à Flink: Extração e análise de redes sociais com tecnologias da Web Semântica

awari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdfawari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdfMarcos993896
 
Dados Abertos Conectados
Dados Abertos ConectadosDados Abertos Conectados
Dados Abertos ConectadosIg Bittencourt
 
Web Semântica: Conceitos e Tecnologias
Web Semântica: Conceitos e TecnologiasWeb Semântica: Conceitos e Tecnologias
Web Semântica: Conceitos e Tecnologiassergiocrespo
 
Apache solr: como, quando e onde
Apache solr: como, quando e ondeApache solr: como, quando e onde
Apache solr: como, quando e ondePedro Rocha
 
Softwares usados por pesquisadores
Softwares usados por pesquisadoresSoftwares usados por pesquisadores
Softwares usados por pesquisadoresElmano Cavalcanti
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosAmbiente Livre
 
Curso Pesquisa Weblinux
Curso Pesquisa WeblinuxCurso Pesquisa Weblinux
Curso Pesquisa Weblinuxmarcosoliv
 
Pesquisa na web
Pesquisa na webPesquisa na web
Pesquisa na webUFJF
 
Padroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisPadroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisRosana Lanzelotte
 

Similaire à Flink: Extração e análise de redes sociais com tecnologias da Web Semântica (20)

Copy of trabalho de redes
Copy of trabalho de redesCopy of trabalho de redes
Copy of trabalho de redes
 
O NoSQL e o Relacional: Uma Análise
O NoSQL e o Relacional: Uma AnáliseO NoSQL e o Relacional: Uma Análise
O NoSQL e o Relacional: Uma Análise
 
awari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdfawari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdf
 
Introdução a Framework Flask
Introdução a Framework FlaskIntrodução a Framework Flask
Introdução a Framework Flask
 
Dados Abertos Conectados
Dados Abertos ConectadosDados Abertos Conectados
Dados Abertos Conectados
 
Web Semântica: Conceitos e Tecnologias
Web Semântica: Conceitos e TecnologiasWeb Semântica: Conceitos e Tecnologias
Web Semântica: Conceitos e Tecnologias
 
Com vocês, Django!
Com vocês, Django!Com vocês, Django!
Com vocês, Django!
 
Apache solr: como, quando e onde
Apache solr: como, quando e ondeApache solr: como, quando e onde
Apache solr: como, quando e onde
 
Imd ad-tp-g5-r
Imd ad-tp-g5-rImd ad-tp-g5-r
Imd ad-tp-g5-r
 
Imd ad-tp-g5-r
Imd ad-tp-g5-rImd ad-tp-g5-r
Imd ad-tp-g5-r
 
Imd ad-tp-g5-r
Imd ad-tp-g5-rImd ad-tp-g5-r
Imd ad-tp-g5-r
 
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
 
Web Crawlers
Web CrawlersWeb Crawlers
Web Crawlers
 
Softwares usados por pesquisadores
Softwares usados por pesquisadoresSoftwares usados por pesquisadores
Softwares usados por pesquisadores
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativos
 
Curso Pesquisa Weblinux
Curso Pesquisa WeblinuxCurso Pesquisa Weblinux
Curso Pesquisa Weblinux
 
Pesquisa na web
Pesquisa na webPesquisa na web
Pesquisa na web
 
Pesquisa na web
Pesquisa na webPesquisa na web
Pesquisa na web
 
Pesquisa na web
Pesquisa na webPesquisa na web
Pesquisa na web
 
Padroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisPadroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicais
 

Plus de Junior Grossi

Apresentação da Qualificação - Mestrado UFMG Ciência da Informação
Apresentação da Qualificação - Mestrado UFMG Ciência da InformaçãoApresentação da Qualificação - Mestrado UFMG Ciência da Informação
Apresentação da Qualificação - Mestrado UFMG Ciência da InformaçãoJunior Grossi
 
Introdução a Banco de Dados UFMG/2014-02 - Exercício 02
Introdução a Banco de Dados UFMG/2014-02 - Exercício 02Introdução a Banco de Dados UFMG/2014-02 - Exercício 02
Introdução a Banco de Dados UFMG/2014-02 - Exercício 02Junior Grossi
 
Introdução a Banco de Dados UFMG/2014-02 - Aula 10
Introdução a Banco de Dados UFMG/2014-02 - Aula 10Introdução a Banco de Dados UFMG/2014-02 - Aula 10
Introdução a Banco de Dados UFMG/2014-02 - Aula 10Junior Grossi
 
Introdução a Banco de Dados UFMG/2014-02 - Aula 09
Introdução a Banco de Dados UFMG/2014-02 - Aula 09Introdução a Banco de Dados UFMG/2014-02 - Aula 09
Introdução a Banco de Dados UFMG/2014-02 - Aula 09Junior Grossi
 
Introdução a Banco de Dados UFMG/2014-02 - Aula 08
Introdução a Banco de Dados UFMG/2014-02 - Aula 08Introdução a Banco de Dados UFMG/2014-02 - Aula 08
Introdução a Banco de Dados UFMG/2014-02 - Aula 08Junior Grossi
 
Introdução a Banco de Dados UFMG/2014-02 - Aula 07
Introdução a Banco de Dados UFMG/2014-02 - Aula 07Introdução a Banco de Dados UFMG/2014-02 - Aula 07
Introdução a Banco de Dados UFMG/2014-02 - Aula 07Junior Grossi
 
Introdução a Banco de Dados UFMG/2014-02 - Aula 06
Introdução a Banco de Dados UFMG/2014-02 - Aula 06Introdução a Banco de Dados UFMG/2014-02 - Aula 06
Introdução a Banco de Dados UFMG/2014-02 - Aula 06Junior Grossi
 
Introdução a Banco de Dados UFMG/2014-02 - Aula 04
Introdução a Banco de Dados UFMG/2014-02 - Aula 04Introdução a Banco de Dados UFMG/2014-02 - Aula 04
Introdução a Banco de Dados UFMG/2014-02 - Aula 04Junior Grossi
 
Exercícíos de Modelagem Conceitual 2014/2
Exercícíos de Modelagem Conceitual 2014/2Exercícíos de Modelagem Conceitual 2014/2
Exercícíos de Modelagem Conceitual 2014/2Junior Grossi
 
Introdução a Banco de Dados 03 - UFMG BIBL 2014/02
Introdução a Banco de Dados 03 - UFMG BIBL 2014/02Introdução a Banco de Dados 03 - UFMG BIBL 2014/02
Introdução a Banco de Dados 03 - UFMG BIBL 2014/02Junior Grossi
 
Introdução a Banco de Dados 02 - UFMG BIBL 2014/02
Introdução a Banco de Dados 02 - UFMG BIBL 2014/02Introdução a Banco de Dados 02 - UFMG BIBL 2014/02
Introdução a Banco de Dados 02 - UFMG BIBL 2014/02Junior Grossi
 
Introdução a Banco de Dados 01 - UFMG BIBL 2014/02
Introdução a Banco de Dados 01 - UFMG BIBL 2014/02Introdução a Banco de Dados 01 - UFMG BIBL 2014/02
Introdução a Banco de Dados 01 - UFMG BIBL 2014/02Junior Grossi
 
Presentation about Ontologies at my Masters (UFMG, pt_BR)
Presentation about Ontologies at my Masters (UFMG, pt_BR)Presentation about Ontologies at my Masters (UFMG, pt_BR)
Presentation about Ontologies at my Masters (UFMG, pt_BR)Junior Grossi
 

Plus de Junior Grossi (13)

Apresentação da Qualificação - Mestrado UFMG Ciência da Informação
Apresentação da Qualificação - Mestrado UFMG Ciência da InformaçãoApresentação da Qualificação - Mestrado UFMG Ciência da Informação
Apresentação da Qualificação - Mestrado UFMG Ciência da Informação
 
Introdução a Banco de Dados UFMG/2014-02 - Exercício 02
Introdução a Banco de Dados UFMG/2014-02 - Exercício 02Introdução a Banco de Dados UFMG/2014-02 - Exercício 02
Introdução a Banco de Dados UFMG/2014-02 - Exercício 02
 
Introdução a Banco de Dados UFMG/2014-02 - Aula 10
Introdução a Banco de Dados UFMG/2014-02 - Aula 10Introdução a Banco de Dados UFMG/2014-02 - Aula 10
Introdução a Banco de Dados UFMG/2014-02 - Aula 10
 
Introdução a Banco de Dados UFMG/2014-02 - Aula 09
Introdução a Banco de Dados UFMG/2014-02 - Aula 09Introdução a Banco de Dados UFMG/2014-02 - Aula 09
Introdução a Banco de Dados UFMG/2014-02 - Aula 09
 
Introdução a Banco de Dados UFMG/2014-02 - Aula 08
Introdução a Banco de Dados UFMG/2014-02 - Aula 08Introdução a Banco de Dados UFMG/2014-02 - Aula 08
Introdução a Banco de Dados UFMG/2014-02 - Aula 08
 
Introdução a Banco de Dados UFMG/2014-02 - Aula 07
Introdução a Banco de Dados UFMG/2014-02 - Aula 07Introdução a Banco de Dados UFMG/2014-02 - Aula 07
Introdução a Banco de Dados UFMG/2014-02 - Aula 07
 
Introdução a Banco de Dados UFMG/2014-02 - Aula 06
Introdução a Banco de Dados UFMG/2014-02 - Aula 06Introdução a Banco de Dados UFMG/2014-02 - Aula 06
Introdução a Banco de Dados UFMG/2014-02 - Aula 06
 
Introdução a Banco de Dados UFMG/2014-02 - Aula 04
Introdução a Banco de Dados UFMG/2014-02 - Aula 04Introdução a Banco de Dados UFMG/2014-02 - Aula 04
Introdução a Banco de Dados UFMG/2014-02 - Aula 04
 
Exercícíos de Modelagem Conceitual 2014/2
Exercícíos de Modelagem Conceitual 2014/2Exercícíos de Modelagem Conceitual 2014/2
Exercícíos de Modelagem Conceitual 2014/2
 
Introdução a Banco de Dados 03 - UFMG BIBL 2014/02
Introdução a Banco de Dados 03 - UFMG BIBL 2014/02Introdução a Banco de Dados 03 - UFMG BIBL 2014/02
Introdução a Banco de Dados 03 - UFMG BIBL 2014/02
 
Introdução a Banco de Dados 02 - UFMG BIBL 2014/02
Introdução a Banco de Dados 02 - UFMG BIBL 2014/02Introdução a Banco de Dados 02 - UFMG BIBL 2014/02
Introdução a Banco de Dados 02 - UFMG BIBL 2014/02
 
Introdução a Banco de Dados 01 - UFMG BIBL 2014/02
Introdução a Banco de Dados 01 - UFMG BIBL 2014/02Introdução a Banco de Dados 01 - UFMG BIBL 2014/02
Introdução a Banco de Dados 01 - UFMG BIBL 2014/02
 
Presentation about Ontologies at my Masters (UFMG, pt_BR)
Presentation about Ontologies at my Masters (UFMG, pt_BR)Presentation about Ontologies at my Masters (UFMG, pt_BR)
Presentation about Ontologies at my Masters (UFMG, pt_BR)
 

Flink: Extração e análise de redes sociais com tecnologias da Web Semântica

  • 1. Flink Semantic Web Technology for the Extraction and Analysis of Social Networks Peter Mika, 2005 Junior Grossi && Paloma Diesel Dezembro/2013 | PPGCI UFMG
  • 2. Peter Mika? ● Yahoo! Research (Barcelona, Espanha) ● Semantic Web, Search, Web Mining ● Flink (2005) - Web - Java ● Livro "Social Networks and the Semantic Web" (2007)
  • 3. Flink (Origem) ● Sucesso da Web ○ Divulgação de informações pessoais ○ Redes Sociais (Friendster - 5M users [2005]) ● Redes Sociais ○ Informações comuns entre os sites ○ Os mesmos dados mantidos em sites diferentes
  • 4. Flink (Origem) ● FOAF Project (www.foaf-project.org) ○ Iniciativa parte do usuário ○ Semântica dos dados pessoais ■ Links nas páginas (meta tag) ■ rdfs:seeAlso Pessoa Pessoa Pessoa
  • 5. Flink (Origem) ● Utilizar FOAF ○ Formar "Social Intellingence" ○ Coletar informações pessoais de pesquisadores ■ Web pages, e-mails, publicações ○ "FOAF ontology" ● 608 pesquisadores de Web Semântica ○ Links de um pesquisador ■ Informações pessoais ■ "Rede Social de Pesquisador"
  • 6.
  • 7. Flink ● Dados Coletados (cada pesquisador) ○ Informações pessoais ○ Localização geográfica ○ Interesses ○ Participação em eventos de Web Semântica ○ Publicações escritas sobre Web Semântica ● Resultados ○ 5147 publicações ○ 8185 mensagens para grupos de discussão
  • 10. Recursos ● Web mining (Google) ○ Conferir área de atuação de pesquisador ■ Crawler ■ Google Mindshare (#) ● NP Interesses / NP Pesquisador (>=0) ● FOAF ○ Crawler RDF para coletar perfis (scutter) ○ Análise das triplas com predicados RDF, RDFs
  • 11. Recursos ● E-mails ○ Download POP3 ou IMAP ○ Header capturado em RDF ● Publicação ○ Google Scholar
  • 12. Armazenamento ● Sesame Server (http://openrdf.org) ○ Deploy de RDF ■ SQL DB, filesystem, in-memory, etc ○ Suporta SPARQL ○ Suporta milhões de triplas
  • 13. Análises ● Interpretação das Redes ● Erros / Ambiguidade ● Ruídos (pequenas falhas)
  • 14. Trabalhos Relacionados ● Ontology-based knowledge management ○ On-To-Knowledge && SEKT Project ○ Coleta de dados manualmente ■ Entrevistas e questionários ● Emails como foco principal ● FOAF ○ Paolillo && Wright
  • 15. Conclusão e Trabalho Futuro ● Desafios 1. Extração, representação e agregação de informações sociais 2. Ontologia Social ■ Classificar relacionamentos 3. Criação de padrões sociais ■ Identificar relacionamentos ■ Utilizando dados eletrônicos ● + Performance ● + Escalabilidade Horizontal