SlideShare une entreprise Scribd logo
1  sur  24
Télécharger pour lire hors ligne
Marcel Caraciolo - @marcelcaraciolo
Mineração de Palestras
1
Quem é Marcel ?
Marcel Pinheiro Caraciolo - @marcelcaraciolo
Mestrando em Ciência da Computação no CIN/UFPE na área de mineração de dados
Diretor de Pesquisa e Desenvolvimento na Orygens
Membro e Moderador da Celúla de Usuários Python de Pernambuco (PUG-PE)
Minhas áreas de interesse: Computação móvel e Computação inteligente
Meus blogs: http://www.mobideia.com (sobre Mobilidade desde 2006)
http://aimotion.blogspot.com (sobre I.A. desde 2009)
Jovem Aprendiz ainda nas artes pythonicas.... (desde 2007)
Sergipano, porém Recifense.
2
Como comecei esta análise ?
20 hrs atrás no Hotel....
3
Scraping do PythonBrasil
Mini-Crawler para extrair as palestras aprovadas
urllib2,BeautifulSoap, regex...
4
Dilema
Esses dados são Públicos ??
Não ? Podemos negociar ein ...
5
Alguns dados interessantes
6
48 Palestras aceitas
2160 minutos de Palestras
7
Ou seja
=˜388.800 tweets postados
8
Ou assistir
Todas temporadas Big Bang Theory
Toda a Saga Star Wars 2x
9
Na nossa língua agora...
Zerar Super Mario 216 x
http://video.google.com/videoplay?docid=-8297067084319900351&q=mario#
10
Na nossa língua agora...
Abrir o Eclipse 2 vezes!
11
Total de Pontos recebidos:
4812
12
Convertendo em votos
Não dava para eleger Tiririca, mas
Mas veja conseguimos um número perfeito!
4812 MB = Capacidade de um DVD!
13
Palestra Hackeada
Dinf & C3SL infra estrutura - 999 vontos
Apelão mesmo!
14
Distribuição das palestras
Ainda precisamos distribuir
melhor o nível das
palestras!
Avançado
2%
Intermediario
56%
Basico
42%
Avançado
Intermediario
Basico
15
Distribuição das palestras
16
Temas mais frequentes
Temas relacionados a desenvolvimento, dados, sistemas, linguagem,
ferramentas, django
A partir dos resumos
17
Temas mais frequentes
Mas como ver a distribuição dos temas
18
Temas mais frequentes
Mas ainda fica difícil de distinguir!
19
Distribuição das palestras
Utilizado o algoritmo de clustering K-means
Ferramenta de visualização em Python UbiGraph
DEMO
20
Distribuição das palestras
Ferramenta de visualização UbiGraph
Inteligencia Artificial
Hardware
Web (Django e AppEngine)
Empreendorismo
Padrões e Práticas
Ferramentas
Testes
Mineração de Dados
http://ubietylab.net/ubigraph/
21
RESUMO
Excelente nível de palestras!
Submetam seus trabalhos, vocês podem
estar aqui também!
Engaje, colabore e divulgue!
22
Marcel Caraciolo - @marcelcaraciolo
Mineração de Palestras
23
Marcel Caraciolo - @marcelcaraciolo
Mineração de Palestras
23

Contenu connexe

En vedette

OpenData-BR, [Captando] Dados públicos brasileiros
OpenData-BR, [Captando] Dados públicos brasileirosOpenData-BR, [Captando] Dados públicos brasileiros
OpenData-BR, [Captando] Dados públicos brasileirosThiago Rondon
 
03 dicas valiosas para a implantação de métodos ágeis na sua organização
03 dicas valiosas para a implantação de métodos ágeis na sua organização03 dicas valiosas para a implantação de métodos ágeis na sua organização
03 dicas valiosas para a implantação de métodos ágeis na sua organizaçãoVitor Massari
 
Mini Curso - WebScraping com C# - Erick Wendel
Mini Curso - WebScraping com C# - Erick WendelMini Curso - WebScraping com C# - Erick Wendel
Mini Curso - WebScraping com C# - Erick WendelErick Wendel
 
O Product Owner e o Scrum
O Product Owner e o ScrumO Product Owner e o Scrum
O Product Owner e o ScrumVitor Massari
 
Scrum: 10 situações de quando ele poderá (e certamente irá) fracassar
Scrum: 10 situações de quando ele poderá (e certamente irá) fracassarScrum: 10 situações de quando ele poderá (e certamente irá) fracassar
Scrum: 10 situações de quando ele poderá (e certamente irá) fracassarVitor Massari
 
Scrum e o gerenciamento de projetos
Scrum e o gerenciamento de projetosScrum e o gerenciamento de projetos
Scrum e o gerenciamento de projetosVitor Massari
 
Scrum: do teórico e filosófico para os desafios reais e avançados na implemen...
Scrum: do teórico e filosófico para os desafios reais e avançados na implemen...Scrum: do teórico e filosófico para os desafios reais e avançados na implemen...
Scrum: do teórico e filosófico para os desafios reais e avançados na implemen...Vitor Massari
 
Formando equipes de alto desempenho
Formando equipes de alto desempenhoFormando equipes de alto desempenho
Formando equipes de alto desempenhoVitor Massari
 
Web Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciênciaWeb Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciênciaSidney Roberto
 
Modelos Híbridos: Case, Verdades, Mitos e Resistências
Modelos Híbridos: Case, Verdades, Mitos e ResistênciasModelos Híbridos: Case, Verdades, Mitos e Resistências
Modelos Híbridos: Case, Verdades, Mitos e ResistênciasVitor Massari
 
Gerenciamento Ágil de Projetos Seguindo as Boas Práticas do PMI
Gerenciamento Ágil de Projetos Seguindo as Boas Práticas do PMIGerenciamento Ágil de Projetos Seguindo as Boas Práticas do PMI
Gerenciamento Ágil de Projetos Seguindo as Boas Práticas do PMIVitor Massari
 
Apresentação de Serviços em Métodos Ágeis - Hiflex Consultoria
Apresentação de Serviços em Métodos Ágeis - Hiflex ConsultoriaApresentação de Serviços em Métodos Ágeis - Hiflex Consultoria
Apresentação de Serviços em Métodos Ágeis - Hiflex ConsultoriaVitor Massari
 
Desenvolvendo web crawler/scraper com Python
Desenvolvendo web crawler/scraper com PythonDesenvolvendo web crawler/scraper com Python
Desenvolvendo web crawler/scraper com PythonRoselma Mendes
 
Extraindo dados públicos na marra com Python
Extraindo dados públicos na marra com PythonExtraindo dados públicos na marra com Python
Extraindo dados públicos na marra com PythonPedro Valente
 

En vedette (17)

OpenData-BR, [Captando] Dados públicos brasileiros
OpenData-BR, [Captando] Dados públicos brasileirosOpenData-BR, [Captando] Dados públicos brasileiros
OpenData-BR, [Captando] Dados públicos brasileiros
 
Web scraping
Web scrapingWeb scraping
Web scraping
 
03 dicas valiosas para a implantação de métodos ágeis na sua organização
03 dicas valiosas para a implantação de métodos ágeis na sua organização03 dicas valiosas para a implantação de métodos ágeis na sua organização
03 dicas valiosas para a implantação de métodos ágeis na sua organização
 
Mini Curso - WebScraping com C# - Erick Wendel
Mini Curso - WebScraping com C# - Erick WendelMini Curso - WebScraping com C# - Erick Wendel
Mini Curso - WebScraping com C# - Erick Wendel
 
O Product Owner e o Scrum
O Product Owner e o ScrumO Product Owner e o Scrum
O Product Owner e o Scrum
 
Scrum: 10 situações de quando ele poderá (e certamente irá) fracassar
Scrum: 10 situações de quando ele poderá (e certamente irá) fracassarScrum: 10 situações de quando ele poderá (e certamente irá) fracassar
Scrum: 10 situações de quando ele poderá (e certamente irá) fracassar
 
Scrum e o gerenciamento de projetos
Scrum e o gerenciamento de projetosScrum e o gerenciamento de projetos
Scrum e o gerenciamento de projetos
 
Scrum: do teórico e filosófico para os desafios reais e avançados na implemen...
Scrum: do teórico e filosófico para os desafios reais e avançados na implemen...Scrum: do teórico e filosófico para os desafios reais e avançados na implemen...
Scrum: do teórico e filosófico para os desafios reais e avançados na implemen...
 
Formando equipes de alto desempenho
Formando equipes de alto desempenhoFormando equipes de alto desempenho
Formando equipes de alto desempenho
 
Web Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciênciaWeb Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciência
 
Modelos Híbridos: Case, Verdades, Mitos e Resistências
Modelos Híbridos: Case, Verdades, Mitos e ResistênciasModelos Híbridos: Case, Verdades, Mitos e Resistências
Modelos Híbridos: Case, Verdades, Mitos e Resistências
 
Gerenciamento Ágil de Projetos Seguindo as Boas Práticas do PMI
Gerenciamento Ágil de Projetos Seguindo as Boas Práticas do PMIGerenciamento Ágil de Projetos Seguindo as Boas Práticas do PMI
Gerenciamento Ágil de Projetos Seguindo as Boas Práticas do PMI
 
Scraping
ScrapingScraping
Scraping
 
Open Data
Open DataOpen Data
Open Data
 
Apresentação de Serviços em Métodos Ágeis - Hiflex Consultoria
Apresentação de Serviços em Métodos Ágeis - Hiflex ConsultoriaApresentação de Serviços em Métodos Ágeis - Hiflex Consultoria
Apresentação de Serviços em Métodos Ágeis - Hiflex Consultoria
 
Desenvolvendo web crawler/scraper com Python
Desenvolvendo web crawler/scraper com PythonDesenvolvendo web crawler/scraper com Python
Desenvolvendo web crawler/scraper com Python
 
Extraindo dados públicos na marra com Python
Extraindo dados públicos na marra com PythonExtraindo dados públicos na marra com Python
Extraindo dados públicos na marra com Python
 

Plus de Marcel Caraciolo

Como interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com PythonComo interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com PythonMarcel Caraciolo
 
Joblib: Lightweight pipelining for parallel jobs (v2)
Joblib:  Lightweight pipelining for parallel jobs (v2)Joblib:  Lightweight pipelining for parallel jobs (v2)
Joblib: Lightweight pipelining for parallel jobs (v2)Marcel Caraciolo
 
Construindo softwares de bioinformática para análises clínicas : Desafios e...
Construindo softwares  de bioinformática  para análises clínicas : Desafios e...Construindo softwares  de bioinformática  para análises clínicas : Desafios e...
Construindo softwares de bioinformática para análises clínicas : Desafios e...Marcel Caraciolo
 
Como Python ajudou a automatizar o nosso laboratório v.2
Como Python ajudou a automatizar o nosso laboratório v.2Como Python ajudou a automatizar o nosso laboratório v.2
Como Python ajudou a automatizar o nosso laboratório v.2Marcel Caraciolo
 
Como Python pode ajudar na automação do seu laboratório
Como Python pode ajudar na automação do  seu laboratórioComo Python pode ajudar na automação do  seu laboratório
Como Python pode ajudar na automação do seu laboratórioMarcel Caraciolo
 
Python on Science ? Yes, We can.
Python on Science ?   Yes, We can.Python on Science ?   Yes, We can.
Python on Science ? Yes, We can.Marcel Caraciolo
 
Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3Marcel Caraciolo
 
Recommender Systems with Ruby (adding machine learning, statistics, etc)
Recommender Systems with Ruby (adding machine learning, statistics, etc)Recommender Systems with Ruby (adding machine learning, statistics, etc)
Recommender Systems with Ruby (adding machine learning, statistics, etc)Marcel Caraciolo
 
Opensource - Como começar e dá dinheiro ?
Opensource - Como começar e dá dinheiro ?Opensource - Como começar e dá dinheiro ?
Opensource - Como começar e dá dinheiro ?Marcel Caraciolo
 
Benchy, python framework for performance benchmarking of Python Scripts
Benchy, python framework for performance benchmarking  of Python ScriptsBenchy, python framework for performance benchmarking  of Python Scripts
Benchy, python framework for performance benchmarking of Python ScriptsMarcel Caraciolo
 
Python e 10 motivos por que devo conhece-la ?
Python e 10 motivos por que devo conhece-la ?Python e 10 motivos por que devo conhece-la ?
Python e 10 motivos por que devo conhece-la ?Marcel Caraciolo
 
GeoMapper, Python Script for Visualizing Data on Social Networks with Geo-loc...
GeoMapper, Python Script for Visualizing Data on Social Networks with Geo-loc...GeoMapper, Python Script for Visualizing Data on Social Networks with Geo-loc...
GeoMapper, Python Script for Visualizing Data on Social Networks with Geo-loc...Marcel Caraciolo
 
Benchy: Lightweight framework for Performance Benchmarks
Benchy: Lightweight framework for Performance Benchmarks Benchy: Lightweight framework for Performance Benchmarks
Benchy: Lightweight framework for Performance Benchmarks Marcel Caraciolo
 
Construindo Sistemas de Recomendação com Python
Construindo Sistemas de Recomendação com PythonConstruindo Sistemas de Recomendação com Python
Construindo Sistemas de Recomendação com PythonMarcel Caraciolo
 
Python, A pílula Azul da programação
Python, A pílula Azul da programaçãoPython, A pílula Azul da programação
Python, A pílula Azul da programaçãoMarcel Caraciolo
 
Construindo Soluções Científicas com Big Data & MapReduce
Construindo Soluções Científicas com Big Data & MapReduceConstruindo Soluções Científicas com Big Data & MapReduce
Construindo Soluções Científicas com Big Data & MapReduceMarcel Caraciolo
 
Como Python está mudando a forma de aprendizagem à distância no Brasil
Como Python está mudando a forma de aprendizagem à distância no BrasilComo Python está mudando a forma de aprendizagem à distância no Brasil
Como Python está mudando a forma de aprendizagem à distância no BrasilMarcel Caraciolo
 
Novas Tendências para a Educação a Distância: Como reinventar a educação ?
Novas Tendências para a Educação a Distância: Como reinventar a educação ?Novas Tendências para a Educação a Distância: Como reinventar a educação ?
Novas Tendências para a Educação a Distância: Como reinventar a educação ?Marcel Caraciolo
 
Aula WebCrawlers com Regex - PyCursos
Aula WebCrawlers com Regex - PyCursosAula WebCrawlers com Regex - PyCursos
Aula WebCrawlers com Regex - PyCursosMarcel Caraciolo
 

Plus de Marcel Caraciolo (20)

Como interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com PythonComo interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com Python
 
Joblib: Lightweight pipelining for parallel jobs (v2)
Joblib:  Lightweight pipelining for parallel jobs (v2)Joblib:  Lightweight pipelining for parallel jobs (v2)
Joblib: Lightweight pipelining for parallel jobs (v2)
 
Construindo softwares de bioinformática para análises clínicas : Desafios e...
Construindo softwares  de bioinformática  para análises clínicas : Desafios e...Construindo softwares  de bioinformática  para análises clínicas : Desafios e...
Construindo softwares de bioinformática para análises clínicas : Desafios e...
 
Como Python ajudou a automatizar o nosso laboratório v.2
Como Python ajudou a automatizar o nosso laboratório v.2Como Python ajudou a automatizar o nosso laboratório v.2
Como Python ajudou a automatizar o nosso laboratório v.2
 
Como Python pode ajudar na automação do seu laboratório
Como Python pode ajudar na automação do  seu laboratórioComo Python pode ajudar na automação do  seu laboratório
Como Python pode ajudar na automação do seu laboratório
 
Python on Science ? Yes, We can.
Python on Science ?   Yes, We can.Python on Science ?   Yes, We can.
Python on Science ? Yes, We can.
 
Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3
 
Recommender Systems with Ruby (adding machine learning, statistics, etc)
Recommender Systems with Ruby (adding machine learning, statistics, etc)Recommender Systems with Ruby (adding machine learning, statistics, etc)
Recommender Systems with Ruby (adding machine learning, statistics, etc)
 
Opensource - Como começar e dá dinheiro ?
Opensource - Como começar e dá dinheiro ?Opensource - Como começar e dá dinheiro ?
Opensource - Como começar e dá dinheiro ?
 
Big Data com Python
Big Data com PythonBig Data com Python
Big Data com Python
 
Benchy, python framework for performance benchmarking of Python Scripts
Benchy, python framework for performance benchmarking  of Python ScriptsBenchy, python framework for performance benchmarking  of Python Scripts
Benchy, python framework for performance benchmarking of Python Scripts
 
Python e 10 motivos por que devo conhece-la ?
Python e 10 motivos por que devo conhece-la ?Python e 10 motivos por que devo conhece-la ?
Python e 10 motivos por que devo conhece-la ?
 
GeoMapper, Python Script for Visualizing Data on Social Networks with Geo-loc...
GeoMapper, Python Script for Visualizing Data on Social Networks with Geo-loc...GeoMapper, Python Script for Visualizing Data on Social Networks with Geo-loc...
GeoMapper, Python Script for Visualizing Data on Social Networks with Geo-loc...
 
Benchy: Lightweight framework for Performance Benchmarks
Benchy: Lightweight framework for Performance Benchmarks Benchy: Lightweight framework for Performance Benchmarks
Benchy: Lightweight framework for Performance Benchmarks
 
Construindo Sistemas de Recomendação com Python
Construindo Sistemas de Recomendação com PythonConstruindo Sistemas de Recomendação com Python
Construindo Sistemas de Recomendação com Python
 
Python, A pílula Azul da programação
Python, A pílula Azul da programaçãoPython, A pílula Azul da programação
Python, A pílula Azul da programação
 
Construindo Soluções Científicas com Big Data & MapReduce
Construindo Soluções Científicas com Big Data & MapReduceConstruindo Soluções Científicas com Big Data & MapReduce
Construindo Soluções Científicas com Big Data & MapReduce
 
Como Python está mudando a forma de aprendizagem à distância no Brasil
Como Python está mudando a forma de aprendizagem à distância no BrasilComo Python está mudando a forma de aprendizagem à distância no Brasil
Como Python está mudando a forma de aprendizagem à distância no Brasil
 
Novas Tendências para a Educação a Distância: Como reinventar a educação ?
Novas Tendências para a Educação a Distância: Como reinventar a educação ?Novas Tendências para a Educação a Distância: Como reinventar a educação ?
Novas Tendências para a Educação a Distância: Como reinventar a educação ?
 
Aula WebCrawlers com Regex - PyCursos
Aula WebCrawlers com Regex - PyCursosAula WebCrawlers com Regex - PyCursos
Aula WebCrawlers com Regex - PyCursos
 

Análise das palestras do PythonBrasil