Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

#VEM Coleta de dados relacionais

Slides da oficina de coleta de dados relacionais aplicada na UFF em 2017.

  • Soyez le premier à commenter

#VEM Coleta de dados relacionais

  1. 1. COLETA DE nas mídias sociais Marcelo alves
  2. 2. COLETA DE nas mídias sociais instrutor •Doutorando pelo PPGCOM/UFF; • Estuda comunicação política em rede; • Sócio-diretor da Vértice Inteligência; • Pesquisador do laboratório de mídia e democracia (LAMIDE/UFF), orientado por Afonso de Albuquerque; • Publica textos no blog www.marceloalves.org
  3. 3. N = 532 fan-pages A = 8.654 arestas Rede antipetista na eleição de 2014
  4. 4. COLETA DE nas mídias sociais c Quais objetos ou temas de pesquisa dos alunos para coleta de dados?
  5. 5. COLETA DE nas mídias sociais O que você vai aprender •O básico da concepção teórica da análise de redes; • Processos de coletas de dados relacionais; • Leitura da documentação da Graph API do Facebook • Métodos de construções de queries; • Funcionamento e prática com Facepager; • Extrair dados das pesquisas dos alunos; • Tratamento e manipulação de dados relacionais; • Importar dados no Gephi.
  6. 6. COLETA DE nas mídias sociais c CONCEITOS TEÓRICOS GERAIS (prometoser breve)
  7. 7. COLETA DE nas mídias sociais Lógicasdacomunicaçãopolíticaemmassaeemrede-KlingereSvensson(2014)
  8. 8. COLETA DE nas mídias sociais Lógicasdacomunicaçãopolíticaemmassaeemrede-KlingereSvensson(2014) • Lógicas de rede não estão tomando o lugar da lógica de massa; • As plataformas de mídias sociais seguem outras regras do jogo; • A mídia de massa e o conteúdo jornalístico continuam sendo uma das principais fontes de informação; • As duas lógicas não são estáticas, mas estão em evolução
  9. 9. COLETA DE nas mídias sociais Sistemasmidiáticoshíbridos–Chadwick(2013) • “O sistema midiático híbrido é baseado em conflito e cooperaçãoentre lógicas novas e antigas; mas também possui considerável grau de interdependênciaentre estas lógicas” (Chadwick, 2013, p. 207) • Convergência midiática – ambos os sistemas estão entrelaçados • Partidos, imprensa e movimentos sociais tradicionais estão se adaptando às lógicas de rede “Conteúdo nas plataformas de mídias sociais nem sempre é gerado pelo usuário, mas frequentemente envolve referências aos meios de massa. A mídia tradicional também busca aprender distribuições virais como uma base de um novo modelo de negócios. Usuários de mídia diversificaram suas dietas noticiosas e começam a navegar em sistemas midiáticos híbridos. No entanto, a sobreposição não torna as lógicas midiáticas indistinguíveis, porque são modus operandi muitos distintos. É tarefa dos estudos empíricos distinguir e medir as lógicas de massa e de rede em casos específicos” (Klinger e Svensson, 2014, p. 12).
  10. 10. COLETA DE nas mídias sociais Repertóriosdigitaisemredesehibridismoorganizacional(Chadwick,2007) Duas tendências paralelas 1) Organizações políticas tradicionais estão adotando e modificando seletivamente características de movimentos sociais; Quatro repertórios principais: (a) mobilizando formas online de ação dos cidadãos; (b) articulando ligações entre diferentes grupos; fundindo discurso políticos e subculturais e (d) aproveitando-se de redes sedimentárias. “Há sinais crescentes de que organizações tradicionais, mais hierárquicas, menos inovadoras – como grupos de interesse e partidos – estão começando a se adaptar e adotar repertórios digitais em rede” (Chadwick, 2007, p. 286) 2) Novas formas organizacionais que só podem existir na internet estão surgindo. “Organizações ainda mais radicais estão surgindo, como o MoveOn, que mistura repertórios ou rapidamente troca de um conjunto de ações para outras. Quando se trata de ação coletiva potencializada pela internet, a imitação é parte da inovação. O conceito que melhor da conta deste resultado é a hibridez organizacional”
  11. 11. COLETA DE nas mídias sociais Ociclodeinformaçãopolítica–Chadwick(2011) Ciclo noticioso = período do dia previsível no qual se produzem as notícias, o tempo para selecionar, apurar, escrever, editar, compilar e apresentar material jornalístico. • Fenômeno explorado pelos autores de sociologia do jornalismo e da comunicação sobre os ciclos produtivos das redações e a noticiabilidade • Construção da notícia é um processo rigidamente controlado e envolve negociações entre a elite política e midiática Ciclo de informação política = bricolagem entre lógicas de massa e de rede na produção de informação política. • Maior número e maior diversidade de atores • Estruturas temporais mais rápidas e complexas • Inclui participantes que tangenciam as elites políticas e midiáticas • Diversificação das fontes de informação •Deslocamento do jornalismo, ou do jornalismo liberal, como balizador da produção de informação.
  12. 12. COLETA DE nas mídias sociais Oquetemosatéaqui? • Uma série de mudanças tecnológicas, sociais e organizacionais na comunicação política. • As elites perdem a exclusividade do acesso e do controle de meios de criação de informação. • Diversos repertórios de expressão política surgem para além das burocracias partidárias e jornalísticas. • Tudo isso está em permanente movimento e relacionamento. A delimitação dos corpus de pesquisa em meios de massa é bastante simples. As notícias publicadas no jornal X ou as peças publicitárias televisivas durante o período eleitoral. O objeto é a cobertura da imprensa ou propagandas políticas oficiais. Frequentemente, os estudos mais recentes escolhem um ator e dedicam-se apenas a ele, por exemplo, a produção da Mídia Ninja. Porém, essa abordagem perde as dinâmicas relacionais criadas em torno daquele agente e todas as negociações com os demais envolvidos.
  13. 13. COLETA DE nas mídias sociais c Contudo, num ambiente midiático híbrido, com surgimento de blogs, lideranças de opinião nativas digitais e uma infinidade de outros fenômenos, Como delimitar o corpus de pesquisa?
  14. 14. COLETA DE nas mídias sociais Esferapúblicaemrede(Benkleretal.2013,p.04)–conceitoprovisório • A esfera pública em rede é uma arena alternativa para o discurso e debate público, uma arena que é menos dominada pelas grandes organizações midiáticas, menos sujeita ao controle do governo e mais aberta a participação ampla. • A esfera pública em rede é manifesta como um ecossistema complexo de canais de comunicação que coletivamente oferecem um ambiente que conduz a expressão política e a criação de diversas formas organizacionais. • Uma série de estudos já evidenciou que elites políticas e midiáticas continuam dominando o centro das esferas públicas em rede (Soon e Cho, 2011; Asserhofer e Maireder, 2012; Kocks, 2016 . No entanto, aceitam a abertura para ações de indivíduos não organizados.
  15. 15. COLETA DE nas mídias sociais Oquesãoredessociais?(WASSERMAN eFAUST,1994) • A diferença fundamental entre análise de redes e análise estatística é a inclusão de conceitos e de informações sobre os relacionamentos entre as unidades de análise do estudo. • Em vez de focar nos atributos das unidades individualmente, estuda as características como emergentes do processo de relacionamento social. • O conceito de redes enfatiza que cada indivíduo tem ligações com outros indivíduos; • As Redes Sociais referem-se a um conjunto de atores e as relações entre eles; • Modelar a estrutura e buscar compreender sua influência no grupo
  16. 16. COLETA DE nas mídias sociais Componentesbásicosdaanálisederedes cator claços cclusters crede Componente individual Ligações entre atores Subconjuntos identificados pela densidade Totalidade de atores e ligações da amostra
  17. 17. COLETA DE nas mídias sociais c O que são dados relacionais? Duas informações distintas Atributos dos atores Arestas de saída e chegada
  18. 18. COLETA DE nas mídias sociais Métodosdigitais–RichardRogers(2004) • A web como fonte de dados; • Virada computacional nas ciências sociais; • Rastros gerados espontaneamente • Análises de hiperlinks • Blogosferas políticas • Repercussão no Twitter • Comunidades no Facebook
  19. 19. COLETA DE nas mídias sociais Doistipos deredesnainternet(recuero,2009) • Redes associativas ou de filiação – possuem ligações mais estáveis, duradouras. Gera o efeito de filiação a um grupo. Exemplo: seguir páginas e fazer amizades; • Redes emergentes – são compostas por ligações circunstanciais, criadas a partir de ações comunicativas ad hoc. Exemplo: menções, retuítes, compartilhamentos.
  20. 20. COLETA DE nas mídias sociais c O que são APIs? Application programming interface
  21. 21. COLETA DE nas mídias sociais Políticasdecessãodedadosdafacebookgraphapi • As políticas de cessão de dados de cada plataforma são documentadas nas APIs; • APIs são tanto documentos técnicos, quanto reflexos das diretrizes empresariais de fornecimento de dados; • APIs são modificadas frequentemente, de acordo com as necessidades e interesses mercadológicos das organizações; • As documentações mostram quais requisições são possíveis (queries), em qual volume (rate limit) e com quais parâmetros.
  22. 22. Versionamento das apis do facebook COLETA DE nas mídias sociais
  23. 23. Vamos praticar? https://developers.facebook.com/tools/explorer/ COLETA DE nas mídias sociais
  24. 24. COLETA DE nas mídias sociais Comoconstruirumaquery?Orientaçãoaid • {id} + fields = {campos} • Retorno em Javascript Object Notation (JSON) • JSON é exibido na tela e convertido para tabulação • Construindo query no navegador • https://graph.facebook.com/v2.6/ + id / {requisição} ?access_token= {token de acesso} https://graph.facebook.com/v2.6/dilmarousseff/likes?access_token=EAACEdEose0cBAErGN0ycFbkfEzlhW8o0whxulUmELq3y0bZBVh0sxbNUtUvddk uF0vQmoz9zlUln9QG9oRypH75VEEI2HI39HlsN6rYA9vZCXWYvaVTkPRN585mUqS07AeCW9HHVOvo5wIiGDgfTtu8jNioAof51U4v1n5YQYZBr0tChVs QiblwFj6KOhkZD
  25. 25. Aplicativos acadêmicos
  26. 26. COLETA DE nas mídias sociais c Qual ferramenta utilizar?
  27. 27. COLETA DE nas mídias sociais Diferençasnasapisdefacebooketwitter
  28. 28. COLETA DE nas mídias sociais Técnicasdeamostragememmétodosdigitais(rieder,2012) • População – volume completo de usuários e publicações de uma determinada plataforma. Geralmente, é adquirido a partir da compra do banco de dados da empresa. Estudo utilizando dados populacionais= (Freelon et al., 2016); • Amostra aleatória: forma mais utilizada para garantir representatividade dos dados digitais. No entanto, como não se sabe a população, há uma série de problemas derivados; • Amostra por tópicos: queries por palavras-chave e hashtags. É o método mais comum no Twitter. Todavia, não funciona no Facebook desde a descontinuidade da Graph API 1.0 em 2015. • Amostrar por marcações: compilada a partir de marcadores geográficos ou linguísticos oferecidos pela API. • Amostra por atores: seleciona determinados canais para coleta de dados. Frequentemente utilizado para estudo de campanhas eleitorais, focando nos candidatos ou partidos. • Amostra por grafos: Examina relações entre uma série de agentes e faz seleções baseado no resultado. Minha dissertação e tese. • Amostra manual: utilizada para projetos qualitaitivos, geralmente são amostras de conveniência.
  29. 29. COLETA DE nas mídias sociais AdaptandoosmétodosparacoletarelacionalnoFacebook(cf.BRUNSEBURGESS,2014) • A API do Facebook não permite a coleta de dados por palavras-chave ou por hashtags. Método mais utilizado no Twitter, esta é uma das principais razões porque o Facebook é plataforma pouco utilizada em pesquisas de métodos digitais. • No entanto, o Facebook é a plataforma mais utilizada pela elite político-midiática e pelos cidadãos comuns. Não estudar o Facebook é ignorar a ferramenta de mídias sociais que concentra maior público. • Assim, surge a questão, como realizar desenhos de pesquisa especificamente para o Facebook? • A estratégia mais comum é focar em poucos atores, como as fan-pages de candidatos durante períodos eleitorais. Embora viável do ponto de vista metodológico, essa opção ignora todas as dinâmicas relacionais que acontecem em torno daqueles candidatos. • É isso que pretendo captar com meus projetos. • Para tanto, aposto no método de amostragem por grafos e bola de neve.
  30. 30. COLETA DE nas mídias sociais Facepager-TillKeylingejakobjunger • Ferramenta desenvolvida para a dissertação; • Código aberto; • Programando em Python 2.7; • Introduz boa parte dos conceitos de data mining, como query, data munging, data storage, log de processos... • É uma interface para se comunicar com a API e fazer o trabalho pesado; • Alto grau de liberdade para os usuários operarem as requisições; • Funciona com Facebook e Twitter;
  31. 31. Vamospraticar? retorno metadados Jsonkey Sistema query
  32. 32. COLETA DE nas mídias sociais Etapasdomapeamentodefan-pages(BRUNS,2007; ADAMetal.,2015) • Lista de nós-sementes; • Nós-sementes devem ser temáticos e homogêneos. • Bola de neve – crawling com 1 ou 2 graus de profundidade; • Limpeza do resultado; • Manipulação de dados – lista de nós e arestas; • Importação no Gephi; • Categorização dos atores Como montar uma lista de sementes?
  33. 33. COLETA DE nas mídias sociais Afunçãosearch Notação: /search ? type= {user, page, event, group, place} & q= {palavra+chave} & fields= search?type=page&q=dilma+rousseff&fields=id,name,link,description, category Fazer testes de acordo com as pesquisas dos alunos
  34. 34. COLETA DE nas mídias sociais Afunçãouserlike Notação: id ? fields = likes {aninhamento de parâmetros} dilmarousseff?fields=likes{name, category, id, link, about} Fazer testes de acordo com as pesquisas dos alunos
  35. 35. COLETA DE nas mídias sociais Documentaçãodasfan-pages Query <user>/likes?fields=name,username,about,talking_about_count,fan_co unt,category,link,bio,description,emails,location,new_like_count,start_inf o,website,id JSON keys name id username category about bio description fan_count talking_about_count emails.0 website link location.city location.state location.longitude location.latitude
  36. 36. COLETA DE nas mídias sociais c Prática de mapeamento de fan-pages
  37. 37. COLETA DE nas mídias sociais TRATAMENTODEDADOS Filtros para limpeza de logs; Preparação das listas de nós e arestas Arestas Funçao PROC (=PROC(B684;$A$3:$A$506;$E$3:$E$506) Criar source e target Nós – Eliminar duplicatas
  38. 38. COLETA DE nas mídias sociais Mesolevel-aDocumentaçãodaspublicações Query comments.limit(1).summary(true),likes.limit(1).summary(true),picture,sto ry,from,to,description,source,link,created_time,message,type,id,status_t ype,name,story_tags,caption, reactions.limit(1).summary(true), shares name from.name from.category from.id to.data.*.id to.data.*.name story_tags sharedposts.data posts.data story link caption message_tags message status_type type shares.count created_time updated_time reactions.summary.total_count likes.summary.total_count comments.summary.total_count shares.count
  39. 39. COLETA DE nas mídias sociais Fluxodecomuinicaçãoentreaspáginas Endpoints Links – referentes aos links compartilhados nas publicações. Só registrando quando a postagem é de tipo LINK; Caption – referente ao domónio do link; Message_tags – perfis marcados na mensagem (similar a @mention); Status_type – identificar compartilhamentos e links; Story_tags – fluxo de compartilhamento To – Perfis mencionados With_tags – Com quem estou.
  40. 40. COLETA DE nas mídias sociais c Prática de fluxos de publicações
  41. 41. COLETA DE nas mídias sociais Referências ADAM, Silke et al. Identifying and Analyzing Hyperlink Issue Networks, In: VOWE ,Gerhard, HENN, Philipp. Political Communication in the Online World (Orgs), Routledge: New York, London, p. 233-247, 2015. ALVES, Marcelo. Coleta de dados nas mídias sociais. In: SILVA, Tarcízio; STABILE, Max (orgs.), Monitoramento e Pesquisa em Mídias Sociais: metodologias, aplicações e inovações, Uva Limão, 2016. BENKLER, Yochai. Political Freedom part 2: Emergence of the networked public sphere. The Wealth of Networks: How Social Production Transforms Markets and Freedom, 2006. BRUNS, Axel. Methodologies for mapping the political blogosphere: An exploration using the IssueCrawler research tool. First Monday, v. 12, n. 5, 2007. CHADWICK, Andrew. Digital network repertoires and organizational hybridity. Political Communication, v. 24, n. 3, p. 283-301, 2007. CHADWICK, Andrew. The political information cycle in a hybrid news system: The British prime minister and the “Bullygate” affair. The International Journal of Press/Politics, v. 16, n. 1, p. 3-29, 2011. CHADWICK, Andrew. The hybrid media system: Politics and power. Oxford University Press, 2013. FREELON, Deen; MCILWAIN, Charlton D.; CLARK, Meredith D. Beyond the hashtags:# Ferguson,# Blacklivesmatter, and the online struggle for offline justice. 2016. KLINGER, Ulrike; SVENSSON, Jakob. The emergence of network media logic in political communication: A theoretical approach. New media & society, v. 17, n. 8, p. 1241-1257, 2015. RECUERO, Raquel. Redes sociais na internet. Sulina, 2009. RIEDER, Bernhard. The refraction chamber: Twitter as sphere and network. First Monday, v. 17, n. 11, 2012. ROGERS, Richard. Information politics on the Web. MIT Press, 2004. WASSERMAN, Stanley; FAUST, Katherine. Social network analysis: Methods and applications. Cambridge university press, 1994.
  42. 42. COLETA DE nas mídias sociais Obrigado! marceloalves.ufsj@hotmail.com

×