O documento discute o uso de Big Data e APIs públicas no jornalismo. Ele descreve como jornalistas podem usar dados abertos e APIs para encontrar novas histórias e como o Facebook e outros usam cientistas de dados para analisar grandes conjuntos de dados dos usuários.
2. - Big Data, Jornalismo Computacional e Data Journalism: estrutura pensamento e prática
profissional na Web de dados, 2012. Walter Teixeira Lima Junior.
- Six provocations for Big Data, 2011. Dana Boyd.
LEITURAS COMPLEMENTARES:
- Jornalismo computacional em função da “Era do Big Data”, 2010. Walter Teixeira Lima Junior.
Leitura obrigatória
3. - Em 1967, o professor Philip Meyer, da University of North Carolina,
utilizou o computador como ferramenta investigativa. Na ocasião,
ele pretendia conduzir uma pesquisa entre afro-americanos durante
os distúrbios em Detroit para o Detroit Free Press.
- A apuração de Meyer o levou a ganhar o Pulitzer, principal prêmio
do Jornalismo no mundo. “O computador não toma o lugar da
reportagem tradicional, analisando ou consolidando. É somente
outra ferramenta”, já dizia, na década de 60.
- No final dos anos 60 e início dos anos 70, o The New York Times
estruturou o primeiro banco de dados, que foi inserido nas etapas de
produção da notícia. A agência de notícias Reuters, em 1968, foi
pioneira a utilizar máquinas computacionais nas conexões da sua
rede interna para gerenciar a demanda de notícias recebidas.
Jornalismo de dados: história
4. - O que é: uso do computador e de métodos da ciência social para adquirir e analisar informações
para produzir histórias que seriam difíceis ou impossíveis de serem construídas por métodos
analógicos.
- Na prática: reportagem cruzando dados - ao invés de documentos
- Importância: O Jornalismo de Dados existe há muito tempo, mas ganhou nova estrutura com a
internet e a disponibilidade de uma quantidade infinita de dados na rede mundial de
computadores.
- Tarefa do Jornalismo: dar vida – e significado – a esses dados.
- O que é um dado? Informações organizadas.
Jornalismo de dados ou Data Journalism
5. -Como obter esses dados? Buscando nos escondidos porões da web informações apresentadas por
várias instâncias (governo, clubes...), conteúdos interessantes, mas que não são compreensíveis ao
maior interessado – nosso leitor
- Como dar um significado a um dado? Use inteligência de software (programação)
- Dados úteis estão – e podem estar – em planilhas de Excel, tabelas, banco de dados e mapas
- Por que usar: será a maior “sensação” do Jornalismo nos próximos anos. Se hoje vivemos a “era
das redes sociais”, viveremos nos próximos anos “a era dos dados”
- O Jornalismo começa assim a tratar informação como produto na rede
Por que o Jornalismo de Dados ganhou terreno na web?
6. É importante que uma redação digital tenha consciência da importância que a tecnologia infere
ao Jornalismo. Testar ferramentas, errar, errar mais uma vez e buscar o produto ideal é uma
tarefa comum em uma área de Pesquisa e Desenvolvimento.
1) Encontrar os dados
2) Analisá-los
3) Visualizá-los
4) Convertê-los em informação, em conteúdo digamos mais amigável a nossos leitores
Como encontrá-los? Duas maneiras:
1) Scraping: raspagem de dados perdidos na web. Na prática, é pegar na marra dados públicos
que não é liberado por API
2) APIs: Application Programming Interface. Se Twitter e Facebook fossem um bolo, a API seria o
fermento: desenvolvedores criam serviços atrelados ao site. Twitter gastou 48 milhões de
dólares em duas plataformas criadas por terceiros: buscas e clients de postagem.
Na prática, quais são as habilidades necessárias?
7. - O Jornalismo ganha muito com as APIs públicas
- O 1º passo da criação de perfis, conversas em plataformas já foi executado. Falta, agora, saber
reunir essas informações e apresentá-las como conteúdo na sua publicação digital
- Jornalismo + Dados escondidos nos porões da web + APIs = mensura, em tempo real, os anseios e
gostos de seus leitores
- “No mundo da tecnologia, tornar-se uma plataforma na qual os aplicativos de terceiros possam
operar é como encontrar o Santo Graal e dispor de todos os seus poderes sobrenaturais”
(KIRKPATRICK, David, 2010)
-“Queremos um ecossistema que não favoreça nossos próprios aplicativos”, já dizia Mark
Zuckerberg em 2007
- Como definir Google, Facebook, Twitter, Amazon e Apple em uma única frase?
A importância das APIs públicas
8. - Principais plataformas de redes sociais e maiores jornais do mundo – The New York Times e The
Guardian – possuem APIs públicas para que desenvolvedores criem serviços atrelados ao conteúdo
- Link: http://goo.gl/skn14
Como usar APIs para produzir Jornalismo
9. - A web permite a criação e manipulação de muitos e muitos dados disponíveis a todos os usuários
conectados. Há quem diga que chegamos a “Era do Big Data”.
- “Big Data”: conjunto de dados cujo tamanho está além da habilidade de ferramentas típicas de
banco de dados em capturar, gerenciar e analisar. A Receita Federal, a CET são bons exemplos de
“Big Data”. A cada segundo, minuto ou hora são inseridos mais e mais dados.
- A web também promoveu a popularidade do “Open Data”, repositórios aberto de dados que
podem ser manuseados e cruzados por quem se interessar. Governos britânicos e americanos já
possuem versões abertas de dados. É a “Era da Transparência”.
- ‘“Big Data” é um termo, digamos, pobre. É um termo que deve ser ressaltado não por seu
tamanho, mas pela capacidade de relacionar dados.” (BOYD, 2011).
- É um termo que deve ser estudado com cuidado, uma vez que consegue – como poucas vezes na
história – reunir ambientes acadêmicos e industriais.
“Big Data” e “Open Data”
11. -A loja de departamento Renner usa a tecnologia para monitorar o fluxo de mercadorias de suas
filiais em todo o país, o que é feito em tempo real. Com o Big Data é possível cruzar os dados de
localização dos caminhões com o nível de estoque das lojas e ainda reorganizar a mercadoria entre
as lojas com base em dados meteorológicos, por exemplo. Além de acompanhar os comentários
sobre seus produtos nas redes sociais.
- Nos dias em que as unidades localizadas em lugares frios vendiam muitos casacos, os gerentes
das lojas com desempenho abaixo da média recebiam um aviso do sistema para mudar a posição
do produto na vitrine. Em uma fase mais recente, o projeto ficou mais sofisticado.
- Ao lançar uma coleção, a Renner posta fotos de algumas peças no Facebook e verifica a aceitação
do público. Isso ajuda na hora de prever o estoque necessário de cada produto. Diariamente, os
gerentes das lojas recebem relatórios que consolidam dados como a previsão do tempo e
comentários em redes sociais
- Softwares desenvolvidos pelo WalMart conseguem, por exemplo, monitorar quando a discussão
sobre o campeonato de futebol americano se intensifica na internet em diferentes cidades dos
Estados Unidos. Sabendo disso, em questão de horas os gerentes de lojas dessas regiões passam a
expor nas vitrines produtos de determinados times.
Por que o Big Data é tão importante?
12. 1) No marketing, “Big Data” pode ser visto como pura oportunidade
2) Governos podem revelar apenas dados que considerem interessantes
3) Montanha de dados pode oferecer personalização de informações aos leitores. A
personalização, contudo, revela apenas uma face da história. Ex: aplicativo que
mostra apenas informações da Direita ou da Esquerda.
Três problemas com o “Big Data”:
13. - Estudo da Universidade de Princeton afirmou que o Facebook perderá 80% do público até
2017. Elaborada por dois estudantes de doutorado, eles estabeleceram uma analogia entre a
curva de adoção, ascensão e queda das redes sociais com as doenças infecciosas, e baseia seus
prognósticos em tendências extraídas de "dados públicos de buscas realizadas no Google".
- Aqui cabem algumas questões:
1) Você acessa o Facebook digitando a palavra no Google?
2) E seus apps móveis? Preciso digitar no Google para visitá-lo?
3) 945 milhões de usuários dos 1,2 bilhão de pessoas conectadas à rede acessam o
serviço por celular.
Quando cruzar dados não é uma solução
14. - Em resposta à universidade, a rede social afirmou que Princeton tem menos cliques no botão
"curtir" do Facebook do que Harvard e Yale. Também afirmou que diminuiu a quantidade de
suas publicações desde o ano 2000 e constatou que o número de buscas sobre Princeton no
Google Scholar, que reúne artigos acadêmicos, também caiu.
- Usando "o mesmo princípio" do relatório de Princeton, a rede estabeleceu uma correlação
entre as inscrições de estudantes em uma instituição e a quantidade de buscas sobre ela no
Google. "Esta tendência sugere que Princeton terá só a metade de suas matrículas atuais em
2018 e, em 2021, não terá alunos", afirmou o "relatório" do Facebook.
- Enquanto estamos preocupados com a Universidade de Princeton, nós estamos ainda mais
preocupados com o destino do planeta. As pesquisas no Google do termo 'ar' também caíram
de forma contínua e nossas projeções mostram que para o ano de 2060 não haverá mais ar"
Quando cruzar dados não é uma solução
15. - O Facebook conta com uma equipe multidisciplinar de 200 profissionais, que esmiuçam a
montanha de dados publicada diariamente por usuários. São especialistas dedicados a
separar o joio do trigo, analisando problemas, tendências e identificando recursos usados
com frequência por nossos usuários. Eles são responsáveis, por exemplo, de fornecer novas
funcionalidades e testarem, em uma pequena fatia, se ela é muito usada.
- A suposição e a dedução dão lugar a exatidão baseada em dados de ações reais.
Uma solução: Cientista de Dados
16. - Durante 20 meses, a equipe de dados do até então candidato à presidência dos Estados
Unidos, Barack Obama, produziu mais de 500 testes A/B em seu site oficial para saber como
seu eleitor absorvia informações.
- Fonte de dados: redes sociais, ligações – e principalmente e-mail
- Resultado: aumento de 49% no valor das doações para campanha
Uma solução: Cientista de Dados