(Seminário da Disciplina de GDW - DCC/UFMG à respeito do Artigo: http://arxiv.org/pdf/1010.3003&)
Abstract—Behavioral economics tells us that emotions can
profoundly affect individual behavior and decision-making. Does
this also apply to societies at large, i.e. can societies experience
mood states that affect their collective decision making? By
extension is the public mood correlated or even predictive of
economic indicators? Here we investigate whether measurements
of collective mood states derived from large-scale Twitter feeds
are correlated to the value of the Dow Jones Industrial Average
(DJIA) over time. We analyze the text content of daily Twitter
feeds by two mood tracking tools, namely OpinionFinder that
measures positive vs. negative mood and Google-Profile of Mood
States (GPOMS) that measures mood in terms of 6 dimensions
(Calm, Alert, Sure, Vital, Kind, and Happy). We cross-validate
the resulting mood time series by comparing their ability to
detect the public’s response to the presidential election and
Thanksgiving day in 2008. A Granger causality analysis and
a Self-Organizing Fuzzy Neural Network are then used to
investigate the hypothesis that public mood states, as measured by
the OpinionFinder and GPOMS mood time series, are predictive
of changes in DJIA closing values. Our results indicate that the
accuracy of DJIA predictions can be significantly improved by
the inclusion of specific public mood dimensions but not others.
We find an accuracy of 87.6% in predicting the daily up and
down changes in the closing values of the DJIA and a reduction
of the Mean Average Percentage Error by more than 6%.
1. Hugo Santos
GERÊNCIA DE DADOS DA WEB
1o. SEMESTRE DE 2014
Twitter mood predicts the stock market
Johan Bollen Huina Mao Xiao-Jun Zeng
Journal of Computational Science
Volume 2, Issue 1, March 2011, Pages 1–8
2. Introdução
• Economia comportamental e a psicologia econômica nos dizem que as
emoções podem afetar o comportamento de individuos na tomada de
decisão.
• Isso se aplica às sociedades como um todo?
• Pode o estado de humor coletivo de uma sociedade afetar sua tomada de
decisão coletiva?
• Ou ainda, o humor coletivo pode estar relacionado ou ser preditor de
fatores econômicos?
3. Resumo
• Pesquisa se os estados de humor coletivos derivados da análise em grande
escala dos feeds do Twitter estão correlacionados com o valor do Dow
Jones Industrial Average (DJIA) ao longo do tempo.
• Usando duas ferramentas como base:
• OpinionFinder: avalia em positivo e negativo;
• Google-Profile of Mood States (GPOMS): avalia em 6 dimensões –
Calm, Alert, Sure, Vital, Kind e Happy.
4. Introdução
• Segundo a Efficient Market Hypothesis (EMH) os preços do mercado de
ações são, em grande parte, impulsionado por novas informações, ou seja,
notícias, em vez de os preços atuais e passados.
• Pesquisas recentes têm demontrado que redes sociais online podem ser usadas
para prever indicadores econômicos e sociais (venda de livros, venda de filmes
etc).
• Além disso, pesquisas na área de psicologia demonstram como emoções, além de
informação, representam um importante papel na tomada de decisão humana.
5. Dados e Método
• Dados:
• 9,853,498 tweets postados por aproximadamente 2.7M usuários
• entre 28 de fevereiro de 2008 a 19 de dezembro 2008.
• Stop-words removidas
• Agrupamento por dia (tweets postados no mesmo dia)
• Somente foram considerados tweets que contém expressão de humor:
• “I am feeling”, “I don’t feel”, “I am”, “makes me”
• Ferramentas:
• OpinionFinder, analisa o conteúdo do texto de tweets enviados em um
determinado dia para prestar um positivo vs série histórica diária negativa de
humor do público. a segunda;
• GPOMS (Google-Profile of Mood States), da mesma forma analisa o conteúdo
de texto de tweets para gerar uma série temporal diária de seis dimensões de
humor.
6. Dados e Método
• 1a Etapa:
• OpinionFinder e GPOMS medem humor nos tweets de forma que são
geradas 7 series temporais
• Extração do Yahoo! Finance da série temporal que representa os
fechamentos do DJIA
• 2a Etapa:
• Granger casuality analysis entre as séries para avaliar a hipótese de
predição.
• 3a Etapa:
• Organizing Fuzzy Neural Network, testar a hipótese de que a acurácia do
modelo de predição pode ser melhorada pela combinação das medidas
(Não linear)
8. Dados e Método
1. Geração das series temporais de humor: OpinionFinder e GPOMS
2. Validação das séries através de eventos culturais de grande escala:
• Eleições
• Thanksgiving
3. Granger Casuality Analysis vs DJIA Prices
4. Modelo não-linear baseado em emoção para a predição de ativos.
11. Granger Casuality Analysis vs DJIA Prices
Calm apresentou proximidade!
Notícias não são previstas pelo humor do público e
apresentam grande impacto.
12. Modelo não-linear baseado em emoção
para a predição de ativos
• Granger casuality é baseado em regressão linear. Provavelmente a relação
entre as emoções e os valores dos ativos é não linear.
• SOFNN (Self-organizing Fuzzy Neural Network) tem sido usado para
decodificar séries temporais que descrevem características do mercado de
ações.
• Um vez que Calm foi a mais aderente, é possível que a combinação
com outras dimensões forneçam um melhor resultado?
14. Conclusões
• Alterações de humor demonstraram refletir no indice DJIA depois de 3 a 4 dias.
• A correlação não foi observada para as medições da OpinionFinder, mas somente
para a dimensão “Calm” do GPOMS.
• Calmness é mais relevante que Positive (OF)
• Os resultados não se limitam a localizações geográficas, mas foram
predominantemente realizadas em idioma Inglês e com usuários do EUA.
• Os resultados são “um indicador forte de uma correlação preditiva”, mas não
representa uma mecanismo de casualidade que conecta Emoções com o índice
DJIA (Granger ?).
• DISCUSSÃO
• A latência de dias é suficiente para DJIA não determinar o Twitter?
• 2008 foi um ano atípico: grandes ganhos e crise (de credibilidade).
• A calma não seria o mais expressivo?
• 15 de setembro de 2008 VERSUS período de análise.
• Não valeria uma menção?