SlideShare une entreprise Scribd logo
1  sur  15
Hugo Santos
GERÊNCIA DE DADOS DA WEB
1o. SEMESTRE DE 2014
Twitter mood predicts the stock market
Johan Bollen Huina Mao Xiao-Jun Zeng
Journal of Computational Science
Volume 2, Issue 1, March 2011, Pages 1–8
Introdução
• Economia comportamental e a psicologia econômica nos dizem que as
emoções podem afetar o comportamento de individuos na tomada de
decisão.
• Isso se aplica às sociedades como um todo?
• Pode o estado de humor coletivo de uma sociedade afetar sua tomada de
decisão coletiva?
• Ou ainda, o humor coletivo pode estar relacionado ou ser preditor de
fatores econômicos?
Resumo
• Pesquisa se os estados de humor coletivos derivados da análise em grande
escala dos feeds do Twitter estão correlacionados com o valor do Dow
Jones Industrial Average (DJIA) ao longo do tempo.
• Usando duas ferramentas como base:
• OpinionFinder: avalia em positivo e negativo;
• Google-Profile of Mood States (GPOMS): avalia em 6 dimensões –
Calm, Alert, Sure, Vital, Kind e Happy.
Introdução
• Segundo a Efficient Market Hypothesis (EMH) os preços do mercado de
ações são, em grande parte, impulsionado por novas informações, ou seja,
notícias, em vez de os preços atuais e passados.
• Pesquisas recentes têm demontrado que redes sociais online podem ser usadas
para prever indicadores econômicos e sociais (venda de livros, venda de filmes
etc).
• Além disso, pesquisas na área de psicologia demonstram como emoções, além de
informação, representam um importante papel na tomada de decisão humana.
Dados e Método
• Dados:
• 9,853,498 tweets postados por aproximadamente 2.7M usuários
• entre 28 de fevereiro de 2008 a 19 de dezembro 2008.
• Stop-words removidas
• Agrupamento por dia (tweets postados no mesmo dia)
• Somente foram considerados tweets que contém expressão de humor:
• “I am feeling”, “I don’t feel”, “I am”, “makes me”
• Ferramentas:
• OpinionFinder, analisa o conteúdo do texto de tweets enviados em um
determinado dia para prestar um positivo vs série histórica diária negativa de
humor do público. a segunda;
• GPOMS (Google-Profile of Mood States), da mesma forma analisa o conteúdo
de texto de tweets para gerar uma série temporal diária de seis dimensões de
humor.
Dados e Método
• 1a Etapa:
• OpinionFinder e GPOMS medem humor nos tweets de forma que são
geradas 7 series temporais
• Extração do Yahoo! Finance da série temporal que representa os
fechamentos do DJIA
• 2a Etapa:
• Granger casuality analysis entre as séries para avaliar a hipótese de
predição.
• 3a Etapa:
• Organizing Fuzzy Neural Network, testar a hipótese de que a acurácia do
modelo de predição pode ser melhorada pela combinação das medidas
(Não linear)
Dados e Método
Dados e Método
1. Geração das series temporais de humor: OpinionFinder e GPOMS
2. Validação das séries através de eventos culturais de grande escala:
• Eleições
• Thanksgiving
3. Granger Casuality Analysis vs DJIA Prices
4. Modelo não-linear baseado em emoção para a predição de ativos.
Séries Temporais e Validação com
eventos socioculturais
Granger Casuality Analysis vs DJIA Prices
Calm apresentou proximidade!
Granger Casuality Analysis vs DJIA Prices
Calm apresentou proximidade!
Notícias não são previstas pelo humor do público e
apresentam grande impacto.
Modelo não-linear baseado em emoção
para a predição de ativos
• Granger casuality é baseado em regressão linear. Provavelmente a relação
entre as emoções e os valores dos ativos é não linear.
• SOFNN (Self-organizing Fuzzy Neural Network) tem sido usado para
decodificar séries temporais que descrevem características do mercado de
ações.
• Um vez que Calm foi a mais aderente, é possível que a combinação
com outras dimensões forneçam um melhor resultado?
Modelo não-linear baseado em emoção
para a predição de ativos
Conclusões
• Alterações de humor demonstraram refletir no indice DJIA depois de 3 a 4 dias.
• A correlação não foi observada para as medições da OpinionFinder, mas somente
para a dimensão “Calm” do GPOMS.
• Calmness é mais relevante que Positive (OF)
• Os resultados não se limitam a localizações geográficas, mas foram
predominantemente realizadas em idioma Inglês e com usuários do EUA.
• Os resultados são “um indicador forte de uma correlação preditiva”, mas não
representa uma mecanismo de casualidade que conecta Emoções com o índice
DJIA (Granger ?).
• DISCUSSÃO
• A latência de dias é suficiente para DJIA não determinar o Twitter?
• 2008 foi um ano atípico: grandes ganhos e crise (de credibilidade).
• A calma não seria o mais expressivo?
• 15 de setembro de 2008 VERSUS período de análise.
• Não valeria uma menção?
Dúvidas

Contenu connexe

En vedette

Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 

En vedette (20)

Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 

Seminário: Twitter mood predicts the stock market

  • 1. Hugo Santos GERÊNCIA DE DADOS DA WEB 1o. SEMESTRE DE 2014 Twitter mood predicts the stock market Johan Bollen Huina Mao Xiao-Jun Zeng Journal of Computational Science Volume 2, Issue 1, March 2011, Pages 1–8
  • 2. Introdução • Economia comportamental e a psicologia econômica nos dizem que as emoções podem afetar o comportamento de individuos na tomada de decisão. • Isso se aplica às sociedades como um todo? • Pode o estado de humor coletivo de uma sociedade afetar sua tomada de decisão coletiva? • Ou ainda, o humor coletivo pode estar relacionado ou ser preditor de fatores econômicos?
  • 3. Resumo • Pesquisa se os estados de humor coletivos derivados da análise em grande escala dos feeds do Twitter estão correlacionados com o valor do Dow Jones Industrial Average (DJIA) ao longo do tempo. • Usando duas ferramentas como base: • OpinionFinder: avalia em positivo e negativo; • Google-Profile of Mood States (GPOMS): avalia em 6 dimensões – Calm, Alert, Sure, Vital, Kind e Happy.
  • 4. Introdução • Segundo a Efficient Market Hypothesis (EMH) os preços do mercado de ações são, em grande parte, impulsionado por novas informações, ou seja, notícias, em vez de os preços atuais e passados. • Pesquisas recentes têm demontrado que redes sociais online podem ser usadas para prever indicadores econômicos e sociais (venda de livros, venda de filmes etc). • Além disso, pesquisas na área de psicologia demonstram como emoções, além de informação, representam um importante papel na tomada de decisão humana.
  • 5. Dados e Método • Dados: • 9,853,498 tweets postados por aproximadamente 2.7M usuários • entre 28 de fevereiro de 2008 a 19 de dezembro 2008. • Stop-words removidas • Agrupamento por dia (tweets postados no mesmo dia) • Somente foram considerados tweets que contém expressão de humor: • “I am feeling”, “I don’t feel”, “I am”, “makes me” • Ferramentas: • OpinionFinder, analisa o conteúdo do texto de tweets enviados em um determinado dia para prestar um positivo vs série histórica diária negativa de humor do público. a segunda; • GPOMS (Google-Profile of Mood States), da mesma forma analisa o conteúdo de texto de tweets para gerar uma série temporal diária de seis dimensões de humor.
  • 6. Dados e Método • 1a Etapa: • OpinionFinder e GPOMS medem humor nos tweets de forma que são geradas 7 series temporais • Extração do Yahoo! Finance da série temporal que representa os fechamentos do DJIA • 2a Etapa: • Granger casuality analysis entre as séries para avaliar a hipótese de predição. • 3a Etapa: • Organizing Fuzzy Neural Network, testar a hipótese de que a acurácia do modelo de predição pode ser melhorada pela combinação das medidas (Não linear)
  • 8. Dados e Método 1. Geração das series temporais de humor: OpinionFinder e GPOMS 2. Validação das séries através de eventos culturais de grande escala: • Eleições • Thanksgiving 3. Granger Casuality Analysis vs DJIA Prices 4. Modelo não-linear baseado em emoção para a predição de ativos.
  • 9. Séries Temporais e Validação com eventos socioculturais
  • 10. Granger Casuality Analysis vs DJIA Prices Calm apresentou proximidade!
  • 11. Granger Casuality Analysis vs DJIA Prices Calm apresentou proximidade! Notícias não são previstas pelo humor do público e apresentam grande impacto.
  • 12. Modelo não-linear baseado em emoção para a predição de ativos • Granger casuality é baseado em regressão linear. Provavelmente a relação entre as emoções e os valores dos ativos é não linear. • SOFNN (Self-organizing Fuzzy Neural Network) tem sido usado para decodificar séries temporais que descrevem características do mercado de ações. • Um vez que Calm foi a mais aderente, é possível que a combinação com outras dimensões forneçam um melhor resultado?
  • 13. Modelo não-linear baseado em emoção para a predição de ativos
  • 14. Conclusões • Alterações de humor demonstraram refletir no indice DJIA depois de 3 a 4 dias. • A correlação não foi observada para as medições da OpinionFinder, mas somente para a dimensão “Calm” do GPOMS. • Calmness é mais relevante que Positive (OF) • Os resultados não se limitam a localizações geográficas, mas foram predominantemente realizadas em idioma Inglês e com usuários do EUA. • Os resultados são “um indicador forte de uma correlação preditiva”, mas não representa uma mecanismo de casualidade que conecta Emoções com o índice DJIA (Granger ?). • DISCUSSÃO • A latência de dias é suficiente para DJIA não determinar o Twitter? • 2008 foi um ano atípico: grandes ganhos e crise (de credibilidade). • A calma não seria o mais expressivo? • 15 de setembro de 2008 VERSUS período de análise. • Não valeria uma menção?