- Mais qu’est-ce vraiment que le Big Data? – Simon Boucher, Fujitsu Canada
- Le Big Data et les réseaux Sociaux – Claude G. Théorêt, Nexalogy Environnics
- L’analyse des réseaux Sociaux – Exemples – Josée Plamondon, consultante
Simon BoucherEnterprise Information and Digital Marketing à Domtar
Qu'est ce que le big data - Présentation AIMM 30 octobre
1. Le Big Data
et les réseaux sociaux
Présentation à AIIM
Fujitsu Canada
Simon Boucher
30 octobre 2013
2. 1
Agenda
Mais qu’est-ce vraiment que le Big Data? – Simon Boucher, Fujitsu Canada
Le Big Data et les réseaux Sociaux – Claude G. Théorêt, Nexalogy Environnics
L’analyse des réseaux Sociaux – Exemples – Josée Plamondon, consultante
3. 2
Mais qu’est-ce vraiment que le Big Data?
En 2010, le terme «Big Data», était pratiquement inconnu, mais à la mi-
2011, il est apparu comme la dernière tendance, avec toutes les
l'exagérations habituelles, comme ce fut le cas pour le « Cloud Computing»
avant lui.
Le terme a aujourd'hui été adopté par tous les vendeurs de produits, les
fournisseurs de servivcs d’externalisation et d’infonuagique désireux de
promouvoir leurs offres.
McNaught Cameron
Vice-président et directeur des solutions stratégiques
international Business
Fujitsu
4. 3
Mais qu’est-ce vraiment que le Big Data?
En bref, le Big Data ajoute une valeur commerciale à toute une gamme de
de nouvelles sources de données comprenant entre autres, les données
des médias sociaux, les données de localisation générées par les GPS, les
smartphones et autres appareils mobiles, ainsi que l'information publique
disponible en ligne (open data), les données provenant des capteurs
installés dans les voitures, les bâtiments, dans des objets et, beaucoup
plus encore.
Traduit deL: Fujitsu White Book of Big Data
5. 4
Mais qu’est-ce vraiment que le Big Data?
http://thumbnails.visually.netdna-cdn.com/big-data-infographic_504f4d2f5bd2f.jpg
6. 5
Mais qu’est-ce vraiment que le Big Data?
http://thumbnails.visually.netdna-cdn.com/big-data-infographic_504f4d2f5bd2f.jpg
7. 6
Définitions du Big Data: le modèle 3V
De nombreux analystes utilisent le modèle de 3V pour définir ce qu’est le
Big Data. Les trois V signifient le volume, la vélocité (vitesse) et la variété.
http://thefinancialbrand.com/wp-content/uploads/2012/11/3_vs_of_big_data.jpg
8. 7
Définitions du Big Data: le modèle 4V
http://cdn.dashburst.com/wp-content/uploads/2013/07/the-four-v-s-of-big-data.jpg
Rapidement est apparu un quatrième V
9. 8
Définitions du Big Data: le modèle 4V
Volume réfère au fait
que le Big Data
consiste à analyser
comparativement
d'énormes quantités
d'informations,
généralement à partir
de dizaines de
téraoctets.
http://cdn.dashburst.com/wp-content/uploads/2013/07/the-four-v-s-of-big-data.jpg
10. 9
Définitions du Big Data: le modèle 4V
Vélocité - Reflète la
vitesse pure à
laquelle ces données
sont générées et
changes rapidement.
Par exemple, les
données associées à
un hashtag particulier
sur Twitter changent
souvent et à une
grande vitesse.
http://cdn.dashburst.com/wp-content/uploads/2013/07/the-four-v-s-of-big-data.jpg
11. 10
Définitions du Big Data: le modèle 4V
Variété - Le Big Data peut
provenir de plusieurs
sources différentes, dans
différents formats et
structures. Par exemple,
les sites de médias
sociaux génèrent un flux
de données en constante
évolution, sous forme de
texte, d’informations
géographiques, d’images,
de vidéos et de musique.
http://cdn.dashburst.com/wp-content/uploads/2013/07/the-four-v-s-of-big-data.jpg
12. 11
Définitions du Big Data: le modèle 4V
http://cdn.dashburst.com/wp-content/uploads/2013/07/the-four-v-s-of-big-data.jpg
Véracité – La dimension
qui pause la question de
la crédibilité de
l’information
13. 12
Définitions du Big Data: le 5ième V
Valeur: le cinquième V
Bien que les modèles 3V et 4V sont des moyens utiles de définir le Big
Data, nous devons en ajouter un cinquième V vital – la Valeur. Il n'y a pas
de raisons pour les organisations de mettre en œuvre une solution de Big
Data, à moins qu'ils puissent identifier comment le Big Data va leur donner
une valeur ajoutée. Cette volonté de maximiser la valeur du Big Data est un
impératif clé.
Traduit deL: Fujitsu White Book of Big Data
En résumé, le Big Data donne aux
organisations la possibilité d'exploiter les
données afin d'en extraire une valeur ajoutée
à travers:
Une prise de décision plus éclairée
Voir les données comme des actifs qui
peuvent être échangés et vendus.
❶
❷ ➌
➍ Véracité ➎ Valeur
16. 15
Big Data: Landscape 2.0
http://www.ongridventures.com/wp-content/uploads/2012/10/Big-Data-Landscape.jpg
17. 16
Éléments d’une solution de Big Data
La boîte rouge
représente la solution
elle-même.
À l'extérieur sur le côté
gauche, sont les
diverses sources de
données qui alimentent
le système par exemple:
les données ouvertes
(par exemple,
données publiques ou
fournis par le
gouvernement, les
sites commerciaux de
données),
les médias sociaux
(par exemple,
données de Twitter) ou
interne (par exemple,
les transactions en
ligne ou les systèmes
d'analyse).
18. 17
Big Data et réseaux sociaux
http://www.ongridventures.com/wp-content/uploads/2012/10/Big-Data-Landscape.jpg
Le Big Data et
l’analyse des médias
(réseaux) sociaux
(par exemple,
Twitter, Facebook,
Google Blogs,
Yammer, etc.
19. 18
Big Data et réseaux sociaux
Si nous pouvions visualiser le Big Data
Analogy taken from - New York City's greenhouse gas emissions
Un jour!
20. 19
Big Data et réseaux sociaux
Si nous pouvions visualiser le Big Data
Analogy taken from - New York City's greenhouse gas emissions
Une année!
22. 21
Agenda
Mais qu’est-ce vraiment que le Big Data? – Simon Boucher, Fujitsu Canada
Le Big Data et les réseaux Sociaux – Claude G. Théorêt, Nexalogy Environnics
L’analyse des réseaux Sociaux – Exemples – Josée Plamondon, consultante
Notes de l'éditeur
0
Fast Data. Recognizing that traditional methods for moving, processing, and querying data were not sufficient, the Big Data industry has created an entirely new set of techniques -- and adapting some of those that existed -- so that organizations can actually process the full universe of information that they possess in enough time to actually get inside the windows of key business processes and critical decision trees. Thus, Fast Data techniques provides the ability to 'see' all (or enough, anyway) of what you know in a short enough time to actually do something with what you've learned. Fast Data techniques, at least so far, have grown exponentially faster at approximately the rate of Moore' Law, just barely keeping up with Big Data growth volume in my research.
Big Analytics. This is where the qualitative differences between traditional business databases and Big Data become more apparent. Where Fast Data is about new techniques to process and transform raw information considerably faster than ever before, Big Analytics is about turning information into knowledge using a combination of existing and new approaches. As you can see from the moving parts visual above, some of the classic players in analytics are in use here including MATLAB, SAS, and R. But some of the most interesting aspects of Big Data can be found in relatively new entrants such as Apache Hive and Mahout, the latter which brings to bear automated machine learning to finding hidden trends and otherwise unthought of or unconsidered ideas. In fact, an entire industry is growing up in smart information management systems that will "not rely on users dreaming up smart questions to ask computers; rather, they will automatically determine if new observations reveal something of sufficient interest to warrant some reaction, e.g., sending an automatic notification to a user or a system about an opportunity or risk."
Deep Insight. The powerful yet unfocused tools of Big Analytics are not sufficient to reap the rewards of Big Data. That requires taking the sum of the information at hand, applying analytic processes to it, and finally generating new knowledge and insights using a a specific, situated method. Insight must be in the domain of the business to be useful, and this part of Big Data is where the technology is connected to ground truth in a feedback loop. That is, the tools of Big Analytics are just tools by themselves. It's not until they are directed at deriving a particular type of result that they are actually useful in a business context. Insights must also be connected to specific objectives (examples depicted in the moving parts visual above) in order to have high levels of impact