4. D’après l’office québécois le terme désigne
«L’ensemble des données produites en temps réel et en
continu, provenant de sources hétérogènes de différents
formats , dont la croissance est faramineuse.»
4
Chaque jour, nous générons 2,5 trillions d’octets de données entre autre même géographiques. A tel point que 90% des données dans le monde ont été créées au cours des deux dernières années seulement. Ces données proviennent de partout : de capteurs utilisés pour collecter les informations, de messages sur les sites sociaux, d'images numériques et de vidéos publiées en ligne, de signaux GPS de téléphones mobiles, pour ne citer que quelques sources. D’où est né le concept de Big Data et VGI.
Les Big Data (grosses données ou Data-masse) est une expression anglophone utilisée pour désigner des ensembles de données qui deviennent tellement volumineuse qu'ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données ou de gestion de l'information.
Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis.
Le phénomène big data est considéré comme l'un des grands défis informatiques de la décennie 2010-2020.
Volume : le volume de donnée est en pleine expansion cela du au fait que le volume actuelle de données est de 4,5 zéta-octets (2013) qui pourra atteindre les 40 zéta-octets en 2020.
Variété : Le volume des Big Data met les data centers devant un réel défi : la variété des données. Il ne s'agit pas de données relationnelles traditionnelles, ces données sont brutes, semi-structurées voire non structurées Ce qui les rend difficilement utilisables avec les outils traditionnels.
Vélocité : La vélocité représente à la fois la fréquence à laquelle les données sont générées, capturées et partagées. Les données arrivent par flux et doivent être analysées en temps réel pour répondre aux besoins des processus chrono-sensibles. Les systèmes doivent autrement dit effectuer du Data Stream Mining.
Visualisation : Face à ce volume de données, sa variété et sa vélocité, il est primordial de se doter de moyens de navigation au sein de cette masse, pour en tirer rapidement et simplement de l'information.
Valeur : Dans le but, non seulement de trouver ce qu‟on cherche, mais aussi de bénéficier d'un atout intéressant à travers de la diversité des données non structurées couplées aux données structurées de l'entreprise.
VGI (Volunteered geographic information) : c’est une gigantesque masse de données géographiques crées par plusieurs personnes géographiquement dispersées dans le monde en utilisant différentes technologies spatiales (Ex :geoweb applications, GPS…) de façon volontaires sans se baser sur des formalismes de structuration ou de collection de données géographiques.
De cette façon plusieurs sources de données géographiques sont impliquées (proviennent) en même temps(en temps réel) ce qui rend la gestion et l’analyse de ces informations pénibles et dure en temps réel car on ne respecte pas les formes usuelles et traditionnelles de l’information géographiques.
Les utilisateurs de données géographiques se sont rendu compte que les logiciels SIG traditionnels ainsi que les SGBD spatial classiques ne sont plus efficaces devant cette masse de données non structurées.
Ce phénomène de VGI fait partie d’une profonde transformation de données, informations et connaissances géographiques et de la façon de sa production ainsi sa circulation donc VGI est associé au domaine de BIG-DATA.
Domaine d’industrie et de commerce: analyser et visualiser les clients, les groupes cibles et les régions de vente pour leurs biens et services.
Organismes de cartographie : les utilisateurs sont considérés comme des bénévoles qui aident les organismes de cartographie pour recueillir l'information géographique.
WikiMapia est un site commercial cartographiant la Terre au moyen des vues satellitaires de Google Maps en permettant à tout internaute de les annoter avec un système de wiki
OpenStreetMap est un projet qui a pour but de constituer une base de données cartographiques libre du monde (permettant par exemple de créer des cartes sous licence libre), en utilisant le système GPS et d'autres données libres.
WikiMapia est un site commercial cartographiant la Terre au moyen des vues satellitaires de Google Maps en permettant à tout internaute de les annoter avec un système de wiki
OpenStreetMap est un projet qui a pour but de constituer une base de données cartographiques libre du monde (permettant par exemple de créer des cartes sous licence libre), en utilisant le système GPS et d'autres données libres.
Google Map Maker est un service gratuit de Google créé en juin 20084 afin d'augmenter les performances de Google Maps. Il permet à n'importe quel internaute, après création d'un compte, de modifier les cartes de Google Maps.
FlickR vient de lancer un système de localisation géographiques des photos. Ainsi, si vous avez un compte FlickR, vous pouvez désormais “créer” un plan très prècis du lieu où vous avez pris vos photos. Par exemple, le mien est ICI . Je trouve l’idée très intéressante parce que ça nous permet de savoir où a été prise la prise la photo… Alors comment faire si on est déjà chez FlickR ? C’est très simple, vous allez dans l’onglet “organizR”, s’ouvre alors la fameuse fenêtre qui vous permet de tout organiser. A ce moment-là , il y a un quatirème onglet, qui n’existait pas auparavant. Cet onglet est celui qui va vous permettre de localiser géographiquement vos photos. C’est l’onglet “map”. Ensuite, vous faîtes comme d’hab. Vous prenez vos photos et vous les déposez sur le plan, où vous le souhaitez. C’est tout simple, mais je trouve l’idée assz sympa !!!
Modélisation de données
Sachant que la fouille de données géographiques a des caractéristiques fondamentalement différentes et les technologies actuelles ne permettent pas de les exploiter. Alors il faudra des modélisations de données spatiales et des langages de requêtes permettant :
une représentation des données spatiales en accord avec les besoins de plusieurs disciplines scientifiques;
de représenter la provenance et la qualité de ces données ;
de représenter des informations contextuelles sur la donnée spatiales pour qu’elle devient plus significative ;
Gestion de données spatiales
Le besoin de gérer des données extrêmement volumineuses est flagrant et les technologies d’aujourd’hui ne permettent pas de le faire. Donc il serait judicieux que les SGBD spatiales puissent donner des réponses rapides et peu coûteuses qui permettraient de guider l’utilisateur dans sa recherche.
Outils de gestion des données géographiques
Les outils utilisés à l’heure actuelle (SIG) ne sont pas en adéquation avec les volumes de données spatiales engendrés dans l’exploration de VGI. Il est nécessaire de concevoir des instruments permettant de mieux visualiser, analyser, et cataloguer les ensembles de données spatiales afin de permettre une optique de recherche guidée par la donnée.