2. PLAN
Introduction
Base de données et cadre analytique de l’IoT
Cycle de vie des données volumineuses pour le réseau IoT
Cadre de gestion des données IoT mappé sur le cycle de
vie des données volumineuses
IDMS IIoT et cycle de vie des données volumineuses
Règles ACID des DDBMS
Différences entre la base de données distribuée et le SGBD
Théorème de tolérance CAP appliqué auxDDB
Analyse des données IoTet décisions d'analyse
Justification du nettoyage des données provenant des IoT
Méthodes de nettoyage des données pour les BD
Visualisation des données et méthodes variées
Conclusion
3. Introduction
Avec la prolifération des appareils connectés à l'IoT, une quantité
massive de données est générée en continu, nécessitant une
organisation,un stockage et une analyse efficaces pour en tirer des
informations significatives. Ce chapitre explore le besoin d'un cadre
de gestion des bases de données adapté à l'IoT,mettant en avant la
nécessité d'une infrastructure réseau dynamique et distribuée pour
gérer les données IoT de manière efficace. La connectivité M2M
(Machine-to-Machine), la détection de l'environnement et le contrôle
des appareils sont des aspects clés abordés dans ce contexte.En
outre, le chapitre souligne l'importance d'une plateforme IoT offrant
des ressources, des services et des applications évolutifs et partagés
pour répondre aux besoins croissants de l'IoT.
4. Dans le contexte de l'Internet des objets (IoT), les bases de données jouent un rôle
essentiel en permettant le stockage,la gestion et l'analyse des données massives
générées par les appareils connectés. Ces données sont cruciales pour prendre
des décisions éclairées, optimiser les processus et améliorer les performances des
systèmes IoT. Un cadre analytique bien défini est nécessaire pour interpréter ces
données et en tirer des insights significatifs, permettant ainsi aux organisations de
maximiser la valeur de leurs investissements dans l'IoT.
Base de données et cadre analytique de l’IoT
Company Overview
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nullam
laoreet risus fringilla, egestas elit a, consequat augue. Phasellus
sollicitudin felis mi, quis egestas ex ornare sed.
5. Le cadre des bases de données et de
l'analytique IoT
La croissance exponentielle des appareils IoT engendre un flux continu
de données sur Internet, nécessitant une gestion adéquate. La
complexité des systèmes IoT exige un cadre de gestion spécifique,
flexible et distribué. Ce cadre permet l'identification autonome des
entités, la connectivité M 2 M et la détection de l'environnement,
facilitant ainsi le traitement et le stockage centralisé des données.
Introduction au cadre des bases de données et de l'analytique IoT
6. Le cadre des bases de données et de
l'analytique IoT
Cadre de gestion des données IoT
Le cadre de gestion des données IoT inclut les architectures, protocoles de
communication et procédures de distribution des données. Il agit comme une
interface entre les appareils IoT et les applications d'analyse, garantissant la
disponibilité des données tout en respectant la confidentialité. Les données
massives IoT sont collectées et traitées vers une base de données centrale,
assurant les propriétés ACID. Le flux de données IoT est géré à travers des
couches de communication, permettant un accès transparent aux
référentiels de données.
7. Cycle de vie des données volumineuses pour le réseau IoT
Le cycle de vie des données au sein d'un système IoT, tel qu'illustré
dans la figure, débute par la production ou la capture des données,
puis passe par des étapes telles que l'agrégation, la livraison, le
filtrage facultatif et le prétraitement, pour enfin aboutir au
stockage et à l'archivage. Les étapes d'interrogation et d'analyse
marquent les points de terminaison où les données sont initiées (par
une requête) et consommées.
Le cycle de vie des données volumineuses pour
le réseau IoT
8. Customer
Satisfaction
Cycle de vie des données volumineuses pour le réseau IoT
Le cycle de vie des données volumineuses pour
le réseau IoT
9. Détails du cycle de vie des données IoT
La génération de données dans un système IoT provient de divers appareils ou
objets, tels que les appareils passifs qui ne sont pas connectés à une source
d'alimentation, les appareils actifs qui transmettent activement des données
environnementales, les événements déclencheurs et les données en temps réel
périodiquement générées par les capteurs. L'acquisition de données implique
la réception et le stockage des données générées par les appareils ou reçues
via une communication M2M, souvent initiée par la configuration des
microcontrôleurs ou des logiciels d'application.
Le cycle de vie des données volumineuses pour
le réseau IoT
10. le cadre de gestion des données IoT tel que cartographié sur le
cycle de vie des données volumineuses
Cadre de gestion des données IoT sur le cycle de vie des
données volumineuses
Le réseau IoT requiert un cadre de données pour faciliter la communication à
partir d'une variété d'appareils et de réseaux, permettant ainsi l'intégration
transparente d'autres sous-systèmes IoT. Ceci exige des solutions de gestion
des données robustes et complètes, favorisant l'interopérabilité entre divers
sous-systèmes tout en intégrant le cycle de vie global de la gestion des données
et en tenant compte du contexte. Les différentes couches de l'infrastructure
correspondent étroitement aux phases du cycle de vie des données IoT
illustrées dans la Figure1.
11. le cadre de gestion des données IoT tel que cartographié sur le
cycle de vie des données volumineuses
Couches du cadre de gestion des données IoT
- La couche "objet" collecte et agrège les données en temps réel à partir des capteurs IoT et
des objets intellig ents.
-La couche de communication facilite la transmission des demandes et des données au sein
du réseau IoT.
- Les couches "données/sources" gèrent les sources de données, leur stockage et leur
indexation.
- La couche de données traite les données au niveau des référentiels locaux.
- La couche de fédération facilite l'intégration des données pour les analyses globales.
- La couche de requête gère l'optimisation des requêtes, y compris les requêtes d'agrégation.
- La couche application/analyse utilise les données et les résultats d'analyse pour répondre
aux besoins du système.
12. le cadre de données pour WPAN
Les WPAN (Wireless Personal Area Networks), une composante de l'IoT, se
focalisent sur le traitement et l'optimisation des données en réseau, sans la
complexité globale de l'IoT. Ils se caractérisent par une collecte rapide de
données en temps réel pour des décisions immédiates. Cependant, les
capteurs statiques, dotés de ressources limitées, entravent la mise en place
de services avancés et d'analyses approfondies. Les solutions de gestion
des données pour les WPAN visent ainsi à assurer une collecte efficace de
données en temps réel, malgré une capacité de stockage restreinte pour un
usage à long terme.
13. le cadre de données pour WPAN
Mappage de l'infrastructure de gestion des données IoT au cycle de
vie des données
14. Le cycle de vie des données volumineuses pour le réseau IIoT
La gestion efficace des données industrielles est essentielle dans
l'industrie 4.0, où les données de l'automatisation peuvent avoir une
grande valeur. Le cycle de vie des données
décompose en trois phases : physique,
industrielles se
middleware et
application/services. Les données sont générées dans l'usine
intelligente (monde réel) puis transférées, traitées et utilisées dans
le monde numérique.
15. Le cycle de vie des données volumineuses pour le réseau IoT
Cadre de gestion des données IIoT
Dans la phase middleware, les
données sont collectées,
filtrées, triées et stockées dans
des référentiels de données. Ces
bases de données sont souvent
hébergées dans des systèmes de
cloud computing, offrant
fiabilité, sécurité et évolutivité.
16. le cadre du système de gestion des données IIoT (IDMS) tel que cartographié
sur le cycle de vie des données volumineuses
Cadre IDMS pour IIoT
L'IDMS (Industrial Data Management System) pour l'IIoT est un système organisé en cinq
couches fondamentales. Chaque couche joue un rôle essentiel dans la gestion des
données industrielles, permettant une collecte efficace, un traitement sécurisé et une
utilisation optimale des informations.
- Physique : Capteurs industriels et dispositifs de terrain.
- Communication : Transmission sécurisée des données.
- Middleware : Traitement et découverte des sources de données.
- Base de données : Stockage local des données agrégées.
- Application et gestion : Gestion des services et sécurité.
17. le cadre du système de gestion des données IIoT (IDMS) tel que cartographié
sur le cycle de vie des données volumineuses
Fonctionnalités de l'IDMS
L'IDMS offre une gamme de services et fonctionnalités pour répondre aux besoins
de gestion des données industrielles dans un environnement IIoT en constante
évolution. Ces fonctionnalités garantissent une interopérabilité efficace, une
analyse approfondie et une sécurité robuste des données.
-Gestion des ressources : Organisation et
enregistrement des sources de données.
-Gestion des événements : Collecte et
traitement des données brutes.
-Gestion des données : Prétraitement et
stockage des données.
-Intégration M L/DL : Techniques
d'apprentissage automatique et profond.
-Stockage cloud : Évolutivité pour répondre
aux besoins de stockage.
18. Différence entre base de données distribue et SGBD
Une base de données distribuée fait référence à un ensemble de bases de données
physiquement distribuées mais logiquement interdépendantes, tandis qu'un système
de gestion de base de données est un logiciel qui permet de gérer efficacement les
données, qu'elles soient distribuées ou non.
19. théorème de tolérance CAP appliqué aux bases de données
distribuées
le théorème CAP souligne qu'en cas de partitionnement du réseau, il est impossible de
garantir simultanément la cohérence, la disponibilité et la tolérance de partition dans
un système distribué. Les concepteurs de systèmes distribués doivent faire des
compromis en fonction des besoins spécifiques de leur application en accordant la
priorité à l'une des trois propriétés en fonction des exigences du système.
20. les différentes méthodes d'analyse des données sur la base de données IoT
Nettoyage des données :
Analyse descriptive :
Analyse prédictive :
Analyse de corrélation :
Analyse en temps réel :
Le choix des méthodes d'analyse des données sur la base de données IoT dépend des
objectifs commerciaux, des types de données, de la complexité des analyses et des
besoins opérationnels de l'organisation. Il est essentiel de sélectionner les analyses
appropriées pour extraire des informations précieuses et prendre des décisions
éclairées.
21. Nettoyage des données provenant des objets IoT
le nettoyage des données provenant des objets IoT est crucial pour garantir la qualité, la
précision, la pertinence et la fiabilité des informations extraites. Cela permet d'améliorer la
performance des analyses, de respecter les normes de conformité, de réduire le bruit et de
prendre des décisions éclairées basées sur des données fiables.
22. Les méthodes de nettoyage des bases de données
Suppression des valeurs non pertinentes
Remplissage des enregistrements manquants :
Conversion des données en unités communes :
Conversion des types de données :
Collecte des champs de données corrects :
23. La visualisation des données et les différentes méthodes de visualisation
des données
Selon l'application, le type
d'analyse est choisi, statistique,
analytique et prédictif pour
interpréter les données afin
d'arriver à des conclusions.
Différentes techniques d'analyse
en fonction de leur génération de
valeur sont présentées à la Fig.8
Les différents types d'analyse
statistique sont les suivants :
24. Conclusion
En conclusion, la gestion et l'analyse des bases de données IoT
représentent des piliers essentiels pour exploiter pleinement le
potentiel des données générées par les appareils connectés dans
l'écosystème de l'Internet des objets. Ce chapitre a mis en
lumière l'importance cruciale de la qualité des données, du cycle
de vie des données et des méthodes d'analyse appropriées pour
garantir le succès des initiatives IoT.
25. ACID
Atomicité : Chaque transaction est soit
entièrement exécutée, soit pas du tout, sans
mise à jour partielle.
Cohérence : Les données restent cohérentes
avant et après une transaction, sans impact
négatif.
Isolement des données : Chaque transaction
est traitée indépendamment, sans
interférence avec d'autres transactions.
Durabilité : Les modifications d'une
transaction validée sont permanentes et ne
sont pas perdues en cas d'échec.