1ère Journée sur les Réseaux
Bayésiens et leurs Applications

Vers une approche de sécurisation
des entrepôts de données en
utilisant les réseaux Bayésiens
Salah Triki
Hanene Ben-Abdallah, Jamel Feki (FSEGS)
Nouria Harbi (Université Lyon 2)

JRBA 2010
1
Plan

Introduction
Sécurisation des entrepôts de données

Proposition pour la sécurisation des ED

Conclusion et perspectives

JRBA 2010
2
Plan

Introduction
Sécurisation des entrepôts de données

Proposition pour la sécurisation des ED

Conclusion et perspectives

JRBA 2010
3
Introduction

Sécurisation entrepôts
de données

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

 Un entrepôts de données est une collection
de données :
 intégrées,
 orientées sujet,
 non volatiles,
 historisées,
 disponibles pour l’interrogation et l’analyse
 Les analyses concernent différents
domaines: Commerce, Hospitalier …
JRBA 2010
4
Sécurisation entrepôts
de données

Introduction

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

 Architecture
Sources de
données
Outils
d’analyse

ETL
Extraction
Transformation
Chargement

Entrepôt
de
Données
- Augmenter le chiffre d’affaires
- Réduire les dépenses
- Prévoir un stock de médicaments
pour une période donnée de
l’année

JRBA 2010
5
Introduction

Sécurisation entrepôts
de données

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

 Les entrepôts de données contiennent :
 Des données sensibles
 Certaines données personnelles
 Exigences légales:
 HIPPA
 GLBA
 Sarbanes-Oxley
 Safe Harbor
 Les organismes doivent respecter ces lois
JRBA 2010
6
Plan

Introduction
Sécurisation des entrepôts de données

Proposition pour la sécurisation des ED

Conclusion et perspectives

JRBA 2010
7
Introduction

Sécurisation des
entrepôts de données

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

 Deux classes de sécurité :
 La sécurisation des opérations:
• Contrôler l’accés aux données
• Baser sur des règles d’accés

 La prévention contre les inférences :
• Interdire la déduction des données cachées à
partir des données accessibles

JRBA 2010
8
Introduction

Sécurisation des
entrepôts de données

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

 L’inference est basée sur :
 Des informations
 La connaissance de la structure de l’ED
 Objectif d’un utilisateur malicieux :
 Inférer une information sensible
 Moyens utilisés par un utilisateur
malicieux :
 Un ensemble d’informations
 Un ensemble de requêtes
JRBA 2010
9
Plan

Introduction
Sécurisation des entrepôts de données

Proposition pour la sécurisation des ED

Conclusion et perspectives

JRBA 2010
10
Introduction

Sécurisation des
entrepôts de données

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

 Traiter les requêtes de type Max ou Min
 Exemples de requêtes de type Max:
 Maximum des ventes par mois et par région
 Maximum du chiffre d’affaires par région et
par fournisseur
 Maximum des commissions par employé et
par année

JRBA 2010
11
Introduction

Sécurisation des
entrepôts de données

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

 Approche
Max  RécupérerMaxRequête (Requête)
data  RécupérerDataRequête (Requête)
RB  ConstruireRéseauxBayésiens (data , Max)
Si (∃ Nœud ∈ RB /Pr (Nœud=Max )> seuil)
ALORS
Interdire la requête
SINON
Autoriser la requête
FINSI

JRBA 2010
12
Sécurisation des
entrepôts de données

Introduction

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

 Construction du réseau Bayésien
Pr1 = 1/5
Pr1=1/3
Pr1 = 1

D1=
900

Pr22= 1/3
Pr = 1/5

D2=
500

Max
(D2, D3)
=700

JRBA 2010

Pr3 = 1/5
Pr3 = 1/3

D3=
700

Pr4 = 1/5 Pr5 = 1/5

D4=
200

D5=
300

Max
(D4, D5)
=300
Max
(D1, D2,
D3, D4,
D5) = 900
13 / 22
Sécurisation des
entrepôts de données

Introduction

 Exemple

Proposition pour la
sécurisation des ED

Habilités à faire des transactions
internationales.

Conclusion et
perspectives

Département
Marketing
Nombre
d’employés du
département
Marketing : 4

ALICE
Décembre 2009
ALICE est
malade

BOB

Chaque employé de
l’entreprise reçoit une
commission sur les
transactions qu’il effectue

Deux types de transactions:
Est-il possible d'inférer le nom de -Nationales
l'employé du département Marketing ayant -Internationales
eu la commission maximale ?
JRBA 2010
14 / 22
Sécurisation des
entrepôts de données

Introduction

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

 Maximum des commissions par Nombre
d'employés et par Département
NB_EMP
4

DEPT_ID

Max Commission

Marketing

900

Finance

950

JRBA 2010
15 / 22
Sécurisation des
entrepôts de données

Introduction

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

 Maximum des commissions par Année et
par Mois
Année

Max Commission

Octobre

850

Novembre

720

Décembre

2009

Mois

900

Le maximum des commissions du
département Marketing est obtenu
au mois de Décembre
JRBA 2010
16 / 22
Sécurisation des
entrepôts de données

Introduction

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

 Maximum des commissions par Année et
par Type de commission
Année
2009

Type de commission

Max Commission

Nationale

840

Internationale

900

Le maximum des commissions du
département Marketing est obtenu au
mois au de Décembre sur une transaction
internationale

BOB est l’employé qui a obtenu le
maximum des commissions
JRBA 2010
17 / 22
Sécurisation entrepôts
de données

Introduction

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

Commission de ALICE
420

840

440

500

520

740

850

0

720

Commission
de BOB
900

720

Pr = 1/10

900
JRBA 2010

850

900
840

Pr = 1/4
Pr = 1/2

900

L a dernière
requête doit être
interdite

18 / 22
Introduction

Sécurisation des
entrepôts de données

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

 Avantages
 Pas de traitement supplémentaire après
l’alimentation de l’ED
 Pas d’altération des données originaux
 Inconvénient
 Temps de calcul important

JRBA 2010
19 / 22
Plan

Introduction
Sécurisation des entrepôts de données

Proposition pour la sécurisation des ED

Conclusion et perspectives

JRBA 2010
20 / 22
Introduction

Sécurisation des
entrepôts de données

Proposition pour la
sécurisation des ED

Conclusion et
perspectives

 Les travaux sur la prévention des
inférences se basent sur l’alteration des
données originales
 Utilisation des notions de probabilités afin
de détecter les cas d’inférences
 Alléger le travail du réseau Bayésien :
 Utiliser les profils des utilisateurs
 Utiliser les méthodes statistiques afin de
détecter les données sécurisées

JRBA 2010
21 / 22
Merci pour votre attention

JRBA 2010

Vers une approche de sécurisation des entrepôts de données en utilisant les réseaux Bayésiens

  • 1.
    1ère Journée surles Réseaux Bayésiens et leurs Applications Vers une approche de sécurisation des entrepôts de données en utilisant les réseaux Bayésiens Salah Triki Hanene Ben-Abdallah, Jamel Feki (FSEGS) Nouria Harbi (Université Lyon 2) JRBA 2010 1
  • 2.
    Plan Introduction Sécurisation des entrepôtsde données Proposition pour la sécurisation des ED Conclusion et perspectives JRBA 2010 2
  • 3.
    Plan Introduction Sécurisation des entrepôtsde données Proposition pour la sécurisation des ED Conclusion et perspectives JRBA 2010 3
  • 4.
    Introduction Sécurisation entrepôts de données Propositionpour la sécurisation des ED Conclusion et perspectives  Un entrepôts de données est une collection de données :  intégrées,  orientées sujet,  non volatiles,  historisées,  disponibles pour l’interrogation et l’analyse  Les analyses concernent différents domaines: Commerce, Hospitalier … JRBA 2010 4
  • 5.
    Sécurisation entrepôts de données Introduction Propositionpour la sécurisation des ED Conclusion et perspectives  Architecture Sources de données Outils d’analyse ETL Extraction Transformation Chargement Entrepôt de Données - Augmenter le chiffre d’affaires - Réduire les dépenses - Prévoir un stock de médicaments pour une période donnée de l’année JRBA 2010 5
  • 6.
    Introduction Sécurisation entrepôts de données Propositionpour la sécurisation des ED Conclusion et perspectives  Les entrepôts de données contiennent :  Des données sensibles  Certaines données personnelles  Exigences légales:  HIPPA  GLBA  Sarbanes-Oxley  Safe Harbor  Les organismes doivent respecter ces lois JRBA 2010 6
  • 7.
    Plan Introduction Sécurisation des entrepôtsde données Proposition pour la sécurisation des ED Conclusion et perspectives JRBA 2010 7
  • 8.
    Introduction Sécurisation des entrepôts dedonnées Proposition pour la sécurisation des ED Conclusion et perspectives  Deux classes de sécurité :  La sécurisation des opérations: • Contrôler l’accés aux données • Baser sur des règles d’accés  La prévention contre les inférences : • Interdire la déduction des données cachées à partir des données accessibles JRBA 2010 8
  • 9.
    Introduction Sécurisation des entrepôts dedonnées Proposition pour la sécurisation des ED Conclusion et perspectives  L’inference est basée sur :  Des informations  La connaissance de la structure de l’ED  Objectif d’un utilisateur malicieux :  Inférer une information sensible  Moyens utilisés par un utilisateur malicieux :  Un ensemble d’informations  Un ensemble de requêtes JRBA 2010 9
  • 10.
    Plan Introduction Sécurisation des entrepôtsde données Proposition pour la sécurisation des ED Conclusion et perspectives JRBA 2010 10
  • 11.
    Introduction Sécurisation des entrepôts dedonnées Proposition pour la sécurisation des ED Conclusion et perspectives  Traiter les requêtes de type Max ou Min  Exemples de requêtes de type Max:  Maximum des ventes par mois et par région  Maximum du chiffre d’affaires par région et par fournisseur  Maximum des commissions par employé et par année JRBA 2010 11
  • 12.
    Introduction Sécurisation des entrepôts dedonnées Proposition pour la sécurisation des ED Conclusion et perspectives  Approche Max  RécupérerMaxRequête (Requête) data  RécupérerDataRequête (Requête) RB  ConstruireRéseauxBayésiens (data , Max) Si (∃ Nœud ∈ RB /Pr (Nœud=Max )> seuil) ALORS Interdire la requête SINON Autoriser la requête FINSI JRBA 2010 12
  • 13.
    Sécurisation des entrepôts dedonnées Introduction Proposition pour la sécurisation des ED Conclusion et perspectives  Construction du réseau Bayésien Pr1 = 1/5 Pr1=1/3 Pr1 = 1 D1= 900 Pr22= 1/3 Pr = 1/5 D2= 500 Max (D2, D3) =700 JRBA 2010 Pr3 = 1/5 Pr3 = 1/3 D3= 700 Pr4 = 1/5 Pr5 = 1/5 D4= 200 D5= 300 Max (D4, D5) =300 Max (D1, D2, D3, D4, D5) = 900 13 / 22
  • 14.
    Sécurisation des entrepôts dedonnées Introduction  Exemple Proposition pour la sécurisation des ED Habilités à faire des transactions internationales. Conclusion et perspectives Département Marketing Nombre d’employés du département Marketing : 4 ALICE Décembre 2009 ALICE est malade BOB Chaque employé de l’entreprise reçoit une commission sur les transactions qu’il effectue Deux types de transactions: Est-il possible d'inférer le nom de -Nationales l'employé du département Marketing ayant -Internationales eu la commission maximale ? JRBA 2010 14 / 22
  • 15.
    Sécurisation des entrepôts dedonnées Introduction Proposition pour la sécurisation des ED Conclusion et perspectives  Maximum des commissions par Nombre d'employés et par Département NB_EMP 4 DEPT_ID Max Commission Marketing 900 Finance 950 JRBA 2010 15 / 22
  • 16.
    Sécurisation des entrepôts dedonnées Introduction Proposition pour la sécurisation des ED Conclusion et perspectives  Maximum des commissions par Année et par Mois Année Max Commission Octobre 850 Novembre 720 Décembre 2009 Mois 900 Le maximum des commissions du département Marketing est obtenu au mois de Décembre JRBA 2010 16 / 22
  • 17.
    Sécurisation des entrepôts dedonnées Introduction Proposition pour la sécurisation des ED Conclusion et perspectives  Maximum des commissions par Année et par Type de commission Année 2009 Type de commission Max Commission Nationale 840 Internationale 900 Le maximum des commissions du département Marketing est obtenu au mois au de Décembre sur une transaction internationale BOB est l’employé qui a obtenu le maximum des commissions JRBA 2010 17 / 22
  • 18.
    Sécurisation entrepôts de données Introduction Propositionpour la sécurisation des ED Conclusion et perspectives Commission de ALICE 420 840 440 500 520 740 850 0 720 Commission de BOB 900 720 Pr = 1/10 900 JRBA 2010 850 900 840 Pr = 1/4 Pr = 1/2 900 L a dernière requête doit être interdite 18 / 22
  • 19.
    Introduction Sécurisation des entrepôts dedonnées Proposition pour la sécurisation des ED Conclusion et perspectives  Avantages  Pas de traitement supplémentaire après l’alimentation de l’ED  Pas d’altération des données originaux  Inconvénient  Temps de calcul important JRBA 2010 19 / 22
  • 20.
    Plan Introduction Sécurisation des entrepôtsde données Proposition pour la sécurisation des ED Conclusion et perspectives JRBA 2010 20 / 22
  • 21.
    Introduction Sécurisation des entrepôts dedonnées Proposition pour la sécurisation des ED Conclusion et perspectives  Les travaux sur la prévention des inférences se basent sur l’alteration des données originales  Utilisation des notions de probabilités afin de détecter les cas d’inférences  Alléger le travail du réseau Bayésien :  Utiliser les profils des utilisateurs  Utiliser les méthodes statistiques afin de détecter les données sécurisées JRBA 2010 21 / 22
  • 22.
    Merci pour votreattention JRBA 2010