SlideShare une entreprise Scribd logo
1  sur  12
Télécharger pour lire hors ligne
Le centre d’accès sécurisé aux données
                (CASD)
Quelles données sur le CASD ?
                         •     De données individuelles très détaillées qui concernent de nombreux
                               domaines :




                                              Données Insee d’ordre




                                                                                      Données du ministère de
                                                                                                 l’agriculture
Données Insee sur les
 individus et ménages




                                                                                                                               A venir :
                                             économique et financier
                        Démographie                                    enquêtes                                  Recensement               Données fiscales
                                                                                                                                           individus et
                        Salaires                                       annuelles                                 agricole                  entreprises
                                                                       entreprises                               Enquêtes                  (modification de la loi
                        Emplois                                                                                                            en cours)
                                                                       liaisons                                  pratiques
                        Transport                                                                                                          Données du
                                                                       financières…                              culturales…               ministère du travail
                        Logement….                                                                                                         Données du
                                                                                                                                           ministère de
                                                                                                                                           l’écologie


                             Un patrimoine très riche de données de qualité, structurées et
                                                     documentées

                         •     Il n’y a pas de noms, prénoms ni d’identifiant direct « universel » tel que le NIR
                               (numéro de sécurité social) par exemple.
                         •     Ces données sont couvertes par la loi 51-711 sur le secret statistique.


                         Sur le CASD, seuls les chercheurs peuvent accéder à ce type de
                         données sous réserve qu’ils aient été habilités par l’administration des
                         archives (loi 51-711) et aient déclaré leur traitement à la CNIL.
                                                                                                                                                      2
Pourquoi le CASD ?

 •   Un nombre important de demandes d’accès aux données
     individuelles très détaillées faites par les chercheurs depuis de
     nombreuses années.
 •   Ce type d’accès existe depuis longtemps dans la plupart des
     autres pays.

 •   Mais surtout, le CASD doit sa création à la volonté de l’Insee
     d’ouvrir le plus largement possible l’accès à ses données aux
     chercheurs pour mieux les valoriser.

 •   Verrou juridique : La modification en 2008 de la loi sur le secret
     statistique (loi n°51-711 du 7 juin 1951) a rendu possible
     juridiquement l’accès des chercheurs à ces données.
 •   Verrou technique : Des contraintes de sécurité importantes
     nécessaires pour ouvrir cet accès : le projet CASD

                                                                      3
Et dans quel contexte technique ?

•   Les premiers centres d’accès sécurisé physiques sont apparus il y a
    plus de 20 ans en Amérique du Nord (Cornell, StatCanada..)
•   Depuis les années 2000, certains pays ont mis en place des
    solutions d’accès sécurisé à distance pour les chercheurs
    (Danemark, suède, Pays-Bas...)
•   Ces solutions reposent sur l’installation sur l’ordinateur du
    chercheur de logiciels particuliers, mais finalement :
     – elles ne sont pas assez sécurisées (le poste socle est maître)
     – elles sont coûteuses et complexes à mettre en œuvre
          • en installation, compatibilité, évolution, assistance…


•   De ce constat, il est apparu qu’il fallait raisonner
    différemment : au lieu de raisonner en termes de logiciel,
    nous avons raisonné en termes de matériel :

                                                                     4
la SD-Box




            5
Le CASD en quelques mots
•   Le CASD est un équipement qui comprend :
     – Une infrastructure informatique centrale « étanche » (IICE) / bulle
     – Des boitiers spécifiques d’accès, les SD-Box, garantissant cette
       étanchéité en étant l’unique moyen d’accès à l’IICE.
•   Grâce à la SD-Box, l’utilisateur peut travailler à distance sur les
    données tout en garantissant au producteur de données :
     – qu’aucun fichier ne puisse être récupéré par le chercheur (pas de
       copier/coller, d’impressions, de clé usb…)
     – qu’il s’agit bien du chercheur habilité qui se connecte sur la SD-Box
       (authentification forte par certificat et biométrique)…
•   Avec la SD-Box, le chercheur peut :
     – réaliser des traitements interactifs à distance avec des logiciels
       statistiques 64 bits : SAS, Stata, R, Gauss, Matlab, latex, excel…
     – demander des sorties de résultat (prévisualisation et conseil)
•   Séance d’enrôlement obligatoire :
     – Accord de confidentialité et conditions d’utilisation
                                                                       6
7
Le projet CASD

• Démarré en grandeur réelle en février 2010
• Aujourd’hui il y a :
     – 322 chercheurs en France et à l’étranger (UK, Italie),
     – répartis sur 143 projets de recherche.
     – Une trentaine de sources de données disponibles sur le CASD


•   A titre de comparaison :
     – Au Danemark : environ 1 000 chercheurs
     – Aux Pays-Bas : environ 400 chercheurs
     – En Suède : Environ 420 chercheurs




                                                            8
•   Le projet CASD est l’un des lauréats de la première vague de l’appel à projet
    « équipement d’excellence » equipex :
     –   4 M€ des investissements d’avenir ont ainsi été attribués au projet
     –   Le projet a été réalisé par le consortium : Genes, Insee, GIS Quetelet, ENS
         Cachan, École polytechnique et HEC
•   Une opportunité pour réussir un développement ambitieux du CASD

                                            Élargir le nombre de
                                            sources de données
                                            disponibles

                                                     Standardiser et
                                                     traduire la
                                                     documentation des
                                                     données
                       EQUIPEX
                        CASD
                                                     Continuer la recherche
                                                     et le développement
                                                     sur la technologie IT

                                             Améliorer le service offert au
                                             chercheur (conseil, formation,
                                             portail...)

                                                                                10
Le CASD dans le contexte international

              - Participation à un grand projet
             européen (FP7) DwB impliquant vingt
             pays ayant pour objectif de favoriser
             l’accès aux micro-données par les
             chercheurs et de réaliser un réseau de
             centres d’accès sécurisé.
              - Participation au projet EssNet DARA
             regroupant plusieurs instituts de
             statistique européens (Allemagne,
             Portugal, Angleterre.. ) pour la mise en
             place d’un pilote de centre d’accès
             sécurisé européen à Eurostat.

Au moins trois rencontres internationales sur ce sujet
                 ont lieu chaque année

                                                     11
Perspectives
•   Big Data : explorer et analyser les données du CASD en les
    enrichissant des données du Big Data :
     – Acquisition par le CASD de données libres du Big Data (réseaux sociaux…)
     – Travailler sur les aspects ‘sécurité’ et juridiques sur des plateformes Big
       Data en construction ou sur des projets R&D Big Data


•   Data Matching : Créer un environnement sécurisé pour pouvoir
    utiliser différentes sources de données de manière conjointe dans le
    respect des libertés individuelles et des lois :
     – une méthodologie complexe à mettre en œuvre pour garantir l’anonymat
       et la sécurité
     – Un potentiel infini d’enrichissement de la donnée


•   Concevoir un réseau de CASD fédéré: Etendre le CASD à un
    réseau de centres d’accès sécurisé accessibles uniquement par des SD-
    Box sécurisées
         –   un niveau élevé et homogène de sécurité
         –   Une industrialisation de fonction de production et d’exploitation
         –   Une allocation dynamique des ressources virtualisées
                                                                           12

Contenu connexe

En vedette

Luxe et Paradoxes Isabelle Butin pour Sup de Luxe
Luxe et Paradoxes   Isabelle Butin pour Sup de LuxeLuxe et Paradoxes   Isabelle Butin pour Sup de Luxe
Luxe et Paradoxes Isabelle Butin pour Sup de LuxeIsabelle BUTIN
 
Paroles d’enfants…paroles
Paroles d’enfants…parolesParoles d’enfants…paroles
Paroles d’enfants…parolesAmineBenjelloun
 
Voici la procédure à respecter afin de s’inscrire
Voici la procédure à respecter afin de s’inscrireVoici la procédure à respecter afin de s’inscrire
Voici la procédure à respecter afin de s’inscrireJacques Côté
 
Conséquences des changements climatiques en milieu océanique
Conséquences des changements climatiques en milieu océaniqueConséquences des changements climatiques en milieu océanique
Conséquences des changements climatiques en milieu océaniquePierreComeau
 
Sesiones 3 y 4 del Curso Superior de Community Managers #CSCMCV
Sesiones 3 y 4 del Curso Superior de Community Managers #CSCMCVSesiones 3 y 4 del Curso Superior de Community Managers #CSCMCV
Sesiones 3 y 4 del Curso Superior de Community Managers #CSCMCVGonzalo Garre Rodas
 
Portfolio Business Booster 2012
Portfolio Business Booster 2012Portfolio Business Booster 2012
Portfolio Business Booster 2012Teemster
 
Aventure et rencontre amoureuse possible !
Aventure et rencontre amoureuse possible !Aventure et rencontre amoureuse possible !
Aventure et rencontre amoureuse possible !pascalsevran
 
Ethique et implant cochléaire
Ethique et  implant cochléaireEthique et  implant cochléaire
Ethique et implant cochléaireAmineBenjelloun
 
Nantes dans ma poche - Nantes Métropole
Nantes dans ma poche - Nantes MétropoleNantes dans ma poche - Nantes Métropole
Nantes dans ma poche - Nantes MétropoleLes Interconnectés
 

En vedette (16)

Luxe et Paradoxes Isabelle Butin pour Sup de Luxe
Luxe et Paradoxes   Isabelle Butin pour Sup de LuxeLuxe et Paradoxes   Isabelle Butin pour Sup de Luxe
Luxe et Paradoxes Isabelle Butin pour Sup de Luxe
 
Paroles d’enfants…paroles
Paroles d’enfants…parolesParoles d’enfants…paroles
Paroles d’enfants…paroles
 
Provigis
ProvigisProvigis
Provigis
 
Diapo5 delors
Diapo5 delorsDiapo5 delors
Diapo5 delors
 
Voici la procédure à respecter afin de s’inscrire
Voici la procédure à respecter afin de s’inscrireVoici la procédure à respecter afin de s’inscrire
Voici la procédure à respecter afin de s’inscrire
 
Tratamiento
TratamientoTratamiento
Tratamiento
 
Fran
FranFran
Fran
 
Conséquences des changements climatiques en milieu océanique
Conséquences des changements climatiques en milieu océaniqueConséquences des changements climatiques en milieu océanique
Conséquences des changements climatiques en milieu océanique
 
El acceso abierto: un desafío para las universidades
El acceso abierto: un desafío para las universidadesEl acceso abierto: un desafío para las universidades
El acceso abierto: un desafío para las universidades
 
Catalogue noel 2013
Catalogue noel 2013Catalogue noel 2013
Catalogue noel 2013
 
Sesiones 3 y 4 del Curso Superior de Community Managers #CSCMCV
Sesiones 3 y 4 del Curso Superior de Community Managers #CSCMCVSesiones 3 y 4 del Curso Superior de Community Managers #CSCMCV
Sesiones 3 y 4 del Curso Superior de Community Managers #CSCMCV
 
Portfolio Business Booster 2012
Portfolio Business Booster 2012Portfolio Business Booster 2012
Portfolio Business Booster 2012
 
Aventure et rencontre amoureuse possible !
Aventure et rencontre amoureuse possible !Aventure et rencontre amoureuse possible !
Aventure et rencontre amoureuse possible !
 
Ethique et implant cochléaire
Ethique et  implant cochléaireEthique et  implant cochléaire
Ethique et implant cochléaire
 
Nantes dans ma poche - Nantes Métropole
Nantes dans ma poche - Nantes MétropoleNantes dans ma poche - Nantes Métropole
Nantes dans ma poche - Nantes Métropole
 
Fabiola chasillacta
Fabiola chasillactaFabiola chasillacta
Fabiola chasillacta
 

Similaire à Data Tuesday 20 nov 2012 INSEE - CASD

Gestion et implantation de la sécurité dans les projets d\'intelligence d\'af...
Gestion et implantation de la sécurité dans les projets d\'intelligence d\'af...Gestion et implantation de la sécurité dans les projets d\'intelligence d\'af...
Gestion et implantation de la sécurité dans les projets d\'intelligence d\'af...Youssef Loudiyi
 
EXL Group - Offre Data Science
EXL Group - Offre Data ScienceEXL Group - Offre Data Science
EXL Group - Offre Data ScienceAshraf Grioute
 
"Aperçu globale des Objectifs de formation Du nouveau CountrySTAT"
"Aperçu globale des Objectifs de formation Du nouveau CountrySTAT""Aperçu globale des Objectifs de formation Du nouveau CountrySTAT"
"Aperçu globale des Objectifs de formation Du nouveau CountrySTAT"FAO
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013ADBS
 
#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big DataNetSecure Day
 
OpenDataSoft au Workshop Open Data Cap Digital
OpenDataSoft au Workshop Open Data Cap DigitalOpenDataSoft au Workshop Open Data Cap Digital
OpenDataSoft au Workshop Open Data Cap DigitalOpenDataSoft
 
Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?mondeca
 
Gestion et diffusion de l’Information scientifique et technique
Gestion et diffusion de l’Information scientifique et techniqueGestion et diffusion de l’Information scientifique et technique
Gestion et diffusion de l’Information scientifique et techniqueiaaldafrika
 
Session 5 Réforme du système d'information sanitaire en Côte d'Ivoire, quelle...
Session 5 Réforme du système d'information sanitaire en Côte d'Ivoire, quelle...Session 5 Réforme du système d'information sanitaire en Côte d'Ivoire, quelle...
Session 5 Réforme du système d'information sanitaire en Côte d'Ivoire, quelle...COP_HHA
 
OpenDataGarage-Session 3A-Antidot
OpenDataGarage-Session 3A-AntidotOpenDataGarage-Session 3A-Antidot
OpenDataGarage-Session 3A-AntidotFing
 
Chap1-Centre-de-donnees - -Une-introduction (1).pdf
Chap1-Centre-de-donnees - -Une-introduction (1).pdfChap1-Centre-de-donnees - -Une-introduction (1).pdf
Chap1-Centre-de-donnees - -Une-introduction (1).pdfKhalo3
 
Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Denodo
 
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationRéinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationDenodo
 
Valtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvreValtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvreValtech
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 
Le Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivité
Le Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivitéLe Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivité
Le Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivitéOCTO Technology
 
Le Data Engineer qui veut se faire aussi gros que le Data Scientist
Le Data Engineer qui veut se faire aussi gros que le Data ScientistLe Data Engineer qui veut se faire aussi gros que le Data Scientist
Le Data Engineer qui veut se faire aussi gros que le Data ScientistBachir Aitmbarek
 
La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 OCTO Technology
 

Similaire à Data Tuesday 20 nov 2012 INSEE - CASD (20)

Gestion et implantation de la sécurité dans les projets d\'intelligence d\'af...
Gestion et implantation de la sécurité dans les projets d\'intelligence d\'af...Gestion et implantation de la sécurité dans les projets d\'intelligence d\'af...
Gestion et implantation de la sécurité dans les projets d\'intelligence d\'af...
 
EXL Group - Offre Data Science
EXL Group - Offre Data ScienceEXL Group - Offre Data Science
EXL Group - Offre Data Science
 
"Aperçu globale des Objectifs de formation Du nouveau CountrySTAT"
"Aperçu globale des Objectifs de formation Du nouveau CountrySTAT""Aperçu globale des Objectifs de formation Du nouveau CountrySTAT"
"Aperçu globale des Objectifs de formation Du nouveau CountrySTAT"
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013
 
#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data
 
OpenDataSoft au Workshop Open Data Cap Digital
OpenDataSoft au Workshop Open Data Cap DigitalOpenDataSoft au Workshop Open Data Cap Digital
OpenDataSoft au Workshop Open Data Cap Digital
 
Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?
 
Gestion et diffusion de l’Information scientifique et technique
Gestion et diffusion de l’Information scientifique et techniqueGestion et diffusion de l’Information scientifique et technique
Gestion et diffusion de l’Information scientifique et technique
 
Session 5 Réforme du système d'information sanitaire en Côte d'Ivoire, quelle...
Session 5 Réforme du système d'information sanitaire en Côte d'Ivoire, quelle...Session 5 Réforme du système d'information sanitaire en Côte d'Ivoire, quelle...
Session 5 Réforme du système d'information sanitaire en Côte d'Ivoire, quelle...
 
OpenDataGarage-Session 3A-Antidot
OpenDataGarage-Session 3A-AntidotOpenDataGarage-Session 3A-Antidot
OpenDataGarage-Session 3A-Antidot
 
Rose des vents
Rose des ventsRose des vents
Rose des vents
 
Chap1-Centre-de-donnees - -Une-introduction (1).pdf
Chap1-Centre-de-donnees - -Une-introduction (1).pdfChap1-Centre-de-donnees - -Une-introduction (1).pdf
Chap1-Centre-de-donnees - -Une-introduction (1).pdf
 
Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...
 
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationRéinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
 
Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)
 
Valtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvreValtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvre
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Le Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivité
Le Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivitéLe Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivité
Le Comptoir x OCTO Academy : La Data au coeur des enjeux de compétitivité
 
Le Data Engineer qui veut se faire aussi gros que le Data Scientist
Le Data Engineer qui veut se faire aussi gros que le Data ScientistLe Data Engineer qui veut se faire aussi gros que le Data Scientist
Le Data Engineer qui veut se faire aussi gros que le Data Scientist
 
La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4
 

Plus de Data Tuesday

Data driven company
Data driven companyData driven company
Data driven companyData Tuesday
 
Bruno Van Haetsdaele - Data Tuesday - VRM
Bruno Van Haetsdaele - Data Tuesday - VRMBruno Van Haetsdaele - Data Tuesday - VRM
Bruno Van Haetsdaele - Data Tuesday - VRMData Tuesday
 
Bruno van haetsdaele_2013-09-vrm
Bruno van haetsdaele_2013-09-vrmBruno van haetsdaele_2013-09-vrm
Bruno van haetsdaele_2013-09-vrmData Tuesday
 
Daniel Kaplan - FING - Data Tuesday - VRM
Daniel Kaplan - FING -  Data Tuesday - VRMDaniel Kaplan - FING -  Data Tuesday - VRM
Daniel Kaplan - FING - Data Tuesday - VRMData Tuesday
 
Nicolas Rose - XANGE - VRM - Data Tuesday
Nicolas Rose - XANGE -  VRM - Data Tuesday Nicolas Rose - XANGE -  VRM - Data Tuesday
Nicolas Rose - XANGE - VRM - Data Tuesday Data Tuesday
 
Cozy Cloud - Data Tuesday - VRM
Cozy Cloud - Data Tuesday - VRMCozy Cloud - Data Tuesday - VRM
Cozy Cloud - Data Tuesday - VRMData Tuesday
 
Didier louvet - ADM - Data Tuesday - VRM - 08-10-2013
Didier louvet - ADM  -  Data Tuesday - VRM - 08-10-2013Didier louvet - ADM  -  Data Tuesday - VRM - 08-10-2013
Didier louvet - ADM - Data Tuesday - VRM - 08-10-2013Data Tuesday
 
Privowny - Data Tuesday VRM
Privowny - Data Tuesday VRMPrivowny - Data Tuesday VRM
Privowny - Data Tuesday VRMData Tuesday
 
Renaud Francou- FING - Datatuesday VRM
Renaud Francou- FING - Datatuesday VRMRenaud Francou- FING - Datatuesday VRM
Renaud Francou- FING - Datatuesday VRMData Tuesday
 
DATATUESDAY VRM - Onecub
DATATUESDAY VRM -  Onecub DATATUESDAY VRM -  Onecub
DATATUESDAY VRM - Onecub Data Tuesday
 
Cristal Festival, Timeline (EN)
Cristal Festival, Timeline (EN)Cristal Festival, Timeline (EN)
Cristal Festival, Timeline (EN)Data Tuesday
 
Cristal Festival, Timeline (FR)
Cristal Festival, Timeline (FR)Cristal Festival, Timeline (FR)
Cristal Festival, Timeline (FR)Data Tuesday
 
4 présentation mgdis open data - datatuesday v2
4   présentation mgdis open data - datatuesday v24   présentation mgdis open data - datatuesday v2
4 présentation mgdis open data - datatuesday v2Data Tuesday
 
Cristal Academy / Séminaire 4 juillet 2013
Cristal Academy / Séminaire 4 juillet 2013Cristal Academy / Séminaire 4 juillet 2013
Cristal Academy / Séminaire 4 juillet 2013Data Tuesday
 
10 jean-louis zimmermann - open streetmap france - lizmobility
10   jean-louis zimmermann - open streetmap france - lizmobility10   jean-louis zimmermann - open streetmap france - lizmobility
10 jean-louis zimmermann - open streetmap france - lizmobilityData Tuesday
 

Plus de Data Tuesday (20)

Data Publica
Data PublicaData Publica
Data Publica
 
Bittle
BittleBittle
Bittle
 
Fruition sciences
Fruition sciencesFruition sciences
Fruition sciences
 
Xiko
XikoXiko
Xiko
 
Shift technology
Shift technologyShift technology
Shift technology
 
Data driven company
Data driven companyData driven company
Data driven company
 
Bruno Van Haetsdaele - Data Tuesday - VRM
Bruno Van Haetsdaele - Data Tuesday - VRMBruno Van Haetsdaele - Data Tuesday - VRM
Bruno Van Haetsdaele - Data Tuesday - VRM
 
Bruno van haetsdaele_2013-09-vrm
Bruno van haetsdaele_2013-09-vrmBruno van haetsdaele_2013-09-vrm
Bruno van haetsdaele_2013-09-vrm
 
Daniel Kaplan - FING - Data Tuesday - VRM
Daniel Kaplan - FING -  Data Tuesday - VRMDaniel Kaplan - FING -  Data Tuesday - VRM
Daniel Kaplan - FING - Data Tuesday - VRM
 
Nicolas Rose - XANGE - VRM - Data Tuesday
Nicolas Rose - XANGE -  VRM - Data Tuesday Nicolas Rose - XANGE -  VRM - Data Tuesday
Nicolas Rose - XANGE - VRM - Data Tuesday
 
Cozy Cloud - Data Tuesday - VRM
Cozy Cloud - Data Tuesday - VRMCozy Cloud - Data Tuesday - VRM
Cozy Cloud - Data Tuesday - VRM
 
Didier louvet - ADM - Data Tuesday - VRM - 08-10-2013
Didier louvet - ADM  -  Data Tuesday - VRM - 08-10-2013Didier louvet - ADM  -  Data Tuesday - VRM - 08-10-2013
Didier louvet - ADM - Data Tuesday - VRM - 08-10-2013
 
Privowny - Data Tuesday VRM
Privowny - Data Tuesday VRMPrivowny - Data Tuesday VRM
Privowny - Data Tuesday VRM
 
Renaud Francou- FING - Datatuesday VRM
Renaud Francou- FING - Datatuesday VRMRenaud Francou- FING - Datatuesday VRM
Renaud Francou- FING - Datatuesday VRM
 
DATATUESDAY VRM - Onecub
DATATUESDAY VRM -  Onecub DATATUESDAY VRM -  Onecub
DATATUESDAY VRM - Onecub
 
Cristal Festival, Timeline (EN)
Cristal Festival, Timeline (EN)Cristal Festival, Timeline (EN)
Cristal Festival, Timeline (EN)
 
Cristal Festival, Timeline (FR)
Cristal Festival, Timeline (FR)Cristal Festival, Timeline (FR)
Cristal Festival, Timeline (FR)
 
4 présentation mgdis open data - datatuesday v2
4   présentation mgdis open data - datatuesday v24   présentation mgdis open data - datatuesday v2
4 présentation mgdis open data - datatuesday v2
 
Cristal Academy / Séminaire 4 juillet 2013
Cristal Academy / Séminaire 4 juillet 2013Cristal Academy / Séminaire 4 juillet 2013
Cristal Academy / Séminaire 4 juillet 2013
 
10 jean-louis zimmermann - open streetmap france - lizmobility
10   jean-louis zimmermann - open streetmap france - lizmobility10   jean-louis zimmermann - open streetmap france - lizmobility
10 jean-louis zimmermann - open streetmap france - lizmobility
 

Data Tuesday 20 nov 2012 INSEE - CASD

  • 1. Le centre d’accès sécurisé aux données (CASD)
  • 2. Quelles données sur le CASD ? • De données individuelles très détaillées qui concernent de nombreux domaines : Données Insee d’ordre Données du ministère de l’agriculture Données Insee sur les individus et ménages A venir : économique et financier Démographie enquêtes Recensement Données fiscales individus et Salaires annuelles agricole entreprises entreprises Enquêtes (modification de la loi Emplois en cours) liaisons pratiques Transport Données du financières… culturales… ministère du travail Logement…. Données du ministère de l’écologie Un patrimoine très riche de données de qualité, structurées et documentées • Il n’y a pas de noms, prénoms ni d’identifiant direct « universel » tel que le NIR (numéro de sécurité social) par exemple. • Ces données sont couvertes par la loi 51-711 sur le secret statistique. Sur le CASD, seuls les chercheurs peuvent accéder à ce type de données sous réserve qu’ils aient été habilités par l’administration des archives (loi 51-711) et aient déclaré leur traitement à la CNIL. 2
  • 3. Pourquoi le CASD ? • Un nombre important de demandes d’accès aux données individuelles très détaillées faites par les chercheurs depuis de nombreuses années. • Ce type d’accès existe depuis longtemps dans la plupart des autres pays. • Mais surtout, le CASD doit sa création à la volonté de l’Insee d’ouvrir le plus largement possible l’accès à ses données aux chercheurs pour mieux les valoriser. • Verrou juridique : La modification en 2008 de la loi sur le secret statistique (loi n°51-711 du 7 juin 1951) a rendu possible juridiquement l’accès des chercheurs à ces données. • Verrou technique : Des contraintes de sécurité importantes nécessaires pour ouvrir cet accès : le projet CASD 3
  • 4. Et dans quel contexte technique ? • Les premiers centres d’accès sécurisé physiques sont apparus il y a plus de 20 ans en Amérique du Nord (Cornell, StatCanada..) • Depuis les années 2000, certains pays ont mis en place des solutions d’accès sécurisé à distance pour les chercheurs (Danemark, suède, Pays-Bas...) • Ces solutions reposent sur l’installation sur l’ordinateur du chercheur de logiciels particuliers, mais finalement : – elles ne sont pas assez sécurisées (le poste socle est maître) – elles sont coûteuses et complexes à mettre en œuvre • en installation, compatibilité, évolution, assistance… • De ce constat, il est apparu qu’il fallait raisonner différemment : au lieu de raisonner en termes de logiciel, nous avons raisonné en termes de matériel : 4
  • 6. Le CASD en quelques mots • Le CASD est un équipement qui comprend : – Une infrastructure informatique centrale « étanche » (IICE) / bulle – Des boitiers spécifiques d’accès, les SD-Box, garantissant cette étanchéité en étant l’unique moyen d’accès à l’IICE. • Grâce à la SD-Box, l’utilisateur peut travailler à distance sur les données tout en garantissant au producteur de données : – qu’aucun fichier ne puisse être récupéré par le chercheur (pas de copier/coller, d’impressions, de clé usb…) – qu’il s’agit bien du chercheur habilité qui se connecte sur la SD-Box (authentification forte par certificat et biométrique)… • Avec la SD-Box, le chercheur peut : – réaliser des traitements interactifs à distance avec des logiciels statistiques 64 bits : SAS, Stata, R, Gauss, Matlab, latex, excel… – demander des sorties de résultat (prévisualisation et conseil) • Séance d’enrôlement obligatoire : – Accord de confidentialité et conditions d’utilisation 6
  • 7. 7
  • 8. Le projet CASD • Démarré en grandeur réelle en février 2010 • Aujourd’hui il y a : – 322 chercheurs en France et à l’étranger (UK, Italie), – répartis sur 143 projets de recherche. – Une trentaine de sources de données disponibles sur le CASD • A titre de comparaison : – Au Danemark : environ 1 000 chercheurs – Aux Pays-Bas : environ 400 chercheurs – En Suède : Environ 420 chercheurs 8
  • 9.
  • 10. Le projet CASD est l’un des lauréats de la première vague de l’appel à projet « équipement d’excellence » equipex : – 4 M€ des investissements d’avenir ont ainsi été attribués au projet – Le projet a été réalisé par le consortium : Genes, Insee, GIS Quetelet, ENS Cachan, École polytechnique et HEC • Une opportunité pour réussir un développement ambitieux du CASD Élargir le nombre de sources de données disponibles Standardiser et traduire la documentation des données EQUIPEX CASD Continuer la recherche et le développement sur la technologie IT Améliorer le service offert au chercheur (conseil, formation, portail...) 10
  • 11. Le CASD dans le contexte international - Participation à un grand projet européen (FP7) DwB impliquant vingt pays ayant pour objectif de favoriser l’accès aux micro-données par les chercheurs et de réaliser un réseau de centres d’accès sécurisé. - Participation au projet EssNet DARA regroupant plusieurs instituts de statistique européens (Allemagne, Portugal, Angleterre.. ) pour la mise en place d’un pilote de centre d’accès sécurisé européen à Eurostat. Au moins trois rencontres internationales sur ce sujet ont lieu chaque année 11
  • 12. Perspectives • Big Data : explorer et analyser les données du CASD en les enrichissant des données du Big Data : – Acquisition par le CASD de données libres du Big Data (réseaux sociaux…) – Travailler sur les aspects ‘sécurité’ et juridiques sur des plateformes Big Data en construction ou sur des projets R&D Big Data • Data Matching : Créer un environnement sécurisé pour pouvoir utiliser différentes sources de données de manière conjointe dans le respect des libertés individuelles et des lois : – une méthodologie complexe à mettre en œuvre pour garantir l’anonymat et la sécurité – Un potentiel infini d’enrichissement de la donnée • Concevoir un réseau de CASD fédéré: Etendre le CASD à un réseau de centres d’accès sécurisé accessibles uniquement par des SD- Box sécurisées – un niveau élevé et homogène de sécurité – Une industrialisation de fonction de production et d’exploitation – Une allocation dynamique des ressources virtualisées 12