Le centre d’accès sécurisé aux données            de la statistique publique française :             un nouvel outil pour ...
Le centre daccès sécurisé aux données de la statistique publique françaisePour répondre à la demande de plus          secr...
Jean-Pierre le Gléau et Jean-François RoyerGrâce aux progrès de l’informatique,         d’économie et statistique, établis...
Le centre daccès sécurisé aux données de la statistique publique françaiseadministratives déjà mises à la dispo-          ...
Jean-Pierre le Gléau et Jean-François Royer Vers une collaboration accrue                          Le cas des appariements...
Prochain SlideShare
Chargement dans…5
×

CASD -données statistique publique française insee mai 2011 (http://www.insee.fr/fr/ffc/docs_ffc/cs130e.pdf)

1 360 vues

Publié le

Le centre d'accès sécurisé aux données de la statistique publique française : un nouvel outil pour les chercheurs

En 2010, l'Insee a mis en place un nouveau dispositif d'accès aux fichiers individuels de la statistique publique, essentiellement à destination des chercheurs : le CASD, « centre d'accès sécurisé distant » (accéder à des données individuelles selon une procédure très réglementée)
Cet article en donne une présentation générale.


http://www.insee.fr/fr/ffc/docs_ffc/cs130e.pdf

0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
1 360
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2
Actions
Partages
0
Téléchargements
5
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

CASD -données statistique publique française insee mai 2011 (http://www.insee.fr/fr/ffc/docs_ffc/cs130e.pdf)

  1. 1. Le centre d’accès sécurisé aux données de la statistique publique française : un nouvel outil pour les chercheurs !Jean-Pierre Le Gléau * et Jean-François Royer **En 2010, l’Insee a mis en place un nouveau dispositif d’accès aux fichiers individuels de lastatistique publique, essentiellement à destination des chercheurs : le CASD, « centre d’ac-cès sécurisé distant ». Rendu possible par l’évolution récente de la loi de 1951 sur le secret enmatière de statistiques, il permet d’accéder à des données individuelles selon une procéduretrès réglementée. Cet article en donne une présentation générale.L a protection de la confiden- pression pour que ces désagrégations c’est-à-dire en pratique des données tialité des données recueillies soient de plus en plus fines est allée sur des entreprises ou des établisse- à des fins d’établissement de en croissant au fil des années, au fur et ments - la loi de 1951 a dès l’originestatistiques est un des principes ma- à mesure du progrès des techniques et prévu la possibilité de dérogationsjeurs de la statistique publique. Dès des outils d’analyse statistique dans au secret statistique. Depuis 1984,1951, la loi organisant la statistique de nombreux secteurs de la société. de telles dérogations sont possiblespublique en France 1 comprenait le Or, au-delà d’un certain niveau de sous réserve d’un passage devant unmot « secret » dans son titre. Dans le détail dans les croisements, le secret comité spécialisé rattaché aucode de bonnes pratiques de la statis- statistique ne peut plus être respecté, Conseil national de l’informationtique européenne publié en 2005, le car les « cases de tableaux » révèlent statistique (Cnis), le comité du secretsecret statistique figure au principe en fait des informations individuelles. statistique. Celui-ci examine len° 52. Il convient en effet de pouvoir Cette contradiction est devenue parti- bien-fondé de la demande, évalue laassurer aux personnes répondant à culièrement apparente dans les nécessité d’avoir recours à des infor-une enquête que leurs réponses ne travaux des chercheurs. La commu- mations individuelles, juge lepourront en aucun cas être utilisées nauté des chercheurs en sciences sérieux du demandeur et la capacitéde façon à leur porter préjudice. humaines et sociales a depuis long- de l’organisme auquel il appartientC’est pourquoi la préservation du se- temps fait valoir son besoin d’accéder et qui soutient sa demande à respec-cret statistique constitue une disposi- à des informations individuelles pour ter en pratique les contraintes liéestion majeure de la loi fondamentale effectuer des travaux de plus en plus au respect du secret statistique. Ende la statistique française. complexes. Ces travaux ne nécessi- cas d’avis positif, le demandeur peutPendant longtemps cette exigence tent pas, en général, de connaître avoir accès aux données, aprèsn’a pas été ressentie comme une forte nommément la personne ayant signature individuelle par chaquegêne par les utilisateurs de la statis- répondu à l’enquête. Mais les cher- bénéficiaire d’un engagement àtique publique. Ceux-ci se conten- cheurs ne peuvent plus se contenter respecter les règles du secret statis-taient de résultats globaux des de disposer de résultats agrégés. Le tique. Il faut souligner que cetteenquêtes ou de résultats désagrégés développement de la théorie et des possibilité, qui en pratique bénéficieselon des catégories prédéfinies (acti- outils économétriques, conjugué à à des équipes de recherche et à desvités, professions, lieux) sans que la celui de la puissance des instruments administrations publiques, ne leur estdiffusion de ces résultats porte de calcul ouvre de multiples possibi- pas réservée par la loi.atteinte au secret. Cependant, la lités fondées sur l’analyse de données individuelles, que les chercheurs sont Dans le cas des « données relatives impatients d’explorer. aux faits et comportements d’ordre* Chef du département de la coordination statistique àl’Insee privé» - c’est-à-dire en pratique des** Chercheur au Crest-Insee Accès à des données données sur des personnes ou des1. Loi n° 51-711 du 7 juin 1951 sur l’obligation, la co-ordination et le secret en matière de statistiques individuelles : la situation ménages - la loi de 1951 ne prévoyait2. « Le respect de la vie privée ou du secret des affaires entre 1951 et 2008 à l’origine aucune dérogation et,des fournisseurs de données (ménages, entreprises, ad- jusqu’en 2008, aucune communica-ministrations et autres répondants), la confidentialité des Dans le cas de renseignements indivi- tion de renseignements individuelsinformations qu’ils communiquent et l’utilisation de cel-les-ci à des fins strictement statistiques doivent être ab- duels relatifs à des « données à carac- n’était possible. Seule la communica-solument garantis ». tère économique et financier » - tion de fichiers anonymisés était licite.Courrier des statistiques n° 130, mai 2011 1
  2. 2. Le centre daccès sécurisé aux données de la statistique publique françaisePour répondre à la demande de plus secret statistique, dont la compétence Le recours à un centreen plus pressante des chercheurs, a donc été étendue. d’accès sécurisél’Insee a créé en 2006 les « fichiers deproduction et de recherche » (FPR), La procédure suppose, après l’avis du Depuis 2008, la loi rend doncfichiers individuels, présentant une comité du secret statistique, l’accord possible la c ommunication d eobservation par individu enquêté, du service dont émanent les docu- données statistiques sur les personnesmais où l’on a au préalable supprimé ments avant la décision formelle de ou les ménages à des chercheurs.toutes les variables permettant l’identi- communication par la direction des Mais l’impératif de protection desfication directe ou indirecte des archives. Pour ce qui le concerne, répondants continue à s’imposer àpersonnes : nom, adresse, profession l’Insee a informé le comité du secret tous, et particulièrement aux institu-et nationalité détaillées, identification statistique, lors de sa séance du tions statistiques. C’est pourquoide l’employeur pour les salariés, etc. 6 octobre 2009, des conditions qu’il l’Insee a choisi de recourir à unCes FPR sont mis à la disposition des mettrait pour donner cet accord : « centre d’accès sécurisé » pourchercheurs via le réseau Quetelet, mettre en œuvre les nouvelles dispo-avec lequel l’Insee a signé une - pour les services statistiques minis- sitions permises par la loi.convention précisant les modalités de tériels (SSM), qui ont dans leurmise en œuvre du dispositif. Cette mission de gérer des dossiers couverts Qu’est-ce qu’un centre d’accès sécu-disposition a permis de satisfaire un par le secret statistique, les fichiers risé ? C’est un dispositif techniquegrand nombre de demandes des cher- seront transmis sous réserve de la permettant à des utilisateurs autoriséscheurs pour l’accès à des données production par eux d’un document de travailler sur des données confi-individuelles, et elle reste d’une attestant qu’ils se sont bien dotés des dentielles tout en s’assurant que cesgrande utilité. moyens pour faire respecter le secret données ne risquent pas d’être statistique et que leur équipement détournées pour d’autres fins, acci-Cependant, il existe un ensemble de informatique présente bien l’étan- dentellement ou intentionnellement.demandes, légitimes du point de vue chéité suffisante par rapport à celui En matière de données statistiques, lascientifique, qui ne peuvent trouver du reste du ministère ; création des premiers centres d’accèsleur satisfaction dans la mise à dispo- sécurisés destinés à la recherche - pour les autres demandeurs, l’accèssition des FPR. Ce sont les projets de remonte aux années 1990 aux USA et aux données se fera par le biais d’unrecherche qui nécessitent un détail au Canada. En Europe, des pays du centre d’accès sécurisé ;géographique, par nationalité ou par Nord (Danemark, Pays-Bas) ont crééprofession non disponible dans les - dans ces deux cas, les fichiers auront de tels centres au début des annéesFPR3, ou qui font appel à un apparie- été, si nécessaire, transformés pour 2000. Ils ont été rejoints par lament avec d’autres fichiers, par perdre leur caractère directement Grande-Bretagne, puis l’Allemagne, 6exemple en couplant, grâce à l’identi- nominatif ; c’est-à-dire qu’on y aura au milieu de cette décennie .fiant de l’employeur, des caractéristi- retiré, le cas échéant, le nom duques de l’enquêté et de l’entreprise répondant et le NIR (numéro d’ins- Les premiers centres d’accès sécuri-dans laquelle il travaille. L’accès à ces cription au répertoire - le numéro de sés à des données statistiques ont étéinformations rompt nécessairement la Sécurité sociale) ; des centres « physiques »,l’anonymat et était, de ce fait, impos- c’est-à-dire des locaux gérés par - pour les demandes d’accès à dessible jusqu’en 2008. une institution statistique (éventuel- documents directement nominatifs, lement à l’intérieur d’une universi- l’accord ne pourrait être donné que té, comme au Canada) et contenant dans le cas de la constitution d’un Les évolutions issues de un serveur de données. Dans ces échantillon pour une enquête de la la loi de 2008 concernant locaux, l’institution statistique statistique publique ayant obtenu un les données sur les ménages donne au demandeur un accès visa5 sous réserve de l’accord expli- physique directement sur le serveur. cite, au cas par cas, du comité deEn 2008, la modification de la loi Cela implique que le demandeur se direction de l’Insee.statistique de 1951 par un article de la déplace pour travailler en dehors de 4loi sur les archives a ouvert la possi- son environnement habituel. Cettebilité d’accéder à des renseignements solution exige aussi l’aménagement 3. Afin de rendre les FPR totalement anonymes, certai-indiv idue ls re la tifs a u x fa its e t nes variables géographiques, sur la nationalité ou la de locaux spécifiques (éventuelle-comportements d’ordre privé sous profession sont supprimées (code commune) ou re- ment en plusieurs points du terri- groupées en un petit nombre de modalités.deux conditions : 4. Loi n°2008-696 du 15 juillet 2008 relative aux ar- toire) matériellement sécurisés chives, article 2 (portes, fenêtres) dont la surveil-- l’une liée à la finalité : cette commu- 5. Ce visa est attribué par le ministre chargé de lance est confiée à une personnenication n’est possible qu’à des fins l’économie et le ministre à la compétence duquel res- sortissent les intéressés. assermentée. C’est la solutionde statistique publique ou de 6. Pour un panorama, on pourra consulter dans le retenue au Canada et en Allemagne.recherche scientifique ou historique ; Courrier des statistiques n°121-122 de décembre Elle est très coûteuse, aussi bien 2007 : « L’accès aux micro-données et la gestion de la- l’autre liée à la procédure : celle-ci confidentialité dans quelques INS européens » par pour l’Institut de statistique queexige en effet un avis du comité du Dominique Rouault. pour les chercheurs.2 Courrier des statistiques n° 130, mai 2011
  3. 3. Jean-Pierre le Gléau et Jean-François RoyerGrâce aux progrès de l’informatique, d’économie et statistique, établisse- chercheur qui estime qu’il ne peuton a vu apparaître depuis 2005 des ment public qui était jusqu’à fin 2010 pas s’en contenter et qu’il a besoin« centres d’accès sécurisés distants » une direction de l’Insee). Elle consiste des fichiers complets doit à ce stade(CASD) n’imposant plus aux cher- à mettre à disposition de l’organisme bien préciser pourquoi certainescheurs de se déplacer dans un endroit demandeur, un terminal appelé « SD variables lui manquent encore :particulier. Ce sont des systèmes Box » pour lui permettre de se c’est l’information cruciale qu’ilinformatiques dans lesquels les connecter et de travailler sur le devra fournir au comité du secretdonnées restent stockées sur un serveur installé au Genes. Cette « SD statistique. Pour cette phase d’éla-serveur unique, géré par l’institution Box » permet au chercheur de voir boration, le chercheur devra impé-statistique, mais sur lequel les cher- les données sur lesquelles il travaille, rativement prendre contact avec lecheurs peuvent travailler à distance, de les intégrer dans ses calculs et d’en service producteur, de façon à biensans risque de dissémination. Il peut tirer des tableaux, graphiques, analy- cerner sa demande et à vérifier qu’ils’agir seulement de pouvoir ses. Mais à aucun moment il ne peut a pris connaissance de tous lessoumettre des travaux à distance ni les imprimer, ni les enregistrer sur fichiers auxquels il peut avoir(« remote submission »), les résultats un support quelconque : clef USB, accès, de leurs possibilités et aussiétant récupérés de façon différée ; ou CD Rom... Ainsi, les données ne quit- de leurs limites.bien il peut s’agir d’un véritable accès tent jamais le serveur du Genes. La« en ligne » (« remote access ») c o m m u n ic a tio n e n tr e c e tte Le chercheur présente ensuite sapermettant au chercheur une forte « SD Box » et le serveur est assurée demande au comité du secret statis-interactivité avec les données. Dans par une liaison sécurisée et cryptée. tique : le secrétariat du comitéce dernier cas, le chercheur distant (comite-secret@cnis.fr) peut lui fournirtravaille réellement « sur le serveur » Cette solution a commencé à fonc- toutes les indications nécessaires. Lede l’institution statistique, mais le tionner début 2010, et à ce jour une comité du secret statistique se réunitlogiciel de sécurisation des données trentaine de projets de recherche en une fois par trimestre et donne un avis ;l’empêche de les exporter. bénéficient. Les deux paragraphes qui il opère comme cela a été décrit précé- suivent décrivent plus en détail le demment pour les données sur les cheminement d’un projet de entreprises. S’ajoutent cependant, La solution retenue recherche qui a recours à ce dispositif. dans les critères à prendre en compte, par l’Insee ceux de la finalité du traitement qui ne peut être, pour les données sur les Phase préparatoire : connaîtrePour les demandeurs autres que les ménages, que la statistique publique les données, explorerSSM, l’Insee a donc choisi la solution du ou la recherche scientifique ou histo- les moyens d’accès, fairepassage par un centre d’accès sécurisé rique. La présence du chercheur à la les formalités administrativesdistant en « remote access », où les séance du comité est nécessaire pourdonnées, les métadonnées et les Concrètement, un chercheur qui que ses membres puissent recevoir lesprogrammes d’utilisation restent donc souhaite accéder à des données indi- éclaircissements et les assurancessur un serveur central unique géré par viduelles sur les ménages produites nécessaires.l’institution statistique ou sous son par l’Insee ou par un SSM doit toutcontrôle. Techniquement, cette solution d’abord prendre connaissance de la En cas d’avis favorable du comité duaurait pu être mise en œuvre en instal- source statistique dont ces données secret statistique, le chercheur peutlant un logiciel gérant la confidentialité peuvent être tirées, et des différents consulter les données sur le centre(interdisant entre autres toute recopie ou produits de diffusion de cette source. d’accès sécurisé distant. Un certainimpression des données examinées) sur Pour cela, ce chercheur dispose de délai est cependant nécessaire pourchaque poste de demandeur. C’est la deux ressources documentaires prin- d’une part mettre en place lessolution retenue aux Pays-Bas. Elle cipales : le site Internet de l’Insee données que le chercheur est autoriséimplique une adaptation de ce logiciel à (www.insee.fr) (ou celui du SSM), à traiter, d’autre part accomplir leschaque configuration des ordinateurs ; riche en informations générales sur la formalités requises par la Commis-elle doit être modifiée lorsque cette source, en données agrégées et qui sion nationale de l’informatique etconfiguration change. met à disposition un fichier individuel des libertés (Cnil). anonymisé d’usage public s’il a étéL a solution r e te nue pa r l’Inse e possible d’en établir un ; le site Inter- Les données disponibles sur le CASDprésente les mêmes fonctionnalités, net du réseau Q u e te le t sont aujourd’hui celles auxquellesmais a l’avantage de n’impliquer (www.reseau-quetelet.cnrs.fr) qui donne accès le comité du secretaucune intervention dans le système donne accès à un dessin de fichier, et statistique, dans sa formation « ména-informatique des établissements de au « FPR » s’il en existe un. ges ». Il s’agit donc d’enquêtes statis-recherche. Elle a été mise au point et tiques auprès des ménages, récentesbrevetée par l’équipe « Organisation Beaucoup de recherches, on l’a dit, ou plus anciennes, y compris ledu système d’information » du Genes peuvent être conduites avec ces recensement de la population. Mais il(Groupe des écoles nationales matériaux d’accès aisé et rapide. Le s’agit aussi de donnéesCourrier des statistiques n° 130, mai 2011 3
  4. 4. Le centre daccès sécurisé aux données de la statistique publique françaiseadministratives déjà mises à la dispo- Phase active : la formation, une « boîte aux lettres » virtuelle àsition de l’Insee ou des SSM au titre de et le travail sur le CASD laquelle il a accès. Ce fichier est bis 7l’article 7 de la loi de 1951 . À titre examiné par des personnes habilitéesd’exemple, les déclarations annuel- Dans les semaines qui suivent son au secret statistique. Elles s’assurentles de données sociales (DADS) figu- autorisation à accéder à certaines que le fichier ne contient pas d’élé-rent dans cette catégorie. D’autres données confidentielles, le chercheur ments pouvant constituer une rupturedonnées peuvent également être est invité par les gestionnaires du du secret statistique. Si tel est le cas,introduites dans l’espace réservé au CASD à participer à une séance dite elles avertissent le chercheur et luiprojet du chercheur sur le CASD, si « d’enrôlement », au cours de demandent de rectifier son fichier deleur utilisation est nécessaire dans le laquelle lui sont rappelés les princi- sortie, afin qu’il soit conforme auxcadre de l’étude pour laquelle il a pes généraux du secret statistique, la règles de la confidentialité. S’il nedemandé l’accès aux informations responsabilité personnelle qui lui comporte aucun élément de nature àconfidentielles. Il peut s’agir par sera confiée et les modalités pratiques dévoiler une information confiden-exemple de données apportées par le d’accès au centre. Ces dernières tielle, il est renvoyé, par simplechercheur lui-même ; elles sont alors consistent en : messagerie, au chercheur.introduites sur le CASD par un agent - l’attribution d’une « SD Box », sihabilité à la gestion du centre. Aujourd’hui, cette vérification est l’organisme dont il dépend n’en est exhaustive sur tous les fichiers de pas encore pourvue ;Comme on l’a vu plus haut, avant de résultats produits dans le CASD dontse connecter, le chercheur doit égale- - l’attribution d’une carte individuelle un chercheur demande la sortie. C’estment avoir accompli les formalités de connexion contenant un code une solution coûteuse, car ellenécessaires auprès de la Cnil : en obtenu par traitement de ses emprein- demande une grande expertise de lagénéral une simple déclaration (pour tes digitales, relevées au cours de part des personnes habilitées. Sonles fichiers ne comportant pas de cette séance. coût augmentera avec celui de ladonnées sensibles), exceptionnelle- fréquentation du centre. Si le nombrement, une demande d’autorisation. Le chercheur peut avoir accès aux de personnes habilitées qui se consa-De son côté, l’Insee effectue progres- fichiers qu’il a demandés, sur la « SD crent à ce contrôle était insuffisant,sivement toutes les formalités auprès Box » qui lui a été attribuée. La recon- cela pourrait de plus entraîner desde la Cnil pour déclarer cette naissance de son identité se fait grâce retards dans le feu vert donné auxnouvelle forme de diffusion de à sa carte et à la reconnaissance de chercheurs. C’est pourquoi on pour-données à caractère personnel. Il ses empreintes digitales par le lecteur rait envisager à l’avenir de n’effectuers’agit de modifier toutes les déclara- intégré à la SD Box. Il faut noter que cette vérification que par sondage.tions (ou demandes d’autorisation) ce dispositif ne comporte aucun stoc- Dans tous les cas, la responsabilité deeffectuées par l’Insee pour les sources kage des empreintes digitales ailleurs la rupture du secret statistique restestatistiques depuis la création de la que sur la carte qui reste en posses- de la responsabilité de celui qui auraitCnil (1978). Ce processus est long et sion du chercheur. produit le fichier fautif. L’absenceplusieurs mois seront encore néces- d’un contrôle exhaustif pourraitsaires avant que toutes les sources Plusieurs chercheurs peuvent être mettre en avant ce point et rappeler leconcernées aient été traitées. Il se inscrits sur un même projet : le dossier chercheur à sa responsabilité person-peut donc que l’accès à certains présenté au comité du secret statis- nelle, alors qu’un contrôle exhaustiffichiers soit temporairement retardé, tique mentionne en ce cas les noms peut lui donner l’illusion (fausse) qu’ille temps que ces formalités se fassent. de tous les chercheurs associés à ce est « couvert » par la vérificationPour diminuer au maximum l’impact projet. Ceux-ci ont alors accès à un effectuée par un tiers.sur les utilisateurs du CASD, l’Insee espace spécifique sur le CASD, dédiécommence évidemment en priorité à leur projet. Le gestionnaire du Lorsque le chercheur a mené sespar les fichiers les plus demandés sur centre y installe les bases de données travaux jusqu’au bout, ce qui doitcelui-ci. qui leur sont spécifiques, et leur ouvre intervenir avant l’expiration de son l’accès aux fichiers de l’Insee ou des habilitation, il en avertit les SSM pour lesquels l’autorisation d’ac- gestionnaires du CASD. Son accès cès leur a été donnée. Personne au CASD est alors coupé. Cepen- d’autre qu’eux n’a accès à cet espace. d a n t, so n e s p a c e d e tr a v a il e s t Ils peuvent également utiliser la large archivé pour une durée de trois ans gamme de logiciels de calcul statis- renouvelable une fois. Cette dispo- tique et d’édition mis à la disposition sition rend possibles les éventuels7. « Sur demande du ministre chargé de l’économie, de tous les chercheurs sur le CASD. « retours vers les données », néces-après avis du Conseil national de l’information statis-tique, et sauf disposition législative contraire, les in- saires après une publication parformations (...) recueillies dans le cadre de sa Lorsque le chercheur a terminé un exemple. Au terme de cettemission, par (...) une personne morale de droit public travail sur les données, il crée un période, tous les fichiers propres au(...) sont cédées, à des fins exclusives d’établissementde statistiques, à l’Insee ou aux services statistiques fichier de résultats (tableaux, projet chercheur et présents sur le CASDministériels. » de publication,...) qu’il glisse dans seront détruits.4 Courrier des statistiques n° 130, mai 2011
  5. 5. Jean-Pierre le Gléau et Jean-François Royer Vers une collaboration accrue Le cas des appariements individuelles sur les entreprises.entre chercheurs et statisticiens Lorsqu’un chercheur a aujourd’hui Les chercheurs ont fréquemment accès à ces données, suite à un avisL’accès à des données individuelles de besoin d’effectuer des appariements du comité du secret statistique, ilsources statistiques pour mener des de données, pour enrichir les informa- obtient ces données sur un CD cryptérecherches est une nécessité pour la tions recueillies lors d’une enquête, qu’il doit conserver pendant unplupart des chercheurs contempo- par des données administratives, ou temps dans des conditions de sécuri-rains. Un premier résultat des progrès issues d’une autre enquête. Cet appa- té garantissant la confidentialité desrécents pour faciliter cet accès - FPR, riement se fait souvent sur un numéro données, puis détruire. On conçoitCASD - doit être une plus grande d’identification (par exemple le NIR facilement que le CASD apporteraprésence et visibilité des données fran- pour les personnes physiques et le des garanties plus solides de ce pointçaises dans des recherches de niveau numéro Sirène pour les personnes de vue.international, qu’elles soient menées morales). Dans certains cas, le cher-par des chercheurs français ou par des cheur pourra mener lui-même cet En 2010, l’accès au CASD était gratuit.chercheurs étrangers habilités. Il faut appariement à l’intérieur du CASD. En effet certains aspects liés à la misepréciser en effet que ni la loi, ni la Dans d’autres cas, ce ne sera pas en route (disponibilité des fichiers,pratique administrative n’interdisent possible, en particulier si c’est le NIR déclaration à la Cnil,...) ont parfoisla communication de ces données à qui est en jeu. Ce numéro, on l’a vu, retardé la mise en œuvre du servicedes chercheurs étrangers : ceux-ci est retiré, s’il existait dans le fichier pour les chercheurs, et il aurait pupeuvent parfaitement s’engager dans initial, au moment de la mise sur le paraître anormal de facturer un servicele processus de demande décrit plus CASD. Si un appariement non faisable qui n’avait pas encore atteint la qualitéhaut. Et le système informatique dans le CASD est cependant néces- voulue. Il est clair cependant que,permet d’installer des « SD Box » en saire, et est autorisé par la Cnil, le cher- au-delà de l’investissement initial, letout lieu. Cependant, l’autorisation ne cheur peut demander à l’Insee de fonctionnement du CASD représentepourra être donnée que si les cher- réaliser cet appariement hors du une charge pour l’institution qui en acheurs concernés donnent toutes les CASD et de mettre le fichier issu de la gestion : gestion des demandes,garanties nécessaires, y compris sur le l’appariement (sans les numéros récupération des fichiers, parfoisplan juridique, en ce qui concerne la d’identification) sur le CASD. Il s’agit anciens, documentation, mise ensanction des ruptures éventuelles du là bien évidemment d’une prestation ligne, formalités Cnil, attributionsecret statistique. spécifique, qui ne peut se faire qu’a- d’une « SD Box », licences pour les vec l’accord du gestionnaire du CASD logiciels, vérification des sorties, etc. ÀUn deuxième résultat de ces progrès et moyennant une facturation du l’avenir, l’accès au CASD devra doncsera une intensification de la colla- service. Le fichier apparié restera sur le couvrir les frais entraînés par ces acti-boration entre statisticiens publics CASD, sans possibilité pour le cher- vités. À ce jour, ni les modalités, ni leet chercheurs autour des sources cheur de le sortir, ni d’en tirer des niveau de cette tarification n’ontstatistiques. Déjà, des formations résultats qui ne respecteraient pas les encore été complètement définis.« sources » sont organisées à l’Insee règles du secret statistique. Ce travailpour les chercheurs bénéficiaires peut aussi bien être effectué sur des Le CASD a été créé à l’Insee, au seindes autorisations : elles sont l’occa- fichiers disponibles sur le centre, qu’a- du Genes, qui en était une compo-sion d’échanges fructueux. Certai- vec un ou des fichiers apportés par le sante. Depuis le 1er janvier 2011, lenes difficultés rencontrées par les chercheur, comme résultats d’une Genes est devenu un établissementc h e r c h e u r s e n c o u r s d e tr a v a il enquête qu’il a lui-même effectuée. public d’enseignement supérieur et dedevront être résolues en faisant recherche, distinct de l’Insee. En ceappel aux producteurs, ce qui qui concerne le CASD, cela a entraî-devrait enrichir la documenta- L’avenir du CASD né le transfert au Genes de tâchestion...et dans certains cas permettre incombant auparavant à l’Insee :de corriger des erreurs. Au fur et à Aujourd’hui, les capacités du CASD habilitation des gestionnaires, trans-mesure que des recherches utilisant sont encore contraintes par les limites fert des fichiers, opérations de vérifica-des données individuelles se en matériel et en personnel qualifié tion en sortie, etc. Le Genes définira,termineront, on attend des cher- nécessaire à son fonctionnement. en son sein, une structure spécifiquecheurs des « retours sur les sources » : Après une inévitable période de de gouvernance pour le CASD. Cesappréciations, critiques, suggestions, rodage, on pourra envisager d’élargir modifications d’ordre administratifetc. Comme beaucoup de ces sources encore les missions qui lui sont attri- n’ont pas eu de conséquences sur l’ac-sont renouvelées périodiquement, ce buées, par exemple en se reposant sur cès au CASD par les chercheurs, pourprocessus peut contribuer fortement à lui également pour la mise à disposi- lesquels cette évolution a été « trans-leur amélioration progressive. tion de fichiers de données parente ». nCourrier des statistiques n° 130, mai 2011 5

×