Gestion des donnees personnelles.

Gestion des données personnelles Lyon-Montréal. 13 Mai 2011 Olivier Ertzscheid // Maître de conférences // Sciences de l’information et de la communication // Université de Nantes // IUT La Roche sur Yon Site : http://www.affordance.info Moteurs et réseaux sociaux Quelle clef de voûte pour une architecture de l’information ?

Le pitch CONSTAT. Le web : un gigantesque entrepôt de données en mouvement. Dont des données « personnelles ». Beaucoup. Les moteurs et les réseaux sociaux s’en nourrissent. Nous les alimentons sans cesse. QUESTIONS. Pourquoi ? D’où viennent ces données ? Comment sont-elles traitées ? Dans quel but ? Comment les « données personnelles » en sont-elles venues à occuper une telle place dans un média de masse numérique ? Que changent-elles dans « les » pratiques documentaires ? Dans nos représentations de la documentation et de l’information ?

1934. Paul Otlet. Traité de documentation. Architecture de l’information = « traitement documentaire »

1978. Le projet SAFARI projet des années 70 d’interconnexion des administrations à partir d’un matricule commun dont le rejet avait été à l’origine de la loi "Informatique, fichiers et libertés" du 6 janvier 1978. http://www.legalis.net/breves-article.php3?id_article=870 INTERCONNEXION

2011. La famille des données documentaires s’agrandit ...

Plus qu’interconnectées, des données réunifiées 1995 2005 2011 Web public Web privé Web « invisible » Web personnel (Desktop) Web intime (Mail) indexé non-indexé Dérive des continents documentaires, des « gisements de données » Web public Web privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs) Web public Web privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs)

ARCHITECTURE DE L’INFORMATION

Architecture ? « L’architecture, c’est ce qui reste de l’édifice, une fois la pierre ôtée. » Plotin.

Architecture de l’information ? « L’architecture de l’information, c’est ce qui reste une fois l’information ôtée. » du système de la navigation de la recherche de l’infrastructure des données

Archi de l’info selon Google Une architecture de serveurs (datacenters) Une architecture de pages (PageRank) Une architecture de relations (liens entre les pages) Lectures industrielles Ecosystème ouvert (galaxie de services) et entonnoir central Une indexation d’info documentaires + ingénierie « de popularité » (procède par agglutination) Archi de l’info selon Facebook Une architecture de serveurs (datacenters) Une architecture de profils (graphe social) Une architecture de relations (liens entre les profils) Industrialisation de l’intime Ecosystème fermé avec droit de douanes pour services tiers. Une collecte d’informations personnelles déclaratives + ingénierie virale (procède par contamination) 2 écoles ? Similarités Différences

Degré zéro de l’architecture de l’info Navigation Données Serveurs & Datacenters Services

Architecture de l’info 1.0 Architecture de l’info 2.0 Le portail du visible La clé vers l’invisible Données Données ???

Architecture de l’info 2.0 Navigation Datacenters Serveurs

Architecture de l’info 2.0 Services Services Services

Architecture de l’info 2.0 Données Données Données Données

Architecture de l’information Entre design ... (services, navigation, etc.) Et industrie lourde (infrastructures, datacenters, gisements de données etc.)

Design visible Ravalement de façade Logos (colorés), Coins (arrondis), Couleurs (pastels), Polices (typos), etc. Design invisible Ergonomie « souterraine » Rich snippets, Microformats, RDF Web-Services Web socio-sémantique Expérience utilisateur. Clic gagnant + LOOK... and ... FEEL

Design de données (exemples) « Journalisme de données » http://data.owni.fr Générateur de visualisations. http://www-958.ibm.com/software/data/cognos/manyeyes/ Nouvelle(s) expérience(s) documentaire(s)

Fouille de données : du datamining au web-mining Mr Google Mr Facebook données Privacy zone

Les nouvelles mines sont ... dans les nuages

Données sont aussi des métadonnées Géolocalisation sur Foursquare + partage dans Facebook Données : latitude, longitude, horaire, nom du bar lounge. Métadonnées : comportementales Recherche d’info sur Google Ma requête sur Google = donnée « mot-clé » Toutes mes requêtes sur Google (historique) = métadonnées documentaires Question de point de vue

Avant, pendant, après. Des données sur tout. Des données partout. Des données pour tout. A. Mes données et leur historique (déclaratives, comport. et techniques) B. Les données de mes proches Couche Ingénieries relationnelles C. Les données de tout le monde Passage à l’échelle (statistique) Mes données et celles de mes proches (A and B) Mes données ou celles de mes proches et celles de tout le monde (A or B) and C Mes données et celles de tout le monde (A and C) Les données de mes proches et celles de tout le monde (B and C) Sur un site marchand AMAZON.COM Données « natives » « intentions d’achat », « préférences » Sur un site social FACEBOOK.COM Données « captives » Rétention « amis, groupes, réseaux » Dans 1 écosystème ouvert de sites GOOGLE / YOUTUBE / GMAIL Données natives et « moissonnées » Que possèdent-ils ?? Des données Qu’en font-ils ?? Des croisements Comment procèdent-ils ?? Par captation Que produisent-ils ? D’autres données, de la richesse et de la redocumentarisation

« Données » 1. Documents d’identité

2. Documenter l’identité « Information »

3. « Redocumentariser » l’identité « Redocumentariser, c’est documentariser à nouveau un document ou une collection en permettant à un bénéficiaire de réarticuler les contenus sémiotiques selon son interprétation et ses usages. » Manuel Zacklad in « Eléments théoriques pour l’étude des pratiques grand public de la documentarisation : réseaux et communautés d’imaginaire » « connaissances »

Redocumentarisation par l’exemple : Facebook EST L’interface « 1 » identité documentée documentaire « n » profils « x » profondeurs

Données personnelles ? DES DONNEES « Ensemble des informations qui permettent sous quelque forme que ce soit, directement ou non, l’identification des personnes physiques auxquelles elles se rapportent ». DES TRAITEMENTS « toute opération ou ensemble d’opérations portant sur des données à caractère personnel, quel que soit le procédé utilisé ». Collecte, enregistrement, conservation, adaptation, modification, extraction, consultation, utilisation, communication par transmission, diffusion ou toute autre forme de mise à disposition, le rapprochement ou l’interconnexion, ainsi que le verrouillage, l’effacement ou la destruction » Lionel MAUREL Techniques : Adresse IP, Cookies ... Déclaratives : mon profil facebook, date de naissance ... Navigationnelles : requêtes, types d’achats ... Comportementales (diachroniques) : historique de recherche

C’est la loi INFORMATION. La loi impose d’informer les personnes « fichées » que des données nominatives les concernant sont collectées DROIT DE RETRAIT. NON-DIVULGATION À DES TIERS. DATE LIMITE DE VALIDITÉ . SOURCE : LIONEL MAUREL C’est le business Pot de terre des législations nationales contre ... (jack)pot de fer de la dérégulation des marchés

Fichiers « log » A chaque fois qu’un utilisateur se connecte, le serveur enregistre un log. 123.45.67.89 - 25/Mar/2007 10:15:32 - http://www.google.com/search?q=flowers - Firefox 2.0.0.7; Windows NT 5.1 - dac465aa86edd2dc « This idea that a cookie is nonpersonal information no longer really applies in this digital age. You don't need to know a person's name to know a person — to understand their likes and their dislikes, the contents of what they read, what they put in their shopping cart. It's really personal now. » Jeff Chester, directeur exécutif du Center for Digital Democracy Personna numerique VS DATA COOKIES De 2003 à 2005, Google cookie expirant en 2038 ... Préconisations G29 (rassemblement CNIL européennes) : 6 mois Google : Adresse IP « anonymisée » au bout de 9 mois (2 derniers chiffres seulement) Cookies supprimés au bout de 18 mois Microsoft : cookies supprimés au bout de 6 mois Petites machineries entre amis.

Pacte Faustien ?? Pourquoi cette quête de données personnelles ? Pour lutter contre l’infobésité (personnalisation) Pour maintenir un modèle économique (marketing ciblé, pub. contextuelle) Pour améliorer l’expérience utilisateur (personnalisation)

Participation active ... et massive !!!

Base de donnée des intentions (John Battelle) « We don’t need taxonomy of knowledge. We need taxonomy of desire, a marketplace of intent » Prabhakar Raghavan. Head of Research and Strategy chez Yahoo! Sept. 2008

Le carré magique des usages SHOPPING (digital cameras) HEALTH (Diabetes) TRAVEL (United 875) LOCAL (French Restaurant)

Recherche Universelle : le principe

Données « personnelles, sociales » (mes amis, mes amours, mes emmerdes) ? Territoires de socialisation Données intentionnelles (achat, déplacement, sorties, restaurant) ? Territoire du marketing Données documentaires (textes, statuts, articles, photos, vidéos, tags ...) ? Territoire de la qualification La guerre des données ?

La guerre des carnets d’adresses Mais d’abord une devinette. Bataille Google / Facebook. Enjeu : amorçage. Résultat : [email_address] Courriel = cheval de troie idéal de nos pratiques connectées. Pourquoi ? "synthétise" notre réseau relationnel (nos "contacts"), point d'entrée le plus aisé vers le cloud computing "intime", "personnel » (pub contextuelle) point pivot autour duquel hiérarchiser l'ensemble des autres données

3 ème exemple. Le cas Facebook

Facebook privacy policy timeline (cf http://www.eff.org/deeplinks/2010/04/facebook-timeline/) « No personal information that you submit to Thefacebook will be available to any user of the Web Site who does not belong to at least one of the groups specified by you in your privacy settings » 2 0 0 5 « Moi et les miens »

We understand you may not want everyone in the world to have the information you share on Facebook; that is why we give you control of your information. Our default privacy settings limit the information displayed in your profile to your school, your specified local area, and other reasonable community limitations that we tell you about. 2 0 0 6 Moi et ma communauté étendue Privauté « par défaut » 2 0 0 7 Profile information you submit to Facebook will be available to users of Facebook who belong to at least one of the networks you allow to access the information through your privacy settings (e.g., school, geography, friends of friends). Your name, school name, and profile picture thumbnail will be available in search results across the Facebook network unless you alter your privacy settings . Arrivée du « search » Arrivée de l’opt-out

Certain categories of information such as your name, profile photo, list of friends and pages you are a fan of , gender, geographic region, and networks you belong to are considered publicly available to everyone, including Facebook-enhanced applications, and therefore do not have privacy settings. Information set to “everyone” is publicly available information, may be accessed by everyone on the Internet (including people not logged into Facebook), is subject to indexing by third party search engines, may be associated with you outside of Facebook (such as when you visit other sites on the internet), and may be imported and exported by us and others without privacy limitations. The default privacy setting for certain types of information you post on Facebook is set to “everyone. ” You can review and change the default settings in your privacy settings Nov. 2 0 0 9 Abolition de la frontière « plateforme » Opt-out systématique et étendu Abolition pure et simple de la privauté « profilaire », « identitaire » Déc. 2 0 0 9

L’illusion de la page blanche

Mon nom est personne Personnalisation : « Invisible » « Persistante » « Participative » Pour l’individu

Une « universalité » très très très « personnalisée » ALGORITHMIE AMBIANTE Pour « la société »

Facebook comme nouveau panopticon. Surveillance ET sous-veillance. LITTLE SISTERS Pour les « communautés »

Cocktail explosif Personnalisation + « universalité » des recherches + Migration dans les nuages + Massification (des accès) + Communautarisation (des pratiques) + Économie de l’attention + Confusion des pratiques = Pour les enjeux documentaires

Ce que l’on savait déjà : Explosion de la masse documentaire Ce que l’on ne savait pas : Bombe à fragmentation Fragmentation Des documents (world wide web) Des usages Des synchronicités (world life web) Des modalités de diffusion, d’appropriation, d’édition … BOUM ! Pour les enjeux documentaires

Moteur de recherche « de voisinage » Everyblock.com / http://chicago.everyblock.com/news/ Adresse / numéro de sécurité sociale / historique déménagements et changements d'adresse depuis 10 ans / Date de naissance / Casier judiciaire / Diverses amendes / Dates mariages et divorces / le nom et n° tél voisins / Montant du bien immobilier qu'il possède (sa maison), sa date d'achat et le nom de celui qui lui a vendu / la taille du "lot" ( cadastre ) sur lequel elle (sa maison) est implantée / une vue satellite de chez lui / Âge moyen des femmes et des hommes habitant dans son voisinage / Nombre de meurtres , de viols, de vols de véhicule et autres larcins dans son quartier / Composition ethnique du quartier / Niveau d'éducation et les langues parlées / les permis qu'il possède (permis de conduire mais aussi permis bateau, avion, moto, etc ...)

http://www.Intelius.com "Nous cherchons dans des milliards de données publiques pour vous aider à trouver ce que vous cherchez. Nous analysons des listes de vente, des commandes sur catalogue, des abonnements à des magazines, des enregistrements d'adresse, des enregistrements de propriété immobilière, des arrêts de cour (...) et toute une série d'autres enregistrements publics et de sources publiques pour vous ."

CONCLUSION 1 constat. 1 morale. 2 questions. 3 conseils.

Changement de perspective information connaissance Documents individus DONNÉES " nous sommes en train de passer d'un web de documents connectés à un web de données connectées. " John Markoff. NY Times. 12 No. 2006 http://www.nytimes.com/2006/11/12/business/12web.html DONNÉES Traitement documentaire Traitement computationnel

Moralité ? Pour les moteurs … Pour les réseaux sociaux « un document » Indexable, cherchable, Profilable, « monétisable » …

« L’antilope qui court dans les plaines d’Afrique ne peut être considérée comme un document…» « Mais si elle est capturée… et devient un objet d’études, on la considère alors comme un document. Elle devient une preuve physique. » Suzanne Briet

Quelle clé de voûte pour l’architecture de l’information ? ?

requêtes profils usages Documents informations Individus d o n n é e s d o n n é e s d o n n é e s d o n n é e s d o n n é e s d o n n é e s d o n n é e s d o n n é e s d o n n é e s

Quel écosystème informationnel ? Indexation Mer des pratiques Moteurs & réseaux sociaux Monétisation Océan des données Collaboration, participation, User Generated Content Résultats Technologies de la capillarité Comportements, profils Moteurs & réseaux sociaux

« Quand la technologie devient l’architecte de notre intimité ». Hubert Guillaud in Internet Actu. En ligne : http://www.internetactu.net/2011/01/19/quand-la-technologie-devient-larchitecte-de-notre-intimite/ « Scroogled » de Cory Doctorow. Trad. Française « Engooglés » Et 2 conseils de lecture Le mien Le web, TOUT le web, est un espace public. AUCUNE « intimité » n’y est possible. Au mieux peut-on espérer quelques infimes zones de privauté sur quelques parcelles d’espace semi-publics.

.Merci. .?. questions .?. questions .?. SAV : olivier.ertzscheid AT gmail.com

Gestion des donnees personnelles.

Contenu connexe

Tendances

En vedette

Similaire à Gestion des donnees personnelles.

Plus de olivier

Dernier

Gestion des donnees personnelles.

Notes de l'éditeur