SlideShare une entreprise Scribd logo
Outils de recherche du web : approfondir Google   Stage URFIST de Rennes 18 mai 2010 Animé par Marie-Laure Malingre
PLAN 1ère partie : Mieux connaître Google pour mieux le questionner :  Repères historiques, économiques, techniques… sur la puissance de Google Fonctionnement technique Stratégie et innovations récentes Google et les données personnelles Questionnements critiques 2ème partie : Mieux exploiter les fonctionnalités et services de Google
1.1 Quelques ressources sur Google Annuaire spécialisé :   Google ’  World Blogs :  The  Official  Google   Blog Zorgloob  :  2004  Google  XXL  :  mai 2007   Blog  du MIP sur l’innovation et sur  Google :  janvier 2009 Sites spécialisés :  WebRankInfo  :  dossiers sur  Google Livres : Ippolita.  La face cachée de  Google , Payot, 2008 L’Entonnoir.  Google  sous la loupe ..  C&F Diaporamas : FaberNovel. Tout  savoir de  Google Voir aussi la  Sélection de ressources sur les outils de recherche  de l’URFIST de Rennes
1.2 Repères chronologiques Origines :   1996  : projet de recherche  BackRub,  de  Sergey Brin  et  Larry Page  (en PhD à Stanford) : méthode d'analyse des liens pointant vers un site web.  Naissance  le 7 septembre  1998 , à Stanford, de la start-up Google Le nom : dérivé du mot  « googol  » , nombre gigantesque (un 1 suivi de 100 zéros...).  Contexte  : recherche d’information dominée par Alta Vista, Yahoo, HotBot, Lycos… Quelques étapes :   1999  : de 500 000 à  3 millions requêtes par jour 2000  : premières publicités contextuelles, moteur de recherche le plus complet au monde :  un demi-milliard de pages Web ;  déjà  100 millions de requêtes par jour 2001  : Rachat de  Deja.com  et de l'archivage de Usenet, création de  Google Groups ;  lancement de  Images Search;  indexation de  nouveaux formats de fichiers  sensibles (.doc; .xls, .ppt...) Fin 2001  :  3 milliards de pages
1.2 Repères chronologiques 2002  :  Lancement du modèle publicitaire des  AdWords ;  lancement officiel de  Google News , indexant plus de 4000 sites de médias ; Fin 2002 :  250 millions de requêtes journalières 2003  : Rachat de plusieurs sociétés  :   Applied Semantics  : technologie de mots-clés Blogger  : édition de blogs Sprinks  : publicité contextuelle Programme publicitaire  AdSense 2004 :  Recherche localisée avec  Google Local .  Gmail , service de webmail gratuit  Introduction en Bourse,  envolée boursière Picasa , gestion des photos numériques Google Desktop , indexation des disques durs  Novembre  : doublement de l’index : de  4,3 milliards à 8,1 millards de pages Google Scholar http:// www.journaldunet.com/dossiers/google/historique.shtml
1.2 Repères chronologiques 2005  : Lancement de : Google Video, Google Maps, Google Earth, Google Talk Annonce de  Google Print  et de la numérisation des livres Recrutement de  Vinton Cerf , l’un des « pères d’Internet » Augmentation de l’action Google de  117 % en un an Fin 2005 : 1 milliard de requêtes journalières ! 2006  :   Lancement de Google.cn en Chine, avec  une  censure des résultats Rachat de  Writely , qui deviendra  Google Docs & Spreadsheets  en octobre Lancement de plusieurs applications :  Google Calendar, Co-Op, Trends, Apps... Septembre  :  procès et condamnation de Google Belgique  face aux éditeurs de presse belges Automne  :  Google News Archives , rachat de   You Tube
1.2 Repères chronologiques 2007 :  Rachat de  DoubleClick , pour  $ 3,1 Mds  ;  Juin  : lancement de la recherche universelle Août  : extension de  Google Earth  au ciel avec  Google Sky Automne  : 1 million de livres numérisés, 27 partenaires pour  Google Books 2008 :   Mars  : annonce de  Google Health , le dossier médical personnel en ligne Juin : partenariat avec Yahoo  pour le partage du marché publicitaire Juillet :  Google à  70 % du trafic aux USA ,  82 % en France  (cf  Abondance )  Septembre  : lancement du navigateur  Google   Chrome,  et de  GAUDI ,  portail de recherche audio Pour une chronologie détaillée, voir  Google  10th  Birthday
1.2 Repères chronologiques 2009 :  Janvier  : Google connaît la crise : licenciements, fermetures… Février  : lancement de  Google Latitude , service de géolocalisation sur téléphone mobile Mai  : lancement de  Google   Wave , plateforme centralisée de communication (cf  Zorgloob ) Août  : annonce de  négociation entre Google et la BNF  pour la numérisation des fonds  Septembre  : lancement de  SideWiki Octobre  :  Partenariat avec  Twitter , indexation des tweets Recherche en temps réel : Twitter, Facebook,MySpace, FrienFeed, Jaiku lancement de  Google  Social  Search ,  moteur de recherche social Novembre  :  Google Street View au Mexique , 15ème pays couvert (sur 33) Lancement de  Google DashBoard Accord Google-éditeurs américains
1.2 Repères chronologiques Quelques événements depuis le début 2010 :  Lancement de  Google Buzz Brevet de Google  sur l’indexation basée sur l’analyse de phrase Lancement de Jazz , une nouvelle interface pour la page de résultats Extension de Google Street View tout le Royaume Uni ; nouvelles vues au Japon et aux Pays-Bas ; Norvège, Finlande, Danemark, Suède ; premiers clichés de Macao et Hong-Kong; accord trouvé avec la Suisse Fin de  Search Wiki /  intégration avec Google Bookmarks Google comme FAI  (fibrer  entre 50 000 et 500 000 foyers américains) Google reader :  création de flux RSS à la volée Google Docs :  envoi et partage de n’importe quel type de fichier 3D sur  Google Maps + Google Places
1.3 Gigantisme de Google Puissance de Google :  Position monopolistique Stratégie de puissance Tous les domaines investis par « l’ogre de Mountain View », « le maître de l’internet  » De multiples positionnements (Applications / Services + maîtrise des aspects réseaux) Moteur, FAI, Constructeur, Editeur, Navigateur, Plateforme de services, Média … Plateforme complète d’accès à l’information Mais décisions récentes :  Abandon d’applications non totalement satisfaisantes Recentrage sur la recherche
1.3 Gigantisme de Google Google Puissance technique Puissance politique Puissance humaine Puissance d’innovation Puissance économique Puissance financière
1.3 Gigantisme de Google : puissance financière Evolution des revenus Google de 2005 à T1 2010  selon  WebRankInfo
1.3 Gigantisme de Google : puissance financière Un poids financier considérable : Des résultats financiers toujours positifs 1er trimestre 2010  :  6,7 Mrds $  de revenus ( 5,9  Mrds $  au T4 2009) Augmentation de  23 %  par rapport au même trimestre en 2009 Des réserves de trésorerie au plus haut  26,5 Mrds $ au 31/03/2010  (+2Mds depuis fin 2009) Quelques signes d’essoufflement ? Ralentissement de sa croissance Fluctuations de l’action Google (-13% depuis le début de l’année) Une présence forte Liste des acquisitions  / Dossier WebRankinfo Derniers chiffres Google
1.3 Gigantisme de Google : puissance financière Adwords Emplacements publicitaires dans les pages de résultats  de Google, avec des liens vers les sites annonceurs, en fonction des mots clés saisis par l’internaute et achetés par l’annonceur. Revenus Adwords / 1er trimestre 2010 4 Mrds $  =  65,5 %  des revenus Adsense   Liens publicitaires sur des sites affiliés à Google  et choisis automatiquement en fonction du contenu et du contexte de la page + des requêtes Revenus Adsense / 1er trimestre 2010 2,04 Mrds $  =  30,1%  des revenus Google n° 1 mondial des liens sponsorisés Chiffres 1er trimestre 2010 : Publicité =  95,6%  de son CA  Extension à de nouveaux modules (News, Maps, vidéos  YouTube…)  et développement de la publicité hors web
1.3 Gigantisme de Google : puissance humaine Puissance humaine : 20 621 employés à temps plein  contre 19 665 au 30/09/2009 et 15916 en septembre 2007  Suppression de postes réduction du rythme des embauches en 2009  Orientation vers un recrutement ciblé et ajusté
1.3 Gigantisme de Google : puissance économique USA : Parts de visite Google.com  :  65,1  % en mars 2010 (source :  Comscore ) France : Parts de visite pour   Google.fr  :  90,2 %  en avril 2010 (source :  Baromètre  Xiti ) Place de Google sur le marché des moteurs
1.3 Gigantisme de Google :  domination des usages Fréquentation de Google  Large prédominance de l’usage de Google Croissance régulière des requêtes effectuées sur Google environ 500 millions de visiteurs uniques  mensuels sur l'ensemble des sites de Google  au moins  2,5 milliards de requêtes par jour  sur l'ensemble des sites de Google (juillet 2009) En Europe,  8 requêtes sur 10  passent par Google Source :  WebRankinfo
1.3 Gigantisme de Google :  domination des usages Source :   http:// www.accessoweb.com / Etc . Google : l’outil universel Voir aussi :  Google , produits et chiffres en une seule image
1.3 Gigantisme de Google :  puissance d’innovation Nombreux projets de recherche, tous azimuts  171 produits et services  Google, un acteur protéiforme : Fournisseur d’applications Web Google App Engine  : création d’un espace dédié pour la mise en ligne d’applications web Opérateur de téléphonie mobile :  22 octobre 2008 : sortie de G1, 1er   Google phone Androïd Acteur dans le domaine satellitaire, de la cartograpie et de la géolocalisation Google Maps, Street View satellites de Google  Google et la santé : Google Health  :  Service de recherche spécialisé en Santé Cartographie du génome humain Google éditeur de  logiciels  : Voir  Google Pack G oogle Google constructeur d’ordinateurs, de système d’exploitation et de langage de programmation … Question de la nature de Google : Moteur de recherche, média,   et plus...
1.3 Gigantisme de Google :  puissance d’innovation GOOGLE Bureautique Téléphonie Réseaux sociaux Publicité Cartographie Recherche d’information  / veille Navigation web Bibliothèques numériques E-commerce Création de contenus web Voir à ce sujet  Wikipedia  et  WebRankinfo Personnalisation Analyse et statistiques web Système d’exploitation Logiciels
1.3 Gigantisme de Google :  puissance technique  Rôle-clé de l’infrastructure technique chez Google :   Quantités gigantesques de données à traiter :   Index de plusieurs centaines de milliards de pages ... Nécessité de :   Capacité de stockage  : >  850 téraoctets Puissance de calcul  :  600 teraflops  (10 fois plus que Columbia, l'ordinateur le plus puissant de la NASA)   Solution adoptée :   “ Racks” de 88 ordinateurs plutôt que des gros serveurs Au total : plus de deux millions de machines Les  Google Data Centers  :   Regroupement des milliers d’ordinateurs hébergeant l’index de Google dans des centres de données  Plus de 60   Data Centers , pour la plupart aux USA et en Europe Voir  Chiffres-clé sur  WebRankInfo
1.4 Repères techniques :  le référencement Deux modes de référencement :  Automatiquement :  Attendre le passage du robot  Google Bot Manuellement :  Remplir le formulaire  d’envoi de contenu  Toujours bien veiller au référencement Quelques règles simples :  Soigner le  titre des pages  (balise Title) Présence de nombreux liens externes de qualité Mises  à jour régulières Mots-clés dans les URL …  (voir sur  WebRankinfo )
1.4 Repères techniques :  le robot collecteur, Google Bot  Le robot  GoogleBot : Visite les pages web signalées ou non Délais : entre 12 h et 1 mois, selon le nombre de liens vers la page Suivi des liens Première analyse de la page : mots, balises HTML… « Prime de fraîcheur » : apparition sur Google mais pas encore de PageRank Voir  Le  système  de crawl... Fréquence des visites de GoogleBot :   Selon le  PageRank  de la page Le cache de Google  :  Après chaque collecte et indexation de document, version du document stockée sur les milliers de serveurs : Version cache  du document Correspond à la version du document au moment du passage du robot
1.4 Repères techniques :  le classement, le PageRank Nombreux critères de classement   Texte, balises, URL… Le  PageRank  :   Calcul des liens entrants et sortants Calcul de l’indice de popularité de la page http:// www.webrankinfo.com/google/pagerank/pagerank.php Classement des pages par combinaison de plusieurs facteurs  Deux niveaux de pondération :  1ère pondération plus forte :   des « pages pivots » : listes de liens, sélections de ressources… des « pages de référence »: pages recevant de nombreux liens 2ème pondération plus forte:   des pages de référence fréquemment citées par pages pivots Mais PR n’est pas le seul critère de classement Opacité des critères réels de classement
1.4 Repères techniques :  la  Google Dance La  Google Dance  :   Mise à jour du PageRank de l’ensemble des pages de l’index de Google Période de mise à jour ( Google Update ) durant plusieurs jours Après calcul des nouveaux PageRank, distribution de l’index sur les milliers de serveurs Pendant cette période, variation possible du PageRank d’une page :  C’est la  Google Dance...   Rythme mensuel, puis trimestriel ; plus irrégulier depuis 2006  La dernière Google Dance et le dernier PageRank :  Calcul des BackLinks (liens entrants) et établissement d’un palmarès des sites ayant un PR (PageRank) de 10  http://www.pr10.fr/google_dance_derniere.htm
1.4 Repères techniques :  l’infrastructure technique Schéma des serveurs de Google utilisés pour répondre aux requêtes (source :  WebRankInfo )  Voir aussi sur Google :  Cycle de vie d’une recherche
1.4 Repères techniques :  le classement des résultats Comment Google classe ses résultats ?  D’abord, constitution d’une liste des pages indexées par Google contenant les mots recherchés.  Ensuite,  tri des pages  selon une série de critères : valeur du PageRank  :  PR : établi de 1 à 10 PR <2 : « mauvais »  PR 4-5 : « bon » PR 6-7 : « très bon » PR 8-10 : « excellent » correspondance entre les mots  recherchés et le  titre  (balise <TITLE>) correspondance entre les mots  recherchés et les  textes de liens  (textes entre les balises <A> et </A>)  correspondance entre les mots  recherchés et les  titres de paragraphes  (balises <H1> à <H6>)  correspondance entre les mots  recherchés et le  texte  de la page  (D’après  WebRankInfo  )
1.4 Repères techniques :  évolutions en cours Projet Google Caffeine  :  Nouvelle architecture technique pour le crawl et l’indexation En beta test depuis août 2009 Objectifs : Améliorer vitesse de collecte, d’indexation des documents, d’affichage des résultats… Reposerait sur les technologies de « cloud computing » Lancement en décembre 09 (sur un seul Data Center, 50% du temps) Déploiement à venir Voir articles :  L.  Bourrelly   O. Andrieu
1.5 Stratégies...: Google, maître des images ? Chercher des images (juin 2001) :  Google Images  Plusieurs milliards d’images indexées Enjeux énormes de la recherche d’images : plus de 100 milliards d’images produites chaque année, déferlement des images sur le web, concurrence acharnée des grands moteurs...  Google Images : 2ème service de Google le plus utilisé au monde (10 % environ) Croissance de 35 % entre 2006 et 2007 Problème des droits d’auteur Différents formats de fichiers Innovations Filtrage sur visages, actualités, taille, formats, couleurs ... Image  Swirl  et  Wonder Wheel : regroupement d’images par similarité
1.5 Stratégies...: Google, nouveau navigateur, nouvel acteur de  téléphonie ? Google  Chrome   : Le navigateur de Google + applications web hors navigateur  Lancé en septembre 2008 Code source sous licence libre Moteur WebKit Réactions : Bilan contrasté des premières utilisations Big browser / Big Brother Nouveauté : scripts GreaseMonkey / Firefox Google Phone  : « ordinateur de poche communicant » Lancement du 1er google phone Technologie Android = système ouvert proposé par Google Constructeur taïwanais HTC Développement de programmes Services : Moteur, Google Maps et Street View, Gmail … Concurrent d’Apple, Nokia …
1.5 Stratégies...: Google, nouveau réseau social ? L’offensive de Google dans les réseaux sociaux : le projet OpenSocial  Jusque là,  5ème place  de Google dans le monde des réseaux sociaux OpenSocial  lancé en nov. 2007  / OpenSocial Foundation Ensemble d’interfaces de programmation : Regroupe API communes permettant le développement d’applications web pour sites partenaires (réseaux sociaux et  sites communautaires) A la base :  Orkut + sites partenaires du projet  (Xing, Friendster, Hi5, LinkedIn, mySpace …) Evolution   Fin 2007 : ralliement de MySpace ; soutien de Viadeo et Xing Mars 08 : Yahoo rejoint OpenSocial Introduction de la “barre sociale” Développement d’un moteur de recherche social :  Google Social Search
1.5 Stratégies... : Google, nouveau ministère de la santé ?  Google   Health Lancé sur Google.com Création de profils de santé personnels Téléchargement de rapports médicaux depuis le cabinet médical ou la pharmacie Conseils et informations Recherche de médecins et services Partage d’informations Les questions posées par Google Health Sécurité des données médicales personnelles Nécessité de normalisation dans la saisie des données médicales Pratique des médecins par rapport à Google ? Projet d’extension à d’autres pays
1.5 Stratégies...: Google, première agence de presse mondiale ? Google News ( Actualités )  :  Créé  à la suite du 11/09/01, l ancé en  mars 2002 Diffusion en continu d’infos sur l’actualité  Sélection de  25 000 sources  d’information (avec les archives) Plus de 40 versions nationales de Google News Automatisation complète Collecte et analyse de chaque source par un robot spécial Classement automatique des informations dans des rubriques prédéfinies  Récemment sur Google News, recherche locale, catégories personnalisées Nombreux conflits :  Avec les agences de presse, les journaux... Problème récent :  affichage  de  publicités  sur Google News ;  réticences  des  éditeurs   de presse
1.5 Stratégies...: Google, bibliothèque numérique mondiale ?   Du projet BackRub à Google Books 2004 : Google Livres, service en ligne permettant d’accéder à des livres numérisés Deux volets du projet :   Projet Bibliothèques  : (Google Library) Programme Partenaires / Editeurs  : mise en ligne d’extraits d’ouvrages et promotion auprès de librairies en ligne (Google Print) Mais un seul programme de numérisation “ Le service Google Recherche de Livres s’inscrit dans notre travail d’organisation des informations mondiales, afin de les rendres universellement accessibles et utiles .”  (Jens Redmer, 2007) Marché de l’information  versus  Bibliothèque universelle Débat autour de la numérisation et de la constitution de collections numériques par Google :  position dominante de Google dans l’économie des contenus en ligne / qualité de la numérisation Droits d’auteur et actions des éditeurs  (renversement par Google de la logique du copyright)
1.5 Stratégies...: Google, bibliothèque numérique mondiale ? Où en est-on aujourd’hui ? La collection Environ 12 millions de titres aujourd’hui  : Livres + Magazines Livres  en librairie et sous droits d’auteur Livres sous droits d’auteurs mais épuisés Livres non soumis au copyright Registre des droits du livre Accords avec de nombreuses bibliothèques  universitaires et publiques américaines et européennes En France : BM de Lyon, BNF (en cours de négociation)  Le contentieux avec les éditeurs / numérisation Recours collectif engagé en 2005 (Author’s Guild, AAP) / Open Book Alliance Accord présenté le 13/11/2009 entre Google et les éditeurs anglo-saxons  Protestation du SNE En France : le 18 décembre, La Martinière / Le Seuil gagne son procès contre Google ; appel de Google La question des relations BNF / Google et le Conseil du Livre du 22/03 Et maintenant , la librairie Google… cet été
1.5 Stratégies...: Google, premier portail scientifique mondial ? Lancement de  Google Scholar  en novembre 2004 Indexation de littérature scientifique mondiale :  Livres, articles, textes sur archives ouvertes, préprints, bases de données bibliographiques… Orientation stratégique  de Google :  Devenir guichet d’accès à l’IST Concurrent direct d'Elsevier (Scopus) Nombreux partenariats :  universités   nord-américaines  éditeurs scientifiques américains bibliothèques :  Catalogue O CLC : Open WorldCat Sudoc 150 bibliothèques   INIST    Google comme premier point d’accès à l’IST française
1.5 Stratégies...: Google, portail scientifique mondial ? Stratégie de Google  :   « guichet universel » pour la science grand catalogue mondial   Succès de Google Scholar :   Très bon accueil  dans les universités Ancrage dans les bibliothèques  anglo-saxonnes, et européennes :  Initiative Library Links Rivalité avec l’ISI :  Même nombre de citations que l’ISI Intérêt de Google Scholar :   Accès gratuit  à l’IST, même en référence secondaire Valorisation et visibilité des AO Intérêt des citations Visibilité des chercheurs Pas de publicité Problèmes posés : Situation dangereuse de monopole d’accès Gratuité pour le moment , mais jusqu’à quand ? Effets pervers de l’indice de popularité Opacité du corpus
1.5 Stratégies...: Google, portail juridique mondial ? Nouveauté sur Google Scholar (17/11) : Accès à l’ensemble de la jurisprudence américaine  :  décisions de justice des tribunaux d’Etats, des cours fédérales et de la Cour Suprême américaine Bouton à cocher : «  Legal  opinions  and   journals  »  Projet d’extension à tous les pays anglo-saxons  Positionnement fort sur le terrain de l’information juridique :  Concurrence avec Lexis/Nexis ? Google : « service public d’accès au droit » ?  Monétisation des accès par la publicité Poursuite de stratégie d’omniprésence de Google sur tous les champs de l’écrit Recherche parmi les publications de brevets
1.5 Stratégies...: Google, premier éducateur mondial ? Literacy Project   Lutter contre l’analphabétisme  (septembre 2006)  Diffusion de contenus favorisant le développement de la lecture et de l’éducation: Coopération  : soutien de campagnes, projets Livres, vidéos, articles scientifiques, LitCam, blogs... Partenariat Google / UNESCO / LitCam Site en  français La  journée   mondiale   du   livre  avec le Literacy Project  (avril 2008) Google Apps Education   = outils gratuits de communication, de collaboration et de publication Développement dans l’enseignement supérieur 1er établissement français : Portail My Esc Lille :  http:// partnerpage.google.com / esc-lille.fr Moteur de recherche, Google Docs, Google Talk, Google Agenda, Gmail… Dans de nombreuses universités de par le monde Le Tout-Google  ?
1.5 Stratégies...: Google, premier office du tourisme mondial ? Google Street View Initiative lancée en 2007 Option créée sous Google Maps  Visualisation des villes en 3D via Google Maps et Google Earth Selon Google : > 293 téra-octets de données pour la France !  Succès considérable  Développement  de Street View :  Google Street View disponible pour 20 pays Au total,  33 pays concernés  (mars 09)  Le dernier en vue : la Croatie Dans les  villes françaises  : Exemple à  Rennes Conflits :  le dernier sur la captation de données d’identification sur les réseaux Wifi Google Latitude, outil de « géolocalisation sociale »
1.5 Stratégies...: Google, cartographe de l’univers ? Google explore l’univers : les innovations liées à la cartographie et la géolocalisation Après  Google   Sky ,  Moon  et  Mars ,  Google Ocean : Projet en cours d’élaboration Module d’exploration des fonds marins en 3 dimensions Exploration de la topographie des sols marins Ajout d’autres paramètres : températures, emplacement des épaves… Moyens : cartographie des fonds marins, ou du moins mise à disposition des images déjà disponibles Données issues de Google Maps, de laboratoires d’universités,  d’instituts de recherche océanographique
1.6 Google et nous «  Nous n’en savons pas assez sur vous  », Eric Schmidt, PDG de Google Google, nouveau Big brother ? La conservation des données personnelles Les efforts de transparence et leurs limites Google, nouveau panopticon ? Street et le droit à l’image
1.6.1 Google, “big brother” mondial ?  Source :  Googlinside
1.6.1 Google, “big brother” mondial ? Présence de Google dans (au moins) 10 domaines d’activités : News  : Alertes Google, Google News, Google Finance  Blogs et RSS  : Blogger, Feedburner, Google Reader  Analyse de trafic  : Google Analytics, Trends, Zeitgeist, Site Maps  Bureautique  : Gmail, Docs & Spreadsheet, Calendar, Writely, Desktop, Greenborder  E-commerce  : Google Checkout, Base, Froogle  Téléphonie  : Dodgeball, Google Phone (en préparation), GTalk, services mobiles  Publicité  : AdWords, AdSense, AdScape, Double Click  Réseaux sociaux  : Orkut, Jotspot, Google Groups  Audiovisuel  : Google Video, YouTube, Google Images, Picasa  Cartographie  : Google Earth, Google Maps, Sketchup, Mars, Panoramio  (d’après  Googlinside )
1.6.1 Google, “big brother” mondial ? Quelles données recueillies par Google ?  Sur un compte personnel :  Nom, adresse mel, mot de passe Sur chaque accès à une page Google :  Envoi de cookies : identification du navigateur, cookie publicitaire… Sur chaque requête : Adresse IP, date et heure, type de navigateur, mots-clés Sur Gmail :   Sujets des messages, pour envoi de publicités contextualisées Sur les services affiliés :  Informations personnelles transmises au service Sur Google Maps Mobiles :   Données de géolocalisation
1.6.1 Google,  “big brother” mondial ? Dangers du rachat de DoubleClick (mai 07)  : Première régie (1997) et leader du marché publicitaire : gère les bandeaux publicitaires Toucherait 80 à 85 % des internautes Plus grande  base de  cookies  du monde  : 1,1 milliard de personnes ! Plusieurs plaintes aux EU Question de la durée de conservation des données de connexion :  Conflit avec la Commission Européenne :   Avril 08 : durée de conservation des données fixée à  6 mois.   Reculs progressifs de Google :  Durée de conservation illimitée, de 98 à 2007 Mai 07 : 18 à 24 mois Sept. 08 :  Google  réduit à 9 mois  la durée de conservation
1.6.1 Google, “big brother” mondial ? Ambivalence des discours de Google :  Reconnaissance progressive du problème de la conservation des données personnelles, mais :  Position ambiguë ou (faussement) angélique Politique du fait accompli: cf Google Street Argument délirant de  Larry  Page  (sur la grippe) ! :  «  Le fait d’avoir ces données personnelles a beaucoup de valeur. Moins on gardera de traces comme celles-là, plus on aura de chances de tous mourir  » (mai 2009).  Efforts de transparence, jusqu’à un certain point…  Lancement du «  Front de Libération des Données  »… par Google
1.6.2 Les efforts de transparence de Google et leurs limites Efforts de Google dans l’information sur les données personnelles : Centre de confidentialité des données  :  Volonté de transparence : explication des conditions d’utilisation des données personnelles Mais pas de liste des « services associés » Choix de l’utilisateur : possibilité de désactiver les cookies publicitaires Pas d’identification personnelle abusive Depuis juillet 2008, accès depuis la page d’accueil
1.6.2 Les efforts de transparence de Google et leurs limites Lancement de  Google   DashBoard , début novembre 2009 Visualisation de toutes les traces laissées sur les applications Google :  Requêtes web, utilisation des services Google, etc.  Possibilité de gérer ses traces :  Effacement des requêtes, gestion des alertes, etc.  Limites :  Gestion des traces laissées volontairement et non celles récupérées par Google à notre insu Quid du croisement des données par Google ?  Illusion de maîtrise par l’usager de ses usages ?
1.6.2 Google et les failles de sécurité Problèmes des failles de sécurité et du cryptage des données :  Bug sur  Google  Docs  (7 mars 2009) : partage non autorisé de documents privés entre utilisateurs ; dénonciation des « pratiques laxistes » par l’EPIC, enquête du Gouvernement américain ;  En Australie, découverte (20 mars) de 22 000  cartes bancaires dans le cache de  Google http://fr.techcrunch.com/2009/03/27/fr-pourquoi-google-nest-pas-invincible/
 
1.6.2 Google,  panopticon mondial ?  Google Street View   Nombreux procès, réactions négatives :  Aux USA, au Japon, en  Grèce , en Allemagne, en France… Deux problèmes juridiques posés par G. Street View :  Notion de donnée personnelle : Visage, plaque d’immatriculation = données personnelles Autorisation nécessaire des personnes photographiées En France, intervention de la CNIL (3 juillet 2008), obligeant Google à flouter les visages des personnes, les plaques d’immatriculation… Floutage comme contournement technique du droit  Le droit à l’image :  Des personnes :  Protection de la vie privée, représentation d’une silhouette.. Floutage souvent insuffisant, reconnaissance possible Problème des photos prises dans un espace privé : ex. du  Japon Des biens :  Plaintes possibles contre Google
1.6.2 Google,  panopticon mondial ? Au-delà des aspects juridiques, problème de la transparence (surveillance) généralisée, posé par Google Street View Google  Latitude  :  Application lancée en février 2009 dans 27 pays Service de géolocalisation des personnes, à partir du téléphone mobile (et de l’ordinateur) :  Compatible avec plusieurs mobiles Transmission en temps réel de sa localisation à son réseau, suivi sur Google Maps.. Enjeux de profilage marketing Des techniques &quot;potentiellement liberticides«  (CNIL) Problème d’une société de (l’auto-) surveillance
 
1.6 Sur les effets possibles des pouvoirs de Google… dans l’avenir Voir la nouvelle de Cory Doctorrow, «  Scroggled  », traduit en français par C&F Editions «  enGooglés  » : «  Pas si simple. Voilà le truc : la surveillance du DHS dans les aéroports n'est rien qu'un premier tri. Cela permet aux affreux d'affiner leurs critères de recherche. Une fois que tu as été retenu pour un interrogatoire complémentaire à la frontière, tu rentres dans la catégorie personne intéressante - et ça ne s'arrête plus jamais. Il vont passer en revue les webcams à la recherche de ton visage et de ta démarche . Il vont lire ton courrier, il vont étudier tes recherches en ligne.  »
1.7 Questionnements critiques Nécessité d’un discours critique sur Google, compte-tenu de son hégémonie et des questions posées Au moins  quatre critiques , entrecroisées :  Dénonciation des dangers du monopole :  “le monde selon Google” Alerte face aux dangers de la traçabilité, de la conservation des donnéées personnelles... Vigilance face à la “googlisation” des usages Critique de “l’idéologie Google”, de “l’impérialisme du bien”
1.7 Questionnements critiques : le « monde selon Google » Risques de monopole d’une entreprise privée sur tous les secteurs de l’information : Dangers de tout monopole Google maître de l’Internet ?  Domination de tous les domaines de l’information : recherche d’information, vidéos, info. scientifique, géolocalisation, dossiers médicaux...  Ampleur mondiale Nombreuses missions de service public assurées par une entreprise privée : Google Scholar, Books... Question de l’avenir : quelle politique de Google dans 10 ou 20 ans ? Q uelle garantie de gratuité d’accès ?  Premières ripostes du  gouvernement américain Voir aussi l’article :  Google , la « fascisation » rampante du web
1.7 Questionnements critiques  : Big Brother Google  Dangers de la traçabilité généralisée :   Vouloir “organiser toute l’information du monde” = vouloir être informé de tout  Somme colossale, inédite, d’informations personnelles détenues par une entreprise privée  Pouvoir immense sur les consommateurs :  Cf Google Health Vers une société de contrôle général :  Fichage généralisé des individus par les états  + profilage marketing des consommateurs par les grandes sociétés + transparence des réseaux sociaux + géolocalisation des individus et des  objets
1.7 Questionnements critiques : l a « googlisation » des usages “ La vie selon Google” :  L’utilisation exclusive de Google pour différentes opérations informationnelles Accès universel pour tous les types de services proposés par Google http://partnerpage.google.com/esc-lille.fr “ Googlisation” des usages :  Cf élèves et étudiants qui ne connaissent plus que Google Risques de cette “googlisation” :  Appauvrissement des usages, des pratiques et des connaissances en matière d’information Conditionnement par l’idéologie Google Soumission au monopole de Google
1.7 Questionnements critiques :  les pièges de « l’idéologie Google » Deux proclamations célèbres  : “ Google a pour mission d'organiser à l'échelle mondiale les informations dans le but de les rendre accessibles et utiles à tous.” “ Don’t be evil !” Vision missionnaire, évangéliste de l’information : “Saint-Google”, patron de l’information ?  « L'idéologie Google » :  Dimension morale chez les fondateurs  “ Impérialisme du bien”  Mythe de la transparence
1.7 Questionnements critiques :  les pièges de « l’idéologie Google » « Don’t be evil » : mythes et réalités de l’idéologie du bien :  Distinction entre la « pureté des résultats » et les liens sponsorisés Investissements réels de Google dans de nombreuses bonnes causes :  Fondation Google, Literacy Project, volonté de rendre accessibles les ressources… Concours  lancé en 2008 pour des projets pouvant « changer le monde » ! Voir les  15 projets philanthropiques  retenus Mais fonction d’habillage, de « discours de communication » de cette posture éthique : Mélange de naïveté morale et de calculs stratégiques Bonne conscience absolue  : peu de questionnements auto-critiques des « googlers » Contradictions avec la réalité et les pratiques réelles de Google :   Cf problèmes sur le droit d’auteur, la censure en Chine, les données personnelles, la politique du secret…
1.7 Questionnements critiques :  les pièges de « l’idéologie Google » Trois confusions épistémologiques du discours sur l’information : Sur l’organisation de « toute l’information du monde » :  Confusion entre infos-data, données informationnelles et information  Sur l’accès à la connaissance :  Confusion entre information et connaissance Sur la « démocratie culturelle » :  Confusion entre information et culture
1.7 Questionnements critiques : conséquences sur la formation Enjeux de la formation des usagers :  Diversifier les outils :  Nécessité de faire connaître d’autres outils Elever les niveaux d’usage de Google :  Interrogation avancée, différents modules... Déconstruire Google :  Expliquer le fonctionnement technique, économique... Montrer les aspects problématiques : données personnelles Donner du recul critique :  Face à l’idéologie Google et ses confusions Face aux dangers du monopole
2ème partie : Mieux exploiter les fonctionnalités et les services de Google 2.1 Maîtriser le mode d’interrogation avancée 2.2 Exploration de 6 modules spécialisés :  Books News Scholar Blogs Images Groups Autres services
2 Les différents services et produits de Google : vue d’ensemble La recherche d’information :  Web  Groups Images Annuaire News (Actualités) Maps Books Scholar Blogs Desktop Search Earth Video … La communication :  GMail Blogger Talk Mobile La gestion de sites :  Analytics Adwords Sitemaps Adsense Autres services :  Picasa Translate … Voir liste complète :  http://www.webrankinfo.com/google/produits.php
2 Les différents services et produits de Google : vue d’ensemble
2.1 Maîtriser l’interrogation avancée : les opérateurs de recherche Opérateurs booléens et de présence :  AND  :  implicite  ; différent de + +  : prend en compte  l’orthographe exacte -  :  exclut  un ou plusieurs termes (SAUF) OR ( ou  |)  :  l’un ou l’autre  ou tous les termes Opérateurs numériques :   ..  = entre ( 200..300 euros)   ..200 = <200 200.. = >200
2.1 Maîtriser l’interrogation avancée : les opérateurs de recherche Opérateurs linguistiques :  «… »  :  recherche d’expression exacte   *  : astérisque permet de  remplacer un terme   ~ :   recherche   sur   les synonymes  (dans version anglaise) define:  :  pour trouver la définition d’un mot Règle des requêtes :   limite des 10 mots
2.1 Maîtriser l’interrogation avancée : les opérateurs de recherche  Filtrage sur le type de documents :  filetype: ou ext:  :  recherche sur le  format ou l’extension de fichier Opérateurs de filtrage sur une page web :  pour utiliser les caractéristiques d’une page web site:  recherche sur le  nom de domaine ( hostname ) Lister toutes les pages d’un site Rechercher des fichiers particuliers sur un site (croiser ext: et site:) Affiner une recherche sur un type de sites inurl:  et  allinurl:  : recherche sur  l’URL de la page intitle:  et  allintitle:  : affinement de la recherche sur  le titre de la page  (balise Title) inanchor:  et  allinanchor:  : recherches sur les  liens contenant les mots-clés
2.1 Maîtriser l’interrogation avancée : les opérateurs de recherche  Opérateurs de fonctions :  pour trouver des informations sur une page ou un site cache:  : affiche la version cache du document related:  : affiche les pages similaires au site ou à la page indiquée link:  :   affiche les pages liées à un site (fonction bridée sur Google) info:  : récapitule toutes les informations dont dispose Google sur un site :  version cache, pages similaires, pages liées, pages du site …
2.1 Maîtriser l’interrogation avancée : le filtrage des résultats  Nouvelles options de recherche :   D’abord sur Google.com ; sur Google.fr depuis novembre 09 Plusieurs possibilités de filtrage :  Sur les types de ressources : blogs, vidéos, actualités… Sur les dates de publication Options de tri et d’affichage :  Sur la chronologie Sur les recherches associées Affinement  et outils : barre latérale gauche de la page de résultats Sur Google.com, opérateur supplémentaire : Wonder wheel  :  représentation cartographique des concepts Résultats Intégration des données de résultats (ex. date de naissance) Fil d’Ariane des pages web
2.1 Maîtriser l’interrogation avancée : utilisation des nuages de tags Plug-in pour Firefox :  Search Cloudlet créé par un Institut de recherche en informatique (INTSPEI) Pour télécharger le plug-in :  http:// getcloudlet.com / Création d’un nuage de tags à partir d’une page de résultats, sur Google et Yahoo Demander « Affichage des résultats par 100 », dans les Préférences Double intérêt pour  :  La navigation dans les résultats :   Clic sur un tag  : affinement de la requête Onglet « Sites »  : affichage et recherche dans les sites les plus présents Onglet « Net »  : affichage des noms de domaines représentés La veille :  Représentation des grandes thématiques sur un corpus Repérage des « signaux faibles » (d’après Netsources, n° 78, 2009)
2.2 Modules spécialisés :  Google  Livres Fonctions : Recherche  fonctionne de la même façon que la recherche web Consultation des livres en ligne Selon les droits attachés, accès  à un aperçu du livre, à des extraits ou au texte intégral Pour des ouvrages du domaine public, téléchargement pdf possible Informations complémentaires Critique de livre, références… Accès au livre Bibliothèque ou librairie
2.2 Modules spécialisés :  Google  Livres Affichage du livre en entier (Source Google Livres)
2.2 Modules spécialisés :  Google  Livres Aperçu limité (Source Google Livres)
2.2 Modules spécialisés :  Google  Livres Affichage d’extraits Source Google Livres
2.2 Modules spécialisés :  Google  Livres Exploiter le document et gérer sa bibliothèque à partir du compte personnel Google Marquer (bookmarks) des livres et les partager  Ajouter à sa bibliothèque Annoter, évaluer et commenter les ouvrages Naviguer dans l’ouvrage Consulter les infos sur l’ouvrage Trouver l’ouvrage Rechercher dans l’ouvrage
2.3 Modules spécialisés :  Google  Actualités Recherche dans plus de 500 sources d’actualité en langue française Recherche avancée  :  Filtrages possibles sur : La source, la date, le lieu, l’emplacement des mots Opérateurs de recherche : intitle:  et  allintitle:  : dans le titre des articles intext:  et  allintext:  : dans le texte des articles inurl:   : dans un site particulier source:  : sur une source précise Source:Libération location:  : dans un pays précis Location:Algérie
2.3 Modules spécialisés :  Google Actualités Fonctionnalités :  Personnalisation :  Ouvrir  Modifier  cette  page  Voir aussi sur  les  InfoStratèges .com Veille :   Syndication de fils RSS  Abonnement gratuit aux alertes  : par thèmes... Deux nouveautés : Recherche   dans  les archives  de journaux Recherche   d’informations  locales  pour la France Google News Archive Search  :  Archives de presse Lancé en 2006, généralisé en 2008  Recherche dans 200 ans d’archives de journaux Affichage de chronologies Pour en savoir plus : voir  brochure de Google
2.4 Modules spécialisés :  Google Scholar Préférences  :  interface en français Lien vers bibliothèques Champs et opérateurs avancés d’interrogation :  Sur l’auteur :   author:   ou  champ   Auteur  en mode avancé Sur le titre d’une revue :   Uniquement en mode avancé :  champ  Publication ,  Sur le titre d’un article ou d’un document  : Opérateur  intitle: Sur la date :   Uniquement en mode avancé :  champ  Date   Pour en savoir plus
2.5 Modules spécialisés :  Google Blogs BlogSearch  : Lancé en sept. 2005 Au début, collecte des contenus par les fils RSS et non par le robot ; depuis automne 2008, indexation par le robot web Indexation en temps réel Fonctionnalités de recherche : Sur le titre du blog Sur l’adresse d’un blog Sur le titre d’un billet Sur l’auteur Sur les dates Conservation des anciens billets :   Recherche possible sur les anciens billets en précisant la date
2.6 Modules spécialisés :  Google Images De nouvelles modalités pour la recherche d’images : Filtres de Google Image : Filtrage par type de contenus : recherche de visages, images d’actualités, dessins, photos, images clipart Filtrage par taille des images Filtrage par format d’image et format de fichier Filtrage des couleurs En ajoutant à l'URL de la page de résultats le paramètre &quot; &imgcolor= &quot; suivi du nom anglais de la couleur de votre choix Filtrage par domaines Filtrage par type de licence SafeSearch Images similaires Problèmes récents de pertinence de la recherche et du classement des résultats sur Google Image Voir le site  Googr.net
2.7 Modules spécialisés :  Google Groups Chercher ou créer un forum de discussion  ( > avril 2001) :  Google Groups  :  Ancienne base de DejaNews Toutes les archives de Usenet depuis 1976 Recherche + possibilité de créer un groupe Recherche : Sur la date des messages Sur le nom du groupe Sur l’objet du messsage Sur l’auteur du message Sur son ID
2.8 Services de recherche d’information : alertes, pages perso.  Google Alerts  Alertes Google Actualités  :  février 2004 en France Google Web Alertes  :  mars 2004 Fusion en septembre 2004  :  une seule interface Système de veille, avec envoi par mel d’articles (News), de textes (Web)… Paramètres : Indication de mots clés Domaines de recherche (actualités, web, groupes, tous les types) Fréquence de l’alerte mail IGoogle  :   création de sa page personnalisée Sélection de centres d’intérêt Choix d’un thème Modules Google Ajout de flux RSS Google Reader  : Agrégateur RSS de Google permettant d’afficher les flux sur la page personnelle
2.9 Services de recherche d’information : moteur personnalisable Définition des moteurs personnalisables :  Choix par l’internaute du périmètre des recherches  : ensemble donné de sites web, thématique précise, type d’informations Compte gratuit, système de veille  Tendance actuelle des moteurs de recherche Google  Custom  Search   Engine   : Lancé en octobre 2006 Base du moteur : index de Google Pas de limite au nombre de sites Possibilité d’intégrer le moteur sur un site privé Ex. :  Réseau   Urfist
2.10 Outils de suivi de Google Google   Zeitgeist   :  Liste des requêtes les plus populaires posées sur Google Publiées tous les mois et tous les ans sur la version américaine : Voir  Zeitgeist  2008 Consultation des  Zeitgeist  par pays Intérêt sociologique et historique

Contenu connexe

Tendances

La recherche d\'information sur internet
La recherche d\'information sur internetLa recherche d\'information sur internet
La recherche d\'information sur internet
alexartiste
 
Moteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçuesMoteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçues
Aref Jdey
 
Gérer ses signets en ligne avec Diigo
Gérer ses signets en ligne avec DiigoGérer ses signets en ligne avec Diigo
Gérer ses signets en ligne avec Diigo
URFIST de Rennes
 
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
juriconnexion
 
Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En...
 Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En... Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En...
Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En...
juriconnexion
 
Bnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique Mesguich
Bibliolab
 
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...Technique de recherche , méthodes et outils de veille sur internet - #Benindi...
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...
Stévy-Ferry WALLACE
 
Diigo : un outil de gestion de signets
Diigo : un outil de gestion de signets Diigo : un outil de gestion de signets
Diigo : un outil de gestion de signets
URFIST de Paris
 
La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...
La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...
La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...
François Magnan
 
Recherche
RechercheRecherche
Recherche
Patrice Leroux
 
Outils de recherche et de veille sur l'actualité
Outils de recherche et de veille sur l'actualité Outils de recherche et de veille sur l'actualité
Outils de recherche et de veille sur l'actualité
URFIST de Rennes
 
Travailler avec End Note
Travailler avec End Note Travailler avec End Note
Travailler avec End Note
URFIST de Rennes
 
Recherche et veille documentaire
Recherche et veille documentaireRecherche et veille documentaire
Recherche et veille documentaire
François Magnan
 
Folkso
FolksoFolkso
Web2.0urfist
Web2.0urfistWeb2.0urfist
Web2.0urfist
Olivier Le Deuff
 
Stage outils curation_2014-12-03
Stage outils curation_2014-12-03Stage outils curation_2014-12-03
Stage outils curation_2014-12-03
URFIST de Rennes
 
Comparaison_outils_citations1
Comparaison_outils_citations1Comparaison_outils_citations1
Comparaison_outils_citations1
marthegag
 
Gérer ses signets en ligne avec Diigo : approfondissement
Gérer ses signets en ligne avec Diigo : approfondissementGérer ses signets en ligne avec Diigo : approfondissement
Gérer ses signets en ligne avec Diigo : approfondissement
URFIST de Rennes
 
Twitter comme outil académique
Twitter comme outil académiqueTwitter comme outil académique
Twitter comme outil académique
URFIST de Paris
 
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
URFIST de Paris
 

Tendances (20)

La recherche d\'information sur internet
La recherche d\'information sur internetLa recherche d\'information sur internet
La recherche d\'information sur internet
 
Moteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçuesMoteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçues
 
Gérer ses signets en ligne avec Diigo
Gérer ses signets en ligne avec DiigoGérer ses signets en ligne avec Diigo
Gérer ses signets en ligne avec Diigo
 
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
 
Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En...
 Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En... Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En...
Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En...
 
Bnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique Mesguich
 
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...Technique de recherche , méthodes et outils de veille sur internet - #Benindi...
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...
 
Diigo : un outil de gestion de signets
Diigo : un outil de gestion de signets Diigo : un outil de gestion de signets
Diigo : un outil de gestion de signets
 
La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...
La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...
La curation et ses différents outils infoMatinale ADBS/Doc Forum Curation inf...
 
Recherche
RechercheRecherche
Recherche
 
Outils de recherche et de veille sur l'actualité
Outils de recherche et de veille sur l'actualité Outils de recherche et de veille sur l'actualité
Outils de recherche et de veille sur l'actualité
 
Travailler avec End Note
Travailler avec End Note Travailler avec End Note
Travailler avec End Note
 
Recherche et veille documentaire
Recherche et veille documentaireRecherche et veille documentaire
Recherche et veille documentaire
 
Folkso
FolksoFolkso
Folkso
 
Web2.0urfist
Web2.0urfistWeb2.0urfist
Web2.0urfist
 
Stage outils curation_2014-12-03
Stage outils curation_2014-12-03Stage outils curation_2014-12-03
Stage outils curation_2014-12-03
 
Comparaison_outils_citations1
Comparaison_outils_citations1Comparaison_outils_citations1
Comparaison_outils_citations1
 
Gérer ses signets en ligne avec Diigo : approfondissement
Gérer ses signets en ligne avec Diigo : approfondissementGérer ses signets en ligne avec Diigo : approfondissement
Gérer ses signets en ligne avec Diigo : approfondissement
 
Twitter comme outil académique
Twitter comme outil académiqueTwitter comme outil académique
Twitter comme outil académique
 
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
Atelier sur les logiciels et services Web gratuits pouvant être utiles en thè...
 

En vedette

Blogosphère scientifique en SHS : présentation de la plateforme Hypothèses
Blogosphère scientifique en SHS : présentation de la plateforme HypothèsesBlogosphère scientifique en SHS : présentation de la plateforme Hypothèses
Blogosphère scientifique en SHS : présentation de la plateforme Hypothèses
URFIST de Rennes
 
Zotero gérer les_références_bibliographiques_urfist_déc_2013
Zotero gérer les_références_bibliographiques_urfist_déc_2013Zotero gérer les_références_bibliographiques_urfist_déc_2013
Zotero gérer les_références_bibliographiques_urfist_déc_2013
François Magnan
 
Créer un blog sur WordPress
Créer un blog sur WordPressCréer un blog sur WordPress
Créer un blog sur WordPress
URFIST de Rennes
 
Questions, méthodes et outils sur les Archives Ouvertes
Questions, méthodes et outils sur les Archives OuvertesQuestions, méthodes et outils sur les Archives Ouvertes
Questions, méthodes et outils sur les Archives Ouvertes
URFIST de Rennes
 
Stage outils travail-collaboratif-2014-05-15
Stage outils travail-collaboratif-2014-05-15Stage outils travail-collaboratif-2014-05-15
Stage outils travail-collaboratif-2014-05-15
URFIST de Rennes
 
Prendre des notes et gérer les informations numériques avec Evernote
Prendre des notes et gérer les informations numériques avec EvernotePrendre des notes et gérer les informations numériques avec Evernote
Prendre des notes et gérer les informations numériques avec Evernote
François Magnan
 
Mendeley gestion de bibliographies et réseau social scientifique
Mendeley gestion de bibliographies et réseau social scientifiqueMendeley gestion de bibliographies et réseau social scientifique
Mendeley gestion de bibliographies et réseau social scientifique
François Magnan
 
Introduction aux outils du Web 2.0
Introduction aux outils du Web 2.0 Introduction aux outils du Web 2.0
Introduction aux outils du Web 2.0
URFIST de Rennes
 
Support stage Scrivener Urfist de lyon 20/05/2015
Support stage Scrivener Urfist de lyon 20/05/2015Support stage Scrivener Urfist de lyon 20/05/2015
Support stage Scrivener Urfist de lyon 20/05/2015
François Magnan
 
Evaluer la crédibilité d'une ressource sur Internet
Evaluer la crédibilité d'une ressource sur InternetEvaluer la crédibilité d'une ressource sur Internet
Evaluer la crédibilité d'une ressource sur Internet
URFIST de Rennes
 
Le web 2.0 pour les bibliothèques
Le web 2.0 pour les bibliothèquesLe web 2.0 pour les bibliothèques
Le web 2.0 pour les bibliothèques
URFIST de Rennes
 
Nouveaux outils pour la formation
Nouveaux outils pour la formation Nouveaux outils pour la formation
Nouveaux outils pour la formation
URFIST de Rennes
 
Zotero logiciel de gestion de références bibliographiques urfist toulouse 22...
 Zotero logiciel de gestion de références bibliographiques urfist toulouse 22... Zotero logiciel de gestion de références bibliographiques urfist toulouse 22...
Zotero logiciel de gestion de références bibliographiques urfist toulouse 22...
François Magnan
 
Curation urfist fevrier_mars_2013
Curation urfist fevrier_mars_2013Curation urfist fevrier_mars_2013
Curation urfist fevrier_mars_2013
François Magnan
 
Stage Construire un projet collaboratif : démarche et outils - 2016-05-31
Stage Construire un projet collaboratif : démarche et outils - 2016-05-31Stage Construire un projet collaboratif : démarche et outils - 2016-05-31
Stage Construire un projet collaboratif : démarche et outils - 2016-05-31
URFIST de Rennes
 
Utiliser les cartes heuristiques pour l'enseignement et la recherche
Utiliser les cartes heuristiques pour l'enseignement et la rechercheUtiliser les cartes heuristiques pour l'enseignement et la recherche
Utiliser les cartes heuristiques pour l'enseignement et la recherche
URFIST de Rennes
 
Initiation à la veille documentaire
Initiation à la veille documentaireInitiation à la veille documentaire
Initiation à la veille documentaire
Joanne Mercher
 
METHODE ET OUTILS POUR LA VEILLE SUR INTERNET
METHODE ET OUTILS POUR LA VEILLE SUR INTERNETMETHODE ET OUTILS POUR LA VEILLE SUR INTERNET
METHODE ET OUTILS POUR LA VEILLE SUR INTERNET
Loïc Haÿ
 
Histoire d’internet et du web : d’Arpanet au web sémantique
Histoire d’internet et du web : d’Arpanet au web sémantiqueHistoire d’internet et du web : d’Arpanet au web sémantique
Histoire d’internet et du web : d’Arpanet au web sémantique
URFIST de Rennes
 

En vedette (19)

Blogosphère scientifique en SHS : présentation de la plateforme Hypothèses
Blogosphère scientifique en SHS : présentation de la plateforme HypothèsesBlogosphère scientifique en SHS : présentation de la plateforme Hypothèses
Blogosphère scientifique en SHS : présentation de la plateforme Hypothèses
 
Zotero gérer les_références_bibliographiques_urfist_déc_2013
Zotero gérer les_références_bibliographiques_urfist_déc_2013Zotero gérer les_références_bibliographiques_urfist_déc_2013
Zotero gérer les_références_bibliographiques_urfist_déc_2013
 
Créer un blog sur WordPress
Créer un blog sur WordPressCréer un blog sur WordPress
Créer un blog sur WordPress
 
Questions, méthodes et outils sur les Archives Ouvertes
Questions, méthodes et outils sur les Archives OuvertesQuestions, méthodes et outils sur les Archives Ouvertes
Questions, méthodes et outils sur les Archives Ouvertes
 
Stage outils travail-collaboratif-2014-05-15
Stage outils travail-collaboratif-2014-05-15Stage outils travail-collaboratif-2014-05-15
Stage outils travail-collaboratif-2014-05-15
 
Prendre des notes et gérer les informations numériques avec Evernote
Prendre des notes et gérer les informations numériques avec EvernotePrendre des notes et gérer les informations numériques avec Evernote
Prendre des notes et gérer les informations numériques avec Evernote
 
Mendeley gestion de bibliographies et réseau social scientifique
Mendeley gestion de bibliographies et réseau social scientifiqueMendeley gestion de bibliographies et réseau social scientifique
Mendeley gestion de bibliographies et réseau social scientifique
 
Introduction aux outils du Web 2.0
Introduction aux outils du Web 2.0 Introduction aux outils du Web 2.0
Introduction aux outils du Web 2.0
 
Support stage Scrivener Urfist de lyon 20/05/2015
Support stage Scrivener Urfist de lyon 20/05/2015Support stage Scrivener Urfist de lyon 20/05/2015
Support stage Scrivener Urfist de lyon 20/05/2015
 
Evaluer la crédibilité d'une ressource sur Internet
Evaluer la crédibilité d'une ressource sur InternetEvaluer la crédibilité d'une ressource sur Internet
Evaluer la crédibilité d'une ressource sur Internet
 
Le web 2.0 pour les bibliothèques
Le web 2.0 pour les bibliothèquesLe web 2.0 pour les bibliothèques
Le web 2.0 pour les bibliothèques
 
Nouveaux outils pour la formation
Nouveaux outils pour la formation Nouveaux outils pour la formation
Nouveaux outils pour la formation
 
Zotero logiciel de gestion de références bibliographiques urfist toulouse 22...
 Zotero logiciel de gestion de références bibliographiques urfist toulouse 22... Zotero logiciel de gestion de références bibliographiques urfist toulouse 22...
Zotero logiciel de gestion de références bibliographiques urfist toulouse 22...
 
Curation urfist fevrier_mars_2013
Curation urfist fevrier_mars_2013Curation urfist fevrier_mars_2013
Curation urfist fevrier_mars_2013
 
Stage Construire un projet collaboratif : démarche et outils - 2016-05-31
Stage Construire un projet collaboratif : démarche et outils - 2016-05-31Stage Construire un projet collaboratif : démarche et outils - 2016-05-31
Stage Construire un projet collaboratif : démarche et outils - 2016-05-31
 
Utiliser les cartes heuristiques pour l'enseignement et la recherche
Utiliser les cartes heuristiques pour l'enseignement et la rechercheUtiliser les cartes heuristiques pour l'enseignement et la recherche
Utiliser les cartes heuristiques pour l'enseignement et la recherche
 
Initiation à la veille documentaire
Initiation à la veille documentaireInitiation à la veille documentaire
Initiation à la veille documentaire
 
METHODE ET OUTILS POUR LA VEILLE SUR INTERNET
METHODE ET OUTILS POUR LA VEILLE SUR INTERNETMETHODE ET OUTILS POUR LA VEILLE SUR INTERNET
METHODE ET OUTILS POUR LA VEILLE SUR INTERNET
 
Histoire d’internet et du web : d’Arpanet au web sémantique
Histoire d’internet et du web : d’Arpanet au web sémantiqueHistoire d’internet et du web : d’Arpanet au web sémantique
Histoire d’internet et du web : d’Arpanet au web sémantique
 

Similaire à Outils de recherche du web : approfondir Google

Google, le monopole
Google, le monopoleGoogle, le monopole
Google, le monopole
asuire
 
La stratégie de diversification de google
La stratégie de diversification de googleLa stratégie de diversification de google
La stratégie de diversification de google
Danièle Attias
 
Toi aussi maîtrise Google+
Toi aussi maîtrise Google+Toi aussi maîtrise Google+
Toi aussi maîtrise Google+
Guy Edgard Botson
 
l'enterprise google
l'enterprise  googlel'enterprise  google
l'enterprise google
Chiekh Abdou
 
Parlons un peu de google
Parlons un peu de googleParlons un peu de google
Parlons un peu de google
Dulout Laurent
 
L'écosystème Google
L'écosystème GoogleL'écosystème Google
L'écosystème Google
Benjamin Labarthe-Piol
 
L'écosystème Google
L'écosystème GoogleL'écosystème Google
L'écosystème Google
Benjamin Labarthe-Piol
 
Ppt google
Ppt google Ppt google
Ppt google
pgt69007
 
Toi aussi maîtrise Google+ (update)
Toi aussi maîtrise Google+ (update)Toi aussi maîtrise Google+ (update)
Toi aussi maîtrise Google+ (update)
Guy Edgard Botson
 
Google structure organisationnelle présentation
Google structure organisationnelle présentationGoogle structure organisationnelle présentation
Google structure organisationnelle présentation
walidhouas
 
Extraits de l'intervention sur la recherche sociale au SMX Paris
Extraits de l'intervention sur la recherche sociale au SMX ParisExtraits de l'intervention sur la recherche sociale au SMX Paris
Extraits de l'intervention sur la recherche sociale au SMX Paris
Softeam agency
 
Exposé socio - Google
Exposé socio - GoogleExposé socio - Google
Exposé socio - Google
Alyn D'un Jour
 
Android, historique et enjeux
Android, historique et enjeuxAndroid, historique et enjeux
Android, historique et enjeux
Crossmedias
 
Rapport De Veille
Rapport De VeilleRapport De Veille
Rapport De Veille
Trochet
 
Galaxie Google
Galaxie GoogleGalaxie Google
Galaxie Google
Vincent Mabillot
 
Cours réseaux sociaux 2
Cours réseaux sociaux 2  Cours réseaux sociaux 2
Cours réseaux sociaux 2
Sébastien Dourver
 
Google une royaume pas comme les autre
Google une royaume pas comme les autreGoogle une royaume pas comme les autre
Google une royaume pas comme les autre
Anis Nouri
 
Café numérique charleroi
Café numérique charleroiCafé numérique charleroi
Café numérique charleroi
Guy Edgard Botson
 
Optimiser le référencement sur google actualité
Optimiser le référencement sur google actualitéOptimiser le référencement sur google actualité
Optimiser le référencement sur google actualité
Marine Morio
 

Similaire à Outils de recherche du web : approfondir Google (20)

Google, le monopole
Google, le monopoleGoogle, le monopole
Google, le monopole
 
La stratégie de diversification de google
La stratégie de diversification de googleLa stratégie de diversification de google
La stratégie de diversification de google
 
Toi aussi maîtrise Google+
Toi aussi maîtrise Google+Toi aussi maîtrise Google+
Toi aussi maîtrise Google+
 
l'enterprise google
l'enterprise  googlel'enterprise  google
l'enterprise google
 
Parlons un peu de google
Parlons un peu de googleParlons un peu de google
Parlons un peu de google
 
L'écosystème Google
L'écosystème GoogleL'écosystème Google
L'écosystème Google
 
L'écosystème Google
L'écosystème GoogleL'écosystème Google
L'écosystème Google
 
Ppt google
Ppt google Ppt google
Ppt google
 
Toi aussi maîtrise Google+ (update)
Toi aussi maîtrise Google+ (update)Toi aussi maîtrise Google+ (update)
Toi aussi maîtrise Google+ (update)
 
Google structure organisationnelle présentation
Google structure organisationnelle présentationGoogle structure organisationnelle présentation
Google structure organisationnelle présentation
 
Extraits de l'intervention sur la recherche sociale au SMX Paris
Extraits de l'intervention sur la recherche sociale au SMX ParisExtraits de l'intervention sur la recherche sociale au SMX Paris
Extraits de l'intervention sur la recherche sociale au SMX Paris
 
Exposé socio - Google
Exposé socio - GoogleExposé socio - Google
Exposé socio - Google
 
Android, historique et enjeux
Android, historique et enjeuxAndroid, historique et enjeux
Android, historique et enjeux
 
Rapport De Veille
Rapport De VeilleRapport De Veille
Rapport De Veille
 
Galaxie Google
Galaxie GoogleGalaxie Google
Galaxie Google
 
Cours réseaux sociaux 2
Cours réseaux sociaux 2  Cours réseaux sociaux 2
Cours réseaux sociaux 2
 
Google une royaume pas comme les autre
Google une royaume pas comme les autreGoogle une royaume pas comme les autre
Google une royaume pas comme les autre
 
Café numérique charleroi
Café numérique charleroiCafé numérique charleroi
Café numérique charleroi
 
Optimiser le référencement sur google actualité
Optimiser le référencement sur google actualitéOptimiser le référencement sur google actualité
Optimiser le référencement sur google actualité
 
Google+
Google+Google+
Google+
 

Dernier

1e Espaces productifs 2024.Espaces productif
1e Espaces productifs 2024.Espaces productif1e Espaces productifs 2024.Espaces productif
1e Espaces productifs 2024.Espaces productif
NadineHG
 
1e geo metropolisation metropolisation x
1e geo metropolisation metropolisation x1e geo metropolisation metropolisation x
1e geo metropolisation metropolisation x
NadineHG
 
GUIDE POUR L’EVRAS BALISES ET APPRENTISSAGES
GUIDE POUR L’EVRAS BALISES ET APPRENTISSAGESGUIDE POUR L’EVRAS BALISES ET APPRENTISSAGES
GUIDE POUR L’EVRAS BALISES ET APPRENTISSAGES
DjibrilToure5
 
Techno Revo et nations (1789-1848) ).pdf
Techno Revo et nations (1789-1848) ).pdfTechno Revo et nations (1789-1848) ).pdf
Techno Revo et nations (1789-1848) ).pdf
NadineHG
 
MÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdf
MÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdfMÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdf
MÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdf
lebaobabbleu
 
Auguste Herbin.pptx Peintre français
Auguste   Herbin.pptx Peintre   françaisAuguste   Herbin.pptx Peintre   français
Auguste Herbin.pptx Peintre français
Txaruka
 
La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...
La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...
La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...
Editions La Dondaine
 
A1- Compréhension orale - présentations.pdf
A1- Compréhension orale - présentations.pdfA1- Compréhension orale - présentations.pdf
A1- Compréhension orale - présentations.pdf
lebaobabbleu
 
Compréhension orale La famille de Sophie (12).pdf
Compréhension orale  La famille de Sophie (12).pdfCompréhension orale  La famille de Sophie (12).pdf
Compréhension orale La famille de Sophie (12).pdf
lebaobabbleu
 

Dernier (9)

1e Espaces productifs 2024.Espaces productif
1e Espaces productifs 2024.Espaces productif1e Espaces productifs 2024.Espaces productif
1e Espaces productifs 2024.Espaces productif
 
1e geo metropolisation metropolisation x
1e geo metropolisation metropolisation x1e geo metropolisation metropolisation x
1e geo metropolisation metropolisation x
 
GUIDE POUR L’EVRAS BALISES ET APPRENTISSAGES
GUIDE POUR L’EVRAS BALISES ET APPRENTISSAGESGUIDE POUR L’EVRAS BALISES ET APPRENTISSAGES
GUIDE POUR L’EVRAS BALISES ET APPRENTISSAGES
 
Techno Revo et nations (1789-1848) ).pdf
Techno Revo et nations (1789-1848) ).pdfTechno Revo et nations (1789-1848) ).pdf
Techno Revo et nations (1789-1848) ).pdf
 
MÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdf
MÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdfMÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdf
MÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdf
 
Auguste Herbin.pptx Peintre français
Auguste   Herbin.pptx Peintre   françaisAuguste   Herbin.pptx Peintre   français
Auguste Herbin.pptx Peintre français
 
La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...
La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...
La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...
 
A1- Compréhension orale - présentations.pdf
A1- Compréhension orale - présentations.pdfA1- Compréhension orale - présentations.pdf
A1- Compréhension orale - présentations.pdf
 
Compréhension orale La famille de Sophie (12).pdf
Compréhension orale  La famille de Sophie (12).pdfCompréhension orale  La famille de Sophie (12).pdf
Compréhension orale La famille de Sophie (12).pdf
 

Outils de recherche du web : approfondir Google

  • 1. Outils de recherche du web : approfondir Google Stage URFIST de Rennes 18 mai 2010 Animé par Marie-Laure Malingre
  • 2. PLAN 1ère partie : Mieux connaître Google pour mieux le questionner : Repères historiques, économiques, techniques… sur la puissance de Google Fonctionnement technique Stratégie et innovations récentes Google et les données personnelles Questionnements critiques 2ème partie : Mieux exploiter les fonctionnalités et services de Google
  • 3. 1.1 Quelques ressources sur Google Annuaire spécialisé : Google ’ World Blogs : The Official Google Blog Zorgloob : 2004 Google XXL : mai 2007 Blog du MIP sur l’innovation et sur Google : janvier 2009 Sites spécialisés : WebRankInfo : dossiers sur Google Livres : Ippolita. La face cachée de Google , Payot, 2008 L’Entonnoir. Google sous la loupe .. C&F Diaporamas : FaberNovel. Tout savoir de Google Voir aussi la Sélection de ressources sur les outils de recherche de l’URFIST de Rennes
  • 4. 1.2 Repères chronologiques Origines : 1996 : projet de recherche BackRub, de Sergey Brin et Larry Page (en PhD à Stanford) : méthode d'analyse des liens pointant vers un site web. Naissance le 7 septembre 1998 , à Stanford, de la start-up Google Le nom : dérivé du mot « googol » , nombre gigantesque (un 1 suivi de 100 zéros...). Contexte : recherche d’information dominée par Alta Vista, Yahoo, HotBot, Lycos… Quelques étapes : 1999 : de 500 000 à 3 millions requêtes par jour 2000 : premières publicités contextuelles, moteur de recherche le plus complet au monde : un demi-milliard de pages Web ; déjà 100 millions de requêtes par jour 2001 : Rachat de Deja.com et de l'archivage de Usenet, création de Google Groups ; lancement de Images Search; indexation de nouveaux formats de fichiers sensibles (.doc; .xls, .ppt...) Fin 2001 : 3 milliards de pages
  • 5. 1.2 Repères chronologiques 2002 : Lancement du modèle publicitaire des AdWords ; lancement officiel de Google News , indexant plus de 4000 sites de médias ; Fin 2002 : 250 millions de requêtes journalières 2003 : Rachat de plusieurs sociétés : Applied Semantics : technologie de mots-clés Blogger : édition de blogs Sprinks : publicité contextuelle Programme publicitaire AdSense 2004 : Recherche localisée avec Google Local . Gmail , service de webmail gratuit Introduction en Bourse, envolée boursière Picasa , gestion des photos numériques Google Desktop , indexation des disques durs Novembre : doublement de l’index : de 4,3 milliards à 8,1 millards de pages Google Scholar http:// www.journaldunet.com/dossiers/google/historique.shtml
  • 6. 1.2 Repères chronologiques 2005 : Lancement de : Google Video, Google Maps, Google Earth, Google Talk Annonce de Google Print et de la numérisation des livres Recrutement de Vinton Cerf , l’un des « pères d’Internet » Augmentation de l’action Google de 117 % en un an Fin 2005 : 1 milliard de requêtes journalières ! 2006 : Lancement de Google.cn en Chine, avec une censure des résultats Rachat de Writely , qui deviendra Google Docs & Spreadsheets en octobre Lancement de plusieurs applications : Google Calendar, Co-Op, Trends, Apps... Septembre : procès et condamnation de Google Belgique face aux éditeurs de presse belges Automne : Google News Archives , rachat de You Tube
  • 7. 1.2 Repères chronologiques 2007 : Rachat de DoubleClick , pour $ 3,1 Mds ; Juin : lancement de la recherche universelle Août : extension de Google Earth au ciel avec Google Sky Automne : 1 million de livres numérisés, 27 partenaires pour Google Books 2008 : Mars : annonce de Google Health , le dossier médical personnel en ligne Juin : partenariat avec Yahoo pour le partage du marché publicitaire Juillet : Google à 70 % du trafic aux USA , 82 % en France (cf Abondance ) Septembre : lancement du navigateur Google Chrome, et de GAUDI , portail de recherche audio Pour une chronologie détaillée, voir Google 10th Birthday
  • 8. 1.2 Repères chronologiques 2009 : Janvier : Google connaît la crise : licenciements, fermetures… Février : lancement de Google Latitude , service de géolocalisation sur téléphone mobile Mai : lancement de Google Wave , plateforme centralisée de communication (cf Zorgloob ) Août : annonce de négociation entre Google et la BNF pour la numérisation des fonds Septembre : lancement de SideWiki Octobre : Partenariat avec Twitter , indexation des tweets Recherche en temps réel : Twitter, Facebook,MySpace, FrienFeed, Jaiku lancement de Google Social Search , moteur de recherche social Novembre : Google Street View au Mexique , 15ème pays couvert (sur 33) Lancement de Google DashBoard Accord Google-éditeurs américains
  • 9. 1.2 Repères chronologiques Quelques événements depuis le début 2010 : Lancement de Google Buzz Brevet de Google sur l’indexation basée sur l’analyse de phrase Lancement de Jazz , une nouvelle interface pour la page de résultats Extension de Google Street View tout le Royaume Uni ; nouvelles vues au Japon et aux Pays-Bas ; Norvège, Finlande, Danemark, Suède ; premiers clichés de Macao et Hong-Kong; accord trouvé avec la Suisse Fin de Search Wiki / intégration avec Google Bookmarks Google comme FAI (fibrer entre 50 000 et 500 000 foyers américains) Google reader : création de flux RSS à la volée Google Docs : envoi et partage de n’importe quel type de fichier 3D sur Google Maps + Google Places
  • 10. 1.3 Gigantisme de Google Puissance de Google : Position monopolistique Stratégie de puissance Tous les domaines investis par « l’ogre de Mountain View », « le maître de l’internet  » De multiples positionnements (Applications / Services + maîtrise des aspects réseaux) Moteur, FAI, Constructeur, Editeur, Navigateur, Plateforme de services, Média … Plateforme complète d’accès à l’information Mais décisions récentes : Abandon d’applications non totalement satisfaisantes Recentrage sur la recherche
  • 11. 1.3 Gigantisme de Google Google Puissance technique Puissance politique Puissance humaine Puissance d’innovation Puissance économique Puissance financière
  • 12. 1.3 Gigantisme de Google : puissance financière Evolution des revenus Google de 2005 à T1 2010 selon WebRankInfo
  • 13. 1.3 Gigantisme de Google : puissance financière Un poids financier considérable : Des résultats financiers toujours positifs 1er trimestre 2010 : 6,7 Mrds $ de revenus ( 5,9 Mrds $ au T4 2009) Augmentation de 23 % par rapport au même trimestre en 2009 Des réserves de trésorerie au plus haut 26,5 Mrds $ au 31/03/2010 (+2Mds depuis fin 2009) Quelques signes d’essoufflement ? Ralentissement de sa croissance Fluctuations de l’action Google (-13% depuis le début de l’année) Une présence forte Liste des acquisitions / Dossier WebRankinfo Derniers chiffres Google
  • 14. 1.3 Gigantisme de Google : puissance financière Adwords Emplacements publicitaires dans les pages de résultats de Google, avec des liens vers les sites annonceurs, en fonction des mots clés saisis par l’internaute et achetés par l’annonceur. Revenus Adwords / 1er trimestre 2010 4 Mrds $ = 65,5 % des revenus Adsense Liens publicitaires sur des sites affiliés à Google et choisis automatiquement en fonction du contenu et du contexte de la page + des requêtes Revenus Adsense / 1er trimestre 2010 2,04 Mrds $ = 30,1% des revenus Google n° 1 mondial des liens sponsorisés Chiffres 1er trimestre 2010 : Publicité = 95,6% de son CA Extension à de nouveaux modules (News, Maps, vidéos YouTube…) et développement de la publicité hors web
  • 15. 1.3 Gigantisme de Google : puissance humaine Puissance humaine : 20 621 employés à temps plein contre 19 665 au 30/09/2009 et 15916 en septembre 2007 Suppression de postes réduction du rythme des embauches en 2009 Orientation vers un recrutement ciblé et ajusté
  • 16. 1.3 Gigantisme de Google : puissance économique USA : Parts de visite Google.com : 65,1 % en mars 2010 (source : Comscore ) France : Parts de visite pour Google.fr : 90,2 % en avril 2010 (source : Baromètre Xiti ) Place de Google sur le marché des moteurs
  • 17. 1.3 Gigantisme de Google : domination des usages Fréquentation de Google Large prédominance de l’usage de Google Croissance régulière des requêtes effectuées sur Google environ 500 millions de visiteurs uniques mensuels sur l'ensemble des sites de Google au moins 2,5 milliards de requêtes par jour sur l'ensemble des sites de Google (juillet 2009) En Europe, 8 requêtes sur 10 passent par Google Source : WebRankinfo
  • 18. 1.3 Gigantisme de Google : domination des usages Source : http:// www.accessoweb.com / Etc . Google : l’outil universel Voir aussi : Google , produits et chiffres en une seule image
  • 19. 1.3 Gigantisme de Google : puissance d’innovation Nombreux projets de recherche, tous azimuts 171 produits et services Google, un acteur protéiforme : Fournisseur d’applications Web Google App Engine : création d’un espace dédié pour la mise en ligne d’applications web Opérateur de téléphonie mobile : 22 octobre 2008 : sortie de G1, 1er Google phone Androïd Acteur dans le domaine satellitaire, de la cartograpie et de la géolocalisation Google Maps, Street View satellites de Google Google et la santé : Google Health : Service de recherche spécialisé en Santé Cartographie du génome humain Google éditeur de logiciels : Voir Google Pack G oogle Google constructeur d’ordinateurs, de système d’exploitation et de langage de programmation … Question de la nature de Google : Moteur de recherche, média, et plus...
  • 20. 1.3 Gigantisme de Google : puissance d’innovation GOOGLE Bureautique Téléphonie Réseaux sociaux Publicité Cartographie Recherche d’information / veille Navigation web Bibliothèques numériques E-commerce Création de contenus web Voir à ce sujet Wikipedia et WebRankinfo Personnalisation Analyse et statistiques web Système d’exploitation Logiciels
  • 21. 1.3 Gigantisme de Google : puissance technique Rôle-clé de l’infrastructure technique chez Google : Quantités gigantesques de données à traiter : Index de plusieurs centaines de milliards de pages ... Nécessité de : Capacité de stockage : > 850 téraoctets Puissance de calcul : 600 teraflops (10 fois plus que Columbia, l'ordinateur le plus puissant de la NASA) Solution adoptée : “ Racks” de 88 ordinateurs plutôt que des gros serveurs Au total : plus de deux millions de machines Les Google Data Centers : Regroupement des milliers d’ordinateurs hébergeant l’index de Google dans des centres de données Plus de 60 Data Centers , pour la plupart aux USA et en Europe Voir Chiffres-clé sur WebRankInfo
  • 22. 1.4 Repères techniques : le référencement Deux modes de référencement : Automatiquement : Attendre le passage du robot Google Bot Manuellement : Remplir le formulaire d’envoi de contenu Toujours bien veiller au référencement Quelques règles simples : Soigner le titre des pages (balise Title) Présence de nombreux liens externes de qualité Mises à jour régulières Mots-clés dans les URL … (voir sur WebRankinfo )
  • 23. 1.4 Repères techniques : le robot collecteur, Google Bot Le robot GoogleBot : Visite les pages web signalées ou non Délais : entre 12 h et 1 mois, selon le nombre de liens vers la page Suivi des liens Première analyse de la page : mots, balises HTML… « Prime de fraîcheur » : apparition sur Google mais pas encore de PageRank Voir Le système de crawl... Fréquence des visites de GoogleBot : Selon le PageRank de la page Le cache de Google : Après chaque collecte et indexation de document, version du document stockée sur les milliers de serveurs : Version cache du document Correspond à la version du document au moment du passage du robot
  • 24. 1.4 Repères techniques : le classement, le PageRank Nombreux critères de classement Texte, balises, URL… Le PageRank : Calcul des liens entrants et sortants Calcul de l’indice de popularité de la page http:// www.webrankinfo.com/google/pagerank/pagerank.php Classement des pages par combinaison de plusieurs facteurs Deux niveaux de pondération : 1ère pondération plus forte : des « pages pivots » : listes de liens, sélections de ressources… des « pages de référence »: pages recevant de nombreux liens 2ème pondération plus forte: des pages de référence fréquemment citées par pages pivots Mais PR n’est pas le seul critère de classement Opacité des critères réels de classement
  • 25. 1.4 Repères techniques : la Google Dance La Google Dance : Mise à jour du PageRank de l’ensemble des pages de l’index de Google Période de mise à jour ( Google Update ) durant plusieurs jours Après calcul des nouveaux PageRank, distribution de l’index sur les milliers de serveurs Pendant cette période, variation possible du PageRank d’une page : C’est la Google Dance... Rythme mensuel, puis trimestriel ; plus irrégulier depuis 2006 La dernière Google Dance et le dernier PageRank : Calcul des BackLinks (liens entrants) et établissement d’un palmarès des sites ayant un PR (PageRank) de 10 http://www.pr10.fr/google_dance_derniere.htm
  • 26. 1.4 Repères techniques : l’infrastructure technique Schéma des serveurs de Google utilisés pour répondre aux requêtes (source : WebRankInfo ) Voir aussi sur Google : Cycle de vie d’une recherche
  • 27. 1.4 Repères techniques : le classement des résultats Comment Google classe ses résultats ? D’abord, constitution d’une liste des pages indexées par Google contenant les mots recherchés. Ensuite, tri des pages selon une série de critères : valeur du PageRank : PR : établi de 1 à 10 PR <2 : « mauvais »  PR 4-5 : « bon » PR 6-7 : « très bon » PR 8-10 : « excellent » correspondance entre les mots recherchés et le titre (balise <TITLE>) correspondance entre les mots recherchés et les textes de liens (textes entre les balises <A> et </A>) correspondance entre les mots recherchés et les titres de paragraphes (balises <H1> à <H6>) correspondance entre les mots recherchés et le texte de la page (D’après WebRankInfo )
  • 28. 1.4 Repères techniques : évolutions en cours Projet Google Caffeine : Nouvelle architecture technique pour le crawl et l’indexation En beta test depuis août 2009 Objectifs : Améliorer vitesse de collecte, d’indexation des documents, d’affichage des résultats… Reposerait sur les technologies de « cloud computing » Lancement en décembre 09 (sur un seul Data Center, 50% du temps) Déploiement à venir Voir articles : L. Bourrelly O. Andrieu
  • 29. 1.5 Stratégies...: Google, maître des images ? Chercher des images (juin 2001) : Google Images Plusieurs milliards d’images indexées Enjeux énormes de la recherche d’images : plus de 100 milliards d’images produites chaque année, déferlement des images sur le web, concurrence acharnée des grands moteurs... Google Images : 2ème service de Google le plus utilisé au monde (10 % environ) Croissance de 35 % entre 2006 et 2007 Problème des droits d’auteur Différents formats de fichiers Innovations Filtrage sur visages, actualités, taille, formats, couleurs ... Image Swirl et Wonder Wheel : regroupement d’images par similarité
  • 30. 1.5 Stratégies...: Google, nouveau navigateur, nouvel acteur de téléphonie ? Google Chrome : Le navigateur de Google + applications web hors navigateur Lancé en septembre 2008 Code source sous licence libre Moteur WebKit Réactions : Bilan contrasté des premières utilisations Big browser / Big Brother Nouveauté : scripts GreaseMonkey / Firefox Google Phone : « ordinateur de poche communicant » Lancement du 1er google phone Technologie Android = système ouvert proposé par Google Constructeur taïwanais HTC Développement de programmes Services : Moteur, Google Maps et Street View, Gmail … Concurrent d’Apple, Nokia …
  • 31. 1.5 Stratégies...: Google, nouveau réseau social ? L’offensive de Google dans les réseaux sociaux : le projet OpenSocial Jusque là, 5ème place de Google dans le monde des réseaux sociaux OpenSocial lancé en nov. 2007 / OpenSocial Foundation Ensemble d’interfaces de programmation : Regroupe API communes permettant le développement d’applications web pour sites partenaires (réseaux sociaux et sites communautaires) A la base : Orkut + sites partenaires du projet (Xing, Friendster, Hi5, LinkedIn, mySpace …) Evolution Fin 2007 : ralliement de MySpace ; soutien de Viadeo et Xing Mars 08 : Yahoo rejoint OpenSocial Introduction de la “barre sociale” Développement d’un moteur de recherche social : Google Social Search
  • 32. 1.5 Stratégies... : Google, nouveau ministère de la santé ? Google Health Lancé sur Google.com Création de profils de santé personnels Téléchargement de rapports médicaux depuis le cabinet médical ou la pharmacie Conseils et informations Recherche de médecins et services Partage d’informations Les questions posées par Google Health Sécurité des données médicales personnelles Nécessité de normalisation dans la saisie des données médicales Pratique des médecins par rapport à Google ? Projet d’extension à d’autres pays
  • 33. 1.5 Stratégies...: Google, première agence de presse mondiale ? Google News ( Actualités ) : Créé à la suite du 11/09/01, l ancé en mars 2002 Diffusion en continu d’infos sur l’actualité Sélection de 25 000 sources d’information (avec les archives) Plus de 40 versions nationales de Google News Automatisation complète Collecte et analyse de chaque source par un robot spécial Classement automatique des informations dans des rubriques prédéfinies Récemment sur Google News, recherche locale, catégories personnalisées Nombreux conflits : Avec les agences de presse, les journaux... Problème récent : affichage de publicités sur Google News ; réticences des éditeurs de presse
  • 34. 1.5 Stratégies...: Google, bibliothèque numérique mondiale ? Du projet BackRub à Google Books 2004 : Google Livres, service en ligne permettant d’accéder à des livres numérisés Deux volets du projet : Projet Bibliothèques : (Google Library) Programme Partenaires / Editeurs : mise en ligne d’extraits d’ouvrages et promotion auprès de librairies en ligne (Google Print) Mais un seul programme de numérisation “ Le service Google Recherche de Livres s’inscrit dans notre travail d’organisation des informations mondiales, afin de les rendres universellement accessibles et utiles .” (Jens Redmer, 2007) Marché de l’information versus Bibliothèque universelle Débat autour de la numérisation et de la constitution de collections numériques par Google : position dominante de Google dans l’économie des contenus en ligne / qualité de la numérisation Droits d’auteur et actions des éditeurs (renversement par Google de la logique du copyright)
  • 35. 1.5 Stratégies...: Google, bibliothèque numérique mondiale ? Où en est-on aujourd’hui ? La collection Environ 12 millions de titres aujourd’hui : Livres + Magazines Livres en librairie et sous droits d’auteur Livres sous droits d’auteurs mais épuisés Livres non soumis au copyright Registre des droits du livre Accords avec de nombreuses bibliothèques universitaires et publiques américaines et européennes En France : BM de Lyon, BNF (en cours de négociation) Le contentieux avec les éditeurs / numérisation Recours collectif engagé en 2005 (Author’s Guild, AAP) / Open Book Alliance Accord présenté le 13/11/2009 entre Google et les éditeurs anglo-saxons Protestation du SNE En France : le 18 décembre, La Martinière / Le Seuil gagne son procès contre Google ; appel de Google La question des relations BNF / Google et le Conseil du Livre du 22/03 Et maintenant , la librairie Google… cet été
  • 36. 1.5 Stratégies...: Google, premier portail scientifique mondial ? Lancement de Google Scholar en novembre 2004 Indexation de littérature scientifique mondiale : Livres, articles, textes sur archives ouvertes, préprints, bases de données bibliographiques… Orientation stratégique de Google : Devenir guichet d’accès à l’IST Concurrent direct d'Elsevier (Scopus) Nombreux partenariats : universités nord-américaines éditeurs scientifiques américains bibliothèques : Catalogue O CLC : Open WorldCat Sudoc 150 bibliothèques INIST  Google comme premier point d’accès à l’IST française
  • 37. 1.5 Stratégies...: Google, portail scientifique mondial ? Stratégie de Google : « guichet universel » pour la science grand catalogue mondial Succès de Google Scholar : Très bon accueil dans les universités Ancrage dans les bibliothèques anglo-saxonnes, et européennes : Initiative Library Links Rivalité avec l’ISI : Même nombre de citations que l’ISI Intérêt de Google Scholar : Accès gratuit à l’IST, même en référence secondaire Valorisation et visibilité des AO Intérêt des citations Visibilité des chercheurs Pas de publicité Problèmes posés : Situation dangereuse de monopole d’accès Gratuité pour le moment , mais jusqu’à quand ? Effets pervers de l’indice de popularité Opacité du corpus
  • 38. 1.5 Stratégies...: Google, portail juridique mondial ? Nouveauté sur Google Scholar (17/11) : Accès à l’ensemble de la jurisprudence américaine : décisions de justice des tribunaux d’Etats, des cours fédérales et de la Cour Suprême américaine Bouton à cocher : «  Legal opinions and journals  » Projet d’extension à tous les pays anglo-saxons Positionnement fort sur le terrain de l’information juridique : Concurrence avec Lexis/Nexis ? Google : « service public d’accès au droit » ? Monétisation des accès par la publicité Poursuite de stratégie d’omniprésence de Google sur tous les champs de l’écrit Recherche parmi les publications de brevets
  • 39. 1.5 Stratégies...: Google, premier éducateur mondial ? Literacy Project Lutter contre l’analphabétisme (septembre 2006) Diffusion de contenus favorisant le développement de la lecture et de l’éducation: Coopération : soutien de campagnes, projets Livres, vidéos, articles scientifiques, LitCam, blogs... Partenariat Google / UNESCO / LitCam Site en français La journée mondiale du livre avec le Literacy Project (avril 2008) Google Apps Education = outils gratuits de communication, de collaboration et de publication Développement dans l’enseignement supérieur 1er établissement français : Portail My Esc Lille : http:// partnerpage.google.com / esc-lille.fr Moteur de recherche, Google Docs, Google Talk, Google Agenda, Gmail… Dans de nombreuses universités de par le monde Le Tout-Google ?
  • 40. 1.5 Stratégies...: Google, premier office du tourisme mondial ? Google Street View Initiative lancée en 2007 Option créée sous Google Maps Visualisation des villes en 3D via Google Maps et Google Earth Selon Google : > 293 téra-octets de données pour la France ! Succès considérable Développement de Street View : Google Street View disponible pour 20 pays Au total, 33 pays concernés (mars 09) Le dernier en vue : la Croatie Dans les villes françaises : Exemple à Rennes Conflits : le dernier sur la captation de données d’identification sur les réseaux Wifi Google Latitude, outil de « géolocalisation sociale »
  • 41. 1.5 Stratégies...: Google, cartographe de l’univers ? Google explore l’univers : les innovations liées à la cartographie et la géolocalisation Après Google Sky , Moon et Mars , Google Ocean : Projet en cours d’élaboration Module d’exploration des fonds marins en 3 dimensions Exploration de la topographie des sols marins Ajout d’autres paramètres : températures, emplacement des épaves… Moyens : cartographie des fonds marins, ou du moins mise à disposition des images déjà disponibles Données issues de Google Maps, de laboratoires d’universités, d’instituts de recherche océanographique
  • 42. 1.6 Google et nous «  Nous n’en savons pas assez sur vous  », Eric Schmidt, PDG de Google Google, nouveau Big brother ? La conservation des données personnelles Les efforts de transparence et leurs limites Google, nouveau panopticon ? Street et le droit à l’image
  • 43. 1.6.1 Google, “big brother” mondial ? Source : Googlinside
  • 44. 1.6.1 Google, “big brother” mondial ? Présence de Google dans (au moins) 10 domaines d’activités : News : Alertes Google, Google News, Google Finance Blogs et RSS : Blogger, Feedburner, Google Reader Analyse de trafic : Google Analytics, Trends, Zeitgeist, Site Maps Bureautique : Gmail, Docs & Spreadsheet, Calendar, Writely, Desktop, Greenborder E-commerce : Google Checkout, Base, Froogle Téléphonie : Dodgeball, Google Phone (en préparation), GTalk, services mobiles Publicité : AdWords, AdSense, AdScape, Double Click Réseaux sociaux : Orkut, Jotspot, Google Groups Audiovisuel : Google Video, YouTube, Google Images, Picasa Cartographie : Google Earth, Google Maps, Sketchup, Mars, Panoramio (d’après Googlinside )
  • 45. 1.6.1 Google, “big brother” mondial ? Quelles données recueillies par Google ? Sur un compte personnel : Nom, adresse mel, mot de passe Sur chaque accès à une page Google : Envoi de cookies : identification du navigateur, cookie publicitaire… Sur chaque requête : Adresse IP, date et heure, type de navigateur, mots-clés Sur Gmail : Sujets des messages, pour envoi de publicités contextualisées Sur les services affiliés : Informations personnelles transmises au service Sur Google Maps Mobiles : Données de géolocalisation
  • 46. 1.6.1 Google, “big brother” mondial ? Dangers du rachat de DoubleClick (mai 07) : Première régie (1997) et leader du marché publicitaire : gère les bandeaux publicitaires Toucherait 80 à 85 % des internautes Plus grande base de cookies du monde : 1,1 milliard de personnes ! Plusieurs plaintes aux EU Question de la durée de conservation des données de connexion : Conflit avec la Commission Européenne : Avril 08 : durée de conservation des données fixée à 6 mois. Reculs progressifs de Google : Durée de conservation illimitée, de 98 à 2007 Mai 07 : 18 à 24 mois Sept. 08 : Google réduit à 9 mois la durée de conservation
  • 47. 1.6.1 Google, “big brother” mondial ? Ambivalence des discours de Google : Reconnaissance progressive du problème de la conservation des données personnelles, mais : Position ambiguë ou (faussement) angélique Politique du fait accompli: cf Google Street Argument délirant de Larry Page (sur la grippe) ! : « Le fait d’avoir ces données personnelles a beaucoup de valeur. Moins on gardera de traces comme celles-là, plus on aura de chances de tous mourir » (mai 2009). Efforts de transparence, jusqu’à un certain point… Lancement du «  Front de Libération des Données  »… par Google
  • 48. 1.6.2 Les efforts de transparence de Google et leurs limites Efforts de Google dans l’information sur les données personnelles : Centre de confidentialité des données : Volonté de transparence : explication des conditions d’utilisation des données personnelles Mais pas de liste des « services associés » Choix de l’utilisateur : possibilité de désactiver les cookies publicitaires Pas d’identification personnelle abusive Depuis juillet 2008, accès depuis la page d’accueil
  • 49. 1.6.2 Les efforts de transparence de Google et leurs limites Lancement de Google DashBoard , début novembre 2009 Visualisation de toutes les traces laissées sur les applications Google : Requêtes web, utilisation des services Google, etc. Possibilité de gérer ses traces : Effacement des requêtes, gestion des alertes, etc. Limites : Gestion des traces laissées volontairement et non celles récupérées par Google à notre insu Quid du croisement des données par Google ? Illusion de maîtrise par l’usager de ses usages ?
  • 50. 1.6.2 Google et les failles de sécurité Problèmes des failles de sécurité et du cryptage des données : Bug sur Google Docs (7 mars 2009) : partage non autorisé de documents privés entre utilisateurs ; dénonciation des « pratiques laxistes » par l’EPIC, enquête du Gouvernement américain ; En Australie, découverte (20 mars) de 22 000 cartes bancaires dans le cache de Google http://fr.techcrunch.com/2009/03/27/fr-pourquoi-google-nest-pas-invincible/
  • 51.  
  • 52. 1.6.2 Google, panopticon mondial ? Google Street View Nombreux procès, réactions négatives : Aux USA, au Japon, en Grèce , en Allemagne, en France… Deux problèmes juridiques posés par G. Street View : Notion de donnée personnelle : Visage, plaque d’immatriculation = données personnelles Autorisation nécessaire des personnes photographiées En France, intervention de la CNIL (3 juillet 2008), obligeant Google à flouter les visages des personnes, les plaques d’immatriculation… Floutage comme contournement technique du droit Le droit à l’image : Des personnes : Protection de la vie privée, représentation d’une silhouette.. Floutage souvent insuffisant, reconnaissance possible Problème des photos prises dans un espace privé : ex. du Japon Des biens : Plaintes possibles contre Google
  • 53. 1.6.2 Google, panopticon mondial ? Au-delà des aspects juridiques, problème de la transparence (surveillance) généralisée, posé par Google Street View Google Latitude : Application lancée en février 2009 dans 27 pays Service de géolocalisation des personnes, à partir du téléphone mobile (et de l’ordinateur) : Compatible avec plusieurs mobiles Transmission en temps réel de sa localisation à son réseau, suivi sur Google Maps.. Enjeux de profilage marketing Des techniques &quot;potentiellement liberticides«  (CNIL) Problème d’une société de (l’auto-) surveillance
  • 54.  
  • 55. 1.6 Sur les effets possibles des pouvoirs de Google… dans l’avenir Voir la nouvelle de Cory Doctorrow, «  Scroggled  », traduit en français par C&F Editions «  enGooglés  » : «  Pas si simple. Voilà le truc : la surveillance du DHS dans les aéroports n'est rien qu'un premier tri. Cela permet aux affreux d'affiner leurs critères de recherche. Une fois que tu as été retenu pour un interrogatoire complémentaire à la frontière, tu rentres dans la catégorie personne intéressante - et ça ne s'arrête plus jamais. Il vont passer en revue les webcams à la recherche de ton visage et de ta démarche . Il vont lire ton courrier, il vont étudier tes recherches en ligne.  »
  • 56. 1.7 Questionnements critiques Nécessité d’un discours critique sur Google, compte-tenu de son hégémonie et des questions posées Au moins quatre critiques , entrecroisées : Dénonciation des dangers du monopole : “le monde selon Google” Alerte face aux dangers de la traçabilité, de la conservation des donnéées personnelles... Vigilance face à la “googlisation” des usages Critique de “l’idéologie Google”, de “l’impérialisme du bien”
  • 57. 1.7 Questionnements critiques : le « monde selon Google » Risques de monopole d’une entreprise privée sur tous les secteurs de l’information : Dangers de tout monopole Google maître de l’Internet ? Domination de tous les domaines de l’information : recherche d’information, vidéos, info. scientifique, géolocalisation, dossiers médicaux... Ampleur mondiale Nombreuses missions de service public assurées par une entreprise privée : Google Scholar, Books... Question de l’avenir : quelle politique de Google dans 10 ou 20 ans ? Q uelle garantie de gratuité d’accès ? Premières ripostes du gouvernement américain Voir aussi l’article : Google , la « fascisation » rampante du web
  • 58. 1.7 Questionnements critiques : Big Brother Google Dangers de la traçabilité généralisée : Vouloir “organiser toute l’information du monde” = vouloir être informé de tout Somme colossale, inédite, d’informations personnelles détenues par une entreprise privée Pouvoir immense sur les consommateurs : Cf Google Health Vers une société de contrôle général : Fichage généralisé des individus par les états + profilage marketing des consommateurs par les grandes sociétés + transparence des réseaux sociaux + géolocalisation des individus et des objets
  • 59. 1.7 Questionnements critiques : l a « googlisation » des usages “ La vie selon Google” : L’utilisation exclusive de Google pour différentes opérations informationnelles Accès universel pour tous les types de services proposés par Google http://partnerpage.google.com/esc-lille.fr “ Googlisation” des usages : Cf élèves et étudiants qui ne connaissent plus que Google Risques de cette “googlisation” : Appauvrissement des usages, des pratiques et des connaissances en matière d’information Conditionnement par l’idéologie Google Soumission au monopole de Google
  • 60. 1.7 Questionnements critiques : les pièges de « l’idéologie Google » Deux proclamations célèbres : “ Google a pour mission d'organiser à l'échelle mondiale les informations dans le but de les rendre accessibles et utiles à tous.” “ Don’t be evil !” Vision missionnaire, évangéliste de l’information : “Saint-Google”, patron de l’information ? « L'idéologie Google » : Dimension morale chez les fondateurs “ Impérialisme du bien” Mythe de la transparence
  • 61. 1.7 Questionnements critiques : les pièges de « l’idéologie Google » « Don’t be evil » : mythes et réalités de l’idéologie du bien : Distinction entre la « pureté des résultats » et les liens sponsorisés Investissements réels de Google dans de nombreuses bonnes causes : Fondation Google, Literacy Project, volonté de rendre accessibles les ressources… Concours lancé en 2008 pour des projets pouvant « changer le monde » ! Voir les 15 projets philanthropiques retenus Mais fonction d’habillage, de « discours de communication » de cette posture éthique : Mélange de naïveté morale et de calculs stratégiques Bonne conscience absolue : peu de questionnements auto-critiques des « googlers » Contradictions avec la réalité et les pratiques réelles de Google : Cf problèmes sur le droit d’auteur, la censure en Chine, les données personnelles, la politique du secret…
  • 62. 1.7 Questionnements critiques : les pièges de « l’idéologie Google » Trois confusions épistémologiques du discours sur l’information : Sur l’organisation de « toute l’information du monde » : Confusion entre infos-data, données informationnelles et information Sur l’accès à la connaissance : Confusion entre information et connaissance Sur la « démocratie culturelle » : Confusion entre information et culture
  • 63. 1.7 Questionnements critiques : conséquences sur la formation Enjeux de la formation des usagers : Diversifier les outils : Nécessité de faire connaître d’autres outils Elever les niveaux d’usage de Google : Interrogation avancée, différents modules... Déconstruire Google : Expliquer le fonctionnement technique, économique... Montrer les aspects problématiques : données personnelles Donner du recul critique : Face à l’idéologie Google et ses confusions Face aux dangers du monopole
  • 64. 2ème partie : Mieux exploiter les fonctionnalités et les services de Google 2.1 Maîtriser le mode d’interrogation avancée 2.2 Exploration de 6 modules spécialisés : Books News Scholar Blogs Images Groups Autres services
  • 65. 2 Les différents services et produits de Google : vue d’ensemble La recherche d’information : Web Groups Images Annuaire News (Actualités) Maps Books Scholar Blogs Desktop Search Earth Video … La communication : GMail Blogger Talk Mobile La gestion de sites : Analytics Adwords Sitemaps Adsense Autres services : Picasa Translate … Voir liste complète : http://www.webrankinfo.com/google/produits.php
  • 66. 2 Les différents services et produits de Google : vue d’ensemble
  • 67. 2.1 Maîtriser l’interrogation avancée : les opérateurs de recherche Opérateurs booléens et de présence : AND : implicite ; différent de + + : prend en compte l’orthographe exacte - : exclut un ou plusieurs termes (SAUF) OR ( ou |) : l’un ou l’autre ou tous les termes Opérateurs numériques : .. = entre ( 200..300 euros) ..200 = <200 200.. = >200
  • 68. 2.1 Maîtriser l’interrogation avancée : les opérateurs de recherche Opérateurs linguistiques : «… » : recherche d’expression exacte * : astérisque permet de remplacer un terme ~ : recherche sur les synonymes (dans version anglaise) define: : pour trouver la définition d’un mot Règle des requêtes : limite des 10 mots
  • 69. 2.1 Maîtriser l’interrogation avancée : les opérateurs de recherche Filtrage sur le type de documents : filetype: ou ext: : recherche sur le format ou l’extension de fichier Opérateurs de filtrage sur une page web : pour utiliser les caractéristiques d’une page web site: recherche sur le nom de domaine ( hostname ) Lister toutes les pages d’un site Rechercher des fichiers particuliers sur un site (croiser ext: et site:) Affiner une recherche sur un type de sites inurl: et allinurl: : recherche sur l’URL de la page intitle: et allintitle: : affinement de la recherche sur le titre de la page (balise Title) inanchor: et allinanchor: : recherches sur les liens contenant les mots-clés
  • 70. 2.1 Maîtriser l’interrogation avancée : les opérateurs de recherche Opérateurs de fonctions : pour trouver des informations sur une page ou un site cache: : affiche la version cache du document related: : affiche les pages similaires au site ou à la page indiquée link: : affiche les pages liées à un site (fonction bridée sur Google) info: : récapitule toutes les informations dont dispose Google sur un site : version cache, pages similaires, pages liées, pages du site …
  • 71. 2.1 Maîtriser l’interrogation avancée : le filtrage des résultats Nouvelles options de recherche : D’abord sur Google.com ; sur Google.fr depuis novembre 09 Plusieurs possibilités de filtrage : Sur les types de ressources : blogs, vidéos, actualités… Sur les dates de publication Options de tri et d’affichage : Sur la chronologie Sur les recherches associées Affinement et outils : barre latérale gauche de la page de résultats Sur Google.com, opérateur supplémentaire : Wonder wheel : représentation cartographique des concepts Résultats Intégration des données de résultats (ex. date de naissance) Fil d’Ariane des pages web
  • 72. 2.1 Maîtriser l’interrogation avancée : utilisation des nuages de tags Plug-in pour Firefox : Search Cloudlet créé par un Institut de recherche en informatique (INTSPEI) Pour télécharger le plug-in : http:// getcloudlet.com / Création d’un nuage de tags à partir d’une page de résultats, sur Google et Yahoo Demander « Affichage des résultats par 100 », dans les Préférences Double intérêt pour : La navigation dans les résultats : Clic sur un tag : affinement de la requête Onglet « Sites » : affichage et recherche dans les sites les plus présents Onglet « Net » : affichage des noms de domaines représentés La veille : Représentation des grandes thématiques sur un corpus Repérage des « signaux faibles » (d’après Netsources, n° 78, 2009)
  • 73. 2.2 Modules spécialisés : Google Livres Fonctions : Recherche fonctionne de la même façon que la recherche web Consultation des livres en ligne Selon les droits attachés, accès à un aperçu du livre, à des extraits ou au texte intégral Pour des ouvrages du domaine public, téléchargement pdf possible Informations complémentaires Critique de livre, références… Accès au livre Bibliothèque ou librairie
  • 74. 2.2 Modules spécialisés : Google Livres Affichage du livre en entier (Source Google Livres)
  • 75. 2.2 Modules spécialisés : Google Livres Aperçu limité (Source Google Livres)
  • 76. 2.2 Modules spécialisés : Google Livres Affichage d’extraits Source Google Livres
  • 77. 2.2 Modules spécialisés : Google Livres Exploiter le document et gérer sa bibliothèque à partir du compte personnel Google Marquer (bookmarks) des livres et les partager Ajouter à sa bibliothèque Annoter, évaluer et commenter les ouvrages Naviguer dans l’ouvrage Consulter les infos sur l’ouvrage Trouver l’ouvrage Rechercher dans l’ouvrage
  • 78. 2.3 Modules spécialisés : Google Actualités Recherche dans plus de 500 sources d’actualité en langue française Recherche avancée : Filtrages possibles sur : La source, la date, le lieu, l’emplacement des mots Opérateurs de recherche : intitle: et allintitle: : dans le titre des articles intext: et allintext: : dans le texte des articles inurl: : dans un site particulier source: : sur une source précise Source:Libération location: : dans un pays précis Location:Algérie
  • 79. 2.3 Modules spécialisés : Google Actualités Fonctionnalités : Personnalisation : Ouvrir Modifier cette page Voir aussi sur les InfoStratèges .com Veille : Syndication de fils RSS Abonnement gratuit aux alertes : par thèmes... Deux nouveautés : Recherche dans les archives de journaux Recherche d’informations locales pour la France Google News Archive Search : Archives de presse Lancé en 2006, généralisé en 2008 Recherche dans 200 ans d’archives de journaux Affichage de chronologies Pour en savoir plus : voir brochure de Google
  • 80. 2.4 Modules spécialisés : Google Scholar Préférences : interface en français Lien vers bibliothèques Champs et opérateurs avancés d’interrogation : Sur l’auteur : author: ou champ Auteur en mode avancé Sur le titre d’une revue : Uniquement en mode avancé : champ Publication , Sur le titre d’un article ou d’un document : Opérateur intitle: Sur la date : Uniquement en mode avancé : champ Date Pour en savoir plus
  • 81. 2.5 Modules spécialisés : Google Blogs BlogSearch : Lancé en sept. 2005 Au début, collecte des contenus par les fils RSS et non par le robot ; depuis automne 2008, indexation par le robot web Indexation en temps réel Fonctionnalités de recherche : Sur le titre du blog Sur l’adresse d’un blog Sur le titre d’un billet Sur l’auteur Sur les dates Conservation des anciens billets : Recherche possible sur les anciens billets en précisant la date
  • 82. 2.6 Modules spécialisés : Google Images De nouvelles modalités pour la recherche d’images : Filtres de Google Image : Filtrage par type de contenus : recherche de visages, images d’actualités, dessins, photos, images clipart Filtrage par taille des images Filtrage par format d’image et format de fichier Filtrage des couleurs En ajoutant à l'URL de la page de résultats le paramètre &quot; &imgcolor= &quot; suivi du nom anglais de la couleur de votre choix Filtrage par domaines Filtrage par type de licence SafeSearch Images similaires Problèmes récents de pertinence de la recherche et du classement des résultats sur Google Image Voir le site Googr.net
  • 83. 2.7 Modules spécialisés : Google Groups Chercher ou créer un forum de discussion ( > avril 2001) : Google Groups : Ancienne base de DejaNews Toutes les archives de Usenet depuis 1976 Recherche + possibilité de créer un groupe Recherche : Sur la date des messages Sur le nom du groupe Sur l’objet du messsage Sur l’auteur du message Sur son ID
  • 84. 2.8 Services de recherche d’information : alertes, pages perso. Google Alerts Alertes Google Actualités : février 2004 en France Google Web Alertes : mars 2004 Fusion en septembre 2004 : une seule interface Système de veille, avec envoi par mel d’articles (News), de textes (Web)… Paramètres : Indication de mots clés Domaines de recherche (actualités, web, groupes, tous les types) Fréquence de l’alerte mail IGoogle : création de sa page personnalisée Sélection de centres d’intérêt Choix d’un thème Modules Google Ajout de flux RSS Google Reader : Agrégateur RSS de Google permettant d’afficher les flux sur la page personnelle
  • 85. 2.9 Services de recherche d’information : moteur personnalisable Définition des moteurs personnalisables : Choix par l’internaute du périmètre des recherches : ensemble donné de sites web, thématique précise, type d’informations Compte gratuit, système de veille Tendance actuelle des moteurs de recherche Google Custom Search Engine : Lancé en octobre 2006 Base du moteur : index de Google Pas de limite au nombre de sites Possibilité d’intégrer le moteur sur un site privé Ex. : Réseau Urfist
  • 86. 2.10 Outils de suivi de Google Google Zeitgeist : Liste des requêtes les plus populaires posées sur Google Publiées tous les mois et tous les ans sur la version américaine : Voir Zeitgeist 2008 Consultation des Zeitgeist par pays Intérêt sociologique et historique

Notes de l'éditeur

  1. Résultats trimestriels Sur cette période le groupe a affiché des revenus de 6,775 Mds$, en augmentation de 23% par rapport au même trimestre de l&apos;année précédente, et en croissance de 1,5% en séquentiel, par rapport au T4 2009. Ces revenus se ventilent de la façon suivante : 4,44 Mds$ pour les liens sponsorisés AdWords , soit 65,5% des revenus, en augmentation de 20,2% en glissement annuel et 0,4% en séquentiel 2,04 Mds$ pour le programme AdSense , soit 30,1% des revenus, en augmentation de 24,3% en glissement annuel et en baisse de 0,4% en séquentiel et 4,4% pour les autres revenus On remarque que la plus grosse croissance vient cette fois des autres revenus : s&apos;agit-il des outils de Google App qu&apos;un certain nombre d&apos;entreprises ont déjà adopté ? Ou bien la publicité sur  Google Local et dans chaque vidéo YouTube  ? Autres chiffres : 53% des revenus sont établis à l&apos;international (comme pour le trimestre précédent). les coûts d&apos;acquisition de trafic ont été de 1,71 Mds$ dont 1,45 Mds$ qui représentent le reversement aux éditeurs AdSense (Google a donc reversé 71,2% des revenus AdSense, encore en baisse comme le trimestre précédent (voir le graphique ci-dessous) au 31/12/2009 l&apos;entreprise comptait 20621 employés à plein temps (contre 19835 au 31/12/2009 et 19665 au 30/09/2009,  20123 au 30/09/2008 et 15916 au 30/09/2007) Google disposait au 31/03/2010 de 26,5 Mds$ de cash. De quoi faire de bien belles acquisitions , comme l&apos;a d&apos;ailleurs déjà annoncé son PDG Eric Schmidt l&apos;année dernière… Part des revenus AdSense reversée aux éditeurs (affiliés) : En faisant une moyenne globale sur l&apos;ensemble des éditeurs AdSense, voici l&apos;évolution de la part reversée par Google. Ce n&apos;est sans doute pas très juste mais étant donné que Google n&apos;est pas transparent sur cet aspect, nous ne pouvons pas en savoir plus…
  2. On remarque que la plus grosse croissance vient cette fois des autres revenus : s&apos;agit-il des outils de Google App qu&apos;un certain nombre d&apos;entreprises ont déjà adopté ? Ou bien la publicité sur  Google Local et dans chaque vidéo YouTube  ?
  3. Google.com : 64,9 en septembre 2009 65,5 en février 2010 Montée de Bing Derniers chiffres fournis par comScore  : En mars 2010, Google a représenté 65,1% des requêtes effectuées sur l&apos;ensemble des moteurs de recherche, soit 0,4 point de moins par rapport au mois précédent Yahoo gagne 0,1 point à 16,9% Microsoft gagne 0,2 point à 11,7% Ask gagne 0,1 point à 3,8% AOL reste stable à 2,5% Les Américains ont effectué 15,4 milliards de requêtes en mars soit 7% de plus qu&apos;en février mais 3,7% de moins si on ramène cela à un nombre journalier. En rapportant au nombre de requêtes quotidiennes, il y a eu moins de requêtes effectuées sur le site de vidéos YouTube.com (-6%) par rapport au mois précédent. La plus grosse augmentation est celle de Facebook qui progresse de 48% (34% en ramenant au nb de jours). Cela dit les internautes font 16 fois plus de requêtes sur les sites de Google (search seulement) que sur Facebook. Depuis le lancement de Bing début juin 2009 , le moteur de Microsoft est passé de 8,0% en mai 2009 à 11,7% en mars 2010. Quand l&apos;accord entre Microsoft et Yahoo sera opérationnel, ces 2 challengers réunis représenteront environ 28,6% contre 65,1% pour leur rival Google . Quant à Yahoo, pas sûr que le transfert de tous les internautes d&apos;Altavista vers Yahoo augmente tant que ça sa part de marché… Pauvre Altavista : repose en paix ! Selon Hitwise, Google a encore gagné des parts de marché aux Etats-Unis en avril 2010 , dépassant largement les 70%. Yahoo continue sa chute, tout comme Bing ce mois-ci.
  4. La question se pose de savoir si Google procède au déploiement de sa nouvelle infrastructure de recherche. Caffeine est le nom de code de la prochaine génération d&apos;architecture pour la recherche Web opérée par Google . La firme de Mountain View a révélé l&apos;existence de ce projet l&apos;été dernier dans le cadre d&apos;une phase de test. De l&apos;aveu de Google, l&apos;utilisateur lambda ne devrait pas forcément constater de réelles différences dans les résultats de recherche. Reste que Google a tout de même promis une amélioration de la vitesse d&apos;indexation des résultats de recherche pour du quasi temps réel, la création d&apos;un index plus imposant et également un impact sur la pertinence. Selon plusieurs webmasters, Caffeine commence à être déployé sur des centres de données, ce que Google n&apos;a pour l&apos;heure pas confirmé. Neowin a dressé une petite liste des centres de données soupçonnés d&apos;être déjà passés à Caffeine. Dans la pratique, ce n&apos;est pas véritablement probant. À voir si Google communiquera sur le sujet dans les prochaines heures. Pour lrbtrax , plusieurs changements Google ont récemment été mis en place avec des conséquences sur le classement de certains sites, la vitesse des recherches. Cette société spécialisée dans le marketing Internet estime néanmoins que le lancement complet de Caffeine n&apos;a pas encore eu lieu.
  5. Début décembre, c’est la fête pour le groupe La Martinière / Le Seuil. Les « petits » éditeurs ont vaincu le « grand » Google dans un procès qui les opposait. Google a été jugé coupable de contrefaçon , avec 300 000 euros de dommages et intérêts, pour avoir diffusé des livres français encore soumis au droit d’auteur. Les avocats ont même réussi à mettre en cause Google France dans l’histoire. Toutefois, les éditeurs ont peut-être gagné une bataille, mais la guerre est loin d’être terminée. Google a fait appel de ce jugement, il faut dire que les approximations et analyses douteuses dans ce procès ont été nombreuses . En Chine une plainte du même type a été déposée , la justice locale tranchera en mars prochain. L’Asie étant un marché sensible, les gens de Bellevue-la-Montagne ont préféré s’excuser auprès des auteurs chinois . Attention à ne pas se tromper de débat, comme les éditeurs l’aimeraient, en mélangeant les polémiques précédentes à celles qui concernent la numérisation des œuvres de bibliothèques françaises. Les principales critiques ont été adressées à l’encontre de la Bibliothèque Municipale de Lyon, qui a signé un partenariat avec Google . Nicolas Sarkozy lui-même est contre cette idée – quitte à débourser plusieurs centaines de millions d’euros pour créer une pseudo-alternative – alors même que les arguments qui tiennent la route face à l’entreprise californienne se comptent sur les doigts d’une main. Des dizaines de milliers de livres, numérisés par Google , seront bientôt mis en vente. Ils seront disponibles non pas par téléchargement mais par consultation à l&apos;aide d&apos;un navigateur et donc depuis n&apos;importe quel ordinateur , contrairement aux livres électroniques récupérables à l&apos;aide du Kindle d&apos;Amazon ou de l&apos; iPad d&apos;Apple. Depuis plusieurs années, Google numérise des quantités énormes d&apos;ouvrages, souvent sans souci des droits d&apos;auteurs (on parle de douze millions de livres). On se souvient notamment de ses démêlées avec l&apos;éditeur français La Martinière qui avait peu apprécié la mise en ligne de livres sans son consentement. Le procès qui s&apos;en est suivi interdit à Google de diffuser gratuitement des livres français sur le site Google Livres. Aux Etats-Unis, l&apos;entreprise s&apos;est également heurtée à la réaction d&apos;éditeurs, avant de trouver un accord financier. En octobre dernier, Google avait annoncé un projet différent : la vente de livres en ligne. Lors d&apos;une conférence des éditeurs à New York, l&apos;un des responsables de la société, Chris Palma, a confirmé cette intention et fournit de nombreuses précisions, rapportées par le Wall Street Journal . « En juin ou en juillet » sera lancé un nouveau service, Google Editions. La concurrence est donc frontale avec les vendeurs de livres électroniques, comme Amazon, Apple et Sony. Librairie mondiale en cours de construction La méthode choisie est cependant différente. Jusqu&apos;ici, l&apos;unique principe retenu était celui du téléchargement à l&apos;aide d&apos;un matériel ou d&apos;un logiciel dédiés. Sony impose son Reader et Apple son iPad . Amazon, qui propose le Kindle , a élargi son offre après l&apos;annonce de l&apos;appareil d&apos;Apple, en diffusant son logiciel de téléchargement de livres électroniques pour les PC sous Windows, les Mac , l&apos; iPhone , le Blackberry et même pour l&apos;iPad. Google va plus loin en évitant le téléchargement : les ouvrages sont consultables en ligne grâce à n&apos;importe quel navigateur. Tout ordinateur ou smartphone pourra donc devenir un e-book. Le confort de lecture, en revanche, ne sera pas le même. Le projet prévoit la rémunération de l&apos;éditeur. Google doit désormais conclure une série d&apos;accords avec eux. On ne sait pas, pour l&apos;instant, combien de références seront proposées ni dans quels pays Google Editions sera disponible.
  6. Depuis trois ans, Google aurait ainsi amassé 600 gigaoctets de données potentiellement sensibles… L’affaire des données wifi récupérées par les voitures de Google Street View qui a éclaté il y a deux semaines aura finalement fait plus de bruit que prévu. Quand la version allemande de la CNIL a dénoncé le fait que ces Google cars récupéraient des informations sur les réseaux sans fil, la firme américaine avait aussitôt émis un communiqué expliquant que seuls les noms et identifiants des boîtiers Wifi étaient enregistrés, dans le but d’améliorer le système de positionnement. Après enquête interne, il s’avère que ces voitures étaient bien plus indiscrètes que ça. Selon Google , le programme utilisé pour analyser les données sans fil ( Kismet ) capturait et enregistrait par erreur des paquets contenant de bribes d’informations privées. L’entreprise aurait engrangé au total 600 gigaoctets de données non-utiles depuis 2007. 600 gigaoctets peuvent sembler être une masse importante de données, mais c’est finalement peu comparé aux pétaoctets nécessaires au stockage des photographies de Google Street View . La firme assure n’avoir jamais eu l’intention de s’en servir et va faire au plus vite pour les supprimer de ses serveurs. En attendant, les voitures ont été temporairement stoppées et à l’avenir il a été décidé que plus aucune information provenant des réseaux wifi ne sera enregistrée. Malgré les efforts déployés par la multinationale, les autorités allemandes perdent encore un peu plus confiance en Google. Par conséquent, vous n’êtes pas prêts de voir en ligne les clichés panoramiques de Berlin, Hambourg ou Francfort… En revanche, vous pourrez découvrir les vues à 360 degrés de l’Afrique du Sud dans dix jours , soit deux semaines avant le début de la Coupe du Monde de football. Google a profité de cette annonce pour dévoiler qu’une version sécurisée de son moteur de recherches sera disponible dès la semaine prochaine. Bonne nouvelle pour les utilisateurs, mauvaise pour les webmasters et spécialistes des web analytics puisque les sites en « https » ne transmettent pas de referer lorsque l’on clique sur un lien. Dès lors il sera impossible pour le webmaster de connaître les mots-clés utilisés par l’internaute pour accéder à son site…
  7. Depuis trois ans, Google aurait ainsi amassé 600 gigaoctets de données potentiellement sensibles… L’affaire des données wifi récupérées par les voitures de Google Street View qui a éclaté il y a deux semaines aura finalement fait plus de bruit que prévu. Quand la version allemande de la CNIL a dénoncé le fait que ces Google cars récupéraient des informations sur les réseaux sans fil, la firme américaine avait aussitôt émis un communiqué expliquant que seuls les noms et identifiants des boîtiers Wifi étaient enregistrés, dans le but d’améliorer le système de positionnement. Après enquête interne, il s’avère que ces voitures étaient bien plus indiscrètes que ça. Selon Google , le programme utilisé pour analyser les données sans fil ( Kismet ) capturait et enregistrait par erreur des paquets contenant de bribes d’informations privées. L’entreprise aurait engrangé au total 600 gigaoctets de données non-utiles depuis 2007. 600 gigaoctets peuvent sembler être une masse importante de données, mais c’est finalement peu comparé aux pétaoctets nécessaires au stockage des photographies de Google Street View . La firme assure n’avoir jamais eu l’intention de s’en servir et va faire au plus vite pour les supprimer de ses serveurs. En attendant, les voitures ont été temporairement stoppées et à l’avenir il a été décidé que plus aucune information provenant des réseaux wifi ne sera enregistrée. Malgré les efforts déployés par la multinationale, les autorités allemandes perdent encore un peu plus confiance en Google. Par conséquent, vous n’êtes pas prêts de voir en ligne les clichés panoramiques de Berlin, Hambourg ou Francfort… En revanche, vous pourrez découvrir les vues à 360 degrés de l’Afrique du Sud dans dix jours , soit deux semaines avant le début de la Coupe du Monde de football. Google a profité de cette annonce pour dévoiler qu’une version sécurisée de son moteur de recherches sera disponible dès la semaine prochaine. Bonne nouvelle pour les utilisateurs, mauvaise pour les webmasters et spécialistes des web analytics puisque les sites en « https » ne transmettent pas de referer lorsque l’on clique sur un lien. Dès lors il sera impossible pour le webmaster de connaître les mots-clés utilisés par l’internaute pour accéder à son site… 1er mai C’est la révélation que Google utilisait ses voitures pour enregistrer les identifiants des boîtiers Wifi qui a mis le feu aux poudres. Ilse Aigner, la ministre de la communication, a appelé les Allemands à se défendre contre Google. Le groupe américain, décidément peu enclin à se rebeller contre le gouvernement local contrairement à ce qu’il a fait en Chine, a plié une fois de plus. Aucune image ne sera publiée tant que toutes les demandes de retrait n’auront pas été examinées, y compris les plaines collectives des municipalités. Sachant que les Allemands n’ont qu’un simple formulaire à remplir (ou e-mail à envoyer) pour qu’une photographie soit supprimée et que cela ne va pas cesser de si tôt, vous ne risquez pas de voir les vues à 360 degrés de Stuttgart ou de Hambourg prochainement… (zorgloob)
  8. Les clichés des voitures de Google sont-ils trop précis, ou pas ? Décidément, Google n’a vraiment pas de chance avec l’Europe ces derniers temps. Les ennuis politico-judiciaires s’accumulent pour la société californienne : jugement en défaveur de Google Vidéo en Italie (avec la pseudo-crainte d’un web censuré remise au goût du jour par la défenderesse), des plaintes pour abus de position dominante (position dominante, oui, mais où est l’abus ?), « taxe Google » en France, etc. Dernière attaque en date, celle du G29 , un organisme réunissant les différents organismes de protection des libertés et des données en Europe. La France est représentée par la CNIL . Selon l’AFP , le G29 a émis des critiques contre la durée de conservation des photographies originales réalisées par les voitures de Google Street View. En effet, pour améliorer sans cesse ses outils de floutage, Google conserve les clichés bruts pendant un an. Le G29 exige que la firme de Mountain View conserve les photos six mois au maximum. Pour l’organisme de protection de la vie privée, cela part d’une bonne intention car des demandes judiciaires ont déjà été envoyées à Google pour fournir les clichés non-floutés (dans une affaire d’agression publique notamment) et Google a accepté. Là où le bât blesse, c’est sur l’argument du G29 pour justifier sa requête. Selon eux, le taux d’erreur concernant les floutages effectués sur les vues panoramiques de Google Street View est « très bas » et qu’il est donc « disproportionné de conserver les copies non floutées des photos pendant un an » après la publication sur internet. Or, c’est exactement l’argument contraire qui était utilisé par le préposé suisse à la protection des données il y a quelques mois pour justifier son ultimatum envers Google Street View. Selon Hanspeter Thür, il y avait un taux d’erreur de 2% avec le système de floutage de Google et qu’il avait reçu en conséquence de nombreuses plaintes. Alors qui croire ? Certes, la Suisse ne fait pas partie du G29 mais on pourrait s’attendre à une harmonisation des arguments dans ce domaine qui touche uniformément les occidentaux. Doit-on voir dans cette requête du groupement européen une dernière pique d’Alex Türk dans un but médiatique, une semaine avant que celui-ci quitte ses fonctions de président du G29 ? Quoiqu’il en soit, un accord a été trouvé en Suisse, tout comme en Allemagne récemment, ce qui indique que Google va rendre public dans les semaines à venir les vues à 360° prises dans ces pays européens qui ne sont pas encore couverts, sans oublier la Belgique, l’Autriche, la Roumanie, et bien d’autres . Par ailleurs, il n’y a pas que les clichés pris par les Google cars qui sont utilisés pour le projet Street View, les photographies des utilisateurs sont également disponibles (non floutées, soit dit en passant) et la navigation parmi celles-ci a été améliorée cette semaine .
  9. Les clichés des voitures de Google sont-ils trop précis, ou pas ? Décidément, Google n’a vraiment pas de chance avec l’Europe ces derniers temps. Les ennuis politico-judiciaires s’accumulent pour la société californienne : jugement en défaveur de Google Vidéo en Italie (avec la pseudo-crainte d’un web censuré remise au goût du jour par la défenderesse), des plaintes pour abus de position dominante (position dominante, oui, mais où est l’abus ?), « taxe Google » en France, etc. Dernière attaque en date, celle du G29, un organisme réunissant les différents organismes de protection des libertés et des données en Europe. La France est représentée par la CNIL . Selon l’AFP, le G29 a émis des critiques contre la durée de conservation des photographies originales réalisées par les voitures de Google Street View. En effet, pour améliorer sans cesse ses outils de floutage, Google conserve les clichés bruts pendant un an. Le G29 exige que la firme de Mountain View conserve les photos six mois au maximum. Pour l’organisme de protection de la vie privée, cela part d’une bonne intention car des demandes judiciaires ont déjà été envoyées à Google pour fournir les clichés non-floutés (dans une affaire d’agression publique notamment) et Google a accepté. Là où le bât blesse, c’est sur l’argument du G29 pour justifier sa requête. Selon eux, le taux d’erreur concernant les floutages effectués sur les vues panoramiques de Google Street View est « très bas » et qu’il est donc « disproportionné de conserver les copies non floutées des photos pendant un an » après la publication sur internet. Or, c’est exactement l’argument contraire qui était utilisé par le préposé suisse à la protection des données il y a quelques mois pour justifier son ultimatum envers Google Street View. Selon Hanspeter Thür, il y avait un taux d’erreur de 2% avec le système de floutage de Google et qu’il avait reçu en conséquence de nombreuses plaintes. Alors qui croire ? Certes, la Suisse ne fait pas partie du G29 mais on pourrait s’attendre à une harmonisation des arguments dans ce domaine qui touche uniformément les occidentaux. Doit-on voir dans cette requête du groupement européen une dernière pique d’Alex Türk dans un but médiatique, une semaine avant que celui-ci quitte ses fonctions de président du G29 ? Quoiqu’il en soit, un accord a été trouvé en Suisse, tout comme en Allemagne récemment, ce qui indique que Google va rendre public dans les semaines à venir les vues à 360° prises dans ces pays européens qui ne sont pas encore couverts, sans oublier la Belgique, l’Autriche, la Roumanie, et bien d’autres. Par ailleurs, il n’y a pas que les clichés pris par les Google cars qui sont utilisés pour le projet Street View, les photographies des utilisateurs sont également disponibles (non floutées, soit dit en passant) et la navigation parmi celles-ci a été améliorée cette semaine.