SlideShare une entreprise Scribd logo
1  sur  32
Sylvain Gateau




Le web sémantique pour mieux anticiper le futur…

Préparons dès à présent le contenu web pour les futurs terminaux…




       UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication
                                    Master 2 AVMN – 2012-2013 - Mémoire sur les pratiques professionnelles
GATEAU Sylvain – Le web sémantique : un pas vers le « future friendly web » - page 1




UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 2




Remerciements


À l’issue de ce travail de synthèse, je tiens à remercier très sincèrement :


// Philippe Quinton, enseignant à l’Université Stendhal de Grenoble, pour son suivi et ses
remises en questions tout au long de ma réflexion.

// Valérie Lépine, enseignante à l’Université Stendhal de Grenoble, pour m’avoir aidée
quant à l’élaboration de ma problématique.


// Viviane Clavier, enseignante à l’Université Stendhal de Grenoble, pour sa disponibilité
et son expertise sur la thématique du web sémantique.

// Julien Pierre, enseignant-chercheur à l’Université Stendhal de Grenoble, pour son cours
d’enseignement sur le web sémantique.


// Et enfin, Antoine Lefeuvre, responsable R&D chez Novius, pour sa disponibilité et son
précieux témoignage.




            UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   2
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 3


Sommaire

Sur les traces du web sémantique… ................................................................................... 4	
  
1	
   Un web renovateur........................................................................................................ 6	
  
       1.1	
   Le web de documents ............................................................................................ 6	
  
       1.2	
   Le web social ......................................................................................................... 7	
  
       1.3	
   Le web sémantique ................................................................................................ 8	
  
          1.3.1	
   Coopération homme / machine ...................................................................... 8	
  
          1.3.2	
   Des triplets, des URI*, un graphe .................................................................. 9	
  
          1.3.3	
   Quelques vocabulaires et attributs courants ................................................. 10	
  
2	
   Bienvenue dans le « Future friendly web » ................................................................ 12	
  
       2.1	
   Le « responsive design » ..................................................................................... 12	
  
       2.2	
   « Future-ready content »...................................................................................... 13	
  
       2.3	
   « COPE : Create Once, Publish Everywhere » ................................................... 14	
  
3	
   Vers une redéfinition de l’écosystème numérique ..................................................... 15	
  
     3.1	
   Réorganisation du référencement naturel* .......................................................... 15	
  
          3.1.1	
   Le référencement par la sémantisation ......................................................... 15	
  
          3.1.2	
   Les moteurs de recherche sémantique .......................................................... 16	
  
          3.1.3	
   Les impacts sur la pratique du web .............................................................. 16	
  
       3.2	
   Le contenu au cœur du processus ........................................................................ 17	
  
       3.3	
   L’apparition de nouveaux corps de métiers ........................................................ 19	
  
          3.3.1	
   Les architectes et stratèges de contenu ......................................................... 19	
  
          3.3.2	
   Les UI et UX designers ................................................................................ 20	
  
Le début d’un long chantier… .......................................................................................... 21	
  
Lexique ............................................................................................................................. 22	
  
Bibliographie .................................................................................................................... 23	
  
Sitographie ........................................................................................................................ 24	
  
Annexe n°1 : Retranscription d’interview - Antoine Lefeuvre, responsable R&D chez
Novius Labs ...................................................................................................................... 26	
  
Annexe 2 : Interface d’administration du CMS COPE Novius OS .................................. 30	
  
	
  




                     UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   3
GATEAU Sylvain – Le web sémantique : un pas vers le « future friendly web » - page 4




Sur les traces du web sémantique…
Lorsque j’ai débuté mes études supérieures, je souhaitais couvrir les événements sportifs
à la télévision, partir à la rencontre des grands champions et travailler pour la télévision.
Un rêve d’enfant, qui ne restera qu’un joli rêve. Puis, je me suis orienté vers la
Communication, un univers vaste, tendance et agréablement prisé par la gente féminine,
pour travailler dans l’organisation d’événements sportifs. Et cinq plus tard, je m’apprête à
entrer dans la vie active en tant que chef de projets web. Véritablement rien ne me
prédisait à me spécialiser vers ce métier, et encore moins dans le domaine du web…
Plutôt habitué au grand air et aux espaces blancs, me voilà à l’aube d’une nouvelle
expérience vécue à travers des écrans, petits, grands, tactiles ou non et interconnectés
entre eux grâce au web et à l’Internet. Il y a encore trois années de cela, j’apprenais à
développer ma première page HTML* sur Dreamweaver, avec beaucoup de texte, peu de
CSS* et encore moins d’interactions. Cette année, avec mes collègues de promotion,
nous avons pensé, conçu et géré le bon développement du site Internet « Savoir-faire,
faire savoir »1 sur le principe du « responsive design »2. Et tout cela en utilisant un seul et
même contenu, adapté aux écrans des différents terminaux.
Le contenu est véritablement un paramètre stratégique et incontournable dans les projets
web d’aujourd’hui et de demain. Lorsque nous allons sur le web via un navigateur ou que
nous utilisons une application mobile, nous cherchons des informations textuelles,


1
    Site consultable sur l’URL suivante : http://www.sffs.clic-et-clap.fr
2
    Le « responsive design » consiste à adapter le contenu d’un site web aux différentes contraintes de résolution d’écrans


                    UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   4
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 5



visuelles, multimédias pertinentes et nous souhaitons les obtenir en l’espace de quelques
clics ou touchers. Les internautes sont de plus en plus exigeants et ont accès aux contenus
à travers différents écrans devenus, pour certains, mobiles. À l’heure où l’« Open Data »3
se déploie, nous, internautes, sommes submergés par une masse d’informations, qui ne
cesse de croitre d’année en année sur le web. Le contenu est la réponse à nos besoins, à
nos recherches, à notre utilisation du web selon moi. Un chef de projets web ne doit donc
pas le négliger : il doit être réfléchi, travaillé et mis en valeur.
Aujourd’hui, le web connaît une rénovation comme le diraient certains professionnels et
universitaires. Après le web 1.0 et le web 2.0, nous voici entrés dans l’ère du web
sémantique. Alors que Google est incontestablement le moteur de recherche le plus
utilisé dans le monde, une actualité m’a particulièrement passionnée en cette année
2012 : le lancement de « Knowledge Graph »4, un moteur de recherche sémantique (« Le
Graphe du Savoir »). Pourquoi Google, acteur majeur du web et habitué à être en position
de leader, présente « seulement en 2012 » un tel projet alors que d’autres s’y sont déjà
employés depuis 2008 comme Wolfram Alpha5 ? Quels enjeux se cachent derrière le web
sémantique ? Quels impacts sont à prévoir sur l’écosystème numérique et quelles peuvent
en être les opportunités pour les agences web et les professionnels du secteur ? À la
croisée des sciences humaines et sociales ainsi que des sciences de l’information et de la
communication, le web sémantique, aussi appelé web de données, « linked data »6 ou
encore web 3.0, est sur le point de modifier considérablement le paysage numérique ainsi
que les enjeux communicationnels.
Mon regard de futur professionnel du web s’attarde sur l’émergence du web sémantique
et me motive à raisonner autour de la problématique suivante :
« Le web sémantique comme dispositif socio-technique : vers une redéfinition des
enjeux communicationnels et de l’organisation de l’écosystème numérique ? »

Au cours de cette synthèse, je ne vais pas décrire le fonctionnement détaillé du web
sémantique, qui serait bien trop compliqué à expliquer et qui résulterait d’un
raisonnement d’informaticien et/ou de documentaliste. Je vais dans un premier temps
revenir sur les étapes marquantes qu’a vécu le web afin de présenter le contexte
d’émergence du web sémantique. Je m’intéresserai par la suite aux courants et pensées
dans lesquels s’inscrit l’émergence de ce web 3.0. Je terminerai ce travail de synthèse par
une observation des enjeux communicationnels et des possibles changements à venir
dans l’écosystème numérique avec l’arrivée du web sémantique.




3
  Ouverture et libre accès des données publiques. URL de la plateforme française d’ouverture des données publiques :
http://www.data.gouv.fr/
4
  URL : http://www.google.com/insidesearch/features/search/knowledge.html
5
  Moteur de recherche sémantique. URL : http://www.wolframalpha.com/
6
  Données liées


               UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   5
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 6




             1 Un web renovateur
             Le web est certes récent, mais il possède déjà sa propre histoire. Que nous soyons
             « digital natives » 7 ou non, utilisateurs réguliers de ressources documentaires en ligne ou
             non, nous avons tous côtoyé et suivi directement ou indirectement l’évolution du web :
             par le biais de notre travail, de nos études, de notre entourage, de notre éducation ou tout
             simplement par nos propres utilisations personnelles. Le web est ancrée dans la société et
             est en continuelle mouvance. L’époque où l’utilisateur ne faisait qu’interroger la machine
             est bien lointaine, mais elle n’a pas totalement disparu pour certains utilisateurs...
             En l’espace de quelques années, le web est passé d’un simple support de consultation à
             « un gigantesque livre » dans lequel les internautes peuvent commenter, échanger,
             produire, partager, converser... Après avoir ajouté une couche sociale et interactive, les
             acteurs du web tels que W3C*, Google ou autre Facebook, promeuvent aujourd’hui
             l’enrichissement sémantique des contenus : le web devient petit à petit « une gigantesque
             base de données ». Pour comprendre ce qu’est le web sémantique, il est important
             d’observer les différentes étapes qui ont conduit à ce vaste projet de sémantisation des
             contenus.

                 1.1    LE WEB DE DOCUMENTS
             Le web 1.0 , aussi connu sous l’appellation « web de documents », fait référence au
             milieu des années 1990 lorsque les premiers navigateurs Internet sont apparus (Nescape,
             Microsoft Explorer, etc.). À cette époque, le web 1.0 permet de diffuser des ressources
                                 non structurées telles que des pages HTML*. Celles-ci sont reliées
                                            entre elles par l’utilisation de liens hypertextes, l’unique facteur
                                            d’interactivité homme / machine (cf. Figure 1). Un utilisateur peut
                                            donc consulter une page et se diriger vers une autre en cliquant sur
                                            un lien. Selon Bruno Bachimont, « le web 1.0 fait ses traitements à
                                            l’aveugle, en ne prenant en compte que le format de codage des
                                            contenus, mais non la sémantique de ces derniers »8. Il s’agit là d’un
                                            constat important qui marquera l’apparition d’une première
                                            problématique : quel est le moyen d’enrichir les traitements
Figure 1 : Les documents HTML*
                                            informatiques et d’exploiter le sens des contenus afin de délivrer des
sont reliés entre eux par des liens
hypertextes    non    typés.    Les         réponses précises et qualitatives à notre requête ? Dans un premier
machines ne peuvent pas exploiter           temps, la solution a été d’inclure l’utilisateur dans le processus : il
le contenu car le contenu n’est pas
structuré. Les données contenues            s’agit du web social…
dans les bases de données ne sont
pas interrogeables.
             7
               Les « digital natives » sont des personnes issues de la génération Y (nées dans les années 1980 et 1990), qui ont grandi et vécu
             au milieu d’un monde numérique de plus en plus connecté, au contact du web. Selon la journaliste Cécil Dijoux7 du site OWNI,
             la génération Y est sur-éduquée, sur-informée et post-idéologique, ne croyant ainsi qu’en ce qui marche.
             8
               Citation tirée de la revue DOCUMENTALISTE SCIENCES DE L’INFORMATION, n°48/4, page 25.


                              UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   6
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 7



                   1.2   LE WEB SOCIAL
              Au milieu des années 2000, nous avons vu apparaître des nouveaux concepts de sites
              web, n’ayant plus pour seul objectif de diffuser des ressources, mais de connecter les
              internautes entre eux. Il s’agit du web 2.0, que certains appellent aussi « web
              participatif », « web social » ou encore « web communautaire ». L’interaction sociale est
              un des facteurs clés de cet espace virtuel. De nombreux outils et réseaux sociaux voient le
              jour tels que les blogs, les wikis*, les forums, Facebook, Twitter, Flickr, Youtube,
              Foursquare, etc. Désormais, les internautes ont la possibilité d’ajouter leurs
                                                            connaissances aux contenus qu’ils consultent à travers leurs
                                                            propres interprétations et annotations. Ils ne sont plus
                                                            spectateurs mais contributeurs des ressources publiées sur le
                                                            web. Ils peuvent s’exprimer, partager, converser, dialoguer,
                                                            échanger, s’entre-aider, créer du contenu (UGC*) et
                                                            interagir entre eux, sans avoir besoin des compétences d’un
                                                            webmestre. Le web 2.0 n’est pas une révolution technique
                                                            mais un changement des usages du web. Il reflète une mise
                                                            en scène numérique ainsi qu’une mise en réseau de soi.
                                                            L’utilisateur s’exprime à travers des profils et lui offre la
Figure 2 : Les API (interfaces de                            possibilité de prendre la parole, « d’extérioriser et de
programmation) permettent d’exploiter les                    théâtraliser sa propre identité »9. Selon Bruno Bachimont, le
informations dans les bases de données
contenant des informations structurées, à                    web 2.0 « considère que les utilisateurs font partie du
travers des requêtes. Les « mashup » sont des                processus documentaire et qu’on peut s’appuyer sur leurs
sites Internet qui exploitent les données
contenues dans différentes bases grâce aux                   connaissances et compétences pour enrichir les traitement
API. Mais les données ne sont toujours pas                   informatiques des ressources. »10 Cet enrichissement des
reliées entre elles : elles ne communiquent
pas directement entre elles.                                 contenus           passe        en      partie        par      les      annotations            et
                                                             commentaires laissés par ces utilisateurs toujours plus
                            11
              nombreux . En effet, avec l’arrivée des blogs et des systèmes de gestion de contenu, ces
              derniers peuvent facilement créer du contenu, les commenter et leur ajouter des mots-
              clés, aussi appelés « tags ».
              Le web 2.0 est également marqué par l’émergence des supports mobiles, types
              Smartphones et tablettes numériques, qui traduisent du pouvoir et du désir de l’ubiquité
              du web. Autrement dit, la volonté d’être à différents endroits simultanément, ce que
              permet de réaliser plus ou moins efficacement l’usages de ces supports. D’après le
              rapport de l’UIT et les chiffres annoncés par le site « Public Data » de Google en 201112,

              9
                Sources : LA LETTRE EMERIT n°57, « Le web 2.0, un phénomène de société ».
              10
                 Citation tirée de la revue DOCUMENTALISTE SCIENCES DE L’INFORMATION, n°48/4, page 25.
              11
                 Selon un rapport de l’Union Internationale des Télécommunications (UIT) publié en Octobre 201211, nous sommes plus d’un
              tiers d’utilisateurs à être connectés à Internet dans le monde entier, c’est-à-dire environ 2,3 milliards d’individus, soit 11% de
              plus qu’en 2011. 600 millions de foyer sur les 1,8 milliards recensés ont accès à une connexion Internet.
              12
                 « Public Data » fournit ses données à travers les informations recueillis par La Banque Mondiale. En 2011, il y avait ainsi
              5,9599 milliards d’abonnements à la téléphonie mobile cellulaire. Sources :


                                 UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   7
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 8



             plus de 6 milliards d’abonnements mobiles sont souscrits dans le monde (certains
             utilisateurs possèdent plusieurs mobiles).
             Mobilité, réseautage et prise de parole font que les données publiées sur le web sont
             conséquentes et sont génératrices de longs débats, notamment sur la protection des
             données personnelles et de l’identité numérique, dont je ne traiterai pas dans ce dossier.
             Avec le web 2.0, l’utilisateur est de plus en plus lié à la machine et celle-ci se décline
             sous différents terminaux permettant un usage quasi-permanent et mobile. Mais au-delà
             de ce constat, qu’en est t-il de la recherche sémantique ? En effet, la relation homme /
             machine est en quelque sorte unilatérale car la machine n’est pas encore capable de
             comprendre le contenu publié sur le web et de l’exploiter. Nous pouvons alors nous
             questionner quant à la place de la machine dans le processus documentaire…

              1.3 LE WEB SEMANTIQUE
             Comme vu précédemment, le web 2.0 permet facilement de créer, partager, commenter,
             échanger du contenu. Mais le constat d’un tel système est que l’internaute peut aussi
             facilement consulter des ressources qui ne répondent en rien à sa requête initiale ou être
             perdu dans une masse d’informations. Le web sémantique va justement permettre une
             optimisation des contenus publiés sur le web afin de faire coopérer l’homme et la
             machine plus efficacement.

                  1.3.1     Coopération homme / machine
             Le web sémantique permet aussi bien aux hommes qu’aux machines, ou agents logiciels,
             de comprendre le sens des données sur le web à travers des standards et normalisations et
             de l’exploiter pleinement afin d’apporter des réponses pertinentes à nos questions ou
                                                                        requêtes. Nous passons donc d’un contenu orienté
                                                                        vers les hommes à un contenu constitué de
                                                                        données exploitables par les agents logiciels. Le
                                                                        but étant de favoriser la coopération homme /
                                                                        machine. Le contenu n’est plus seulement pensé
                                                                        pour être manipulé par les internautes, mais par

Figure 3 : Il s’agit d’un espace documentaire global où                  les machines (cf. Figure 3). Le web sémantique
les données circulent indépendamment de leur base de
                                                                         consiste ainsi à enrichir les contenus par
données. Les informations extraites sont des ressources
et sont reliées entre elles par des liens typés : cela                   l’utilisation de descriptions de ressources, aussi
permet de décrire les liens entre les ressources.                        appelées métadonnées.
             Il ne s’agit pas d’un web nouveau ou d’une nouveauté mais simplement d’une
             « extension de l’actuel »13. Il intègre en effet les fondamentaux du web dit classique. Le

             http://www.google.fr/publicdata/explore?ds=d5bncppjof8f9_&ctype=l&met_y=it_net_user_p2#!ctype=l&strail=false&bcs=d&n
             selm=h&met_y=it_cel_sets&scale_y=lin&ind_y=false&rdim=region&ifdim=region&tdim=true&hl=fr&dl=fr&ind=false
             13
                Sources : Thèse rédigée par Mouhamed Diouf, Spécification et mise en œuvre d’un formalisme de règles métier, Chapitre 5
             « Le web sémantique », page 130 à 141.


                             UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   8
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 9



web sémantique est une expression présentée en 2001 par Tim Berners-Lee, membre du
W3C*. Aussi appelé web de données ou encore web 3.0, il s’agit d’un projet mené depuis
plus de dix ans et toujours en construction. Il offre la possibilité de nommer les
ressources documentaires et vise à apporter du sens aux contenus afin de donner une plus
grande importance à l’interprétation des ressources par les machines. Contrairement au
web 2.0, qui place au centre de son processus les internautes et leur interprétation, le web
sémantique cherche à mobiliser davantage la machine. L’objectif étant, selon Bruno
Bachimont, de « représenter ces connaissances et interprétations et concevoir les outils
pouvant les exploiter. »14
Tim Berners Lee, l’un des acteurs principaux du web de données, définit le web
sémantique comme étant « un vaste espace d’échanges de ressources entre machines
permettant l’exploitation de grands volumes d’informations et de services variés, aidant
les utilisateurs en les libérant d’une bonne partie de leur travail de recherche, et de
combinaison de ces ressources. »15
Cette nouvelle étape du web permet donc d’exploiter au maximum le contenu publié sur
le web par un enrichissement sémantique normalisé et standardisé. Les limites perçues il
y a quelques années sont ainsi repoussées : les utilisateurs sont en mesure d’accéder
rapidement à l’information pertinente souhaitée.

     1.3.2     Des triplets, des URI*, un graphe
Le web sémantique repose essentiellement sur le modèle RDF, « Resource Description
Framework » aussi appelé cadre de description des ressources. Il s’agit de la « première
brique des standards du web sémantique qui recouvre plusieurs syntaxes pour publier des
données à propos de tout sur le web »16. Le modèle utilisé par RDF est simple et repose
sur la forme d’un triplet : sujet – prédicat – objet. Ainsi, « Sylvain (sujet) a rédigé
(prédicat) cette synthèse (objet) » est un triplet RDF. Il est donc facile de comprendre le
sens de la phrase et le lien unissant le sujet et l’objet. Par la suite, un triplet peut
également être relié à un autre : « Cette synthèse (sujet) s’inscrit dans (prédicat) la
formation du master Audiovisuel et Médias Numériques de l’ICM (objet) ». L’objet de la
première insertion peut ensuite devenir le sujet d’un nouveau triplet et ainsi de suite : on
devine ainsi que la synthèse est un devoir à réaliser dans le cadre des études de Sylvain,
réalisées à l’ICM. La description d’une ressource comme celle-ci est un assemblage
« d’attributs, de caractéristiques et de relations » avec d’autres ressources. Lorsque nous
créons une ressource, nous élaborons une notice qui contient un certain nombre
d’informations sur la ressource. RDF va alors séparer ces éléments de la notice pour en
faire des insertions indépendantes. Nous obtenons ainsi une ressource qui est un

14
   Citation tirée de la revue DOCUMENTALISTE SCIENCES DE L’INFORMATION, n°48/4, page 25.
15
   Sources : Citation de Tim Berners Lee en 2001 dans Recherche d’informations. État des lieux et perspectives de Mohand
Boughanem et Jacques Savoy, page 232.
16
   Citation tirée du livre LE WEB SÉMANTIQUE : Comment lier les données et les schémas sur le web ? , page 28.


                UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   9
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 10



            document universitaire ; cette ressource a pour auteur Sylvain Gateau ; cette ressource
            s’inscrit dans la formation du master, etc. Pour cela, nous utilisons des URI* : des
            identifiants propres et uniques à chaque ressource. La notice devient alors un graphe
            constitué de nœuds organisés et d’arcs orientés reliant ces nœuds ainsi qu’un espace
            globale et granulaire de l’information grâce à la connexion de triplets RDF. La
            granularité de l’information est plus fine et chaque insertion possède du sens. Il est alors
            possible de sélectionner les informations à un niveau beaucoup plus fin qu’auparavant
            afin de répondre précisément à nos requêtes.

                 1.3.3      Quelques vocabulaires et attributs courants
            Afin d’enrichir sémantiquement les contenus web et donc ces triplets précédemment
            cités, une multitude de vocabulaires et attributs sont à disposition des professionnels. Ces
            métadonnées en tout genre permettent d’ajouter davantage de sens au contenu. Nous
            pouvons par exemple citer les microformats17. Il s’agit d’un ensemble de standards
            permettant de marquer des personnes, des recettes de cuisine, des événements,… et
            d’ajouter de la sémantique dans le code HTML*. À titre d’exemple, le standard hCard
                                                                    proposé par le générateur microformats permet
                                                                    d’enrichir le profil d’une personnes par l’utilisation
                                                                    d’un balisage sémantique adapté et sémantique (cf.
                                                                    Figure 4).
                                                                    Les micro-données quant à elles apportent du sens
                                                                    au contenu et permettent aux robots des moteurs de
                                                                    recherche d’exploiter le sens des ressources décrites.
                                                                    La bibliothèque de micro-données la plus connue et
                                                                    exhaustive à ce jour est Schema.org18. Créé en 2010
                                                                    par Google, Bing et Yahoo, cette bibliothèque de
                                                                    micro-données est pourtant contestée du fait de son
                                                                    système fermé.
Figure 4 : Voici mon profil enrichi sémantiquement
                                                   RDFa19 est une syntaxe permettant d’ajouter des
par l’ajout de classes sémantiques telles que
l’attribut  « given-name »     pour   le   prénom, attributs et de décrire les ressources. Ce vocabulaire
« addiotional-name » pour le surnom ou encore
                                                   est    conforme      au     « Resource     Description
« org » pour l’organisme où j’étudie.
                                                                    Framework » (RDF), précédemment présenté.
                                                   20
            « Friend Of A Friend »                      est également un vocabulaire conforme au « Resource
            Description Framework » (RDF) permettant de créer des profils FOAF et ainsi de décrire
            les relations entre personnes ainsi que leurs activités. Il s’agit d’un vocabulaire très
            prometteur puisque l’établissement des relations sociales sur le web en est une

            17
               URL : http://microformats.org/
            18
               URL : http://schema.org/
            19
               URL d’un générateur de code RDFa : http://buzzword.org.uk/2011/rdfa-card/
            20
               URL : http://www.foaf-project.org/


                            UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   10
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 11



composante majeure, comme le démontre les différents réseaux sociaux types Facebook,
Copains d’avant, ou encore les réseaux sociaux professionnels tels que LinkedIn ou
Viadeo.
Il existe d’autres vocabulaires et attributs permettant d’enrichir sémantiquement le
contenu diffusé sur le web, à savoir les Creative Commons21 ou encore les Dublin Core22
permettant entre autre d’enrichir les œuvres, les droits d’auteurs, les publications, les
thématiques,…


Ainsi, le web sémantique est un travail de l’ombre et de longue haleine, visant à enrichir
sémantiquement et intelligemment les contenus diffusés sur le web. Bien que le projet ait
été lancé il y a plus de dix ans, nous n’en sommes qu’à ses balbutiements. Les
réfractaires à cette extension du web actuel pensent qu’il serait impossible de mettre en
place un tel mécanisme par le simple fait qu’il serait nécessaire de « ré-analyser et
transformer tous les documents du web existant »23. Certes, le web sémantique n’est pas
visible par l’utilisateur et ne peut donc pas être jugé à sa juste valeur. Mais il nourrit de
grands espoirs et a su se doter d’une communauté prête à l’adopter…




21
   URL : http://creativecommons.org/
22
   URL : http://dublincore.org/documents/dces/
23
   Sources : citation tirée du livre LE WEB SÉMANTIQUE : Comment lier les données et les schémas sur le web, page 190.


                UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   11
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 12




         2 Bienvenue dans le « Future friendly web »
         Le web met à disposition des utilisateurs d’innombrables ressources. Il est également
         plus fluide, plus mobile et accessible sur plus de terminaux qu’auparavant. Certains
         diront que « les interfaces s’envolent, et le contenu reste »24. Aujourd’hui, le web est
         caractérisé par l’ensemble des terminaux qui en sont interconnectés, comme nous
                                                     pouvons le constater sur la Figure 5. Nous sommes passés
                                                     d’un écran d’ordinateur unique à une multitude d’écrans,
                                                     petits, grands, tactiles ou non, mobiles ou non. Et demain,
                                                     nous aurons en notre possession de nouveaux écrans
                                                     toujours plus mobiles et inattendus. Se pose alors la
                                                     question de l’adaptabilité du contenu sur ces écrans…
                                                     Le « future friendly web » est un courant américain
                                                     consistant à nous projeter dans l’avenir afin d’imaginer et
                                                     anticiper le web de demain et la valeur des contenus. Les
                                                     adeptes de ce mouvement prône un web plus efficace,
                                                     mieux conçu et à l’heure du temps. Et il semblerait bien que
                                                     le web sémantique en soi intimement lié…

                                                        2.1      LE « RESPONSIVE DESIGN »
                                                     Le « responsive design » est un principe de conception web
                                                     consistant à adapter le contenu d’un site web aux différentes
                                                     contraintes de résolution d’écrans. Le site est développé
                                                     avec un seul et même code HTML* et est agrémenté de
                                                     « Media Queries CSS » : il s’agit d’un code CSS* spécifiant
                                                     les dimensions du contenu en fonction du terminal utilisé
                                                     pour le consulter. Ainsi, le site comble tout l’espace de
                                                     l’écran et est adapté pour une lisibilité et une utilisation
                                                     optimale. Le « responsive design » est une solution
Figure 5 : Représentation imagée de                  économique, stratégique et efficace : au lieu de développer
l’évolution du web il y a 10 ans,
aujourd’hui et demain.                               un site pour ordinateur, un autre site pour tablette tactile et
                                                     un dernier pour Smartphone, il suffit d’une seule plateforme
         adaptable sur ces terminaux. Cela réduit ainsi les coups de développement, de
         maintenance et de mise à jour de ces différents supports.
         En fonction des terminaux utilisés, le contenu mis en avant ne sera pas forcément
         identique : il s’adaptera en fonction du contexte d’utilisation, de l’importance d’un


         24
             Sources : Présentation SlideShare réalisée par l’équipe projet                   de    Novius     OS,    pages    34    à   40.    URL :
         http://fr.slideshare.net/novius-os/create-once-publish-everywhere-anytime


                         UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   12
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 13



               contenu en fonction du terminal utilisé, etc. Encore faut-il que cela ait été réalisé lors de
               la conception du site « responsive design » et que le contenu ait été hiérarchisé.
               Selon Antoine Lefeuvre (cf. Annexe 1, pages 26 à 29), le « responsive design » n’est que
               le commencement de ce courant appelé « future friendly web ». En 2012, cette pratique
               permet de répondre efficacement aux besoins d’adaptabilité sur différents supports.
               Comme je le signalais en introduction de cette synthèse, nous avons décidé, avec mes
               collègues de promotion, de concevoir le site de « Savoir-faire, faire savoir »25 en
               intégrant la notion d’adaptabilité afin de concevoir un contenu optimisé pour les écrans
               d’ordinateurs, de tablettes tactiles et de Smartphones. Mais cette technique suffira t-elle
               en 2015 lorsque nous consulterons le contenu web à travers nos lunettes de soleil, comme
               le prédit Google dans sa vidéo prospective « Google glass : One day… »26 ?

                2.2 « FUTURE-READY CONTENT »
               Selon Brad Frost, « get your content ready to go anywhere because it’s going to go
               everywhere »27 (cf. Figure 6). Ce spécialiste en stratégie web mobile affirme que nous
               devons, dès à présent, préparer notre contenu à aller n’importe où car il sera amené à être
               diffusé partout. Il s’agit ici de la pensée fondatrice du courant « future-ready »28.
               Le contenu d’une entreprise vit en moyenne deux à trois ans. Le travail des
               professionnels du web, et notamment des chefs de projets, consistera donc à préparer le
               contenu et à le structurer afin qu’il soit mis en place et consultable sur différents canaux
                                                  toujours plus mobiles et interconnectés.
                                                  Nous ne pouvons prédire l’avenir car la société évoluera, les
                                                  technologies se développeront, les normes changeront, etc. Mais
                                                  nous pouvons dès à présent apprendre à gérer le contenu en
                                                  cherchant à comprendre son sens, ses valeurs, ses objectifs, ses
                                                  relations, et ses structures afin de le préparer au mieux aux futurs
                                                  terminaux.
                                                  Dans ce monde interconnecté de plus en plus complexe, nous
                                                  devons nous concentrer sur ce qui importe le plus l’utilisateur : un
Figure 6 : « Get your content ready to go
anywhere because it’s going to go
                                          contenu ayant du sens. En effet, les internautes, mobinautes et
everywhere », Brad Frost                  autres utilisateurs de terminaux connectés sont ennuyés, fatigués
               et parfois énervés du bruit d’informations : ils cherchent l’information pertinente dans
               une masse de contenu en tout genre. La recherche doit être simplifiée, naturelle et
               intuitive. Si les produits Apple se vendent à petits pains depuis plusieurs années, c’est
               que leurs produits répondent de manière simplifiée, naturelle et intuitive à nos besoins.

               25
                  Site consultable sur : http://sffs.clic-et-clap.fr/
               26
                    Vidéo Youtube « Project Glass : One day... » réalisée par Google et diffusée en Avril 2012. URL :
               http://youtu.be/9c6W4CCU9M4
               27
                  Sources : Article « Future-Ready Content » rédigé par Sara Wachter-Boettcher et publié sur le site Internet « A lista part »..
               URL : http://www.alistapart.com/articles/future-ready-content/
               28
                  « Soyons prêt pour le futur »


                                UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   13
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 14



L’intégration de la technologie Siri sur les nouveaux iPhones et iPads en est l’exemple le
plus récent : elle cherche à faciliter notre recherche et notre collaboration avec la
machine. Pour cela, nous devons définir le contenu afin qu’il soit accessible sous
différentes formes, qu’il soit interopérable, qu’il est du sens et qu’il soit consultable à la
fois par les utilisateurs et les machines.

  2.3 « COPE : CREATE ONCE, PUBLISH EVERYWHERE »
« Create Once, Publish Everywhere » est une philosophie rattachée au courant « future
friendly web » consistant à ne créer le contenu qu’une fois pour ensuite le publier partout.
Mis en œuvre par Daniel Jacobsen, directeur de développement d’application chez
National Public Radio (NPR), « COPE » consiste à construire des systèmes de gestion de
contenu (CMS29) permettant l’utilisation d’un seul contenu pour une diffusion
multicanale. Cela revient en réalité à séparer le contenu de la forme et d’en assurer sa
modularité et sa portabilité sur les terminaux interconnectés au web. « COPE » est une
critique ouverte à l’ensemble des systèmes de gestion de contenu qui ne font que publier
des pages web : il faut désormais rassembler l’ensemble des informations afin de
présenter le contenu sur n’importe quel terminal, avec n’importe quelle forme, à tout
moment30.
Bien que cette philosophie soit récente, les bénéfices ainsi que le retour sur
investissement semblent fructueux puisqu’il s’agit d’un gain de temps à la fois pour les
développeurs mais également pour les intégrateurs de contenus et les « community
managers »* en charge de diffuser les informations et d’animer la communauté d’une
entreprise par l’utilisation de ce contenu.
L’agence web Novius, basée à Lyon et Paris, et dans laquelle je vais effectuer mon stage
de fin d’études, à récemment lancé son propre CMS « COPE » nouvelle génération
destiné à une diffusion multicanale par l’utilisation d’un seul et même contenu : Novius
OS. Ce système d’exploitation « open source »31 exploite les données relatives à la
communication d’une entreprise afin de les diffuser sur différents canaux (cf. Annexe 2,
page 30).


Ainsi, le web sémantique nourrit de nombreux espoirs pour bon nombre de
professionnels. Des courants futuristes et intelligents se sont mis en place afin de mettre
en avant les bienfaits du web sémantique et de nous préparer à utiliser un web sur des
terminaux toujours plus volatiles...



29
   Content Management System
30
   Sources : Article « COPE: Create Once, Publish Everywhere » publié sur le site Internet « Programmable Web ». URL :
http://blog.programmableweb.com/2009/10/13/cope-create-once-publish-everywhere/
31
   Libre accès au code source d’un logiciel par son auteur / éditeur. Cela sous-entend une utilisation gratuite du logiciel et la
possibilité de contribuer à l’enrichissement de l’outil.


                 UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   14
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 15




3 Vers une redéfinition de l’écosystème numérique
Nous l’avons vu précédemment, le web sémantique commence dès à présent à modifier
la vision de la conception de supports web et du contenu destiné à y être diffusé. Des
outils sont déjà mis en place et sont sur le point d’optimiser nos usages du web. En tant
que futur chef de projets web, le web sémantique est une thématique qui m’intrigue car
elle va affecter les métiers liés à notre secteur. Comme je l’ai précédemment présenté, le
rapport homme / machine a considérablement évolué : l’utilisateur fait sa requête et la
machine analyse le sens des contenu pour l’exploiter de manière pertinente. Pour avoir
davantage de précisions sur les pratiques et les impacts du web sémantique dans le milieu
professionnel, j’ai eu l’opportunité de contacter Antoine Lefeuvre, responsable R&D
chez Novius (cf. Annexe1 pages 26 à 29).

     3.1   REORGANISATION DU REFERENCEMENT NATUREL*

      3.1.1      Le référencement par la sémantisation
Bien que l’agence Novius intègre de plus en plus le web sémantique dans ses projets
web, je reste sceptique quant à l’implication des professionnels de la communication sur
cette thématique. En effet, les spécialistes du web 3.0 sont encore rares et les chefs de
projets web ne peuvent pas maitrisés l’ensemble des corps de métiers qu’ils regroupent
dans leur équipe. Les agences web, « digitales » ou numériques ainsi que les Société de
Services en Ingénierie Informatique (SSII) semblent à l’heure d’aujourd’hui les
principaux acteurs de cette mouvance vers la sémantisation des contenus32, du moins les
seuls à en comprendre le fonctionnement et les enjeux.
Cependant, la demande semble se faire ressentir. En effet, comme me l’a confié Antoine
Lefeuvre, les moteurs de recherche comme Google exercent une pression sur certains
secteurs d’activités tels que le transport ou la cuisine. Ils sont, pour la plupart, « capables
de choisir et privilégier des attributs sémantiques et de se les approprier afin d’afficher
des résultats de recettes directement dans leur page de résultat par exemple »33.
À l’heure actuelle, les agences web et les professionnels du référencement vendent des
prestations liées au web sémantique principalement pour des problématiques de
référencement naturel*. Pour se faire, ils travaillent de plus en plus avec les vocabulaires
et     attributs       d’enrichissement                sémantique              vus       précédemment :                 microformats,
microdonnées, RDFa, FOAF, etc. (cités dans la partie 1.3.3, pages 10 et 11).



32
   Au cours de cette synthèse, j’ai contacté cinq agences de communication globale dans la région Rhône-Alpes : Régie
COMTOO (Lyon), Brainstorming (Lyon), Omaha Beach (Brignais), INEDITS (Échirolles) et Colocarts (Grenoble). Aucune
d’entre elles n’intègre de prestations liées au web sémantique et certaines n’en connaissent pas la signification. Il ne s’agit pas
d’une analyse pertinente mais cela montre l’intérêt que portent les agences plus « générales » par-rapport à l’actualité du web.
33
   Citation tirée de l’entretien téléphonique avec Antoine Lefeuvre, annexe n°1, pages 26 à 29.


                 UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   15
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 16



                  3.1.2     Les moteurs de recherche sémantique34
             Dans le contexte actuel, le web est limité car les contenus sont en partie inaccessibles aux
             traitements informatiques des machines. Les moteurs de recherche utilisent la recherche
             plein texte : l’exploitation automatique des contenus est ainsi réduite. En parallèle, les
             utilisateurs souhaitent accéder à l’information le plus rapidement possible et obtenir des
             résultats pertinents. Cependant, nous sommes confrontés à une grande diversité de
                                         sources d’informations, ce qui nous incite à consulter
                                                        plusieurs pages et ressources web et à en combiner nous-
                                                        même les informations qui nous intéressent afin de répondre
                                                        à nos requêtes.
                                                        Désormais, certaines compagnies proposent des moteurs de
                                                        recherche sémantique : « Knowledge Graph »35 (de
                                                        Google), Wolfram Alpha (cf. Figure 7), etc. Grâce à ces
                                                        moteurs sémantiques, l’utilisateur n’a plus accès à des listes
                                                        de résultats mais à des combinaisons d’informations
                                                        répondant de manière qualitative, immédiate et en partie
                                                        exhaustive à sa requête. Cela est en parti possible grâce à
                                                        l’accès des machines aux informations sémantiques des
                                                        ressources : cela leur permet de raisonner et de comprendre
                                                        le sens des contenus afin de les exploiter correctement. Ils
                                                        sont ainsi capables de traduire nos requêtes en langages
                                                        naturels et d’en combiner des informations précises,
Figure 7 : Résultat de recherche dans le moteur         granulaires et indépendantes les unes des autres (comme
Wolfram Alpha pour la requête « Bode Miller »
                                                        expliqué dans la partie 1.3.1, pages 8 et 9).

                  3.1.3     Les impacts sur la pratique du web
             Le web sémantique et l’avènement des moteurs de recherche sémantique sont sur le point
             d’impacter à la fois notre pratique du web, mais également l’économie « traditionnelle »
             bâtie jusqu’à ce jour. En effet, nous pouvons imaginer une certaine perdition en terme de
             diversité d’informations dans les résultats de recherche des moteurs sémantiques, du fait
             de l’agrégation automatique des ressources. Les contenus enrichis sémantiquement
             seront, de manière justifiée ou non, mis en valeur par-rapport aux ressources dépourvues
             de métadonnées. De plus, certains sites Internet vont probablement connaître une perte de
             trafic puisque leurs contenus seront directement consultables à travers les pages de
             résultats de ces moteurs de recherche sémantique (cf. Figure 8).



             34
                Partie inspirée de ma présentation SlideShare « Les moteurs de recehrche sémantique » réalisée en Novembre 2012 dans le
             cours « Enjeux sociaux et organisationnels de TIC » animé par Caroline Angé, pages 8 à 11. URL :
             http://fr.slideshare.net/Cerise_sur_le_Gateau/les-moteurs-de-recherche-smantique
             35
                URL : http://www.google.com/insidesearch/features/search/knowledge.html


                             UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   16
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 17



                                                                  Cela est déjà le cas en ce qui concerne certains sites
                                                                  de cuisine pour lesquels les recettes sont directement
                                                                  accessibles en page d’accueil du moteur de recherche.
                                                                  Selon Antoine Lefeuvre, il s’agira davantage d’un
                                                                  report de trafic qu’une baisse de trafic car avec
                                                                  l’avènement des réseaux sociaux et notamment de
                                                                  Facebook, les sites Internet des éditeurs ont déjà
                                                                  connu un tel phénomène et ont su s’y adapter.
                                                                  Une chose est certaine : avec le lancement de
                                                                  « Knowledge Graph » par Google en Mai 2012, les
                                                                  utilisateurs vont être confrontés de plus en plus au
                                                                  web sémantique. Nos recherches vont être impactées
Figure 8 : Résultat de recherche dans Google pour la
                                                                  par cette rénovation du web. Selon moi, il s’agit là
requête « Bode Miller ». À droite des résultats de
recherche se trouve un emplacement proposant des                  d’une forme de déterminisme technique36 : Google,
combinaisons d’informations correspondant à la requête            leader des moteurs de recherche en France avec
initiale.
                                                                  environ 90% de parts de marché37 ainsi qu’aux Etats-
             Unis avec 66,4%38, va inéluctablement modifier le mécanisme de référencement naturel*
             réalisé par ses robots d’indexation jusqu’à ce jour. En effet, ces derniers devraient
             logiquement se concentrer sur les contenus enrichis sémantiquement et ainsi les mettre en
             valeur, au détriment de ceux dépourvus de métadonnées. En utilisant dès à présent le
             moteur de recherche Google, l’utilisateur est confronté aux premières esquisses de la
             recherche sémantique (cf. Figure 8). Selon Antoine Lefeuvre, « l’internaute n’a pas la
             notion de HTML*, de CSS*,... Ce qui lui importe, c’est uniquement d’accéder à
             l’information et de trouver des réponses à ses requêtes rapidement. Les sites web ne sont
             pas une fin en soi à ses yeux ». Il n’aura probablement aucun problème à s’adapter à la
             recherche sémantique car il s’est très bien adapté aux médias sociaux et notamment à
             Facebook, qui agrège les contenus comme le font déjà les moteurs de recherche
             sémantique.

                  3.2   LE CONTENU AU CŒUR DU PROCESSUS
             À l’heure où le multicanal est omniprésent dans notre société, le web sémantique prend
             une dimension stratégique incontournable. Le contenu des clients, des marques et des
             entreprises est amené à être diffusé sur de nombreux supports différents (mobile, tactile,
             grand écran, etc.). Il représente donc la valeur principale des marques et il doit être


             36
                 Sources : L’INNOVATION TECHNIQUE : récents développements en sciences sociales. Vers une nouvelles théorie de
             l’innovation. Chapitre 3 « L’anthropologie de la technique. Penser ensemble le technique et le social ». Pages 75 à 90.
             37
                  Information tirée du « Baromètre des moteurs de recherche » réalisé en Juillet 2012 par AT Internet. URL :
             http://www.atinternet.fr/documents/barometre-des-moteurs-de-recherche-juillet-2012/
             38
                Information tirée du bulletin mensuel de mesure de parts de marché des moteurs de recherche, réalisé en Août 2012 par
             comScore. URL :
             http://www.comscore.com/Insights/Press_Releases/2012/9/comScore_Releases_August_2012_U.S._Search_Engine_Rankings


                             UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   17
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 18



réfléchie dès aujourd’hui afin d’être adapté sur tous ces supports. Selon l’étude Orange
Exposure 2012/2013 réalisée par TNS Sofres pour Orange Advertising, « les mobinautes
utilisent les écrans (mobile, tablette, TV et PC) de façon plus interchangeable
qu’auparavant, cherchant l’écran le mieux adapté à leurs besoins du moment »39. Même
les consoles de jeux et les télévisions connectées permettent d’accéder au web (un tiers
du trafic web américain est généré à partir des consoles de jeux connectés).
Le contenu est « tout ce qui véhicule de l’information porteuse de sens pour l’être
humain »40. Dans de nombreux projets web, il est parfois délaissé au détriment du design
et de l’interactivité de l’interface. Mais il s’agit de l’élément central du web sémantique.
C’est à travers ce dernier qu’est véhiculé le sens des ressources. Écrire pour le web ne
revient pas à écrire une dissertation. Il y a un certain nombre de fondamentaux à
respecter. Un bon contenu web est avant tout un contenu adapté à l’activité de
l’entreprise mais également à son contexte d’utilisation : l’utilisateur peut le consulter à
travers une multitude de terminaux. Il convient donc d’adapter et de hiérarchiser ce
contenu aux différents écrans. De plus, le contenu web doit être utile afin de ne pas faire
perdre le temps aux utilisateurs. Pour cela, il est nécessaire de définir l’objectif d’un
contenu, d’analyser en quoi il soutiendra l’objectif général du site, pour quelle(s)
raison(s) l’utilisateur en aura besoin et ce qu’il sera supposé en faire. Chaque type de
contenu doit ainsi être pensé avant d’entreprendre des décisions de conception. Identifier
les types de contenus revient à déterminer les éléments de base constituants chaque
contenu. Un contenu orienté utilisateur permettra de répondre à ses besoins et de
satisfaire ses désirs. Cela requiert de connaître le cadre cognitif et mental de l’utilisateur
avant de préparer le contenu. La compréhension de chaque type de contenu est un facteur
stratégique car il permet de décider quant à la façon dont il sera agencé, en fonction des
priorités et contraintes liées au contexte, aux dimensions de l’écran du terminal utilisé, à
la mobilité de l’utilisateur, etc. Chercher la signification d’un contenu revient à évaluer sa
contribution dans l’ensemble du contenu et à établir des relations entre les éléments qui le
constituent.
La stratégie de contenu demande donc la faculté à anticiper les préférences des
utilisateurs et à faire des compromis afin de toujours adapter le contenu au contexte.
Selon moi, porter une telle importance au contenu ne sera pas sans conséquence dans les
interfaces d’utilisateurs futures. Le courant minimaliste étant déjà répandu et apprécié, je
suis persuadé que les plateformes et interfaces vont être de plus en plus épurées afin de
focaliser la concentration des utilisateurs sur la matière, le contenu. Je ne dis en aucun cas
que le graphisme ou le web design* sont amenés à disparaître, mais ces pratiques vont



39
   Étude consultée sur l’application iPad de TNS Sofres, catégorie « Technologie » et publiée le 4 décembre 2012. Également
consultable à cette URL : http://www.tns-sofres.com/points-de-vue/71C211C357D44CB1A21D88B7EEA29197.aspx
40
   Citation tirée du livre STRATÉGIE DE CONTENU WEB, rédigé par Erin Kissane. Introduction, page 1.


                UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   18
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 19



probablement s’orienter vers de nouveaux courants. Les formes et les couleurs auront
toujours leur importance dans la mise en valeur et la lecture du contenu.

     3.3   L’APPARITION DE NOUVEAUX CORPS DE METIERS

      3.3.1   Les architectes et stratèges de contenu
De nouveaux métiers venus des États-Unis sont apparus avec l’émergence du web
sémantique : les stratèges et les architectes de contenu. Ces professionnels, « payés à prix
d’or en tant que consultant généralement », sont amenés à devenir de plus en plus
présents et populaires dans le paysage numérique français. Leur travail consiste à penser,
réfléchir et gérer le contenu des marques / éditeurs. Les stratèges et architectes de
contenu se concentrent dans un premier temps sur la compréhension des besoins de
contenu actuel, futur et potentiel de leur client. Ils recensent leur contenu afin de déceler
les « content nuggets », aussi appelés les pépites de contenus : il s’agit de l’information
pure qui fait sens auprès de l’utilisateur et de la machine et qui peut-être déclinée sur
différents supports et formes41. Les CMS « COPE », tels que Novius OS (présenté dans
la partie 2.3, page 14) fonctionnent de cette manière. Puis, ils créent des
recommandations et des lignes directrices dans lesquelles ils exposent leurs conseils sur
le contenu pertinent à mettre en valeur, le ton à adopter ainsi que les types de contenu
granulaires les plus efficaces pour transmettre leur message à travers les différents
terminaux. Ainsi, les architectes et stratèges de contenu pensent le contenu comme étant
la matière principale d’un web aujourd’hui devenu polymorphe et le structurent afin de
l’adapter aux différents canaux. Le contenu est classé et structuré selon un vocabulaire
précis. On parle également de design de taxonomie. Il s’agit de classer et hiérarchiser un
ensemble de termes définis par une communauté pour en faire un vocabulaire organisé :
les termes sont hiérarchisés entre eux, permettant ainsi d’organiser le vocabulaire et de
lui apporter du sens par l’ajout de liens entre les termes42.
Aux Etats-Unis, The Understanding Group43 est, selon Antoine Lefeuvre, l’une des
principales agences à proposer des prestations de structuration d’informations dignes de
ce nom. En effet, cette entreprise propose des offres de « Content strategy »44 et
d’ « Information architecture »45 très développées. La vision de cette agence, également
adoptée par Novius, consiste à penser que chaque « espace d'information et de
communication possède une architecture de l'information spécifique et nécessite une
optimisation des structures d'information et de ces espaces ».


41
     Sources : Présentation SlideShare réalisée par l’équipe projet de Novius OS, pages 34 à 40. URL :
http://fr.slideshare.net/novius-os/create-once-publish-everywhere-anytime
42
     Sources : Page Internet « Ontologie, thésaurus, taxonomie et Web sémantique ». URL : http://www.la-
grange.net/2004/03/19.html#ontologies
43
   URL de l’agence : www.understandinggroup.com
44
   Stratégie de contenu
45
   Architecture de l’information


              UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   19
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 20



En France, une agence est particulièrement connue pour la structuration de contenu :
Nealite. Elle est essentiellement composée de UX et UI designers…

     3.3.2      Les UI et UX designers
Les architectes et stratèges de l’information sont intimement liés à l’émergence des
métiers UI et UX designers46. Il s’agit de professionnels spécialisés dans « l’user
interface » et « l’user experience », autrement dit l’interface utilisateur et l’expérience
utilisateur. Leur travail consiste à designer une solution par-rapport à un problème
identifié en se concentrant sur l’expérience utilisateur. Pour cela, ils proposent aux
consommateurs de vivre une expérience et une histoire à part à travers une interface
pensée et réfléchie. Le but étant de maximiser l’expérience utilisateur. Certains
établissements, tels que le CELSA ou l’École des Gobelins à Paris, proposent des
formations pour se former à ces nouveaux métiers. Selon Manuel Diaz, président de
l’agence Emakina, nous assistons aujourd’hui à une cohabitation de métiers
« traditionnels » et émergents dans la mise en place de projets web. Le chef de projets
web doit désormais composer avec des ergonomes, des sémiologues, des architectes, des
stratèges, des développeurs, des webdesigners, des UX/UI designers,... Certains métiers
sont sur le point de connaître une réelle croissance. La difficulté sera alors de trouver les
meilleurs professionnels au bon moment afin de composer une équipe efficace et
réunissant toutes les compétences requises pour l’accomplissement d’un projet web.


L’écosystème numérique est bel et bien impacté par l’émergence du web sémantique. Les
premières pratiques apparaissent, des outils intelligents se mettent en place et de
nouveaux métiers intègrent le paysage polymorphe du web. Malgré le fait que Google va
imposer petit à petit le web sémantique aux utilisateurs, nous pouvons dire que le web 3.0
est un dispositif socio-technique, qui selon moi va permettre une optimisation de nos
pratiques sur le web.




46
  Vidéo Youtube réalisée par Mushroom Conseil, cabinet de chasseurs de têtes, et diffusée sur la web TV Mushroom TV.
Découverte des nouvelles tendances, des nouveaux métiers et des nouveaux acteurs du secteur de la communication. Épisode 1 :
UX DESIGNER. URL : http://youtu.be/KKoayiQbUc0


                UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   20
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 21



Le début d’un long chantier…

L’histoire du web rapportée à l’échelle humaine est quasi-inexistante. Pourtant, depuis
son apparition dans la société, dans les années 1990, rares ont été les secteurs comme
celui-ci à évoluer autant sur le court terme. Tout d’abord, le web 1.0 a ouvert une
nouvelle manière de communiquer avec l’apparition des sites Internet, des campagnes
d’e-mailing, des pages HTML*, etc. Puis le web social et mobile s’est imposé au cours
des années 2000, offrant davantage d’interactivité, de contenu, de fonctionnalités et
d’usages qu’auparavant. Aujourd’hui, le web sémantique vient compléter ce vaste
épouvantail de possibilités qu’offre le web en complexifiant un peu plus les mécanismes
et les techniques utilisées pour son bon fonctionnement.
Le web sémantique n’en est qu’à ses balbutiements mais ses effets se font déjà ressentir
sur l’écosystème numérique ainsi que sur les enjeux communicationnels. La relation
homme / machine n’a jamais été aussi développée dans le web que maintenant, à tel point
que ces agents logiciels peuvent désormais comprendre le sens des contenus et l’exploiter
de manière réfléchie et pertinente. Nous sommes passés d’une relation unilatérale à
bilatérale : le web sémantique permet l’optimisation de la coopération homme / machine.
Les deux entités travaillent simultanément et de manière intelligente et efficace.
La mouvance du « future friendly web » ajoute au web 3.0 un aspect futuriste,
ergonomique et ubiquitaire. Le contenu est amené à naviguer partout et à être exploité à
tout moment par les machines pour répondre à nos désirs et besoins de manière
instantanée. Les CMS « COPE » sont une première réponse à ce constat et n’ont pas fini
de se développer et de se complexifier avec l’apparition de terminaux plus petits, mobiles
et inattendus. Les métiers de stratèges et architectes de contenu vont se répandre et
intégrer progressivement le paysage numérique afin de préparer le contenu pour le futur.
Les interfaces et expériences utilisateurs vont être amenés à considérablement évoluer
jusqu’à en devenir presque volatiles. Le jour où nous porterons des lunettes de vue
connectées est bientôt arrivé. Nous serons alors continuellement connectés à la réalité
augmenté, au monde virtuel. Les informations viendront à nous naturellement, au bon
moment et au bon endroit afin d’enrichir notre quotidien et faciliter tous nos faits et
gestes, et parfois même en les anticipant.
        Parler d’intelligence artificielle dans une synthèse portant sur le web sémantique
        peut paraître exagérée mais nous sommes véritablement à l’aube d’une explosion
        de l’intelligence. Le web sémantique offre des interactions encore jamais
        rencontrées et permet petit à petit aux machines de s’immiscer dans notre
        environnement intime, cognitif et communicationnel…




            UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   21
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 22



Lexique

Community manager : Terme anglophone pour désigner un gestionnaire de communauté
sur Internet à travers les médias sociaux.

CSS: Abréviation pour « Cascading Style Sheets ». Il s’agit d’un langage Internet, utilisé
en parallèle du langage HTML, permettant de mettre en forme les pages d’un site
Internet. Il permet ainsi de paramétrer une couleur de fond, une typographie, et bien
d’autres éléments.

HTML : Abréviation pour « Hyper Text Markup Language ». Il s’agit d’un
langage Internet qui permet de créer des pages et sites Internet. Ce langage est constitué
de balises permettant ainsi de structurer les pages et d’organiser le contenu en ligne.

Référencement naturel : Ensemble de pratiques qui consiste à rendre un site le plus
visible possible sur les résultats de recherches Internet. Il s’agit d’associer des
métadonnées aux pages du site Internet. De nombreux paramètres sont pris en compte
pour favoriser le référencement, à savoir le nom des page HTML, les balises H1, le nom
des images, le contenu textuel des pages, les liens hypertextes,...

UGC : Abréviation pour « User Generated Content ». Il s’agit du contenu généré par les
internautes sur les réseaux sociaux et autres plateformes de partage.

URI : Abréviation de « Uniform Resource Identifier ». Identifiant propre et unique à
chaque ressource caractérisé par une chaine de caractères. Les URI sont enregistrés
auprès de l’organisme IANA (Internet Assigned Numbers Authority) afin de s’assurer
qu‘il soit unique.

W3C : Abréviation de « World Wide Web Consortium ». Institution en charge du
développement et de la standardisation des langages et technologies du web au niveau
international.

Web design : Conception graphique des différentes pages d’un site Internet, réalisé par
un web designer. Il est réalisé en phase de conception puis est intégré par les
développeurs en phase de dévelppement.

Wiki : Plateforme Internet pouvant être modifiée par les internautes. Les wikis reposent
sur le principe de la collaboration : ils permettent aux utilisateurs d’apporter leurs
connaissances sur des sujets et thématiques précises. Le wiki le plus connu est
Wikipedia. Ces plateformes sont également développées au sein de certaines entreprises,
ce qui permet aux salariés d’accéder et d’apporter des mises à jour sur le contenu.


            UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   22
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 23


Bibliographie

OUVRAGES

  •     BOUGHANEM Mohand, SAVOY Jacques, AUSSENAC-GILLES Nathalie.
        Recherche d’informations, état des lieux et perspectives. Lavoisier, 2008, 342
        pages.
  •     FAYON David. Web 2.0 et au-delà . Nouveaux internautes : du surfeur à l’acteur.
        Édition ECONOMICA, 2010, 2ème édition, 190 pages.
  •     GANDON Fabien, CORBY Olivier, FARON-ZUCKER Catherine. Le web
        sémantique : Comment lier les données et les schémas sur le web ? Éditions
        Dunod, 2012, 206 pages.
  •     PÉDAUQUE Roger T. La redocumentarisation du monde. Édition Cépaduès,
        2007, 212 pages.
  •     PÉDAUQUE Roger T. Le Document à la lumière du numérique :forme, texte,
        médium : comprendre le rôle du document numérique dans l'émergence d'une
        nouvelle modernité. CF éditions, 2006, 218 pages.
  •     FLICHY Patrice. L’innovation technique. Récents développements en sciences
        sociales. Vers une nouvelle théorie de l’innovation. Éditions La Découverte,
        1995, 256 pages.

MAGAZINES // REVUES

  •     DOCUMENTALISTE, SCIENCES DE L’INFORMATION n°48/4. Dossier :
        Web sémantique, web de données… Quelle nouvelle donne ? Enjeux et
        technologies. Approches documentaires. ADBS, Décembre 2011, pages 20 à 61.
  •     LA LETTRE ÉMERITE n°57. Le web 2.0, un phénomène de sociét é. FTU
        Centre de Recherche Travail  Technologies, Premier 2009, 8 pages.

THESE


  •     DIOUF, Mouhamed. Spécification et mise en œuvre d’un formalisme de règles
        métier. Université Bordeaux 1. Soutenance présentée le 10 Décembre 2007. 244
        pages.




            UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   23
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 24



Sitographie

SITES WEB
   • NOVIUS OS. CMS Open Source nouvelle génération [en ligne]. Disponible sur :
        http://www.novius-os.org/ 
   •   FUTURE FRIENDLY. Collectif américain défendant les valeurs du « Future
       friendly web » [en ligne]. Consultable sur :  http://futurefriend.ly/ 
   •   BRAD FROST WEB. Site de Brad Frost, spécialite de la stratégie web mobile et
       fondateur du « future friendly web » [en ligne]. Consultable sur :
        http://bradfrostweb.com/ 
   •   THE UNDERSTANDING GROUP. Agence américaine spécialisée dans
       l’architecture de l’information et les prestations numériques [en ligne].
       Consultable sur :  http://understandinggroup.com/ 
   •   NEALITE. Agence française de design de services et d’expérience utilisateur [en
       ligne]. Consultable sur :  http://www.nealite.fr/ 
   •   KNOWLEDGE GRAPH. Moteur de recherche sémantique de Google [en ligne].
       Consultable sur :
        http://www.google.com/insidesearch/features/search/knowledge.html 
   •   WOLFRAM ALPHA. Moteur de recherche sémantique [en ligne]. Consultable
       sur :  http://www.wolframalpha.com/ 
   •   SCHEMA.ORG. Bibliothèque de microdonnées établit par Google, Yahoo et
       Bing [en ligne]. Consultable sur :  http://schema.org/ 
   •   MICROFORMATS. Site, blog et wiki sur les microformats [en ligne].
       Consultable sur :  http://microformats.org/ 

PAGES INTERNET
   •   PROGRAMMABLE WEB. COPE : Create Once, Publish Everywhere [en ligne].
       Octobre 2009. Disponible sur :
        http://blog.programmableweb.com/2009/10/13/cope-create-once-publish-
       everywhere/ 
   •   A LIST APART. Future-ready content [en ligne]. Février 2012. Disponible sur :
        http://www.alistapart.com/articles/future-ready-content/ .
   •   FRED CAVAZZA. L’art de la taxonomie [en ligne]. Mai 2004. Disponible sur :
        http://www.fredcavazza.net/2004/05/21/lart-de-la-taxonomie/ 
   •   LA GRANGE. Ontologies, thésaurus, taxonomie et web sémantique [en ligne].
       Disponible sur :  http://www.la-grange.net/2004/03/19.html#ontologies 
   •   TNS SOFRES. Mobinautes et tablonautes accélèrent leur percée [en ligne].
       Disponible sur : http://www.tns-sofres.com/points-de-
       vue/71C211C357D44CB1A21D88B7EEA29197.aspx 


           UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   24
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 25




PRESENTATION SLIDESHARE
  •   CREATE ONCE, PUBLISH EVERYWHERE (version française). Présentation
      SlideShare réalisée par Novius OS [en ligne]. Octobre 2012. Disponible sur :
       http://fr.slideshare.net/novius-os/create-once-publish-everywhere-anytime 
  •   LES MOTEURS DE RECHERCHE SÉMANTIQUE :
      CONTEXTUALISATION, SÉMANTISATION ET RÉNOVATION.
      Présentation SlideShare réalisée par Sylvain Gateau [en ligne]. Novembre 2012.
      Disponible sur :
       http://fr.slideshare.net/Cerise_sur_le_Gateau/les-moteurs-de-recherche-
      smantique 
  •   FOR A FUTURE FRIENDLY WEB. Présentation SlideShare réalisée par Brad
      Frost [en ligne]. Disponible sur :
       http://fr.slideshare.net/bradfrostweb/for-a-futurefriendly-web 

VIDEOS YOUTUBE
  •   PROJECT GLASS : ONE DAY… Vidéo prospective réalisée par Google [en
      ligne]. Avril 2012. Disponible sur :  http://youtu.be/9c6W4CCU9M4 
  •   MUSHROOM TV : UX DESIGNERS (épisode 1). Vidéo-reportage sur le métier
      d’UX Designer réalisée par le cabinet de chasseurs de têtes Mushroom [en ligne].
      Disponible sur :  http://youtu.be/KKoayiQbUc0 




          UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   25
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 26



Annexe n°1 : Retranscription d’interview - Antoine Lefeuvre,
responsable RD chez Novius Labs

Entretien téléphonique réalisé le Vendredi 7 Décembre 2012 de 17h30 à 19h.

Question 1
Quelle est la place du web sémantique (WS) dans l’agence Novius à l’heure actuelle ?
Réponse d’Antoine Lefeuvre
Chez Novius, il faut tout d’abord discerner l’activité « agence » de l’activité « laboratoire ».
Dans l’un comme dans l’autre, le WS est intégré dans la vision de l’agence. Je vais parler
dans un premier temps du WS au sein de l’activité « agence ».
Aujourd’hui, nous pouvons voir apparaître la mention de WS dans certains cahiers des
charges. Le WS sera intégré aux projets en fonction de la sensibilité des chefs de projets. Le
WS est principalement traité pour ses caractéristiques de référencement. Chez Novius, nous
n’avons pas de politique de référencement dans nos offres. Nous travaillons donc avec des
référenceurs, sous forme de prestations.
Nous avons déjà collaboré sur quelques projets tels que le site de Bjorg, la marque
agroalimentaire. Nous avons élaboré une base de recette, enrichie par des microformats et
notamment l’attribut « hrecepe ». Il faut savoir qu’aujourd’hui des moteurs de recherche
comme Google sont capables de choisir et privilégier des attributs sémantiques et de se les
approprier afin d’afficher des résultats de recettes directement dans leur page de résultat par
exemple. D’où l’intérêt pour ce client d’intégrer des microformats.


Question 2
Pratiquez-vous une politique de tarification spécifique pour ces prestations liées au WS
?
Réponse d’Antoine Lefeuvre
Nous n’appliquons pas de tarification spécifique. Les tarifs seront pris en compte dans la
prestation d’optimisation de référencement, sans en être séparée. Cependant, il peut nous
arriver d’ajouter une phase de référencement pendant ou après la conception du projet. Dans
quel cas nous prévoyons un devis à part.
Je suis convaincu que le WS sera de plus en plus présent dans les projets web, mais pas
uniquement pour des problématiques de référencement.




             UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   26
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 27



Question 3
Quelle est la place du contenu dans le WS ? Les produits conçus par Novius Labs sont-
ils optimisés pour le WS ?
Réponse d’Antoine Lefeuvre
Nous avons la particularité d’avoir ce laboratoire dans lequel nous avons déjà conçu une suite
d’outils que nous commercialisons auprès de nos clients. Depuis plus d’un an maintenant, je
me suis penché sur le WS pour notre nouveau projet Novius OS, lancé au cours de l’année
2012. Novius OS est un CMS nouvelle génération permettant de gérer du contenu multicanal.
Notre problématique de départ était la suivante : qu’est ce que gérer du contenu aujourd’hui,
à l’heure du multicanal ?
Pour répondre à cela, je me suis intéressé à l’apparition de nouveaux métiers aux États-Unis :
les architectes de contenu et les stratèges de contenu. Ces professionnels pensent l’Internet
comme étant de plus en plus polymorphe, notamment avec l’avènement des tablettes tactiles,
des Smartphones et même des consoles de jeu qui représentent un pourcentage très élevé du
trafic sur Internet aux États-Unis. La nouvelle génération sera les lunettes, comme nous l’a
présenté Google avec son projet « Google Glass ».
Tout cela nous indique que le contenu est actuellement présenté sous différentes formes et
que cela va s’accroitre dans les années à venir. Le contenu est la valeur principale pour une
entreprise et il doit être structuré. On parle de design de taxonomie : le contenu est classé
selon du vocabulaire et il est ainsi structuré.

Question 4
Quelle est la place du chef de projet dans cette mouvance ? Comment intégrer ces
nouveaux métiers dans une équipe ou dans une agence « digitale » ?
Réponse d’Antoine Lefeuvre
Le chef de projet restera selon moi un chef d’orchestre des différents métiers de son équipe. Il
devra composer avec ces nouveaux métiers. Cela sous entend être au courant de ce qu’il se
passe. Mais il ne devra pas en être un spécialiste, car il ne peut pas maitriser toutes les
compétences de son équipe, et cela n’est pas nouveau. Au moment venu, il devra être capable
de s’entourer de professionnels (stratèges et architectes). S’il n’en trouve pas, il sera
certainement amené à composer par lui-même, avec ses connaissances.
Les métiers d’architecture de contenu et de stratège de contenu se font de plus en plus
présents. Leur travail consiste à recenser le contenu dans les entreprises et à en donner une
structure. Pour le moment, ce sont des professionnels qui interviennent à la journée et qui
sont payés très chers.
Le « responsive design » n’est que le commencement de cette mouvance. En 2012, cette
pratique permet de répondre efficacement aux besoins d’adaptabilité sur différents supports.
Mais il ne suffira plus en 2015. Les contenus d’une entreprise vivent deux à trois ans en
moyenne. Le travail des stratèges est donc de les conseiller dès aujourd’hui afin de les


             UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   27
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 28



préparer à structurer leur contenu. Il s’agit d’un courant nommé le « future-ready »,
autrement dit, accepter le fait que le contenu va changer et faire en sorte qu’il soit prêt à être
mis en place sur plusieurs canaux de nature différente.
En France, une agence est connue pour la structuration de contenu : Nealite. Mais une des
plus connues est sans doute Under Standing Group aux USA. Il y a une émergence de ces
nouveaux métiers et ces professionnels seront progressivement intégrés dans des agences
digitales.

Question 5
Quelle est la place / l’importance des moteurs de recherche dans ce contexte ?
Réponse d’Antoine Lefeuvre
Les moteurs de recherche vont exiger de plus en plus la sémantisation des contenus car le
web sémantique représente, pour eux, une réelle aubaine : la sémantisation des contenus
facilitent la structuration des données et donc le travail de ces objets.
Les moteurs de recherche sont divisés entre 2 forces :
    •    Les utilisateurs, qui demandent à accéder aux informations et qui n’ont pas de réel
         jugement sur la forme que cela doit prendre.
    •    Les moteurs de recherche eux même, qui vont exiger de plus en plus une meilleure
         sémantisation des ressources chez les éditeurs s’ils veulent bénéficier d’un bon
         référencement.
Grâce aux moteurs de recherche sémantique, les utilisateurs ont accès à l’information
correspondant à leur requête sans même avoir à consulter plusieurs pages. Il s’agit d’un gain
de temps et d’une optimisation de la collaboration entre l’homme et sa machine.

Question 6
Nous pouvons donc imaginer que le trafic sur les sites Internet des éditeurs sera amené
à diminuer considérablement ? On peut parler d’une redéfinition du système
économique numérique ?
Réponse d’Antoine Lefeuvre
Oui, il y aura très certainement une baisse de trafic, mais est-ce une rupture ? Aujourd’hui, un
site comme Facebook s’avère être un agrégateur de flux de données très performants. Les
utilisateurs de ce réseau social, plus d’un milliard à ce jour, publient et consomment
quotidiennement du contenu sans forcément se diriger sur les sites Internet des éditeurs. Cela
est difficile à maitriser pour les éditeurs mais le phénomène n’est pas nouveau et il faudra
composer de plus en plus avec cela. Il y aura un report du trafic et non une baisse : les médias
sociaux n’ont pas fait disparaître les sites Internet. Ce qui est certain, c’est que nous assistons
à un changement du modèle économique. Toute l’offre de référencement va être affectée dans
un premier temps.




             UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   28
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 29



Question 7
Google a récemment lancé « Knowledge Graph », un moteur de recherche sémantique.
Le WS est-il imposé à l’utilisateur ou est-ce une réponse à ses besoins ? Comment voyez-
vous l’évolution, à court terme, du WS ?
Réponse d’Antoine Lefeuvre
L’utilisateur n’a pas la notion de HTML*, de CSS*. Ce qu’il lui importe, c’est d’accéder à
l’information et de trouver des réponses à ses requêtes. Les sites web ne sont pas une fin en
soi à ses yeux. Il n’aura probablement aucun problème à s’adapter car il s’est très bien adapté
aux médias sociaux et notamment à Facebook, qui agrège les contenus.
La notion de web 3.0 a véritablement décollé en 2008 / 2009. Le web sémantique est
désormais très présent, le mouvement est bien enclenché mais peu de gens l’utilisent. Je
pense que dans les trois années à venir, le WS va considérablement s’envoler.

Question 8
Il y a t-il des secteurs d’activité dans lesquels le WS aura une importance considérable ?
Réponse d’Antoine Lefeuvre
Il y a une réelle pression exercée par les moteurs de recherche sur certains domaines tels que
les transports, la cuisine, la documentation (très en avance sur ce sujet avec notamment le
projet DITA), ainsi que les réseaux de présentation d’expériences professionnelles (LinkedIn
se base aujourd’hui sur le microformat « hresume »). Un secteur comme celui de la cuisine
est aujourd’hui très normalisé, d’où l’apport de sémantisation dans le projet de Bjorg
(précédemment cité). Dans le domaine des transports, il est nécessaire de fournir des flux de
données aux moteurs de recherche (quel vol en partance de Paris pour New-York
aujourd’hui ? Pour quel prix ? À quelle heure ?). L’utilisateur d’aujourd’hui ne va pas
consulter les sites de chaque compagnie aérienne afin de trouver son billet. Il va plutôt
privilégier les comparateurs de prix. Cela est d’autant plus important que le domaine du
transport sera de plus en plus imposé par l’ouverture de ses données publiques (Open Data).

Question 9
Une dernière question : qu’entendez-vous par le terme « digitale » ?
Réponse d’Antoine Lefeuvre
Il s’agit en réalité d’un effet de mode. C’est un anglicisme du terme « numérique ».
Aujourd’hui, les agences l’utilisent, il faut donc « s’aligner » et utiliser ce terme. Il y a
quelques temps, le terme « web agency » ou agence web a disparu car comme je le disais, le
web est polymorphe et sous entend des formes différentes. Or, le terme « web » est souvent
assimilé aux sites Internet, alors que les applications mobiles et tablettes ne cessent de
croitre : c’est réducteur et peu représentatif des prestations proposées en agence. D’où
l’utilisation du mot « digitale ».




             UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   29
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 30



         Annexe 2 : Interface d’administration du CMS COPE Novius OS




Interface d’administration du CMS COPE développé par Novius. Sur cette interface, nous avons accès à un
seul et même contenu concernant la venue d’un nouveau Gorille. Le contenu est entré selon différents
champs (titre, images, lien hypertexte, Description,…). Il suffit alors de sélectionner l’affichage de contenu
en fonction de la diffusion souhaitée (sur Twitter, Facebook, l’application mobile,…) et de publier le
contenu. Ce dernier est alors adapté au terminal / réseau sélectionné. Il peut par la suite être publié sur
divers canaux, en utilisant ce même contenu. Ce CMS reflète donc bien le courant « Create Once, Publish
Everywhere ».




                      UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   30
GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 31


                                                        Résumé

Après le web 1.0 et le web 2.0, place au web sémantique. Jusque là encore unilatérale, la
relation homme / machine prend une nouvelle dimension avec la sémantisation des
contenus : les machines sont désormais capables de comprendre et d’exploiter le contenu.
Pour notre plus grand bien ?
Le web sémantique est en marche pour nous préparer au futur. Des courants de pensées,
tels que le « Future friendly web », prônent un web propre, structuré, et véhiculant du
contenu porteur de sens, prêt à s’adapter et à être diffusé n’importe où, n’importe quand.
À la croisée des Sciences Sociales et Humaines et des Sciences de l’Information et de la
Communication, le web sémantique est donc sur le point de redéfinir nos relations
communicationnelles ainsi que l’organisation de l’écosystème numérique.
Vers de nouveaux métiers ? De nouveaux acteurs ? De nouvelles pratiques ? Une chose
est sûre, c’est qu’à partir d’aujourd’hui, la machine entre un peu plus dans notre sphère
intime, relationnelle et communicationnelle. Un pas de plus vers l’intelligence
artificielle ?




                                                       Mots-clés
                                                   Web sémantique
                                                  Graphe de triplets
                                          Sémantisation des contenus
                                               « Responsive design »
                                              « Future friendly web »
                                            « Future-ready content »
                                                   « COPE »
                                                 Stratège de contenu
                                               Architecte de contenu
                                                    UI / UX design




            UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013   31

Contenu connexe

Tendances

Formation réseaux sociaux cci versailles trendeo
Formation réseaux sociaux cci versailles trendeoFormation réseaux sociaux cci versailles trendeo
Formation réseaux sociaux cci versailles trendeoTrendeo
 
Politique d’utilisation des médias sociaux: modèle et exemples
Politique d’utilisation des médias sociaux: modèle et exemplesPolitique d’utilisation des médias sociaux: modèle et exemples
Politique d’utilisation des médias sociaux: modèle et exemplesGenève Lab
 
Web 2.0 BtoB pour les entreprises, les marques, les collaborateurs
Web 2.0 BtoB pour les entreprises, les marques, les collaborateursWeb 2.0 BtoB pour les entreprises, les marques, les collaborateurs
Web 2.0 BtoB pour les entreprises, les marques, les collaborateursegrospiron
 
L'avenir des médias sociaux, c'est maintenant (Journée du marketing hôtelier ...
L'avenir des médias sociaux, c'est maintenant (Journée du marketing hôtelier ...L'avenir des médias sociaux, c'est maintenant (Journée du marketing hôtelier ...
L'avenir des médias sociaux, c'est maintenant (Journée du marketing hôtelier ...Olivier Tripet
 
emploi 2.0 @ Web2.connect
emploi 2.0 @ Web2.connectemploi 2.0 @ Web2.connect
emploi 2.0 @ Web2.connectrmen
 
Moovement @ WebDeux.connect
Moovement @ WebDeux.connectMoovement @ WebDeux.connect
Moovement @ WebDeux.connectrmen
 
Manifesto Blog RH
Manifesto Blog RHManifesto Blog RH
Manifesto Blog RHrmen
 
Le community management
Le community managementLe community management
Le community managementCYB@RDECHE
 
E marketing Paris presentation - January 29 - 2013
E marketing Paris presentation - January 29 - 2013 E marketing Paris presentation - January 29 - 2013
E marketing Paris presentation - January 29 - 2013 Brightcove
 
Médias sociaux et métiers de demain
Médias sociaux et métiers de demainMédias sociaux et métiers de demain
Médias sociaux et métiers de demainOlivier Tripet
 
Catalogue de nos formation auprès des elus janvier 2013
Catalogue de nos formation auprès des elus  janvier 2013Catalogue de nos formation auprès des elus  janvier 2013
Catalogue de nos formation auprès des elus janvier 2013Julien Voyez
 
PickAsso - Exemple d'Audit Digital anonyme
PickAsso -  Exemple d'Audit Digital anonymePickAsso -  Exemple d'Audit Digital anonyme
PickAsso - Exemple d'Audit Digital anonymePickAsso
 
Charte utilisation des réseaux sociaux de GrDF
Charte utilisation des réseaux sociaux de GrDFCharte utilisation des réseaux sociaux de GrDF
Charte utilisation des réseaux sociaux de GrDFVincent Gailhaguet
 
Utiliser les réseaux sociaux pour développer son Business!
Utiliser les réseaux sociaux pour développer son Business!Utiliser les réseaux sociaux pour développer son Business!
Utiliser les réseaux sociaux pour développer son Business!Patrick Barrabé® 😊
 
Réussir son site internet - Extraits de conférence / formation
Réussir son site internet - Extraits de conférence / formationRéussir son site internet - Extraits de conférence / formation
Réussir son site internet - Extraits de conférence / formationLACT
 
Cercle MD : Comprendre media sociaux pour agir Inbox
Cercle MD : Comprendre media sociaux pour agir Inbox Cercle MD : Comprendre media sociaux pour agir Inbox
Cercle MD : Comprendre media sociaux pour agir Inbox Henri Kaufman
 
2007 10 25 Le rapid elearning : un atout pour la FOAD
2007 10 25 Le rapid elearning : un atout pour la  FOAD2007 10 25 Le rapid elearning : un atout pour la  FOAD
2007 10 25 Le rapid elearning : un atout pour la FOADnovantura
 
Les réseaux sociaux professionnels et l'identité numérique - Dispo cadres - s...
Les réseaux sociaux professionnels et l'identité numérique - Dispo cadres - s...Les réseaux sociaux professionnels et l'identité numérique - Dispo cadres - s...
Les réseaux sociaux professionnels et l'identité numérique - Dispo cadres - s...Le Groupe La Poste
 
2007 12 11 Le Nouvel Art D Apprendre Tout Au Long Du Travail
2007 12 11  Le Nouvel Art D Apprendre Tout Au Long Du Travail2007 12 11  Le Nouvel Art D Apprendre Tout Au Long Du Travail
2007 12 11 Le Nouvel Art D Apprendre Tout Au Long Du Travailnovantura
 

Tendances (20)

Formation réseaux sociaux cci versailles trendeo
Formation réseaux sociaux cci versailles trendeoFormation réseaux sociaux cci versailles trendeo
Formation réseaux sociaux cci versailles trendeo
 
Politique d’utilisation des médias sociaux: modèle et exemples
Politique d’utilisation des médias sociaux: modèle et exemplesPolitique d’utilisation des médias sociaux: modèle et exemples
Politique d’utilisation des médias sociaux: modèle et exemples
 
Web 2.0 BtoB pour les entreprises, les marques, les collaborateurs
Web 2.0 BtoB pour les entreprises, les marques, les collaborateursWeb 2.0 BtoB pour les entreprises, les marques, les collaborateurs
Web 2.0 BtoB pour les entreprises, les marques, les collaborateurs
 
L'avenir des médias sociaux, c'est maintenant (Journée du marketing hôtelier ...
L'avenir des médias sociaux, c'est maintenant (Journée du marketing hôtelier ...L'avenir des médias sociaux, c'est maintenant (Journée du marketing hôtelier ...
L'avenir des médias sociaux, c'est maintenant (Journée du marketing hôtelier ...
 
emploi 2.0 @ Web2.connect
emploi 2.0 @ Web2.connectemploi 2.0 @ Web2.connect
emploi 2.0 @ Web2.connect
 
Moovement @ WebDeux.connect
Moovement @ WebDeux.connectMoovement @ WebDeux.connect
Moovement @ WebDeux.connect
 
Manifesto Blog RH
Manifesto Blog RHManifesto Blog RH
Manifesto Blog RH
 
Le community management
Le community managementLe community management
Le community management
 
E marketing Paris presentation - January 29 - 2013
E marketing Paris presentation - January 29 - 2013 E marketing Paris presentation - January 29 - 2013
E marketing Paris presentation - January 29 - 2013
 
Médias sociaux et métiers de demain
Médias sociaux et métiers de demainMédias sociaux et métiers de demain
Médias sociaux et métiers de demain
 
Médias sociaux (3)
Médias sociaux (3)Médias sociaux (3)
Médias sociaux (3)
 
Catalogue de nos formation auprès des elus janvier 2013
Catalogue de nos formation auprès des elus  janvier 2013Catalogue de nos formation auprès des elus  janvier 2013
Catalogue de nos formation auprès des elus janvier 2013
 
PickAsso - Exemple d'Audit Digital anonyme
PickAsso -  Exemple d'Audit Digital anonymePickAsso -  Exemple d'Audit Digital anonyme
PickAsso - Exemple d'Audit Digital anonyme
 
Charte utilisation des réseaux sociaux de GrDF
Charte utilisation des réseaux sociaux de GrDFCharte utilisation des réseaux sociaux de GrDF
Charte utilisation des réseaux sociaux de GrDF
 
Utiliser les réseaux sociaux pour développer son Business!
Utiliser les réseaux sociaux pour développer son Business!Utiliser les réseaux sociaux pour développer son Business!
Utiliser les réseaux sociaux pour développer son Business!
 
Réussir son site internet - Extraits de conférence / formation
Réussir son site internet - Extraits de conférence / formationRéussir son site internet - Extraits de conférence / formation
Réussir son site internet - Extraits de conférence / formation
 
Cercle MD : Comprendre media sociaux pour agir Inbox
Cercle MD : Comprendre media sociaux pour agir Inbox Cercle MD : Comprendre media sociaux pour agir Inbox
Cercle MD : Comprendre media sociaux pour agir Inbox
 
2007 10 25 Le rapid elearning : un atout pour la FOAD
2007 10 25 Le rapid elearning : un atout pour la  FOAD2007 10 25 Le rapid elearning : un atout pour la  FOAD
2007 10 25 Le rapid elearning : un atout pour la FOAD
 
Les réseaux sociaux professionnels et l'identité numérique - Dispo cadres - s...
Les réseaux sociaux professionnels et l'identité numérique - Dispo cadres - s...Les réseaux sociaux professionnels et l'identité numérique - Dispo cadres - s...
Les réseaux sociaux professionnels et l'identité numérique - Dispo cadres - s...
 
2007 12 11 Le Nouvel Art D Apprendre Tout Au Long Du Travail
2007 12 11  Le Nouvel Art D Apprendre Tout Au Long Du Travail2007 12 11  Le Nouvel Art D Apprendre Tout Au Long Du Travail
2007 12 11 Le Nouvel Art D Apprendre Tout Au Long Du Travail
 

En vedette

Web 3.0 The Semantic Web
Web 3.0 The Semantic WebWeb 3.0 The Semantic Web
Web 3.0 The Semantic WebHatem Mahmoud
 
Clases CGC Unidad 1 versión 2011
Clases CGC Unidad 1 versión 2011Clases CGC Unidad 1 versión 2011
Clases CGC Unidad 1 versión 2011Illich Gálvez
 
Daily Routine Keynote
Daily Routine KeynoteDaily Routine Keynote
Daily Routine Keynoteks428945mhs
 
Ingénieur civil
Ingénieur civilIngénieur civil
Ingénieur civilmanonc
 
Top 10 Micron Associates world tourists plugs
Top 10 Micron Associates world tourists plugsTop 10 Micron Associates world tourists plugs
Top 10 Micron Associates world tourists plugsCraig Bloom
 
Informe del secretario general de la OEA
Informe del secretario general  de la OEAInforme del secretario general  de la OEA
Informe del secretario general de la OEAEspacio Público
 
Rsi ACOSS Avis Regularisation - Communiqué du 22 septembre 2014
Rsi ACOSS Avis Regularisation - Communiqué du 22 septembre 2014Rsi ACOSS Avis Regularisation - Communiqué du 22 septembre 2014
Rsi ACOSS Avis Regularisation - Communiqué du 22 septembre 2014A3C - Expert Comptable à Dunkerque
 
Enquête novancia doctorants & créa
Enquête novancia doctorants & créaEnquête novancia doctorants & créa
Enquête novancia doctorants & créaechosentrepreneurs
 
04 f2000 - 2011 - martiniere-diderot - lyon
04   f2000 - 2011 - martiniere-diderot - lyon04   f2000 - 2011 - martiniere-diderot - lyon
04 f2000 - 2011 - martiniere-diderot - lyonCédric Frayssinet
 
El efecto de Ryanair sobre los destinos españoles
El efecto de Ryanair sobre los destinos españolesEl efecto de Ryanair sobre los destinos españoles
El efecto de Ryanair sobre los destinos españolesHosteltur
 
Ingénieur civil
Ingénieur civilIngénieur civil
Ingénieur civilmanonc
 
Vie Pratique Santé - Luxomed
Vie Pratique Santé - LuxomedVie Pratique Santé - Luxomed
Vie Pratique Santé - LuxomedLuxomed
 
Sémiologie : campagne Leclerc pharmacie
Sémiologie : campagne Leclerc pharmacieSémiologie : campagne Leclerc pharmacie
Sémiologie : campagne Leclerc pharmacieElodie Mielczareck
 
Guia consejo tecnico escolar
Guia consejo tecnico escolarGuia consejo tecnico escolar
Guia consejo tecnico escolarevamariafloresr
 

En vedette (20)

Web 3.0 The Semantic Web
Web 3.0 The Semantic WebWeb 3.0 The Semantic Web
Web 3.0 The Semantic Web
 
Clases CGC Unidad 1 versión 2011
Clases CGC Unidad 1 versión 2011Clases CGC Unidad 1 versión 2011
Clases CGC Unidad 1 versión 2011
 
Daily Routine Keynote
Daily Routine KeynoteDaily Routine Keynote
Daily Routine Keynote
 
Ingénieur civil
Ingénieur civilIngénieur civil
Ingénieur civil
 
Crear cuenta gmail
Crear cuenta gmailCrear cuenta gmail
Crear cuenta gmail
 
Etat actionnaire rapport 2011
Etat actionnaire rapport 2011Etat actionnaire rapport 2011
Etat actionnaire rapport 2011
 
Tocame
TocameTocame
Tocame
 
Top 10 Micron Associates world tourists plugs
Top 10 Micron Associates world tourists plugsTop 10 Micron Associates world tourists plugs
Top 10 Micron Associates world tourists plugs
 
Informe del secretario general de la OEA
Informe del secretario general  de la OEAInforme del secretario general  de la OEA
Informe del secretario general de la OEA
 
Rsi ACOSS Avis Regularisation - Communiqué du 22 septembre 2014
Rsi ACOSS Avis Regularisation - Communiqué du 22 septembre 2014Rsi ACOSS Avis Regularisation - Communiqué du 22 septembre 2014
Rsi ACOSS Avis Regularisation - Communiqué du 22 septembre 2014
 
Mapas conceptuales
Mapas conceptualesMapas conceptuales
Mapas conceptuales
 
Enquête novancia doctorants & créa
Enquête novancia doctorants & créaEnquête novancia doctorants & créa
Enquête novancia doctorants & créa
 
04 f2000 - 2011 - martiniere-diderot - lyon
04   f2000 - 2011 - martiniere-diderot - lyon04   f2000 - 2011 - martiniere-diderot - lyon
04 f2000 - 2011 - martiniere-diderot - lyon
 
Orientation pour ton organisme inscrit sur CanaDon
Orientation pour ton organisme inscrit sur CanaDonOrientation pour ton organisme inscrit sur CanaDon
Orientation pour ton organisme inscrit sur CanaDon
 
El efecto de Ryanair sobre los destinos españoles
El efecto de Ryanair sobre los destinos españolesEl efecto de Ryanair sobre los destinos españoles
El efecto de Ryanair sobre los destinos españoles
 
Ingénieur civil
Ingénieur civilIngénieur civil
Ingénieur civil
 
Vie Pratique Santé - Luxomed
Vie Pratique Santé - LuxomedVie Pratique Santé - Luxomed
Vie Pratique Santé - Luxomed
 
Sémiologie : campagne Leclerc pharmacie
Sémiologie : campagne Leclerc pharmacieSémiologie : campagne Leclerc pharmacie
Sémiologie : campagne Leclerc pharmacie
 
Guia consejo tecnico escolar
Guia consejo tecnico escolarGuia consejo tecnico escolar
Guia consejo tecnico escolar
 
Presentación máster lógica2014
Presentación máster lógica2014Presentación máster lógica2014
Presentación máster lógica2014
 

Similaire à Le web sémantique pour mieux anticiper le futur

La compétence numérique, cadre de travail évolutif pour le design d'interface...
La compétence numérique, cadre de travail évolutif pour le design d'interface...La compétence numérique, cadre de travail évolutif pour le design d'interface...
La compétence numérique, cadre de travail évolutif pour le design d'interface...Vincent Beneche
 
Une plateforme pédagogique d'orientation_Projet de fin d'études
Une plateforme pédagogique d'orientation_Projet de fin d'étudesUne plateforme pédagogique d'orientation_Projet de fin d'études
Une plateforme pédagogique d'orientation_Projet de fin d'étudesMOUDOUBAH Lamia
 
Les intranets et leur écosystème, portrait des usages et meilleures pratiques
Les intranets et leur écosystème, portrait des usages et meilleures pratiquesLes intranets et leur écosystème, portrait des usages et meilleures pratiques
Les intranets et leur écosystème, portrait des usages et meilleures pratiquesCEFRIO
 
Chaire Machine Learning for Big Data
Chaire Machine Learning for Big DataChaire Machine Learning for Big Data
Chaire Machine Learning for Big DataTélécom Paris
 
Guide méthodologique et professionnel à destination des formateurs non-initié...
Guide méthodologique et professionnel à destination des formateurs non-initié...Guide méthodologique et professionnel à destination des formateurs non-initié...
Guide méthodologique et professionnel à destination des formateurs non-initié...FRPDL
 
Rapport stage
Rapport stageRapport stage
Rapport stageTECOS
 
Mise en place d’une application mobile de géolocalisation
Mise en place d’une application mobile de géolocalisationMise en place d’une application mobile de géolocalisation
Mise en place d’une application mobile de géolocalisationCléa Aurianne Leencé BAWE
 
TFE. Conception et réalisation d'une application web mobile touristique. Marg...
TFE. Conception et réalisation d'une application web mobile touristique. Marg...TFE. Conception et réalisation d'une application web mobile touristique. Marg...
TFE. Conception et réalisation d'une application web mobile touristique. Marg...Jonathan Margrève
 
Memoire web 3.0 Marion Pelouzet
Memoire web 3.0 Marion PelouzetMemoire web 3.0 Marion Pelouzet
Memoire web 3.0 Marion PelouzetPelouzet
 
Mémoire_SciencesPo_Alexis-Legrand_L’INTERNET-DES-OBJETS,-UN-PAS-VERS-LA-TRAN...
Mémoire_SciencesPo_Alexis-Legrand_L’INTERNET-DES-OBJETS,-UN-PAS-VERS-LA-TRAN...Mémoire_SciencesPo_Alexis-Legrand_L’INTERNET-DES-OBJETS,-UN-PAS-VERS-LA-TRAN...
Mémoire_SciencesPo_Alexis-Legrand_L’INTERNET-DES-OBJETS,-UN-PAS-VERS-LA-TRAN...Alexis Legrand
 
Projet de fin d'etude 2015 (le web to store) élaborer par Debbichi zied
Projet de fin d'etude 2015 (le web to store) élaborer par Debbichi ziedProjet de fin d'etude 2015 (le web to store) élaborer par Debbichi zied
Projet de fin d'etude 2015 (le web to store) élaborer par Debbichi ziedZied Debbichi
 
Presentation web3.0 par Tassha Studio
Presentation web3.0 par Tassha StudioPresentation web3.0 par Tassha Studio
Presentation web3.0 par Tassha StudioMildiou
 
Marie Montané - "L’influence du webdesign sur l’image de marque, ou dans quel...
Marie Montané - "L’influence du webdesign sur l’image de marque, ou dans quel...Marie Montané - "L’influence du webdesign sur l’image de marque, ou dans quel...
Marie Montané - "L’influence du webdesign sur l’image de marque, ou dans quel...Geoffrey Dorne
 
Community manager et rédacteur web : convergence ou concurrence ?
Community manager et rédacteur web : convergence ou concurrence ?Community manager et rédacteur web : convergence ou concurrence ?
Community manager et rédacteur web : convergence ou concurrence ?Anne Schnepp
 
Mémoire lolcats
Mémoire lolcatsMémoire lolcats
Mémoire lolcatsHugo Clery
 
Comment conduire un projet web entre planification ?
Comment conduire un projet web entre planification ?Comment conduire un projet web entre planification ?
Comment conduire un projet web entre planification ?MarineS6
 
Indicateurs de pilotage du numérique en EPLE
Indicateurs de pilotage du numérique en EPLEIndicateurs de pilotage du numérique en EPLE
Indicateurs de pilotage du numérique en EPLENicolas Defay
 

Similaire à Le web sémantique pour mieux anticiper le futur (20)

IntenrnshipMyApp
IntenrnshipMyAppIntenrnshipMyApp
IntenrnshipMyApp
 
La compétence numérique, cadre de travail évolutif pour le design d'interface...
La compétence numérique, cadre de travail évolutif pour le design d'interface...La compétence numérique, cadre de travail évolutif pour le design d'interface...
La compétence numérique, cadre de travail évolutif pour le design d'interface...
 
Une plateforme pédagogique d'orientation_Projet de fin d'études
Une plateforme pédagogique d'orientation_Projet de fin d'étudesUne plateforme pédagogique d'orientation_Projet de fin d'études
Une plateforme pédagogique d'orientation_Projet de fin d'études
 
Les intranets et leur écosystème, portrait des usages et meilleures pratiques
Les intranets et leur écosystème, portrait des usages et meilleures pratiquesLes intranets et leur écosystème, portrait des usages et meilleures pratiques
Les intranets et leur écosystème, portrait des usages et meilleures pratiques
 
Chaire Machine Learning for Big Data
Chaire Machine Learning for Big DataChaire Machine Learning for Big Data
Chaire Machine Learning for Big Data
 
Guide méthodologique et professionnel à destination des formateurs non-initié...
Guide méthodologique et professionnel à destination des formateurs non-initié...Guide méthodologique et professionnel à destination des formateurs non-initié...
Guide méthodologique et professionnel à destination des formateurs non-initié...
 
Rapport stage
Rapport stageRapport stage
Rapport stage
 
Mise en place d’une application mobile de géolocalisation
Mise en place d’une application mobile de géolocalisationMise en place d’une application mobile de géolocalisation
Mise en place d’une application mobile de géolocalisation
 
TFE. Conception et réalisation d'une application web mobile touristique. Marg...
TFE. Conception et réalisation d'une application web mobile touristique. Marg...TFE. Conception et réalisation d'une application web mobile touristique. Marg...
TFE. Conception et réalisation d'une application web mobile touristique. Marg...
 
Memoire web 3.0 Marion Pelouzet
Memoire web 3.0 Marion PelouzetMemoire web 3.0 Marion Pelouzet
Memoire web 3.0 Marion Pelouzet
 
Mémoire_SciencesPo_Alexis-Legrand_L’INTERNET-DES-OBJETS,-UN-PAS-VERS-LA-TRAN...
Mémoire_SciencesPo_Alexis-Legrand_L’INTERNET-DES-OBJETS,-UN-PAS-VERS-LA-TRAN...Mémoire_SciencesPo_Alexis-Legrand_L’INTERNET-DES-OBJETS,-UN-PAS-VERS-LA-TRAN...
Mémoire_SciencesPo_Alexis-Legrand_L’INTERNET-DES-OBJETS,-UN-PAS-VERS-LA-TRAN...
 
Projet de fin d'etude 2015 (le web to store) élaborer par Debbichi zied
Projet de fin d'etude 2015 (le web to store) élaborer par Debbichi ziedProjet de fin d'etude 2015 (le web to store) élaborer par Debbichi zied
Projet de fin d'etude 2015 (le web to store) élaborer par Debbichi zied
 
Propositions tf ecole_numerique
Propositions tf ecole_numeriquePropositions tf ecole_numerique
Propositions tf ecole_numerique
 
Presentation web3.0 par Tassha Studio
Presentation web3.0 par Tassha StudioPresentation web3.0 par Tassha Studio
Presentation web3.0 par Tassha Studio
 
Marie Montané - "L’influence du webdesign sur l’image de marque, ou dans quel...
Marie Montané - "L’influence du webdesign sur l’image de marque, ou dans quel...Marie Montané - "L’influence du webdesign sur l’image de marque, ou dans quel...
Marie Montané - "L’influence du webdesign sur l’image de marque, ou dans quel...
 
Community manager et rédacteur web : convergence ou concurrence ?
Community manager et rédacteur web : convergence ou concurrence ?Community manager et rédacteur web : convergence ou concurrence ?
Community manager et rédacteur web : convergence ou concurrence ?
 
Mémoire lolcats
Mémoire lolcatsMémoire lolcats
Mémoire lolcats
 
GEmploi : Smart school timetable management software using RFID technology
GEmploi : Smart school timetable management software using RFID technologyGEmploi : Smart school timetable management software using RFID technology
GEmploi : Smart school timetable management software using RFID technology
 
Comment conduire un projet web entre planification ?
Comment conduire un projet web entre planification ?Comment conduire un projet web entre planification ?
Comment conduire un projet web entre planification ?
 
Indicateurs de pilotage du numérique en EPLE
Indicateurs de pilotage du numérique en EPLEIndicateurs de pilotage du numérique en EPLE
Indicateurs de pilotage du numérique en EPLE
 

Plus de Sylvain Gateau

Les moteurs de recherche sémantique
Les moteurs de recherche sémantiqueLes moteurs de recherche sémantique
Les moteurs de recherche sémantiqueSylvain Gateau
 
Scénario d’usage d’un enseignant // Concept "Cu3" // Si...
Scénario d’usage d’un enseignant // Concept "Cu3" // Si...Scénario d’usage d’un enseignant // Concept "Cu3" // Si...
Scénario d’usage d’un enseignant // Concept "Cu3" // Si...Sylvain Gateau
 
Scénario d’usage d’une institution // Concept "Cu3" // ...
Scénario d’usage d’une institution // Concept "Cu3" // ...Scénario d’usage d’une institution // Concept "Cu3" // ...
Scénario d’usage d’une institution // Concept "Cu3" // ...Sylvain Gateau
 
Scénario d’usage d’un étudiant // Concept "Cu3" // Site...
Scénario d’usage d’un étudiant // Concept "Cu3" // Site...Scénario d’usage d’un étudiant // Concept "Cu3" // Site...
Scénario d’usage d’un étudiant // Concept "Cu3" // Site...Sylvain Gateau
 
Architecture du concept "Cu3" // Site de la Maison de la Création
Architecture du concept "Cu3" // Site de la Maison de la CréationArchitecture du concept "Cu3" // Site de la Maison de la Création
Architecture du concept "Cu3" // Site de la Maison de la CréationSylvain Gateau
 
Architecture du concept "Nhub" // Site de la Maison de la Création
Architecture du concept "Nhub" // Site de la Maison de la CréationArchitecture du concept "Nhub" // Site de la Maison de la Création
Architecture du concept "Nhub" // Site de la Maison de la CréationSylvain Gateau
 
Réflexion d’architecture et navigation "Apéricube" // Site Ma...
Réflexion d’architecture et navigation "Apéricube" // Site Ma...Réflexion d’architecture et navigation "Apéricube" // Site Ma...
Réflexion d’architecture et navigation "Apéricube" // Site Ma...Sylvain Gateau
 
Les réseaux sociaux en France en 2011
Les réseaux sociaux en France en 2011Les réseaux sociaux en France en 2011
Les réseaux sociaux en France en 2011Sylvain Gateau
 

Plus de Sylvain Gateau (8)

Les moteurs de recherche sémantique
Les moteurs de recherche sémantiqueLes moteurs de recherche sémantique
Les moteurs de recherche sémantique
 
Scénario d’usage d’un enseignant // Concept "Cu3" // Si...
Scénario d’usage d’un enseignant // Concept "Cu3" // Si...Scénario d’usage d’un enseignant // Concept "Cu3" // Si...
Scénario d’usage d’un enseignant // Concept "Cu3" // Si...
 
Scénario d’usage d’une institution // Concept "Cu3" // ...
Scénario d’usage d’une institution // Concept "Cu3" // ...Scénario d’usage d’une institution // Concept "Cu3" // ...
Scénario d’usage d’une institution // Concept "Cu3" // ...
 
Scénario d’usage d’un étudiant // Concept "Cu3" // Site...
Scénario d’usage d’un étudiant // Concept "Cu3" // Site...Scénario d’usage d’un étudiant // Concept "Cu3" // Site...
Scénario d’usage d’un étudiant // Concept "Cu3" // Site...
 
Architecture du concept "Cu3" // Site de la Maison de la Création
Architecture du concept "Cu3" // Site de la Maison de la CréationArchitecture du concept "Cu3" // Site de la Maison de la Création
Architecture du concept "Cu3" // Site de la Maison de la Création
 
Architecture du concept "Nhub" // Site de la Maison de la Création
Architecture du concept "Nhub" // Site de la Maison de la CréationArchitecture du concept "Nhub" // Site de la Maison de la Création
Architecture du concept "Nhub" // Site de la Maison de la Création
 
Réflexion d’architecture et navigation "Apéricube" // Site Ma...
Réflexion d’architecture et navigation "Apéricube" // Site Ma...Réflexion d’architecture et navigation "Apéricube" // Site Ma...
Réflexion d’architecture et navigation "Apéricube" // Site Ma...
 
Les réseaux sociaux en France en 2011
Les réseaux sociaux en France en 2011Les réseaux sociaux en France en 2011
Les réseaux sociaux en France en 2011
 

Le web sémantique pour mieux anticiper le futur

  • 1. Sylvain Gateau Le web sémantique pour mieux anticiper le futur… Préparons dès à présent le contenu web pour les futurs terminaux… UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication Master 2 AVMN – 2012-2013 - Mémoire sur les pratiques professionnelles
  • 2. GATEAU Sylvain – Le web sémantique : un pas vers le « future friendly web » - page 1 UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013
  • 3. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 2 Remerciements À l’issue de ce travail de synthèse, je tiens à remercier très sincèrement : // Philippe Quinton, enseignant à l’Université Stendhal de Grenoble, pour son suivi et ses remises en questions tout au long de ma réflexion. // Valérie Lépine, enseignante à l’Université Stendhal de Grenoble, pour m’avoir aidée quant à l’élaboration de ma problématique. // Viviane Clavier, enseignante à l’Université Stendhal de Grenoble, pour sa disponibilité et son expertise sur la thématique du web sémantique. // Julien Pierre, enseignant-chercheur à l’Université Stendhal de Grenoble, pour son cours d’enseignement sur le web sémantique. // Et enfin, Antoine Lefeuvre, responsable R&D chez Novius, pour sa disponibilité et son précieux témoignage. UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 2
  • 4. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 3 Sommaire Sur les traces du web sémantique… ................................................................................... 4   1   Un web renovateur........................................................................................................ 6   1.1   Le web de documents ............................................................................................ 6   1.2   Le web social ......................................................................................................... 7   1.3   Le web sémantique ................................................................................................ 8   1.3.1   Coopération homme / machine ...................................................................... 8   1.3.2   Des triplets, des URI*, un graphe .................................................................. 9   1.3.3   Quelques vocabulaires et attributs courants ................................................. 10   2   Bienvenue dans le « Future friendly web » ................................................................ 12   2.1   Le « responsive design » ..................................................................................... 12   2.2   « Future-ready content »...................................................................................... 13   2.3   « COPE : Create Once, Publish Everywhere » ................................................... 14   3   Vers une redéfinition de l’écosystème numérique ..................................................... 15   3.1   Réorganisation du référencement naturel* .......................................................... 15   3.1.1   Le référencement par la sémantisation ......................................................... 15   3.1.2   Les moteurs de recherche sémantique .......................................................... 16   3.1.3   Les impacts sur la pratique du web .............................................................. 16   3.2   Le contenu au cœur du processus ........................................................................ 17   3.3   L’apparition de nouveaux corps de métiers ........................................................ 19   3.3.1   Les architectes et stratèges de contenu ......................................................... 19   3.3.2   Les UI et UX designers ................................................................................ 20   Le début d’un long chantier… .......................................................................................... 21   Lexique ............................................................................................................................. 22   Bibliographie .................................................................................................................... 23   Sitographie ........................................................................................................................ 24   Annexe n°1 : Retranscription d’interview - Antoine Lefeuvre, responsable R&D chez Novius Labs ...................................................................................................................... 26   Annexe 2 : Interface d’administration du CMS COPE Novius OS .................................. 30     UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 3
  • 5. GATEAU Sylvain – Le web sémantique : un pas vers le « future friendly web » - page 4 Sur les traces du web sémantique… Lorsque j’ai débuté mes études supérieures, je souhaitais couvrir les événements sportifs à la télévision, partir à la rencontre des grands champions et travailler pour la télévision. Un rêve d’enfant, qui ne restera qu’un joli rêve. Puis, je me suis orienté vers la Communication, un univers vaste, tendance et agréablement prisé par la gente féminine, pour travailler dans l’organisation d’événements sportifs. Et cinq plus tard, je m’apprête à entrer dans la vie active en tant que chef de projets web. Véritablement rien ne me prédisait à me spécialiser vers ce métier, et encore moins dans le domaine du web… Plutôt habitué au grand air et aux espaces blancs, me voilà à l’aube d’une nouvelle expérience vécue à travers des écrans, petits, grands, tactiles ou non et interconnectés entre eux grâce au web et à l’Internet. Il y a encore trois années de cela, j’apprenais à développer ma première page HTML* sur Dreamweaver, avec beaucoup de texte, peu de CSS* et encore moins d’interactions. Cette année, avec mes collègues de promotion, nous avons pensé, conçu et géré le bon développement du site Internet « Savoir-faire, faire savoir »1 sur le principe du « responsive design »2. Et tout cela en utilisant un seul et même contenu, adapté aux écrans des différents terminaux. Le contenu est véritablement un paramètre stratégique et incontournable dans les projets web d’aujourd’hui et de demain. Lorsque nous allons sur le web via un navigateur ou que nous utilisons une application mobile, nous cherchons des informations textuelles, 1 Site consultable sur l’URL suivante : http://www.sffs.clic-et-clap.fr 2 Le « responsive design » consiste à adapter le contenu d’un site web aux différentes contraintes de résolution d’écrans UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 4
  • 6. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 5 visuelles, multimédias pertinentes et nous souhaitons les obtenir en l’espace de quelques clics ou touchers. Les internautes sont de plus en plus exigeants et ont accès aux contenus à travers différents écrans devenus, pour certains, mobiles. À l’heure où l’« Open Data »3 se déploie, nous, internautes, sommes submergés par une masse d’informations, qui ne cesse de croitre d’année en année sur le web. Le contenu est la réponse à nos besoins, à nos recherches, à notre utilisation du web selon moi. Un chef de projets web ne doit donc pas le négliger : il doit être réfléchi, travaillé et mis en valeur. Aujourd’hui, le web connaît une rénovation comme le diraient certains professionnels et universitaires. Après le web 1.0 et le web 2.0, nous voici entrés dans l’ère du web sémantique. Alors que Google est incontestablement le moteur de recherche le plus utilisé dans le monde, une actualité m’a particulièrement passionnée en cette année 2012 : le lancement de « Knowledge Graph »4, un moteur de recherche sémantique (« Le Graphe du Savoir »). Pourquoi Google, acteur majeur du web et habitué à être en position de leader, présente « seulement en 2012 » un tel projet alors que d’autres s’y sont déjà employés depuis 2008 comme Wolfram Alpha5 ? Quels enjeux se cachent derrière le web sémantique ? Quels impacts sont à prévoir sur l’écosystème numérique et quelles peuvent en être les opportunités pour les agences web et les professionnels du secteur ? À la croisée des sciences humaines et sociales ainsi que des sciences de l’information et de la communication, le web sémantique, aussi appelé web de données, « linked data »6 ou encore web 3.0, est sur le point de modifier considérablement le paysage numérique ainsi que les enjeux communicationnels. Mon regard de futur professionnel du web s’attarde sur l’émergence du web sémantique et me motive à raisonner autour de la problématique suivante : « Le web sémantique comme dispositif socio-technique : vers une redéfinition des enjeux communicationnels et de l’organisation de l’écosystème numérique ? » Au cours de cette synthèse, je ne vais pas décrire le fonctionnement détaillé du web sémantique, qui serait bien trop compliqué à expliquer et qui résulterait d’un raisonnement d’informaticien et/ou de documentaliste. Je vais dans un premier temps revenir sur les étapes marquantes qu’a vécu le web afin de présenter le contexte d’émergence du web sémantique. Je m’intéresserai par la suite aux courants et pensées dans lesquels s’inscrit l’émergence de ce web 3.0. Je terminerai ce travail de synthèse par une observation des enjeux communicationnels et des possibles changements à venir dans l’écosystème numérique avec l’arrivée du web sémantique. 3 Ouverture et libre accès des données publiques. URL de la plateforme française d’ouverture des données publiques : http://www.data.gouv.fr/ 4 URL : http://www.google.com/insidesearch/features/search/knowledge.html 5 Moteur de recherche sémantique. URL : http://www.wolframalpha.com/ 6 Données liées UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 5
  • 7. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 6 1 Un web renovateur Le web est certes récent, mais il possède déjà sa propre histoire. Que nous soyons « digital natives » 7 ou non, utilisateurs réguliers de ressources documentaires en ligne ou non, nous avons tous côtoyé et suivi directement ou indirectement l’évolution du web : par le biais de notre travail, de nos études, de notre entourage, de notre éducation ou tout simplement par nos propres utilisations personnelles. Le web est ancrée dans la société et est en continuelle mouvance. L’époque où l’utilisateur ne faisait qu’interroger la machine est bien lointaine, mais elle n’a pas totalement disparu pour certains utilisateurs... En l’espace de quelques années, le web est passé d’un simple support de consultation à « un gigantesque livre » dans lequel les internautes peuvent commenter, échanger, produire, partager, converser... Après avoir ajouté une couche sociale et interactive, les acteurs du web tels que W3C*, Google ou autre Facebook, promeuvent aujourd’hui l’enrichissement sémantique des contenus : le web devient petit à petit « une gigantesque base de données ». Pour comprendre ce qu’est le web sémantique, il est important d’observer les différentes étapes qui ont conduit à ce vaste projet de sémantisation des contenus. 1.1 LE WEB DE DOCUMENTS Le web 1.0 , aussi connu sous l’appellation « web de documents », fait référence au milieu des années 1990 lorsque les premiers navigateurs Internet sont apparus (Nescape, Microsoft Explorer, etc.). À cette époque, le web 1.0 permet de diffuser des ressources non structurées telles que des pages HTML*. Celles-ci sont reliées entre elles par l’utilisation de liens hypertextes, l’unique facteur d’interactivité homme / machine (cf. Figure 1). Un utilisateur peut donc consulter une page et se diriger vers une autre en cliquant sur un lien. Selon Bruno Bachimont, « le web 1.0 fait ses traitements à l’aveugle, en ne prenant en compte que le format de codage des contenus, mais non la sémantique de ces derniers »8. Il s’agit là d’un constat important qui marquera l’apparition d’une première problématique : quel est le moyen d’enrichir les traitements Figure 1 : Les documents HTML* informatiques et d’exploiter le sens des contenus afin de délivrer des sont reliés entre eux par des liens hypertextes non typés. Les réponses précises et qualitatives à notre requête ? Dans un premier machines ne peuvent pas exploiter temps, la solution a été d’inclure l’utilisateur dans le processus : il le contenu car le contenu n’est pas structuré. Les données contenues s’agit du web social… dans les bases de données ne sont pas interrogeables. 7 Les « digital natives » sont des personnes issues de la génération Y (nées dans les années 1980 et 1990), qui ont grandi et vécu au milieu d’un monde numérique de plus en plus connecté, au contact du web. Selon la journaliste Cécil Dijoux7 du site OWNI, la génération Y est sur-éduquée, sur-informée et post-idéologique, ne croyant ainsi qu’en ce qui marche. 8 Citation tirée de la revue DOCUMENTALISTE SCIENCES DE L’INFORMATION, n°48/4, page 25. UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 6
  • 8. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 7 1.2 LE WEB SOCIAL Au milieu des années 2000, nous avons vu apparaître des nouveaux concepts de sites web, n’ayant plus pour seul objectif de diffuser des ressources, mais de connecter les internautes entre eux. Il s’agit du web 2.0, que certains appellent aussi « web participatif », « web social » ou encore « web communautaire ». L’interaction sociale est un des facteurs clés de cet espace virtuel. De nombreux outils et réseaux sociaux voient le jour tels que les blogs, les wikis*, les forums, Facebook, Twitter, Flickr, Youtube, Foursquare, etc. Désormais, les internautes ont la possibilité d’ajouter leurs connaissances aux contenus qu’ils consultent à travers leurs propres interprétations et annotations. Ils ne sont plus spectateurs mais contributeurs des ressources publiées sur le web. Ils peuvent s’exprimer, partager, converser, dialoguer, échanger, s’entre-aider, créer du contenu (UGC*) et interagir entre eux, sans avoir besoin des compétences d’un webmestre. Le web 2.0 n’est pas une révolution technique mais un changement des usages du web. Il reflète une mise en scène numérique ainsi qu’une mise en réseau de soi. L’utilisateur s’exprime à travers des profils et lui offre la Figure 2 : Les API (interfaces de possibilité de prendre la parole, « d’extérioriser et de programmation) permettent d’exploiter les théâtraliser sa propre identité »9. Selon Bruno Bachimont, le informations dans les bases de données contenant des informations structurées, à web 2.0 « considère que les utilisateurs font partie du travers des requêtes. Les « mashup » sont des processus documentaire et qu’on peut s’appuyer sur leurs sites Internet qui exploitent les données contenues dans différentes bases grâce aux connaissances et compétences pour enrichir les traitement API. Mais les données ne sont toujours pas informatiques des ressources. »10 Cet enrichissement des reliées entre elles : elles ne communiquent pas directement entre elles. contenus passe en partie par les annotations et commentaires laissés par ces utilisateurs toujours plus 11 nombreux . En effet, avec l’arrivée des blogs et des systèmes de gestion de contenu, ces derniers peuvent facilement créer du contenu, les commenter et leur ajouter des mots- clés, aussi appelés « tags ». Le web 2.0 est également marqué par l’émergence des supports mobiles, types Smartphones et tablettes numériques, qui traduisent du pouvoir et du désir de l’ubiquité du web. Autrement dit, la volonté d’être à différents endroits simultanément, ce que permet de réaliser plus ou moins efficacement l’usages de ces supports. D’après le rapport de l’UIT et les chiffres annoncés par le site « Public Data » de Google en 201112, 9 Sources : LA LETTRE EMERIT n°57, « Le web 2.0, un phénomène de société ». 10 Citation tirée de la revue DOCUMENTALISTE SCIENCES DE L’INFORMATION, n°48/4, page 25. 11 Selon un rapport de l’Union Internationale des Télécommunications (UIT) publié en Octobre 201211, nous sommes plus d’un tiers d’utilisateurs à être connectés à Internet dans le monde entier, c’est-à-dire environ 2,3 milliards d’individus, soit 11% de plus qu’en 2011. 600 millions de foyer sur les 1,8 milliards recensés ont accès à une connexion Internet. 12 « Public Data » fournit ses données à travers les informations recueillis par La Banque Mondiale. En 2011, il y avait ainsi 5,9599 milliards d’abonnements à la téléphonie mobile cellulaire. Sources : UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 7
  • 9. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 8 plus de 6 milliards d’abonnements mobiles sont souscrits dans le monde (certains utilisateurs possèdent plusieurs mobiles). Mobilité, réseautage et prise de parole font que les données publiées sur le web sont conséquentes et sont génératrices de longs débats, notamment sur la protection des données personnelles et de l’identité numérique, dont je ne traiterai pas dans ce dossier. Avec le web 2.0, l’utilisateur est de plus en plus lié à la machine et celle-ci se décline sous différents terminaux permettant un usage quasi-permanent et mobile. Mais au-delà de ce constat, qu’en est t-il de la recherche sémantique ? En effet, la relation homme / machine est en quelque sorte unilatérale car la machine n’est pas encore capable de comprendre le contenu publié sur le web et de l’exploiter. Nous pouvons alors nous questionner quant à la place de la machine dans le processus documentaire… 1.3 LE WEB SEMANTIQUE Comme vu précédemment, le web 2.0 permet facilement de créer, partager, commenter, échanger du contenu. Mais le constat d’un tel système est que l’internaute peut aussi facilement consulter des ressources qui ne répondent en rien à sa requête initiale ou être perdu dans une masse d’informations. Le web sémantique va justement permettre une optimisation des contenus publiés sur le web afin de faire coopérer l’homme et la machine plus efficacement. 1.3.1 Coopération homme / machine Le web sémantique permet aussi bien aux hommes qu’aux machines, ou agents logiciels, de comprendre le sens des données sur le web à travers des standards et normalisations et de l’exploiter pleinement afin d’apporter des réponses pertinentes à nos questions ou requêtes. Nous passons donc d’un contenu orienté vers les hommes à un contenu constitué de données exploitables par les agents logiciels. Le but étant de favoriser la coopération homme / machine. Le contenu n’est plus seulement pensé pour être manipulé par les internautes, mais par Figure 3 : Il s’agit d’un espace documentaire global où les machines (cf. Figure 3). Le web sémantique les données circulent indépendamment de leur base de consiste ainsi à enrichir les contenus par données. Les informations extraites sont des ressources et sont reliées entre elles par des liens typés : cela l’utilisation de descriptions de ressources, aussi permet de décrire les liens entre les ressources. appelées métadonnées. Il ne s’agit pas d’un web nouveau ou d’une nouveauté mais simplement d’une « extension de l’actuel »13. Il intègre en effet les fondamentaux du web dit classique. Le http://www.google.fr/publicdata/explore?ds=d5bncppjof8f9_&ctype=l&met_y=it_net_user_p2#!ctype=l&strail=false&bcs=d&n selm=h&met_y=it_cel_sets&scale_y=lin&ind_y=false&rdim=region&ifdim=region&tdim=true&hl=fr&dl=fr&ind=false 13 Sources : Thèse rédigée par Mouhamed Diouf, Spécification et mise en œuvre d’un formalisme de règles métier, Chapitre 5 « Le web sémantique », page 130 à 141. UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 8
  • 10. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 9 web sémantique est une expression présentée en 2001 par Tim Berners-Lee, membre du W3C*. Aussi appelé web de données ou encore web 3.0, il s’agit d’un projet mené depuis plus de dix ans et toujours en construction. Il offre la possibilité de nommer les ressources documentaires et vise à apporter du sens aux contenus afin de donner une plus grande importance à l’interprétation des ressources par les machines. Contrairement au web 2.0, qui place au centre de son processus les internautes et leur interprétation, le web sémantique cherche à mobiliser davantage la machine. L’objectif étant, selon Bruno Bachimont, de « représenter ces connaissances et interprétations et concevoir les outils pouvant les exploiter. »14 Tim Berners Lee, l’un des acteurs principaux du web de données, définit le web sémantique comme étant « un vaste espace d’échanges de ressources entre machines permettant l’exploitation de grands volumes d’informations et de services variés, aidant les utilisateurs en les libérant d’une bonne partie de leur travail de recherche, et de combinaison de ces ressources. »15 Cette nouvelle étape du web permet donc d’exploiter au maximum le contenu publié sur le web par un enrichissement sémantique normalisé et standardisé. Les limites perçues il y a quelques années sont ainsi repoussées : les utilisateurs sont en mesure d’accéder rapidement à l’information pertinente souhaitée. 1.3.2 Des triplets, des URI*, un graphe Le web sémantique repose essentiellement sur le modèle RDF, « Resource Description Framework » aussi appelé cadre de description des ressources. Il s’agit de la « première brique des standards du web sémantique qui recouvre plusieurs syntaxes pour publier des données à propos de tout sur le web »16. Le modèle utilisé par RDF est simple et repose sur la forme d’un triplet : sujet – prédicat – objet. Ainsi, « Sylvain (sujet) a rédigé (prédicat) cette synthèse (objet) » est un triplet RDF. Il est donc facile de comprendre le sens de la phrase et le lien unissant le sujet et l’objet. Par la suite, un triplet peut également être relié à un autre : « Cette synthèse (sujet) s’inscrit dans (prédicat) la formation du master Audiovisuel et Médias Numériques de l’ICM (objet) ». L’objet de la première insertion peut ensuite devenir le sujet d’un nouveau triplet et ainsi de suite : on devine ainsi que la synthèse est un devoir à réaliser dans le cadre des études de Sylvain, réalisées à l’ICM. La description d’une ressource comme celle-ci est un assemblage « d’attributs, de caractéristiques et de relations » avec d’autres ressources. Lorsque nous créons une ressource, nous élaborons une notice qui contient un certain nombre d’informations sur la ressource. RDF va alors séparer ces éléments de la notice pour en faire des insertions indépendantes. Nous obtenons ainsi une ressource qui est un 14 Citation tirée de la revue DOCUMENTALISTE SCIENCES DE L’INFORMATION, n°48/4, page 25. 15 Sources : Citation de Tim Berners Lee en 2001 dans Recherche d’informations. État des lieux et perspectives de Mohand Boughanem et Jacques Savoy, page 232. 16 Citation tirée du livre LE WEB SÉMANTIQUE : Comment lier les données et les schémas sur le web ? , page 28. UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 9
  • 11. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 10 document universitaire ; cette ressource a pour auteur Sylvain Gateau ; cette ressource s’inscrit dans la formation du master, etc. Pour cela, nous utilisons des URI* : des identifiants propres et uniques à chaque ressource. La notice devient alors un graphe constitué de nœuds organisés et d’arcs orientés reliant ces nœuds ainsi qu’un espace globale et granulaire de l’information grâce à la connexion de triplets RDF. La granularité de l’information est plus fine et chaque insertion possède du sens. Il est alors possible de sélectionner les informations à un niveau beaucoup plus fin qu’auparavant afin de répondre précisément à nos requêtes. 1.3.3 Quelques vocabulaires et attributs courants Afin d’enrichir sémantiquement les contenus web et donc ces triplets précédemment cités, une multitude de vocabulaires et attributs sont à disposition des professionnels. Ces métadonnées en tout genre permettent d’ajouter davantage de sens au contenu. Nous pouvons par exemple citer les microformats17. Il s’agit d’un ensemble de standards permettant de marquer des personnes, des recettes de cuisine, des événements,… et d’ajouter de la sémantique dans le code HTML*. À titre d’exemple, le standard hCard proposé par le générateur microformats permet d’enrichir le profil d’une personnes par l’utilisation d’un balisage sémantique adapté et sémantique (cf. Figure 4). Les micro-données quant à elles apportent du sens au contenu et permettent aux robots des moteurs de recherche d’exploiter le sens des ressources décrites. La bibliothèque de micro-données la plus connue et exhaustive à ce jour est Schema.org18. Créé en 2010 par Google, Bing et Yahoo, cette bibliothèque de micro-données est pourtant contestée du fait de son système fermé. Figure 4 : Voici mon profil enrichi sémantiquement RDFa19 est une syntaxe permettant d’ajouter des par l’ajout de classes sémantiques telles que l’attribut « given-name » pour le prénom, attributs et de décrire les ressources. Ce vocabulaire « addiotional-name » pour le surnom ou encore est conforme au « Resource Description « org » pour l’organisme où j’étudie. Framework » (RDF), précédemment présenté. 20 « Friend Of A Friend » est également un vocabulaire conforme au « Resource Description Framework » (RDF) permettant de créer des profils FOAF et ainsi de décrire les relations entre personnes ainsi que leurs activités. Il s’agit d’un vocabulaire très prometteur puisque l’établissement des relations sociales sur le web en est une 17 URL : http://microformats.org/ 18 URL : http://schema.org/ 19 URL d’un générateur de code RDFa : http://buzzword.org.uk/2011/rdfa-card/ 20 URL : http://www.foaf-project.org/ UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 10
  • 12. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 11 composante majeure, comme le démontre les différents réseaux sociaux types Facebook, Copains d’avant, ou encore les réseaux sociaux professionnels tels que LinkedIn ou Viadeo. Il existe d’autres vocabulaires et attributs permettant d’enrichir sémantiquement le contenu diffusé sur le web, à savoir les Creative Commons21 ou encore les Dublin Core22 permettant entre autre d’enrichir les œuvres, les droits d’auteurs, les publications, les thématiques,… Ainsi, le web sémantique est un travail de l’ombre et de longue haleine, visant à enrichir sémantiquement et intelligemment les contenus diffusés sur le web. Bien que le projet ait été lancé il y a plus de dix ans, nous n’en sommes qu’à ses balbutiements. Les réfractaires à cette extension du web actuel pensent qu’il serait impossible de mettre en place un tel mécanisme par le simple fait qu’il serait nécessaire de « ré-analyser et transformer tous les documents du web existant »23. Certes, le web sémantique n’est pas visible par l’utilisateur et ne peut donc pas être jugé à sa juste valeur. Mais il nourrit de grands espoirs et a su se doter d’une communauté prête à l’adopter… 21 URL : http://creativecommons.org/ 22 URL : http://dublincore.org/documents/dces/ 23 Sources : citation tirée du livre LE WEB SÉMANTIQUE : Comment lier les données et les schémas sur le web, page 190. UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 11
  • 13. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 12 2 Bienvenue dans le « Future friendly web » Le web met à disposition des utilisateurs d’innombrables ressources. Il est également plus fluide, plus mobile et accessible sur plus de terminaux qu’auparavant. Certains diront que « les interfaces s’envolent, et le contenu reste »24. Aujourd’hui, le web est caractérisé par l’ensemble des terminaux qui en sont interconnectés, comme nous pouvons le constater sur la Figure 5. Nous sommes passés d’un écran d’ordinateur unique à une multitude d’écrans, petits, grands, tactiles ou non, mobiles ou non. Et demain, nous aurons en notre possession de nouveaux écrans toujours plus mobiles et inattendus. Se pose alors la question de l’adaptabilité du contenu sur ces écrans… Le « future friendly web » est un courant américain consistant à nous projeter dans l’avenir afin d’imaginer et anticiper le web de demain et la valeur des contenus. Les adeptes de ce mouvement prône un web plus efficace, mieux conçu et à l’heure du temps. Et il semblerait bien que le web sémantique en soi intimement lié… 2.1 LE « RESPONSIVE DESIGN » Le « responsive design » est un principe de conception web consistant à adapter le contenu d’un site web aux différentes contraintes de résolution d’écrans. Le site est développé avec un seul et même code HTML* et est agrémenté de « Media Queries CSS » : il s’agit d’un code CSS* spécifiant les dimensions du contenu en fonction du terminal utilisé pour le consulter. Ainsi, le site comble tout l’espace de l’écran et est adapté pour une lisibilité et une utilisation optimale. Le « responsive design » est une solution Figure 5 : Représentation imagée de économique, stratégique et efficace : au lieu de développer l’évolution du web il y a 10 ans, aujourd’hui et demain. un site pour ordinateur, un autre site pour tablette tactile et un dernier pour Smartphone, il suffit d’une seule plateforme adaptable sur ces terminaux. Cela réduit ainsi les coups de développement, de maintenance et de mise à jour de ces différents supports. En fonction des terminaux utilisés, le contenu mis en avant ne sera pas forcément identique : il s’adaptera en fonction du contexte d’utilisation, de l’importance d’un 24 Sources : Présentation SlideShare réalisée par l’équipe projet de Novius OS, pages 34 à 40. URL : http://fr.slideshare.net/novius-os/create-once-publish-everywhere-anytime UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 12
  • 14. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 13 contenu en fonction du terminal utilisé, etc. Encore faut-il que cela ait été réalisé lors de la conception du site « responsive design » et que le contenu ait été hiérarchisé. Selon Antoine Lefeuvre (cf. Annexe 1, pages 26 à 29), le « responsive design » n’est que le commencement de ce courant appelé « future friendly web ». En 2012, cette pratique permet de répondre efficacement aux besoins d’adaptabilité sur différents supports. Comme je le signalais en introduction de cette synthèse, nous avons décidé, avec mes collègues de promotion, de concevoir le site de « Savoir-faire, faire savoir »25 en intégrant la notion d’adaptabilité afin de concevoir un contenu optimisé pour les écrans d’ordinateurs, de tablettes tactiles et de Smartphones. Mais cette technique suffira t-elle en 2015 lorsque nous consulterons le contenu web à travers nos lunettes de soleil, comme le prédit Google dans sa vidéo prospective « Google glass : One day… »26 ? 2.2 « FUTURE-READY CONTENT » Selon Brad Frost, « get your content ready to go anywhere because it’s going to go everywhere »27 (cf. Figure 6). Ce spécialiste en stratégie web mobile affirme que nous devons, dès à présent, préparer notre contenu à aller n’importe où car il sera amené à être diffusé partout. Il s’agit ici de la pensée fondatrice du courant « future-ready »28. Le contenu d’une entreprise vit en moyenne deux à trois ans. Le travail des professionnels du web, et notamment des chefs de projets, consistera donc à préparer le contenu et à le structurer afin qu’il soit mis en place et consultable sur différents canaux toujours plus mobiles et interconnectés. Nous ne pouvons prédire l’avenir car la société évoluera, les technologies se développeront, les normes changeront, etc. Mais nous pouvons dès à présent apprendre à gérer le contenu en cherchant à comprendre son sens, ses valeurs, ses objectifs, ses relations, et ses structures afin de le préparer au mieux aux futurs terminaux. Dans ce monde interconnecté de plus en plus complexe, nous devons nous concentrer sur ce qui importe le plus l’utilisateur : un Figure 6 : « Get your content ready to go anywhere because it’s going to go contenu ayant du sens. En effet, les internautes, mobinautes et everywhere », Brad Frost autres utilisateurs de terminaux connectés sont ennuyés, fatigués et parfois énervés du bruit d’informations : ils cherchent l’information pertinente dans une masse de contenu en tout genre. La recherche doit être simplifiée, naturelle et intuitive. Si les produits Apple se vendent à petits pains depuis plusieurs années, c’est que leurs produits répondent de manière simplifiée, naturelle et intuitive à nos besoins. 25 Site consultable sur : http://sffs.clic-et-clap.fr/ 26 Vidéo Youtube « Project Glass : One day... » réalisée par Google et diffusée en Avril 2012. URL : http://youtu.be/9c6W4CCU9M4 27 Sources : Article « Future-Ready Content » rédigé par Sara Wachter-Boettcher et publié sur le site Internet « A lista part ».. URL : http://www.alistapart.com/articles/future-ready-content/ 28 « Soyons prêt pour le futur » UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 13
  • 15. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 14 L’intégration de la technologie Siri sur les nouveaux iPhones et iPads en est l’exemple le plus récent : elle cherche à faciliter notre recherche et notre collaboration avec la machine. Pour cela, nous devons définir le contenu afin qu’il soit accessible sous différentes formes, qu’il soit interopérable, qu’il est du sens et qu’il soit consultable à la fois par les utilisateurs et les machines. 2.3 « COPE : CREATE ONCE, PUBLISH EVERYWHERE » « Create Once, Publish Everywhere » est une philosophie rattachée au courant « future friendly web » consistant à ne créer le contenu qu’une fois pour ensuite le publier partout. Mis en œuvre par Daniel Jacobsen, directeur de développement d’application chez National Public Radio (NPR), « COPE » consiste à construire des systèmes de gestion de contenu (CMS29) permettant l’utilisation d’un seul contenu pour une diffusion multicanale. Cela revient en réalité à séparer le contenu de la forme et d’en assurer sa modularité et sa portabilité sur les terminaux interconnectés au web. « COPE » est une critique ouverte à l’ensemble des systèmes de gestion de contenu qui ne font que publier des pages web : il faut désormais rassembler l’ensemble des informations afin de présenter le contenu sur n’importe quel terminal, avec n’importe quelle forme, à tout moment30. Bien que cette philosophie soit récente, les bénéfices ainsi que le retour sur investissement semblent fructueux puisqu’il s’agit d’un gain de temps à la fois pour les développeurs mais également pour les intégrateurs de contenus et les « community managers »* en charge de diffuser les informations et d’animer la communauté d’une entreprise par l’utilisation de ce contenu. L’agence web Novius, basée à Lyon et Paris, et dans laquelle je vais effectuer mon stage de fin d’études, à récemment lancé son propre CMS « COPE » nouvelle génération destiné à une diffusion multicanale par l’utilisation d’un seul et même contenu : Novius OS. Ce système d’exploitation « open source »31 exploite les données relatives à la communication d’une entreprise afin de les diffuser sur différents canaux (cf. Annexe 2, page 30). Ainsi, le web sémantique nourrit de nombreux espoirs pour bon nombre de professionnels. Des courants futuristes et intelligents se sont mis en place afin de mettre en avant les bienfaits du web sémantique et de nous préparer à utiliser un web sur des terminaux toujours plus volatiles... 29 Content Management System 30 Sources : Article « COPE: Create Once, Publish Everywhere » publié sur le site Internet « Programmable Web ». URL : http://blog.programmableweb.com/2009/10/13/cope-create-once-publish-everywhere/ 31 Libre accès au code source d’un logiciel par son auteur / éditeur. Cela sous-entend une utilisation gratuite du logiciel et la possibilité de contribuer à l’enrichissement de l’outil. UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 14
  • 16. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 15 3 Vers une redéfinition de l’écosystème numérique Nous l’avons vu précédemment, le web sémantique commence dès à présent à modifier la vision de la conception de supports web et du contenu destiné à y être diffusé. Des outils sont déjà mis en place et sont sur le point d’optimiser nos usages du web. En tant que futur chef de projets web, le web sémantique est une thématique qui m’intrigue car elle va affecter les métiers liés à notre secteur. Comme je l’ai précédemment présenté, le rapport homme / machine a considérablement évolué : l’utilisateur fait sa requête et la machine analyse le sens des contenu pour l’exploiter de manière pertinente. Pour avoir davantage de précisions sur les pratiques et les impacts du web sémantique dans le milieu professionnel, j’ai eu l’opportunité de contacter Antoine Lefeuvre, responsable R&D chez Novius (cf. Annexe1 pages 26 à 29). 3.1 REORGANISATION DU REFERENCEMENT NATUREL* 3.1.1 Le référencement par la sémantisation Bien que l’agence Novius intègre de plus en plus le web sémantique dans ses projets web, je reste sceptique quant à l’implication des professionnels de la communication sur cette thématique. En effet, les spécialistes du web 3.0 sont encore rares et les chefs de projets web ne peuvent pas maitrisés l’ensemble des corps de métiers qu’ils regroupent dans leur équipe. Les agences web, « digitales » ou numériques ainsi que les Société de Services en Ingénierie Informatique (SSII) semblent à l’heure d’aujourd’hui les principaux acteurs de cette mouvance vers la sémantisation des contenus32, du moins les seuls à en comprendre le fonctionnement et les enjeux. Cependant, la demande semble se faire ressentir. En effet, comme me l’a confié Antoine Lefeuvre, les moteurs de recherche comme Google exercent une pression sur certains secteurs d’activités tels que le transport ou la cuisine. Ils sont, pour la plupart, « capables de choisir et privilégier des attributs sémantiques et de se les approprier afin d’afficher des résultats de recettes directement dans leur page de résultat par exemple »33. À l’heure actuelle, les agences web et les professionnels du référencement vendent des prestations liées au web sémantique principalement pour des problématiques de référencement naturel*. Pour se faire, ils travaillent de plus en plus avec les vocabulaires et attributs d’enrichissement sémantique vus précédemment : microformats, microdonnées, RDFa, FOAF, etc. (cités dans la partie 1.3.3, pages 10 et 11). 32 Au cours de cette synthèse, j’ai contacté cinq agences de communication globale dans la région Rhône-Alpes : Régie COMTOO (Lyon), Brainstorming (Lyon), Omaha Beach (Brignais), INEDITS (Échirolles) et Colocarts (Grenoble). Aucune d’entre elles n’intègre de prestations liées au web sémantique et certaines n’en connaissent pas la signification. Il ne s’agit pas d’une analyse pertinente mais cela montre l’intérêt que portent les agences plus « générales » par-rapport à l’actualité du web. 33 Citation tirée de l’entretien téléphonique avec Antoine Lefeuvre, annexe n°1, pages 26 à 29. UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 15
  • 17. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 16 3.1.2 Les moteurs de recherche sémantique34 Dans le contexte actuel, le web est limité car les contenus sont en partie inaccessibles aux traitements informatiques des machines. Les moteurs de recherche utilisent la recherche plein texte : l’exploitation automatique des contenus est ainsi réduite. En parallèle, les utilisateurs souhaitent accéder à l’information le plus rapidement possible et obtenir des résultats pertinents. Cependant, nous sommes confrontés à une grande diversité de sources d’informations, ce qui nous incite à consulter plusieurs pages et ressources web et à en combiner nous- même les informations qui nous intéressent afin de répondre à nos requêtes. Désormais, certaines compagnies proposent des moteurs de recherche sémantique : « Knowledge Graph »35 (de Google), Wolfram Alpha (cf. Figure 7), etc. Grâce à ces moteurs sémantiques, l’utilisateur n’a plus accès à des listes de résultats mais à des combinaisons d’informations répondant de manière qualitative, immédiate et en partie exhaustive à sa requête. Cela est en parti possible grâce à l’accès des machines aux informations sémantiques des ressources : cela leur permet de raisonner et de comprendre le sens des contenus afin de les exploiter correctement. Ils sont ainsi capables de traduire nos requêtes en langages naturels et d’en combiner des informations précises, Figure 7 : Résultat de recherche dans le moteur granulaires et indépendantes les unes des autres (comme Wolfram Alpha pour la requête « Bode Miller » expliqué dans la partie 1.3.1, pages 8 et 9). 3.1.3 Les impacts sur la pratique du web Le web sémantique et l’avènement des moteurs de recherche sémantique sont sur le point d’impacter à la fois notre pratique du web, mais également l’économie « traditionnelle » bâtie jusqu’à ce jour. En effet, nous pouvons imaginer une certaine perdition en terme de diversité d’informations dans les résultats de recherche des moteurs sémantiques, du fait de l’agrégation automatique des ressources. Les contenus enrichis sémantiquement seront, de manière justifiée ou non, mis en valeur par-rapport aux ressources dépourvues de métadonnées. De plus, certains sites Internet vont probablement connaître une perte de trafic puisque leurs contenus seront directement consultables à travers les pages de résultats de ces moteurs de recherche sémantique (cf. Figure 8). 34 Partie inspirée de ma présentation SlideShare « Les moteurs de recehrche sémantique » réalisée en Novembre 2012 dans le cours « Enjeux sociaux et organisationnels de TIC » animé par Caroline Angé, pages 8 à 11. URL : http://fr.slideshare.net/Cerise_sur_le_Gateau/les-moteurs-de-recherche-smantique 35 URL : http://www.google.com/insidesearch/features/search/knowledge.html UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 16
  • 18. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 17 Cela est déjà le cas en ce qui concerne certains sites de cuisine pour lesquels les recettes sont directement accessibles en page d’accueil du moteur de recherche. Selon Antoine Lefeuvre, il s’agira davantage d’un report de trafic qu’une baisse de trafic car avec l’avènement des réseaux sociaux et notamment de Facebook, les sites Internet des éditeurs ont déjà connu un tel phénomène et ont su s’y adapter. Une chose est certaine : avec le lancement de « Knowledge Graph » par Google en Mai 2012, les utilisateurs vont être confrontés de plus en plus au web sémantique. Nos recherches vont être impactées Figure 8 : Résultat de recherche dans Google pour la par cette rénovation du web. Selon moi, il s’agit là requête « Bode Miller ». À droite des résultats de recherche se trouve un emplacement proposant des d’une forme de déterminisme technique36 : Google, combinaisons d’informations correspondant à la requête leader des moteurs de recherche en France avec initiale. environ 90% de parts de marché37 ainsi qu’aux Etats- Unis avec 66,4%38, va inéluctablement modifier le mécanisme de référencement naturel* réalisé par ses robots d’indexation jusqu’à ce jour. En effet, ces derniers devraient logiquement se concentrer sur les contenus enrichis sémantiquement et ainsi les mettre en valeur, au détriment de ceux dépourvus de métadonnées. En utilisant dès à présent le moteur de recherche Google, l’utilisateur est confronté aux premières esquisses de la recherche sémantique (cf. Figure 8). Selon Antoine Lefeuvre, « l’internaute n’a pas la notion de HTML*, de CSS*,... Ce qui lui importe, c’est uniquement d’accéder à l’information et de trouver des réponses à ses requêtes rapidement. Les sites web ne sont pas une fin en soi à ses yeux ». Il n’aura probablement aucun problème à s’adapter à la recherche sémantique car il s’est très bien adapté aux médias sociaux et notamment à Facebook, qui agrège les contenus comme le font déjà les moteurs de recherche sémantique. 3.2 LE CONTENU AU CŒUR DU PROCESSUS À l’heure où le multicanal est omniprésent dans notre société, le web sémantique prend une dimension stratégique incontournable. Le contenu des clients, des marques et des entreprises est amené à être diffusé sur de nombreux supports différents (mobile, tactile, grand écran, etc.). Il représente donc la valeur principale des marques et il doit être 36 Sources : L’INNOVATION TECHNIQUE : récents développements en sciences sociales. Vers une nouvelles théorie de l’innovation. Chapitre 3 « L’anthropologie de la technique. Penser ensemble le technique et le social ». Pages 75 à 90. 37 Information tirée du « Baromètre des moteurs de recherche » réalisé en Juillet 2012 par AT Internet. URL : http://www.atinternet.fr/documents/barometre-des-moteurs-de-recherche-juillet-2012/ 38 Information tirée du bulletin mensuel de mesure de parts de marché des moteurs de recherche, réalisé en Août 2012 par comScore. URL : http://www.comscore.com/Insights/Press_Releases/2012/9/comScore_Releases_August_2012_U.S._Search_Engine_Rankings UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 17
  • 19. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 18 réfléchie dès aujourd’hui afin d’être adapté sur tous ces supports. Selon l’étude Orange Exposure 2012/2013 réalisée par TNS Sofres pour Orange Advertising, « les mobinautes utilisent les écrans (mobile, tablette, TV et PC) de façon plus interchangeable qu’auparavant, cherchant l’écran le mieux adapté à leurs besoins du moment »39. Même les consoles de jeux et les télévisions connectées permettent d’accéder au web (un tiers du trafic web américain est généré à partir des consoles de jeux connectés). Le contenu est « tout ce qui véhicule de l’information porteuse de sens pour l’être humain »40. Dans de nombreux projets web, il est parfois délaissé au détriment du design et de l’interactivité de l’interface. Mais il s’agit de l’élément central du web sémantique. C’est à travers ce dernier qu’est véhiculé le sens des ressources. Écrire pour le web ne revient pas à écrire une dissertation. Il y a un certain nombre de fondamentaux à respecter. Un bon contenu web est avant tout un contenu adapté à l’activité de l’entreprise mais également à son contexte d’utilisation : l’utilisateur peut le consulter à travers une multitude de terminaux. Il convient donc d’adapter et de hiérarchiser ce contenu aux différents écrans. De plus, le contenu web doit être utile afin de ne pas faire perdre le temps aux utilisateurs. Pour cela, il est nécessaire de définir l’objectif d’un contenu, d’analyser en quoi il soutiendra l’objectif général du site, pour quelle(s) raison(s) l’utilisateur en aura besoin et ce qu’il sera supposé en faire. Chaque type de contenu doit ainsi être pensé avant d’entreprendre des décisions de conception. Identifier les types de contenus revient à déterminer les éléments de base constituants chaque contenu. Un contenu orienté utilisateur permettra de répondre à ses besoins et de satisfaire ses désirs. Cela requiert de connaître le cadre cognitif et mental de l’utilisateur avant de préparer le contenu. La compréhension de chaque type de contenu est un facteur stratégique car il permet de décider quant à la façon dont il sera agencé, en fonction des priorités et contraintes liées au contexte, aux dimensions de l’écran du terminal utilisé, à la mobilité de l’utilisateur, etc. Chercher la signification d’un contenu revient à évaluer sa contribution dans l’ensemble du contenu et à établir des relations entre les éléments qui le constituent. La stratégie de contenu demande donc la faculté à anticiper les préférences des utilisateurs et à faire des compromis afin de toujours adapter le contenu au contexte. Selon moi, porter une telle importance au contenu ne sera pas sans conséquence dans les interfaces d’utilisateurs futures. Le courant minimaliste étant déjà répandu et apprécié, je suis persuadé que les plateformes et interfaces vont être de plus en plus épurées afin de focaliser la concentration des utilisateurs sur la matière, le contenu. Je ne dis en aucun cas que le graphisme ou le web design* sont amenés à disparaître, mais ces pratiques vont 39 Étude consultée sur l’application iPad de TNS Sofres, catégorie « Technologie » et publiée le 4 décembre 2012. Également consultable à cette URL : http://www.tns-sofres.com/points-de-vue/71C211C357D44CB1A21D88B7EEA29197.aspx 40 Citation tirée du livre STRATÉGIE DE CONTENU WEB, rédigé par Erin Kissane. Introduction, page 1. UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 18
  • 20. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 19 probablement s’orienter vers de nouveaux courants. Les formes et les couleurs auront toujours leur importance dans la mise en valeur et la lecture du contenu. 3.3 L’APPARITION DE NOUVEAUX CORPS DE METIERS 3.3.1 Les architectes et stratèges de contenu De nouveaux métiers venus des États-Unis sont apparus avec l’émergence du web sémantique : les stratèges et les architectes de contenu. Ces professionnels, « payés à prix d’or en tant que consultant généralement », sont amenés à devenir de plus en plus présents et populaires dans le paysage numérique français. Leur travail consiste à penser, réfléchir et gérer le contenu des marques / éditeurs. Les stratèges et architectes de contenu se concentrent dans un premier temps sur la compréhension des besoins de contenu actuel, futur et potentiel de leur client. Ils recensent leur contenu afin de déceler les « content nuggets », aussi appelés les pépites de contenus : il s’agit de l’information pure qui fait sens auprès de l’utilisateur et de la machine et qui peut-être déclinée sur différents supports et formes41. Les CMS « COPE », tels que Novius OS (présenté dans la partie 2.3, page 14) fonctionnent de cette manière. Puis, ils créent des recommandations et des lignes directrices dans lesquelles ils exposent leurs conseils sur le contenu pertinent à mettre en valeur, le ton à adopter ainsi que les types de contenu granulaires les plus efficaces pour transmettre leur message à travers les différents terminaux. Ainsi, les architectes et stratèges de contenu pensent le contenu comme étant la matière principale d’un web aujourd’hui devenu polymorphe et le structurent afin de l’adapter aux différents canaux. Le contenu est classé et structuré selon un vocabulaire précis. On parle également de design de taxonomie. Il s’agit de classer et hiérarchiser un ensemble de termes définis par une communauté pour en faire un vocabulaire organisé : les termes sont hiérarchisés entre eux, permettant ainsi d’organiser le vocabulaire et de lui apporter du sens par l’ajout de liens entre les termes42. Aux Etats-Unis, The Understanding Group43 est, selon Antoine Lefeuvre, l’une des principales agences à proposer des prestations de structuration d’informations dignes de ce nom. En effet, cette entreprise propose des offres de « Content strategy »44 et d’ « Information architecture »45 très développées. La vision de cette agence, également adoptée par Novius, consiste à penser que chaque « espace d'information et de communication possède une architecture de l'information spécifique et nécessite une optimisation des structures d'information et de ces espaces ». 41 Sources : Présentation SlideShare réalisée par l’équipe projet de Novius OS, pages 34 à 40. URL : http://fr.slideshare.net/novius-os/create-once-publish-everywhere-anytime 42 Sources : Page Internet « Ontologie, thésaurus, taxonomie et Web sémantique ». URL : http://www.la- grange.net/2004/03/19.html#ontologies 43 URL de l’agence : www.understandinggroup.com 44 Stratégie de contenu 45 Architecture de l’information UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 19
  • 21. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 20 En France, une agence est particulièrement connue pour la structuration de contenu : Nealite. Elle est essentiellement composée de UX et UI designers… 3.3.2 Les UI et UX designers Les architectes et stratèges de l’information sont intimement liés à l’émergence des métiers UI et UX designers46. Il s’agit de professionnels spécialisés dans « l’user interface » et « l’user experience », autrement dit l’interface utilisateur et l’expérience utilisateur. Leur travail consiste à designer une solution par-rapport à un problème identifié en se concentrant sur l’expérience utilisateur. Pour cela, ils proposent aux consommateurs de vivre une expérience et une histoire à part à travers une interface pensée et réfléchie. Le but étant de maximiser l’expérience utilisateur. Certains établissements, tels que le CELSA ou l’École des Gobelins à Paris, proposent des formations pour se former à ces nouveaux métiers. Selon Manuel Diaz, président de l’agence Emakina, nous assistons aujourd’hui à une cohabitation de métiers « traditionnels » et émergents dans la mise en place de projets web. Le chef de projets web doit désormais composer avec des ergonomes, des sémiologues, des architectes, des stratèges, des développeurs, des webdesigners, des UX/UI designers,... Certains métiers sont sur le point de connaître une réelle croissance. La difficulté sera alors de trouver les meilleurs professionnels au bon moment afin de composer une équipe efficace et réunissant toutes les compétences requises pour l’accomplissement d’un projet web. L’écosystème numérique est bel et bien impacté par l’émergence du web sémantique. Les premières pratiques apparaissent, des outils intelligents se mettent en place et de nouveaux métiers intègrent le paysage polymorphe du web. Malgré le fait que Google va imposer petit à petit le web sémantique aux utilisateurs, nous pouvons dire que le web 3.0 est un dispositif socio-technique, qui selon moi va permettre une optimisation de nos pratiques sur le web. 46 Vidéo Youtube réalisée par Mushroom Conseil, cabinet de chasseurs de têtes, et diffusée sur la web TV Mushroom TV. Découverte des nouvelles tendances, des nouveaux métiers et des nouveaux acteurs du secteur de la communication. Épisode 1 : UX DESIGNER. URL : http://youtu.be/KKoayiQbUc0 UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 20
  • 22. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 21 Le début d’un long chantier… L’histoire du web rapportée à l’échelle humaine est quasi-inexistante. Pourtant, depuis son apparition dans la société, dans les années 1990, rares ont été les secteurs comme celui-ci à évoluer autant sur le court terme. Tout d’abord, le web 1.0 a ouvert une nouvelle manière de communiquer avec l’apparition des sites Internet, des campagnes d’e-mailing, des pages HTML*, etc. Puis le web social et mobile s’est imposé au cours des années 2000, offrant davantage d’interactivité, de contenu, de fonctionnalités et d’usages qu’auparavant. Aujourd’hui, le web sémantique vient compléter ce vaste épouvantail de possibilités qu’offre le web en complexifiant un peu plus les mécanismes et les techniques utilisées pour son bon fonctionnement. Le web sémantique n’en est qu’à ses balbutiements mais ses effets se font déjà ressentir sur l’écosystème numérique ainsi que sur les enjeux communicationnels. La relation homme / machine n’a jamais été aussi développée dans le web que maintenant, à tel point que ces agents logiciels peuvent désormais comprendre le sens des contenus et l’exploiter de manière réfléchie et pertinente. Nous sommes passés d’une relation unilatérale à bilatérale : le web sémantique permet l’optimisation de la coopération homme / machine. Les deux entités travaillent simultanément et de manière intelligente et efficace. La mouvance du « future friendly web » ajoute au web 3.0 un aspect futuriste, ergonomique et ubiquitaire. Le contenu est amené à naviguer partout et à être exploité à tout moment par les machines pour répondre à nos désirs et besoins de manière instantanée. Les CMS « COPE » sont une première réponse à ce constat et n’ont pas fini de se développer et de se complexifier avec l’apparition de terminaux plus petits, mobiles et inattendus. Les métiers de stratèges et architectes de contenu vont se répandre et intégrer progressivement le paysage numérique afin de préparer le contenu pour le futur. Les interfaces et expériences utilisateurs vont être amenés à considérablement évoluer jusqu’à en devenir presque volatiles. Le jour où nous porterons des lunettes de vue connectées est bientôt arrivé. Nous serons alors continuellement connectés à la réalité augmenté, au monde virtuel. Les informations viendront à nous naturellement, au bon moment et au bon endroit afin d’enrichir notre quotidien et faciliter tous nos faits et gestes, et parfois même en les anticipant. Parler d’intelligence artificielle dans une synthèse portant sur le web sémantique peut paraître exagérée mais nous sommes véritablement à l’aube d’une explosion de l’intelligence. Le web sémantique offre des interactions encore jamais rencontrées et permet petit à petit aux machines de s’immiscer dans notre environnement intime, cognitif et communicationnel… UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 21
  • 23. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 22 Lexique Community manager : Terme anglophone pour désigner un gestionnaire de communauté sur Internet à travers les médias sociaux. CSS: Abréviation pour « Cascading Style Sheets ». Il s’agit d’un langage Internet, utilisé en parallèle du langage HTML, permettant de mettre en forme les pages d’un site Internet. Il permet ainsi de paramétrer une couleur de fond, une typographie, et bien d’autres éléments. HTML : Abréviation pour « Hyper Text Markup Language ». Il s’agit d’un langage Internet qui permet de créer des pages et sites Internet. Ce langage est constitué de balises permettant ainsi de structurer les pages et d’organiser le contenu en ligne. Référencement naturel : Ensemble de pratiques qui consiste à rendre un site le plus visible possible sur les résultats de recherches Internet. Il s’agit d’associer des métadonnées aux pages du site Internet. De nombreux paramètres sont pris en compte pour favoriser le référencement, à savoir le nom des page HTML, les balises H1, le nom des images, le contenu textuel des pages, les liens hypertextes,... UGC : Abréviation pour « User Generated Content ». Il s’agit du contenu généré par les internautes sur les réseaux sociaux et autres plateformes de partage. URI : Abréviation de « Uniform Resource Identifier ». Identifiant propre et unique à chaque ressource caractérisé par une chaine de caractères. Les URI sont enregistrés auprès de l’organisme IANA (Internet Assigned Numbers Authority) afin de s’assurer qu‘il soit unique. W3C : Abréviation de « World Wide Web Consortium ». Institution en charge du développement et de la standardisation des langages et technologies du web au niveau international. Web design : Conception graphique des différentes pages d’un site Internet, réalisé par un web designer. Il est réalisé en phase de conception puis est intégré par les développeurs en phase de dévelppement. Wiki : Plateforme Internet pouvant être modifiée par les internautes. Les wikis reposent sur le principe de la collaboration : ils permettent aux utilisateurs d’apporter leurs connaissances sur des sujets et thématiques précises. Le wiki le plus connu est Wikipedia. Ces plateformes sont également développées au sein de certaines entreprises, ce qui permet aux salariés d’accéder et d’apporter des mises à jour sur le contenu. UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 22
  • 24. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 23 Bibliographie OUVRAGES • BOUGHANEM Mohand, SAVOY Jacques, AUSSENAC-GILLES Nathalie. Recherche d’informations, état des lieux et perspectives. Lavoisier, 2008, 342 pages. • FAYON David. Web 2.0 et au-delà . Nouveaux internautes : du surfeur à l’acteur. Édition ECONOMICA, 2010, 2ème édition, 190 pages. • GANDON Fabien, CORBY Olivier, FARON-ZUCKER Catherine. Le web sémantique : Comment lier les données et les schémas sur le web ? Éditions Dunod, 2012, 206 pages. • PÉDAUQUE Roger T. La redocumentarisation du monde. Édition Cépaduès, 2007, 212 pages. • PÉDAUQUE Roger T. Le Document à la lumière du numérique :forme, texte, médium : comprendre le rôle du document numérique dans l'émergence d'une nouvelle modernité. CF éditions, 2006, 218 pages. • FLICHY Patrice. L’innovation technique. Récents développements en sciences sociales. Vers une nouvelle théorie de l’innovation. Éditions La Découverte, 1995, 256 pages. MAGAZINES // REVUES • DOCUMENTALISTE, SCIENCES DE L’INFORMATION n°48/4. Dossier : Web sémantique, web de données… Quelle nouvelle donne ? Enjeux et technologies. Approches documentaires. ADBS, Décembre 2011, pages 20 à 61. • LA LETTRE ÉMERITE n°57. Le web 2.0, un phénomène de sociét é. FTU Centre de Recherche Travail Technologies, Premier 2009, 8 pages. THESE • DIOUF, Mouhamed. Spécification et mise en œuvre d’un formalisme de règles métier. Université Bordeaux 1. Soutenance présentée le 10 Décembre 2007. 244 pages. UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 23
  • 25. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 24 Sitographie SITES WEB • NOVIUS OS. CMS Open Source nouvelle génération [en ligne]. Disponible sur : http://www.novius-os.org/ • FUTURE FRIENDLY. Collectif américain défendant les valeurs du « Future friendly web » [en ligne]. Consultable sur : http://futurefriend.ly/ • BRAD FROST WEB. Site de Brad Frost, spécialite de la stratégie web mobile et fondateur du « future friendly web » [en ligne]. Consultable sur : http://bradfrostweb.com/ • THE UNDERSTANDING GROUP. Agence américaine spécialisée dans l’architecture de l’information et les prestations numériques [en ligne]. Consultable sur : http://understandinggroup.com/ • NEALITE. Agence française de design de services et d’expérience utilisateur [en ligne]. Consultable sur : http://www.nealite.fr/ • KNOWLEDGE GRAPH. Moteur de recherche sémantique de Google [en ligne]. Consultable sur : http://www.google.com/insidesearch/features/search/knowledge.html • WOLFRAM ALPHA. Moteur de recherche sémantique [en ligne]. Consultable sur : http://www.wolframalpha.com/ • SCHEMA.ORG. Bibliothèque de microdonnées établit par Google, Yahoo et Bing [en ligne]. Consultable sur : http://schema.org/ • MICROFORMATS. Site, blog et wiki sur les microformats [en ligne]. Consultable sur : http://microformats.org/ PAGES INTERNET • PROGRAMMABLE WEB. COPE : Create Once, Publish Everywhere [en ligne]. Octobre 2009. Disponible sur : http://blog.programmableweb.com/2009/10/13/cope-create-once-publish- everywhere/ • A LIST APART. Future-ready content [en ligne]. Février 2012. Disponible sur : http://www.alistapart.com/articles/future-ready-content/ . • FRED CAVAZZA. L’art de la taxonomie [en ligne]. Mai 2004. Disponible sur : http://www.fredcavazza.net/2004/05/21/lart-de-la-taxonomie/ • LA GRANGE. Ontologies, thésaurus, taxonomie et web sémantique [en ligne]. Disponible sur : http://www.la-grange.net/2004/03/19.html#ontologies • TNS SOFRES. Mobinautes et tablonautes accélèrent leur percée [en ligne]. Disponible sur : http://www.tns-sofres.com/points-de- vue/71C211C357D44CB1A21D88B7EEA29197.aspx UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 24
  • 26. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 25 PRESENTATION SLIDESHARE • CREATE ONCE, PUBLISH EVERYWHERE (version française). Présentation SlideShare réalisée par Novius OS [en ligne]. Octobre 2012. Disponible sur : http://fr.slideshare.net/novius-os/create-once-publish-everywhere-anytime • LES MOTEURS DE RECHERCHE SÉMANTIQUE : CONTEXTUALISATION, SÉMANTISATION ET RÉNOVATION. Présentation SlideShare réalisée par Sylvain Gateau [en ligne]. Novembre 2012. Disponible sur : http://fr.slideshare.net/Cerise_sur_le_Gateau/les-moteurs-de-recherche- smantique • FOR A FUTURE FRIENDLY WEB. Présentation SlideShare réalisée par Brad Frost [en ligne]. Disponible sur : http://fr.slideshare.net/bradfrostweb/for-a-futurefriendly-web VIDEOS YOUTUBE • PROJECT GLASS : ONE DAY… Vidéo prospective réalisée par Google [en ligne]. Avril 2012. Disponible sur : http://youtu.be/9c6W4CCU9M4 • MUSHROOM TV : UX DESIGNERS (épisode 1). Vidéo-reportage sur le métier d’UX Designer réalisée par le cabinet de chasseurs de têtes Mushroom [en ligne]. Disponible sur : http://youtu.be/KKoayiQbUc0 UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 25
  • 27. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 26 Annexe n°1 : Retranscription d’interview - Antoine Lefeuvre, responsable RD chez Novius Labs Entretien téléphonique réalisé le Vendredi 7 Décembre 2012 de 17h30 à 19h. Question 1 Quelle est la place du web sémantique (WS) dans l’agence Novius à l’heure actuelle ? Réponse d’Antoine Lefeuvre Chez Novius, il faut tout d’abord discerner l’activité « agence » de l’activité « laboratoire ». Dans l’un comme dans l’autre, le WS est intégré dans la vision de l’agence. Je vais parler dans un premier temps du WS au sein de l’activité « agence ». Aujourd’hui, nous pouvons voir apparaître la mention de WS dans certains cahiers des charges. Le WS sera intégré aux projets en fonction de la sensibilité des chefs de projets. Le WS est principalement traité pour ses caractéristiques de référencement. Chez Novius, nous n’avons pas de politique de référencement dans nos offres. Nous travaillons donc avec des référenceurs, sous forme de prestations. Nous avons déjà collaboré sur quelques projets tels que le site de Bjorg, la marque agroalimentaire. Nous avons élaboré une base de recette, enrichie par des microformats et notamment l’attribut « hrecepe ». Il faut savoir qu’aujourd’hui des moteurs de recherche comme Google sont capables de choisir et privilégier des attributs sémantiques et de se les approprier afin d’afficher des résultats de recettes directement dans leur page de résultat par exemple. D’où l’intérêt pour ce client d’intégrer des microformats. Question 2 Pratiquez-vous une politique de tarification spécifique pour ces prestations liées au WS ? Réponse d’Antoine Lefeuvre Nous n’appliquons pas de tarification spécifique. Les tarifs seront pris en compte dans la prestation d’optimisation de référencement, sans en être séparée. Cependant, il peut nous arriver d’ajouter une phase de référencement pendant ou après la conception du projet. Dans quel cas nous prévoyons un devis à part. Je suis convaincu que le WS sera de plus en plus présent dans les projets web, mais pas uniquement pour des problématiques de référencement. UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 26
  • 28. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 27 Question 3 Quelle est la place du contenu dans le WS ? Les produits conçus par Novius Labs sont- ils optimisés pour le WS ? Réponse d’Antoine Lefeuvre Nous avons la particularité d’avoir ce laboratoire dans lequel nous avons déjà conçu une suite d’outils que nous commercialisons auprès de nos clients. Depuis plus d’un an maintenant, je me suis penché sur le WS pour notre nouveau projet Novius OS, lancé au cours de l’année 2012. Novius OS est un CMS nouvelle génération permettant de gérer du contenu multicanal. Notre problématique de départ était la suivante : qu’est ce que gérer du contenu aujourd’hui, à l’heure du multicanal ? Pour répondre à cela, je me suis intéressé à l’apparition de nouveaux métiers aux États-Unis : les architectes de contenu et les stratèges de contenu. Ces professionnels pensent l’Internet comme étant de plus en plus polymorphe, notamment avec l’avènement des tablettes tactiles, des Smartphones et même des consoles de jeu qui représentent un pourcentage très élevé du trafic sur Internet aux États-Unis. La nouvelle génération sera les lunettes, comme nous l’a présenté Google avec son projet « Google Glass ». Tout cela nous indique que le contenu est actuellement présenté sous différentes formes et que cela va s’accroitre dans les années à venir. Le contenu est la valeur principale pour une entreprise et il doit être structuré. On parle de design de taxonomie : le contenu est classé selon du vocabulaire et il est ainsi structuré. Question 4 Quelle est la place du chef de projet dans cette mouvance ? Comment intégrer ces nouveaux métiers dans une équipe ou dans une agence « digitale » ? Réponse d’Antoine Lefeuvre Le chef de projet restera selon moi un chef d’orchestre des différents métiers de son équipe. Il devra composer avec ces nouveaux métiers. Cela sous entend être au courant de ce qu’il se passe. Mais il ne devra pas en être un spécialiste, car il ne peut pas maitriser toutes les compétences de son équipe, et cela n’est pas nouveau. Au moment venu, il devra être capable de s’entourer de professionnels (stratèges et architectes). S’il n’en trouve pas, il sera certainement amené à composer par lui-même, avec ses connaissances. Les métiers d’architecture de contenu et de stratège de contenu se font de plus en plus présents. Leur travail consiste à recenser le contenu dans les entreprises et à en donner une structure. Pour le moment, ce sont des professionnels qui interviennent à la journée et qui sont payés très chers. Le « responsive design » n’est que le commencement de cette mouvance. En 2012, cette pratique permet de répondre efficacement aux besoins d’adaptabilité sur différents supports. Mais il ne suffira plus en 2015. Les contenus d’une entreprise vivent deux à trois ans en moyenne. Le travail des stratèges est donc de les conseiller dès aujourd’hui afin de les UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 27
  • 29. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 28 préparer à structurer leur contenu. Il s’agit d’un courant nommé le « future-ready », autrement dit, accepter le fait que le contenu va changer et faire en sorte qu’il soit prêt à être mis en place sur plusieurs canaux de nature différente. En France, une agence est connue pour la structuration de contenu : Nealite. Mais une des plus connues est sans doute Under Standing Group aux USA. Il y a une émergence de ces nouveaux métiers et ces professionnels seront progressivement intégrés dans des agences digitales. Question 5 Quelle est la place / l’importance des moteurs de recherche dans ce contexte ? Réponse d’Antoine Lefeuvre Les moteurs de recherche vont exiger de plus en plus la sémantisation des contenus car le web sémantique représente, pour eux, une réelle aubaine : la sémantisation des contenus facilitent la structuration des données et donc le travail de ces objets. Les moteurs de recherche sont divisés entre 2 forces : • Les utilisateurs, qui demandent à accéder aux informations et qui n’ont pas de réel jugement sur la forme que cela doit prendre. • Les moteurs de recherche eux même, qui vont exiger de plus en plus une meilleure sémantisation des ressources chez les éditeurs s’ils veulent bénéficier d’un bon référencement. Grâce aux moteurs de recherche sémantique, les utilisateurs ont accès à l’information correspondant à leur requête sans même avoir à consulter plusieurs pages. Il s’agit d’un gain de temps et d’une optimisation de la collaboration entre l’homme et sa machine. Question 6 Nous pouvons donc imaginer que le trafic sur les sites Internet des éditeurs sera amené à diminuer considérablement ? On peut parler d’une redéfinition du système économique numérique ? Réponse d’Antoine Lefeuvre Oui, il y aura très certainement une baisse de trafic, mais est-ce une rupture ? Aujourd’hui, un site comme Facebook s’avère être un agrégateur de flux de données très performants. Les utilisateurs de ce réseau social, plus d’un milliard à ce jour, publient et consomment quotidiennement du contenu sans forcément se diriger sur les sites Internet des éditeurs. Cela est difficile à maitriser pour les éditeurs mais le phénomène n’est pas nouveau et il faudra composer de plus en plus avec cela. Il y aura un report du trafic et non une baisse : les médias sociaux n’ont pas fait disparaître les sites Internet. Ce qui est certain, c’est que nous assistons à un changement du modèle économique. Toute l’offre de référencement va être affectée dans un premier temps. UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 28
  • 30. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 29 Question 7 Google a récemment lancé « Knowledge Graph », un moteur de recherche sémantique. Le WS est-il imposé à l’utilisateur ou est-ce une réponse à ses besoins ? Comment voyez- vous l’évolution, à court terme, du WS ? Réponse d’Antoine Lefeuvre L’utilisateur n’a pas la notion de HTML*, de CSS*. Ce qu’il lui importe, c’est d’accéder à l’information et de trouver des réponses à ses requêtes. Les sites web ne sont pas une fin en soi à ses yeux. Il n’aura probablement aucun problème à s’adapter car il s’est très bien adapté aux médias sociaux et notamment à Facebook, qui agrège les contenus. La notion de web 3.0 a véritablement décollé en 2008 / 2009. Le web sémantique est désormais très présent, le mouvement est bien enclenché mais peu de gens l’utilisent. Je pense que dans les trois années à venir, le WS va considérablement s’envoler. Question 8 Il y a t-il des secteurs d’activité dans lesquels le WS aura une importance considérable ? Réponse d’Antoine Lefeuvre Il y a une réelle pression exercée par les moteurs de recherche sur certains domaines tels que les transports, la cuisine, la documentation (très en avance sur ce sujet avec notamment le projet DITA), ainsi que les réseaux de présentation d’expériences professionnelles (LinkedIn se base aujourd’hui sur le microformat « hresume »). Un secteur comme celui de la cuisine est aujourd’hui très normalisé, d’où l’apport de sémantisation dans le projet de Bjorg (précédemment cité). Dans le domaine des transports, il est nécessaire de fournir des flux de données aux moteurs de recherche (quel vol en partance de Paris pour New-York aujourd’hui ? Pour quel prix ? À quelle heure ?). L’utilisateur d’aujourd’hui ne va pas consulter les sites de chaque compagnie aérienne afin de trouver son billet. Il va plutôt privilégier les comparateurs de prix. Cela est d’autant plus important que le domaine du transport sera de plus en plus imposé par l’ouverture de ses données publiques (Open Data). Question 9 Une dernière question : qu’entendez-vous par le terme « digitale » ? Réponse d’Antoine Lefeuvre Il s’agit en réalité d’un effet de mode. C’est un anglicisme du terme « numérique ». Aujourd’hui, les agences l’utilisent, il faut donc « s’aligner » et utiliser ce terme. Il y a quelques temps, le terme « web agency » ou agence web a disparu car comme je le disais, le web est polymorphe et sous entend des formes différentes. Or, le terme « web » est souvent assimilé aux sites Internet, alors que les applications mobiles et tablettes ne cessent de croitre : c’est réducteur et peu représentatif des prestations proposées en agence. D’où l’utilisation du mot « digitale ». UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 29
  • 31. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 30 Annexe 2 : Interface d’administration du CMS COPE Novius OS Interface d’administration du CMS COPE développé par Novius. Sur cette interface, nous avons accès à un seul et même contenu concernant la venue d’un nouveau Gorille. Le contenu est entré selon différents champs (titre, images, lien hypertexte, Description,…). Il suffit alors de sélectionner l’affichage de contenu en fonction de la diffusion souhaitée (sur Twitter, Facebook, l’application mobile,…) et de publier le contenu. Ce dernier est alors adapté au terminal / réseau sélectionné. Il peut par la suite être publié sur divers canaux, en utilisant ce même contenu. Ce CMS reflète donc bien le courant « Create Once, Publish Everywhere ». UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 30
  • 32. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 31 Résumé Après le web 1.0 et le web 2.0, place au web sémantique. Jusque là encore unilatérale, la relation homme / machine prend une nouvelle dimension avec la sémantisation des contenus : les machines sont désormais capables de comprendre et d’exploiter le contenu. Pour notre plus grand bien ? Le web sémantique est en marche pour nous préparer au futur. Des courants de pensées, tels que le « Future friendly web », prônent un web propre, structuré, et véhiculant du contenu porteur de sens, prêt à s’adapter et à être diffusé n’importe où, n’importe quand. À la croisée des Sciences Sociales et Humaines et des Sciences de l’Information et de la Communication, le web sémantique est donc sur le point de redéfinir nos relations communicationnelles ainsi que l’organisation de l’écosystème numérique. Vers de nouveaux métiers ? De nouveaux acteurs ? De nouvelles pratiques ? Une chose est sûre, c’est qu’à partir d’aujourd’hui, la machine entre un peu plus dans notre sphère intime, relationnelle et communicationnelle. Un pas de plus vers l’intelligence artificielle ? Mots-clés Web sémantique Graphe de triplets Sémantisation des contenus « Responsive design » « Future friendly web » « Future-ready content » « COPE » Stratège de contenu Architecte de contenu UI / UX design UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 31