Après le web 1.0 et le web 2.0, place au web sémantique. Jusque là encore unilatérale, la relation homme / machine prend une nouvelle dimension avec la sémantisation des contenus : les machines sont désormais capables de comprendre et d’exploiter le contenu. Pour notre plus grand bien ?
Le web sémantique est en marche pour nous préparer au futur. Des courants de pensées, tels que le « Future friendly web », prônent un web propre, structuré, et véhiculant du contenu porteur de sens, prêt à s’adapter et à être diffusé n’importe où, n’importe quand. À la croisée des Sciences Sociales et Humaines et des Sciences de l’Information et de la Communication, le web sémantique est donc sur le point de redéfinir nos relations communicationnelles ainsi que l’organisation de l’écosystème numérique.
Vers de nouveaux métiers ? De nouveaux acteurs ? De nouvelles pratiques ? Une chose est sûre, c’est qu’à partir d’aujourd’hui, la machine entre un peu plus dans notre sphère intime, relationnelle et communicationnelle. Un pas de plus vers l’intelligence artificielle ?
1. Sylvain Gateau
Le web sémantique pour mieux anticiper le futur…
Préparons dès à présent le contenu web pour les futurs terminaux…
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication
Master 2 AVMN – 2012-2013 - Mémoire sur les pratiques professionnelles
2. GATEAU Sylvain – Le web sémantique : un pas vers le « future friendly web » - page 1
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013
3. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 2
Remerciements
À l’issue de ce travail de synthèse, je tiens à remercier très sincèrement :
// Philippe Quinton, enseignant à l’Université Stendhal de Grenoble, pour son suivi et ses
remises en questions tout au long de ma réflexion.
// Valérie Lépine, enseignante à l’Université Stendhal de Grenoble, pour m’avoir aidée
quant à l’élaboration de ma problématique.
// Viviane Clavier, enseignante à l’Université Stendhal de Grenoble, pour sa disponibilité
et son expertise sur la thématique du web sémantique.
// Julien Pierre, enseignant-chercheur à l’Université Stendhal de Grenoble, pour son cours
d’enseignement sur le web sémantique.
// Et enfin, Antoine Lefeuvre, responsable R&D chez Novius, pour sa disponibilité et son
précieux témoignage.
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 2
4. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 3
Sommaire
Sur les traces du web sémantique… ................................................................................... 4
1
Un web renovateur........................................................................................................ 6
1.1
Le web de documents ............................................................................................ 6
1.2
Le web social ......................................................................................................... 7
1.3
Le web sémantique ................................................................................................ 8
1.3.1
Coopération homme / machine ...................................................................... 8
1.3.2
Des triplets, des URI*, un graphe .................................................................. 9
1.3.3
Quelques vocabulaires et attributs courants ................................................. 10
2
Bienvenue dans le « Future friendly web » ................................................................ 12
2.1
Le « responsive design » ..................................................................................... 12
2.2
« Future-ready content »...................................................................................... 13
2.3
« COPE : Create Once, Publish Everywhere » ................................................... 14
3
Vers une redéfinition de l’écosystème numérique ..................................................... 15
3.1
Réorganisation du référencement naturel* .......................................................... 15
3.1.1
Le référencement par la sémantisation ......................................................... 15
3.1.2
Les moteurs de recherche sémantique .......................................................... 16
3.1.3
Les impacts sur la pratique du web .............................................................. 16
3.2
Le contenu au cœur du processus ........................................................................ 17
3.3
L’apparition de nouveaux corps de métiers ........................................................ 19
3.3.1
Les architectes et stratèges de contenu ......................................................... 19
3.3.2
Les UI et UX designers ................................................................................ 20
Le début d’un long chantier… .......................................................................................... 21
Lexique ............................................................................................................................. 22
Bibliographie .................................................................................................................... 23
Sitographie ........................................................................................................................ 24
Annexe n°1 : Retranscription d’interview - Antoine Lefeuvre, responsable R&D chez
Novius Labs ...................................................................................................................... 26
Annexe 2 : Interface d’administration du CMS COPE Novius OS .................................. 30
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 3
5. GATEAU Sylvain – Le web sémantique : un pas vers le « future friendly web » - page 4
Sur les traces du web sémantique…
Lorsque j’ai débuté mes études supérieures, je souhaitais couvrir les événements sportifs
à la télévision, partir à la rencontre des grands champions et travailler pour la télévision.
Un rêve d’enfant, qui ne restera qu’un joli rêve. Puis, je me suis orienté vers la
Communication, un univers vaste, tendance et agréablement prisé par la gente féminine,
pour travailler dans l’organisation d’événements sportifs. Et cinq plus tard, je m’apprête à
entrer dans la vie active en tant que chef de projets web. Véritablement rien ne me
prédisait à me spécialiser vers ce métier, et encore moins dans le domaine du web…
Plutôt habitué au grand air et aux espaces blancs, me voilà à l’aube d’une nouvelle
expérience vécue à travers des écrans, petits, grands, tactiles ou non et interconnectés
entre eux grâce au web et à l’Internet. Il y a encore trois années de cela, j’apprenais à
développer ma première page HTML* sur Dreamweaver, avec beaucoup de texte, peu de
CSS* et encore moins d’interactions. Cette année, avec mes collègues de promotion,
nous avons pensé, conçu et géré le bon développement du site Internet « Savoir-faire,
faire savoir »1 sur le principe du « responsive design »2. Et tout cela en utilisant un seul et
même contenu, adapté aux écrans des différents terminaux.
Le contenu est véritablement un paramètre stratégique et incontournable dans les projets
web d’aujourd’hui et de demain. Lorsque nous allons sur le web via un navigateur ou que
nous utilisons une application mobile, nous cherchons des informations textuelles,
1
Site consultable sur l’URL suivante : http://www.sffs.clic-et-clap.fr
2
Le « responsive design » consiste à adapter le contenu d’un site web aux différentes contraintes de résolution d’écrans
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 4
6. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 5
visuelles, multimédias pertinentes et nous souhaitons les obtenir en l’espace de quelques
clics ou touchers. Les internautes sont de plus en plus exigeants et ont accès aux contenus
à travers différents écrans devenus, pour certains, mobiles. À l’heure où l’« Open Data »3
se déploie, nous, internautes, sommes submergés par une masse d’informations, qui ne
cesse de croitre d’année en année sur le web. Le contenu est la réponse à nos besoins, à
nos recherches, à notre utilisation du web selon moi. Un chef de projets web ne doit donc
pas le négliger : il doit être réfléchi, travaillé et mis en valeur.
Aujourd’hui, le web connaît une rénovation comme le diraient certains professionnels et
universitaires. Après le web 1.0 et le web 2.0, nous voici entrés dans l’ère du web
sémantique. Alors que Google est incontestablement le moteur de recherche le plus
utilisé dans le monde, une actualité m’a particulièrement passionnée en cette année
2012 : le lancement de « Knowledge Graph »4, un moteur de recherche sémantique (« Le
Graphe du Savoir »). Pourquoi Google, acteur majeur du web et habitué à être en position
de leader, présente « seulement en 2012 » un tel projet alors que d’autres s’y sont déjà
employés depuis 2008 comme Wolfram Alpha5 ? Quels enjeux se cachent derrière le web
sémantique ? Quels impacts sont à prévoir sur l’écosystème numérique et quelles peuvent
en être les opportunités pour les agences web et les professionnels du secteur ? À la
croisée des sciences humaines et sociales ainsi que des sciences de l’information et de la
communication, le web sémantique, aussi appelé web de données, « linked data »6 ou
encore web 3.0, est sur le point de modifier considérablement le paysage numérique ainsi
que les enjeux communicationnels.
Mon regard de futur professionnel du web s’attarde sur l’émergence du web sémantique
et me motive à raisonner autour de la problématique suivante :
« Le web sémantique comme dispositif socio-technique : vers une redéfinition des
enjeux communicationnels et de l’organisation de l’écosystème numérique ? »
Au cours de cette synthèse, je ne vais pas décrire le fonctionnement détaillé du web
sémantique, qui serait bien trop compliqué à expliquer et qui résulterait d’un
raisonnement d’informaticien et/ou de documentaliste. Je vais dans un premier temps
revenir sur les étapes marquantes qu’a vécu le web afin de présenter le contexte
d’émergence du web sémantique. Je m’intéresserai par la suite aux courants et pensées
dans lesquels s’inscrit l’émergence de ce web 3.0. Je terminerai ce travail de synthèse par
une observation des enjeux communicationnels et des possibles changements à venir
dans l’écosystème numérique avec l’arrivée du web sémantique.
3
Ouverture et libre accès des données publiques. URL de la plateforme française d’ouverture des données publiques :
http://www.data.gouv.fr/
4
URL : http://www.google.com/insidesearch/features/search/knowledge.html
5
Moteur de recherche sémantique. URL : http://www.wolframalpha.com/
6
Données liées
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 5
7. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 6
1 Un web renovateur
Le web est certes récent, mais il possède déjà sa propre histoire. Que nous soyons
« digital natives » 7 ou non, utilisateurs réguliers de ressources documentaires en ligne ou
non, nous avons tous côtoyé et suivi directement ou indirectement l’évolution du web :
par le biais de notre travail, de nos études, de notre entourage, de notre éducation ou tout
simplement par nos propres utilisations personnelles. Le web est ancrée dans la société et
est en continuelle mouvance. L’époque où l’utilisateur ne faisait qu’interroger la machine
est bien lointaine, mais elle n’a pas totalement disparu pour certains utilisateurs...
En l’espace de quelques années, le web est passé d’un simple support de consultation à
« un gigantesque livre » dans lequel les internautes peuvent commenter, échanger,
produire, partager, converser... Après avoir ajouté une couche sociale et interactive, les
acteurs du web tels que W3C*, Google ou autre Facebook, promeuvent aujourd’hui
l’enrichissement sémantique des contenus : le web devient petit à petit « une gigantesque
base de données ». Pour comprendre ce qu’est le web sémantique, il est important
d’observer les différentes étapes qui ont conduit à ce vaste projet de sémantisation des
contenus.
1.1 LE WEB DE DOCUMENTS
Le web 1.0 , aussi connu sous l’appellation « web de documents », fait référence au
milieu des années 1990 lorsque les premiers navigateurs Internet sont apparus (Nescape,
Microsoft Explorer, etc.). À cette époque, le web 1.0 permet de diffuser des ressources
non structurées telles que des pages HTML*. Celles-ci sont reliées
entre elles par l’utilisation de liens hypertextes, l’unique facteur
d’interactivité homme / machine (cf. Figure 1). Un utilisateur peut
donc consulter une page et se diriger vers une autre en cliquant sur
un lien. Selon Bruno Bachimont, « le web 1.0 fait ses traitements à
l’aveugle, en ne prenant en compte que le format de codage des
contenus, mais non la sémantique de ces derniers »8. Il s’agit là d’un
constat important qui marquera l’apparition d’une première
problématique : quel est le moyen d’enrichir les traitements
Figure 1 : Les documents HTML*
informatiques et d’exploiter le sens des contenus afin de délivrer des
sont reliés entre eux par des liens
hypertextes non typés. Les réponses précises et qualitatives à notre requête ? Dans un premier
machines ne peuvent pas exploiter temps, la solution a été d’inclure l’utilisateur dans le processus : il
le contenu car le contenu n’est pas
structuré. Les données contenues s’agit du web social…
dans les bases de données ne sont
pas interrogeables.
7
Les « digital natives » sont des personnes issues de la génération Y (nées dans les années 1980 et 1990), qui ont grandi et vécu
au milieu d’un monde numérique de plus en plus connecté, au contact du web. Selon la journaliste Cécil Dijoux7 du site OWNI,
la génération Y est sur-éduquée, sur-informée et post-idéologique, ne croyant ainsi qu’en ce qui marche.
8
Citation tirée de la revue DOCUMENTALISTE SCIENCES DE L’INFORMATION, n°48/4, page 25.
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 6
8. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 7
1.2 LE WEB SOCIAL
Au milieu des années 2000, nous avons vu apparaître des nouveaux concepts de sites
web, n’ayant plus pour seul objectif de diffuser des ressources, mais de connecter les
internautes entre eux. Il s’agit du web 2.0, que certains appellent aussi « web
participatif », « web social » ou encore « web communautaire ». L’interaction sociale est
un des facteurs clés de cet espace virtuel. De nombreux outils et réseaux sociaux voient le
jour tels que les blogs, les wikis*, les forums, Facebook, Twitter, Flickr, Youtube,
Foursquare, etc. Désormais, les internautes ont la possibilité d’ajouter leurs
connaissances aux contenus qu’ils consultent à travers leurs
propres interprétations et annotations. Ils ne sont plus
spectateurs mais contributeurs des ressources publiées sur le
web. Ils peuvent s’exprimer, partager, converser, dialoguer,
échanger, s’entre-aider, créer du contenu (UGC*) et
interagir entre eux, sans avoir besoin des compétences d’un
webmestre. Le web 2.0 n’est pas une révolution technique
mais un changement des usages du web. Il reflète une mise
en scène numérique ainsi qu’une mise en réseau de soi.
L’utilisateur s’exprime à travers des profils et lui offre la
Figure 2 : Les API (interfaces de possibilité de prendre la parole, « d’extérioriser et de
programmation) permettent d’exploiter les théâtraliser sa propre identité »9. Selon Bruno Bachimont, le
informations dans les bases de données
contenant des informations structurées, à web 2.0 « considère que les utilisateurs font partie du
travers des requêtes. Les « mashup » sont des processus documentaire et qu’on peut s’appuyer sur leurs
sites Internet qui exploitent les données
contenues dans différentes bases grâce aux connaissances et compétences pour enrichir les traitement
API. Mais les données ne sont toujours pas informatiques des ressources. »10 Cet enrichissement des
reliées entre elles : elles ne communiquent
pas directement entre elles. contenus passe en partie par les annotations et
commentaires laissés par ces utilisateurs toujours plus
11
nombreux . En effet, avec l’arrivée des blogs et des systèmes de gestion de contenu, ces
derniers peuvent facilement créer du contenu, les commenter et leur ajouter des mots-
clés, aussi appelés « tags ».
Le web 2.0 est également marqué par l’émergence des supports mobiles, types
Smartphones et tablettes numériques, qui traduisent du pouvoir et du désir de l’ubiquité
du web. Autrement dit, la volonté d’être à différents endroits simultanément, ce que
permet de réaliser plus ou moins efficacement l’usages de ces supports. D’après le
rapport de l’UIT et les chiffres annoncés par le site « Public Data » de Google en 201112,
9
Sources : LA LETTRE EMERIT n°57, « Le web 2.0, un phénomène de société ».
10
Citation tirée de la revue DOCUMENTALISTE SCIENCES DE L’INFORMATION, n°48/4, page 25.
11
Selon un rapport de l’Union Internationale des Télécommunications (UIT) publié en Octobre 201211, nous sommes plus d’un
tiers d’utilisateurs à être connectés à Internet dans le monde entier, c’est-à-dire environ 2,3 milliards d’individus, soit 11% de
plus qu’en 2011. 600 millions de foyer sur les 1,8 milliards recensés ont accès à une connexion Internet.
12
« Public Data » fournit ses données à travers les informations recueillis par La Banque Mondiale. En 2011, il y avait ainsi
5,9599 milliards d’abonnements à la téléphonie mobile cellulaire. Sources :
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 7
9. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 8
plus de 6 milliards d’abonnements mobiles sont souscrits dans le monde (certains
utilisateurs possèdent plusieurs mobiles).
Mobilité, réseautage et prise de parole font que les données publiées sur le web sont
conséquentes et sont génératrices de longs débats, notamment sur la protection des
données personnelles et de l’identité numérique, dont je ne traiterai pas dans ce dossier.
Avec le web 2.0, l’utilisateur est de plus en plus lié à la machine et celle-ci se décline
sous différents terminaux permettant un usage quasi-permanent et mobile. Mais au-delà
de ce constat, qu’en est t-il de la recherche sémantique ? En effet, la relation homme /
machine est en quelque sorte unilatérale car la machine n’est pas encore capable de
comprendre le contenu publié sur le web et de l’exploiter. Nous pouvons alors nous
questionner quant à la place de la machine dans le processus documentaire…
1.3 LE WEB SEMANTIQUE
Comme vu précédemment, le web 2.0 permet facilement de créer, partager, commenter,
échanger du contenu. Mais le constat d’un tel système est que l’internaute peut aussi
facilement consulter des ressources qui ne répondent en rien à sa requête initiale ou être
perdu dans une masse d’informations. Le web sémantique va justement permettre une
optimisation des contenus publiés sur le web afin de faire coopérer l’homme et la
machine plus efficacement.
1.3.1 Coopération homme / machine
Le web sémantique permet aussi bien aux hommes qu’aux machines, ou agents logiciels,
de comprendre le sens des données sur le web à travers des standards et normalisations et
de l’exploiter pleinement afin d’apporter des réponses pertinentes à nos questions ou
requêtes. Nous passons donc d’un contenu orienté
vers les hommes à un contenu constitué de
données exploitables par les agents logiciels. Le
but étant de favoriser la coopération homme /
machine. Le contenu n’est plus seulement pensé
pour être manipulé par les internautes, mais par
Figure 3 : Il s’agit d’un espace documentaire global où les machines (cf. Figure 3). Le web sémantique
les données circulent indépendamment de leur base de
consiste ainsi à enrichir les contenus par
données. Les informations extraites sont des ressources
et sont reliées entre elles par des liens typés : cela l’utilisation de descriptions de ressources, aussi
permet de décrire les liens entre les ressources. appelées métadonnées.
Il ne s’agit pas d’un web nouveau ou d’une nouveauté mais simplement d’une
« extension de l’actuel »13. Il intègre en effet les fondamentaux du web dit classique. Le
http://www.google.fr/publicdata/explore?ds=d5bncppjof8f9_&ctype=l&met_y=it_net_user_p2#!ctype=l&strail=false&bcs=d&n
selm=h&met_y=it_cel_sets&scale_y=lin&ind_y=false&rdim=region&ifdim=region&tdim=true&hl=fr&dl=fr&ind=false
13
Sources : Thèse rédigée par Mouhamed Diouf, Spécification et mise en œuvre d’un formalisme de règles métier, Chapitre 5
« Le web sémantique », page 130 à 141.
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 8
10. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 9
web sémantique est une expression présentée en 2001 par Tim Berners-Lee, membre du
W3C*. Aussi appelé web de données ou encore web 3.0, il s’agit d’un projet mené depuis
plus de dix ans et toujours en construction. Il offre la possibilité de nommer les
ressources documentaires et vise à apporter du sens aux contenus afin de donner une plus
grande importance à l’interprétation des ressources par les machines. Contrairement au
web 2.0, qui place au centre de son processus les internautes et leur interprétation, le web
sémantique cherche à mobiliser davantage la machine. L’objectif étant, selon Bruno
Bachimont, de « représenter ces connaissances et interprétations et concevoir les outils
pouvant les exploiter. »14
Tim Berners Lee, l’un des acteurs principaux du web de données, définit le web
sémantique comme étant « un vaste espace d’échanges de ressources entre machines
permettant l’exploitation de grands volumes d’informations et de services variés, aidant
les utilisateurs en les libérant d’une bonne partie de leur travail de recherche, et de
combinaison de ces ressources. »15
Cette nouvelle étape du web permet donc d’exploiter au maximum le contenu publié sur
le web par un enrichissement sémantique normalisé et standardisé. Les limites perçues il
y a quelques années sont ainsi repoussées : les utilisateurs sont en mesure d’accéder
rapidement à l’information pertinente souhaitée.
1.3.2 Des triplets, des URI*, un graphe
Le web sémantique repose essentiellement sur le modèle RDF, « Resource Description
Framework » aussi appelé cadre de description des ressources. Il s’agit de la « première
brique des standards du web sémantique qui recouvre plusieurs syntaxes pour publier des
données à propos de tout sur le web »16. Le modèle utilisé par RDF est simple et repose
sur la forme d’un triplet : sujet – prédicat – objet. Ainsi, « Sylvain (sujet) a rédigé
(prédicat) cette synthèse (objet) » est un triplet RDF. Il est donc facile de comprendre le
sens de la phrase et le lien unissant le sujet et l’objet. Par la suite, un triplet peut
également être relié à un autre : « Cette synthèse (sujet) s’inscrit dans (prédicat) la
formation du master Audiovisuel et Médias Numériques de l’ICM (objet) ». L’objet de la
première insertion peut ensuite devenir le sujet d’un nouveau triplet et ainsi de suite : on
devine ainsi que la synthèse est un devoir à réaliser dans le cadre des études de Sylvain,
réalisées à l’ICM. La description d’une ressource comme celle-ci est un assemblage
« d’attributs, de caractéristiques et de relations » avec d’autres ressources. Lorsque nous
créons une ressource, nous élaborons une notice qui contient un certain nombre
d’informations sur la ressource. RDF va alors séparer ces éléments de la notice pour en
faire des insertions indépendantes. Nous obtenons ainsi une ressource qui est un
14
Citation tirée de la revue DOCUMENTALISTE SCIENCES DE L’INFORMATION, n°48/4, page 25.
15
Sources : Citation de Tim Berners Lee en 2001 dans Recherche d’informations. État des lieux et perspectives de Mohand
Boughanem et Jacques Savoy, page 232.
16
Citation tirée du livre LE WEB SÉMANTIQUE : Comment lier les données et les schémas sur le web ? , page 28.
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 9
11. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 10
document universitaire ; cette ressource a pour auteur Sylvain Gateau ; cette ressource
s’inscrit dans la formation du master, etc. Pour cela, nous utilisons des URI* : des
identifiants propres et uniques à chaque ressource. La notice devient alors un graphe
constitué de nœuds organisés et d’arcs orientés reliant ces nœuds ainsi qu’un espace
globale et granulaire de l’information grâce à la connexion de triplets RDF. La
granularité de l’information est plus fine et chaque insertion possède du sens. Il est alors
possible de sélectionner les informations à un niveau beaucoup plus fin qu’auparavant
afin de répondre précisément à nos requêtes.
1.3.3 Quelques vocabulaires et attributs courants
Afin d’enrichir sémantiquement les contenus web et donc ces triplets précédemment
cités, une multitude de vocabulaires et attributs sont à disposition des professionnels. Ces
métadonnées en tout genre permettent d’ajouter davantage de sens au contenu. Nous
pouvons par exemple citer les microformats17. Il s’agit d’un ensemble de standards
permettant de marquer des personnes, des recettes de cuisine, des événements,… et
d’ajouter de la sémantique dans le code HTML*. À titre d’exemple, le standard hCard
proposé par le générateur microformats permet
d’enrichir le profil d’une personnes par l’utilisation
d’un balisage sémantique adapté et sémantique (cf.
Figure 4).
Les micro-données quant à elles apportent du sens
au contenu et permettent aux robots des moteurs de
recherche d’exploiter le sens des ressources décrites.
La bibliothèque de micro-données la plus connue et
exhaustive à ce jour est Schema.org18. Créé en 2010
par Google, Bing et Yahoo, cette bibliothèque de
micro-données est pourtant contestée du fait de son
système fermé.
Figure 4 : Voici mon profil enrichi sémantiquement
RDFa19 est une syntaxe permettant d’ajouter des
par l’ajout de classes sémantiques telles que
l’attribut « given-name » pour le prénom, attributs et de décrire les ressources. Ce vocabulaire
« addiotional-name » pour le surnom ou encore
est conforme au « Resource Description
« org » pour l’organisme où j’étudie.
Framework » (RDF), précédemment présenté.
20
« Friend Of A Friend » est également un vocabulaire conforme au « Resource
Description Framework » (RDF) permettant de créer des profils FOAF et ainsi de décrire
les relations entre personnes ainsi que leurs activités. Il s’agit d’un vocabulaire très
prometteur puisque l’établissement des relations sociales sur le web en est une
17
URL : http://microformats.org/
18
URL : http://schema.org/
19
URL d’un générateur de code RDFa : http://buzzword.org.uk/2011/rdfa-card/
20
URL : http://www.foaf-project.org/
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 10
12. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 11
composante majeure, comme le démontre les différents réseaux sociaux types Facebook,
Copains d’avant, ou encore les réseaux sociaux professionnels tels que LinkedIn ou
Viadeo.
Il existe d’autres vocabulaires et attributs permettant d’enrichir sémantiquement le
contenu diffusé sur le web, à savoir les Creative Commons21 ou encore les Dublin Core22
permettant entre autre d’enrichir les œuvres, les droits d’auteurs, les publications, les
thématiques,…
Ainsi, le web sémantique est un travail de l’ombre et de longue haleine, visant à enrichir
sémantiquement et intelligemment les contenus diffusés sur le web. Bien que le projet ait
été lancé il y a plus de dix ans, nous n’en sommes qu’à ses balbutiements. Les
réfractaires à cette extension du web actuel pensent qu’il serait impossible de mettre en
place un tel mécanisme par le simple fait qu’il serait nécessaire de « ré-analyser et
transformer tous les documents du web existant »23. Certes, le web sémantique n’est pas
visible par l’utilisateur et ne peut donc pas être jugé à sa juste valeur. Mais il nourrit de
grands espoirs et a su se doter d’une communauté prête à l’adopter…
21
URL : http://creativecommons.org/
22
URL : http://dublincore.org/documents/dces/
23
Sources : citation tirée du livre LE WEB SÉMANTIQUE : Comment lier les données et les schémas sur le web, page 190.
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 11
13. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 12
2 Bienvenue dans le « Future friendly web »
Le web met à disposition des utilisateurs d’innombrables ressources. Il est également
plus fluide, plus mobile et accessible sur plus de terminaux qu’auparavant. Certains
diront que « les interfaces s’envolent, et le contenu reste »24. Aujourd’hui, le web est
caractérisé par l’ensemble des terminaux qui en sont interconnectés, comme nous
pouvons le constater sur la Figure 5. Nous sommes passés
d’un écran d’ordinateur unique à une multitude d’écrans,
petits, grands, tactiles ou non, mobiles ou non. Et demain,
nous aurons en notre possession de nouveaux écrans
toujours plus mobiles et inattendus. Se pose alors la
question de l’adaptabilité du contenu sur ces écrans…
Le « future friendly web » est un courant américain
consistant à nous projeter dans l’avenir afin d’imaginer et
anticiper le web de demain et la valeur des contenus. Les
adeptes de ce mouvement prône un web plus efficace,
mieux conçu et à l’heure du temps. Et il semblerait bien que
le web sémantique en soi intimement lié…
2.1 LE « RESPONSIVE DESIGN »
Le « responsive design » est un principe de conception web
consistant à adapter le contenu d’un site web aux différentes
contraintes de résolution d’écrans. Le site est développé
avec un seul et même code HTML* et est agrémenté de
« Media Queries CSS » : il s’agit d’un code CSS* spécifiant
les dimensions du contenu en fonction du terminal utilisé
pour le consulter. Ainsi, le site comble tout l’espace de
l’écran et est adapté pour une lisibilité et une utilisation
optimale. Le « responsive design » est une solution
Figure 5 : Représentation imagée de économique, stratégique et efficace : au lieu de développer
l’évolution du web il y a 10 ans,
aujourd’hui et demain. un site pour ordinateur, un autre site pour tablette tactile et
un dernier pour Smartphone, il suffit d’une seule plateforme
adaptable sur ces terminaux. Cela réduit ainsi les coups de développement, de
maintenance et de mise à jour de ces différents supports.
En fonction des terminaux utilisés, le contenu mis en avant ne sera pas forcément
identique : il s’adaptera en fonction du contexte d’utilisation, de l’importance d’un
24
Sources : Présentation SlideShare réalisée par l’équipe projet de Novius OS, pages 34 à 40. URL :
http://fr.slideshare.net/novius-os/create-once-publish-everywhere-anytime
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 12
14. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 13
contenu en fonction du terminal utilisé, etc. Encore faut-il que cela ait été réalisé lors de
la conception du site « responsive design » et que le contenu ait été hiérarchisé.
Selon Antoine Lefeuvre (cf. Annexe 1, pages 26 à 29), le « responsive design » n’est que
le commencement de ce courant appelé « future friendly web ». En 2012, cette pratique
permet de répondre efficacement aux besoins d’adaptabilité sur différents supports.
Comme je le signalais en introduction de cette synthèse, nous avons décidé, avec mes
collègues de promotion, de concevoir le site de « Savoir-faire, faire savoir »25 en
intégrant la notion d’adaptabilité afin de concevoir un contenu optimisé pour les écrans
d’ordinateurs, de tablettes tactiles et de Smartphones. Mais cette technique suffira t-elle
en 2015 lorsque nous consulterons le contenu web à travers nos lunettes de soleil, comme
le prédit Google dans sa vidéo prospective « Google glass : One day… »26 ?
2.2 « FUTURE-READY CONTENT »
Selon Brad Frost, « get your content ready to go anywhere because it’s going to go
everywhere »27 (cf. Figure 6). Ce spécialiste en stratégie web mobile affirme que nous
devons, dès à présent, préparer notre contenu à aller n’importe où car il sera amené à être
diffusé partout. Il s’agit ici de la pensée fondatrice du courant « future-ready »28.
Le contenu d’une entreprise vit en moyenne deux à trois ans. Le travail des
professionnels du web, et notamment des chefs de projets, consistera donc à préparer le
contenu et à le structurer afin qu’il soit mis en place et consultable sur différents canaux
toujours plus mobiles et interconnectés.
Nous ne pouvons prédire l’avenir car la société évoluera, les
technologies se développeront, les normes changeront, etc. Mais
nous pouvons dès à présent apprendre à gérer le contenu en
cherchant à comprendre son sens, ses valeurs, ses objectifs, ses
relations, et ses structures afin de le préparer au mieux aux futurs
terminaux.
Dans ce monde interconnecté de plus en plus complexe, nous
devons nous concentrer sur ce qui importe le plus l’utilisateur : un
Figure 6 : « Get your content ready to go
anywhere because it’s going to go
contenu ayant du sens. En effet, les internautes, mobinautes et
everywhere », Brad Frost autres utilisateurs de terminaux connectés sont ennuyés, fatigués
et parfois énervés du bruit d’informations : ils cherchent l’information pertinente dans
une masse de contenu en tout genre. La recherche doit être simplifiée, naturelle et
intuitive. Si les produits Apple se vendent à petits pains depuis plusieurs années, c’est
que leurs produits répondent de manière simplifiée, naturelle et intuitive à nos besoins.
25
Site consultable sur : http://sffs.clic-et-clap.fr/
26
Vidéo Youtube « Project Glass : One day... » réalisée par Google et diffusée en Avril 2012. URL :
http://youtu.be/9c6W4CCU9M4
27
Sources : Article « Future-Ready Content » rédigé par Sara Wachter-Boettcher et publié sur le site Internet « A lista part »..
URL : http://www.alistapart.com/articles/future-ready-content/
28
« Soyons prêt pour le futur »
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 13
15. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 14
L’intégration de la technologie Siri sur les nouveaux iPhones et iPads en est l’exemple le
plus récent : elle cherche à faciliter notre recherche et notre collaboration avec la
machine. Pour cela, nous devons définir le contenu afin qu’il soit accessible sous
différentes formes, qu’il soit interopérable, qu’il est du sens et qu’il soit consultable à la
fois par les utilisateurs et les machines.
2.3 « COPE : CREATE ONCE, PUBLISH EVERYWHERE »
« Create Once, Publish Everywhere » est une philosophie rattachée au courant « future
friendly web » consistant à ne créer le contenu qu’une fois pour ensuite le publier partout.
Mis en œuvre par Daniel Jacobsen, directeur de développement d’application chez
National Public Radio (NPR), « COPE » consiste à construire des systèmes de gestion de
contenu (CMS29) permettant l’utilisation d’un seul contenu pour une diffusion
multicanale. Cela revient en réalité à séparer le contenu de la forme et d’en assurer sa
modularité et sa portabilité sur les terminaux interconnectés au web. « COPE » est une
critique ouverte à l’ensemble des systèmes de gestion de contenu qui ne font que publier
des pages web : il faut désormais rassembler l’ensemble des informations afin de
présenter le contenu sur n’importe quel terminal, avec n’importe quelle forme, à tout
moment30.
Bien que cette philosophie soit récente, les bénéfices ainsi que le retour sur
investissement semblent fructueux puisqu’il s’agit d’un gain de temps à la fois pour les
développeurs mais également pour les intégrateurs de contenus et les « community
managers »* en charge de diffuser les informations et d’animer la communauté d’une
entreprise par l’utilisation de ce contenu.
L’agence web Novius, basée à Lyon et Paris, et dans laquelle je vais effectuer mon stage
de fin d’études, à récemment lancé son propre CMS « COPE » nouvelle génération
destiné à une diffusion multicanale par l’utilisation d’un seul et même contenu : Novius
OS. Ce système d’exploitation « open source »31 exploite les données relatives à la
communication d’une entreprise afin de les diffuser sur différents canaux (cf. Annexe 2,
page 30).
Ainsi, le web sémantique nourrit de nombreux espoirs pour bon nombre de
professionnels. Des courants futuristes et intelligents se sont mis en place afin de mettre
en avant les bienfaits du web sémantique et de nous préparer à utiliser un web sur des
terminaux toujours plus volatiles...
29
Content Management System
30
Sources : Article « COPE: Create Once, Publish Everywhere » publié sur le site Internet « Programmable Web ». URL :
http://blog.programmableweb.com/2009/10/13/cope-create-once-publish-everywhere/
31
Libre accès au code source d’un logiciel par son auteur / éditeur. Cela sous-entend une utilisation gratuite du logiciel et la
possibilité de contribuer à l’enrichissement de l’outil.
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 14
16. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 15
3 Vers une redéfinition de l’écosystème numérique
Nous l’avons vu précédemment, le web sémantique commence dès à présent à modifier
la vision de la conception de supports web et du contenu destiné à y être diffusé. Des
outils sont déjà mis en place et sont sur le point d’optimiser nos usages du web. En tant
que futur chef de projets web, le web sémantique est une thématique qui m’intrigue car
elle va affecter les métiers liés à notre secteur. Comme je l’ai précédemment présenté, le
rapport homme / machine a considérablement évolué : l’utilisateur fait sa requête et la
machine analyse le sens des contenu pour l’exploiter de manière pertinente. Pour avoir
davantage de précisions sur les pratiques et les impacts du web sémantique dans le milieu
professionnel, j’ai eu l’opportunité de contacter Antoine Lefeuvre, responsable R&D
chez Novius (cf. Annexe1 pages 26 à 29).
3.1 REORGANISATION DU REFERENCEMENT NATUREL*
3.1.1 Le référencement par la sémantisation
Bien que l’agence Novius intègre de plus en plus le web sémantique dans ses projets
web, je reste sceptique quant à l’implication des professionnels de la communication sur
cette thématique. En effet, les spécialistes du web 3.0 sont encore rares et les chefs de
projets web ne peuvent pas maitrisés l’ensemble des corps de métiers qu’ils regroupent
dans leur équipe. Les agences web, « digitales » ou numériques ainsi que les Société de
Services en Ingénierie Informatique (SSII) semblent à l’heure d’aujourd’hui les
principaux acteurs de cette mouvance vers la sémantisation des contenus32, du moins les
seuls à en comprendre le fonctionnement et les enjeux.
Cependant, la demande semble se faire ressentir. En effet, comme me l’a confié Antoine
Lefeuvre, les moteurs de recherche comme Google exercent une pression sur certains
secteurs d’activités tels que le transport ou la cuisine. Ils sont, pour la plupart, « capables
de choisir et privilégier des attributs sémantiques et de se les approprier afin d’afficher
des résultats de recettes directement dans leur page de résultat par exemple »33.
À l’heure actuelle, les agences web et les professionnels du référencement vendent des
prestations liées au web sémantique principalement pour des problématiques de
référencement naturel*. Pour se faire, ils travaillent de plus en plus avec les vocabulaires
et attributs d’enrichissement sémantique vus précédemment : microformats,
microdonnées, RDFa, FOAF, etc. (cités dans la partie 1.3.3, pages 10 et 11).
32
Au cours de cette synthèse, j’ai contacté cinq agences de communication globale dans la région Rhône-Alpes : Régie
COMTOO (Lyon), Brainstorming (Lyon), Omaha Beach (Brignais), INEDITS (Échirolles) et Colocarts (Grenoble). Aucune
d’entre elles n’intègre de prestations liées au web sémantique et certaines n’en connaissent pas la signification. Il ne s’agit pas
d’une analyse pertinente mais cela montre l’intérêt que portent les agences plus « générales » par-rapport à l’actualité du web.
33
Citation tirée de l’entretien téléphonique avec Antoine Lefeuvre, annexe n°1, pages 26 à 29.
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 15
17. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 16
3.1.2 Les moteurs de recherche sémantique34
Dans le contexte actuel, le web est limité car les contenus sont en partie inaccessibles aux
traitements informatiques des machines. Les moteurs de recherche utilisent la recherche
plein texte : l’exploitation automatique des contenus est ainsi réduite. En parallèle, les
utilisateurs souhaitent accéder à l’information le plus rapidement possible et obtenir des
résultats pertinents. Cependant, nous sommes confrontés à une grande diversité de
sources d’informations, ce qui nous incite à consulter
plusieurs pages et ressources web et à en combiner nous-
même les informations qui nous intéressent afin de répondre
à nos requêtes.
Désormais, certaines compagnies proposent des moteurs de
recherche sémantique : « Knowledge Graph »35 (de
Google), Wolfram Alpha (cf. Figure 7), etc. Grâce à ces
moteurs sémantiques, l’utilisateur n’a plus accès à des listes
de résultats mais à des combinaisons d’informations
répondant de manière qualitative, immédiate et en partie
exhaustive à sa requête. Cela est en parti possible grâce à
l’accès des machines aux informations sémantiques des
ressources : cela leur permet de raisonner et de comprendre
le sens des contenus afin de les exploiter correctement. Ils
sont ainsi capables de traduire nos requêtes en langages
naturels et d’en combiner des informations précises,
Figure 7 : Résultat de recherche dans le moteur granulaires et indépendantes les unes des autres (comme
Wolfram Alpha pour la requête « Bode Miller »
expliqué dans la partie 1.3.1, pages 8 et 9).
3.1.3 Les impacts sur la pratique du web
Le web sémantique et l’avènement des moteurs de recherche sémantique sont sur le point
d’impacter à la fois notre pratique du web, mais également l’économie « traditionnelle »
bâtie jusqu’à ce jour. En effet, nous pouvons imaginer une certaine perdition en terme de
diversité d’informations dans les résultats de recherche des moteurs sémantiques, du fait
de l’agrégation automatique des ressources. Les contenus enrichis sémantiquement
seront, de manière justifiée ou non, mis en valeur par-rapport aux ressources dépourvues
de métadonnées. De plus, certains sites Internet vont probablement connaître une perte de
trafic puisque leurs contenus seront directement consultables à travers les pages de
résultats de ces moteurs de recherche sémantique (cf. Figure 8).
34
Partie inspirée de ma présentation SlideShare « Les moteurs de recehrche sémantique » réalisée en Novembre 2012 dans le
cours « Enjeux sociaux et organisationnels de TIC » animé par Caroline Angé, pages 8 à 11. URL :
http://fr.slideshare.net/Cerise_sur_le_Gateau/les-moteurs-de-recherche-smantique
35
URL : http://www.google.com/insidesearch/features/search/knowledge.html
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 16
18. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 17
Cela est déjà le cas en ce qui concerne certains sites
de cuisine pour lesquels les recettes sont directement
accessibles en page d’accueil du moteur de recherche.
Selon Antoine Lefeuvre, il s’agira davantage d’un
report de trafic qu’une baisse de trafic car avec
l’avènement des réseaux sociaux et notamment de
Facebook, les sites Internet des éditeurs ont déjà
connu un tel phénomène et ont su s’y adapter.
Une chose est certaine : avec le lancement de
« Knowledge Graph » par Google en Mai 2012, les
utilisateurs vont être confrontés de plus en plus au
web sémantique. Nos recherches vont être impactées
Figure 8 : Résultat de recherche dans Google pour la
par cette rénovation du web. Selon moi, il s’agit là
requête « Bode Miller ». À droite des résultats de
recherche se trouve un emplacement proposant des d’une forme de déterminisme technique36 : Google,
combinaisons d’informations correspondant à la requête leader des moteurs de recherche en France avec
initiale.
environ 90% de parts de marché37 ainsi qu’aux Etats-
Unis avec 66,4%38, va inéluctablement modifier le mécanisme de référencement naturel*
réalisé par ses robots d’indexation jusqu’à ce jour. En effet, ces derniers devraient
logiquement se concentrer sur les contenus enrichis sémantiquement et ainsi les mettre en
valeur, au détriment de ceux dépourvus de métadonnées. En utilisant dès à présent le
moteur de recherche Google, l’utilisateur est confronté aux premières esquisses de la
recherche sémantique (cf. Figure 8). Selon Antoine Lefeuvre, « l’internaute n’a pas la
notion de HTML*, de CSS*,... Ce qui lui importe, c’est uniquement d’accéder à
l’information et de trouver des réponses à ses requêtes rapidement. Les sites web ne sont
pas une fin en soi à ses yeux ». Il n’aura probablement aucun problème à s’adapter à la
recherche sémantique car il s’est très bien adapté aux médias sociaux et notamment à
Facebook, qui agrège les contenus comme le font déjà les moteurs de recherche
sémantique.
3.2 LE CONTENU AU CŒUR DU PROCESSUS
À l’heure où le multicanal est omniprésent dans notre société, le web sémantique prend
une dimension stratégique incontournable. Le contenu des clients, des marques et des
entreprises est amené à être diffusé sur de nombreux supports différents (mobile, tactile,
grand écran, etc.). Il représente donc la valeur principale des marques et il doit être
36
Sources : L’INNOVATION TECHNIQUE : récents développements en sciences sociales. Vers une nouvelles théorie de
l’innovation. Chapitre 3 « L’anthropologie de la technique. Penser ensemble le technique et le social ». Pages 75 à 90.
37
Information tirée du « Baromètre des moteurs de recherche » réalisé en Juillet 2012 par AT Internet. URL :
http://www.atinternet.fr/documents/barometre-des-moteurs-de-recherche-juillet-2012/
38
Information tirée du bulletin mensuel de mesure de parts de marché des moteurs de recherche, réalisé en Août 2012 par
comScore. URL :
http://www.comscore.com/Insights/Press_Releases/2012/9/comScore_Releases_August_2012_U.S._Search_Engine_Rankings
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 17
19. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 18
réfléchie dès aujourd’hui afin d’être adapté sur tous ces supports. Selon l’étude Orange
Exposure 2012/2013 réalisée par TNS Sofres pour Orange Advertising, « les mobinautes
utilisent les écrans (mobile, tablette, TV et PC) de façon plus interchangeable
qu’auparavant, cherchant l’écran le mieux adapté à leurs besoins du moment »39. Même
les consoles de jeux et les télévisions connectées permettent d’accéder au web (un tiers
du trafic web américain est généré à partir des consoles de jeux connectés).
Le contenu est « tout ce qui véhicule de l’information porteuse de sens pour l’être
humain »40. Dans de nombreux projets web, il est parfois délaissé au détriment du design
et de l’interactivité de l’interface. Mais il s’agit de l’élément central du web sémantique.
C’est à travers ce dernier qu’est véhiculé le sens des ressources. Écrire pour le web ne
revient pas à écrire une dissertation. Il y a un certain nombre de fondamentaux à
respecter. Un bon contenu web est avant tout un contenu adapté à l’activité de
l’entreprise mais également à son contexte d’utilisation : l’utilisateur peut le consulter à
travers une multitude de terminaux. Il convient donc d’adapter et de hiérarchiser ce
contenu aux différents écrans. De plus, le contenu web doit être utile afin de ne pas faire
perdre le temps aux utilisateurs. Pour cela, il est nécessaire de définir l’objectif d’un
contenu, d’analyser en quoi il soutiendra l’objectif général du site, pour quelle(s)
raison(s) l’utilisateur en aura besoin et ce qu’il sera supposé en faire. Chaque type de
contenu doit ainsi être pensé avant d’entreprendre des décisions de conception. Identifier
les types de contenus revient à déterminer les éléments de base constituants chaque
contenu. Un contenu orienté utilisateur permettra de répondre à ses besoins et de
satisfaire ses désirs. Cela requiert de connaître le cadre cognitif et mental de l’utilisateur
avant de préparer le contenu. La compréhension de chaque type de contenu est un facteur
stratégique car il permet de décider quant à la façon dont il sera agencé, en fonction des
priorités et contraintes liées au contexte, aux dimensions de l’écran du terminal utilisé, à
la mobilité de l’utilisateur, etc. Chercher la signification d’un contenu revient à évaluer sa
contribution dans l’ensemble du contenu et à établir des relations entre les éléments qui le
constituent.
La stratégie de contenu demande donc la faculté à anticiper les préférences des
utilisateurs et à faire des compromis afin de toujours adapter le contenu au contexte.
Selon moi, porter une telle importance au contenu ne sera pas sans conséquence dans les
interfaces d’utilisateurs futures. Le courant minimaliste étant déjà répandu et apprécié, je
suis persuadé que les plateformes et interfaces vont être de plus en plus épurées afin de
focaliser la concentration des utilisateurs sur la matière, le contenu. Je ne dis en aucun cas
que le graphisme ou le web design* sont amenés à disparaître, mais ces pratiques vont
39
Étude consultée sur l’application iPad de TNS Sofres, catégorie « Technologie » et publiée le 4 décembre 2012. Également
consultable à cette URL : http://www.tns-sofres.com/points-de-vue/71C211C357D44CB1A21D88B7EEA29197.aspx
40
Citation tirée du livre STRATÉGIE DE CONTENU WEB, rédigé par Erin Kissane. Introduction, page 1.
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 18
20. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 19
probablement s’orienter vers de nouveaux courants. Les formes et les couleurs auront
toujours leur importance dans la mise en valeur et la lecture du contenu.
3.3 L’APPARITION DE NOUVEAUX CORPS DE METIERS
3.3.1 Les architectes et stratèges de contenu
De nouveaux métiers venus des États-Unis sont apparus avec l’émergence du web
sémantique : les stratèges et les architectes de contenu. Ces professionnels, « payés à prix
d’or en tant que consultant généralement », sont amenés à devenir de plus en plus
présents et populaires dans le paysage numérique français. Leur travail consiste à penser,
réfléchir et gérer le contenu des marques / éditeurs. Les stratèges et architectes de
contenu se concentrent dans un premier temps sur la compréhension des besoins de
contenu actuel, futur et potentiel de leur client. Ils recensent leur contenu afin de déceler
les « content nuggets », aussi appelés les pépites de contenus : il s’agit de l’information
pure qui fait sens auprès de l’utilisateur et de la machine et qui peut-être déclinée sur
différents supports et formes41. Les CMS « COPE », tels que Novius OS (présenté dans
la partie 2.3, page 14) fonctionnent de cette manière. Puis, ils créent des
recommandations et des lignes directrices dans lesquelles ils exposent leurs conseils sur
le contenu pertinent à mettre en valeur, le ton à adopter ainsi que les types de contenu
granulaires les plus efficaces pour transmettre leur message à travers les différents
terminaux. Ainsi, les architectes et stratèges de contenu pensent le contenu comme étant
la matière principale d’un web aujourd’hui devenu polymorphe et le structurent afin de
l’adapter aux différents canaux. Le contenu est classé et structuré selon un vocabulaire
précis. On parle également de design de taxonomie. Il s’agit de classer et hiérarchiser un
ensemble de termes définis par une communauté pour en faire un vocabulaire organisé :
les termes sont hiérarchisés entre eux, permettant ainsi d’organiser le vocabulaire et de
lui apporter du sens par l’ajout de liens entre les termes42.
Aux Etats-Unis, The Understanding Group43 est, selon Antoine Lefeuvre, l’une des
principales agences à proposer des prestations de structuration d’informations dignes de
ce nom. En effet, cette entreprise propose des offres de « Content strategy »44 et
d’ « Information architecture »45 très développées. La vision de cette agence, également
adoptée par Novius, consiste à penser que chaque « espace d'information et de
communication possède une architecture de l'information spécifique et nécessite une
optimisation des structures d'information et de ces espaces ».
41
Sources : Présentation SlideShare réalisée par l’équipe projet de Novius OS, pages 34 à 40. URL :
http://fr.slideshare.net/novius-os/create-once-publish-everywhere-anytime
42
Sources : Page Internet « Ontologie, thésaurus, taxonomie et Web sémantique ». URL : http://www.la-
grange.net/2004/03/19.html#ontologies
43
URL de l’agence : www.understandinggroup.com
44
Stratégie de contenu
45
Architecture de l’information
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 19
21. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 20
En France, une agence est particulièrement connue pour la structuration de contenu :
Nealite. Elle est essentiellement composée de UX et UI designers…
3.3.2 Les UI et UX designers
Les architectes et stratèges de l’information sont intimement liés à l’émergence des
métiers UI et UX designers46. Il s’agit de professionnels spécialisés dans « l’user
interface » et « l’user experience », autrement dit l’interface utilisateur et l’expérience
utilisateur. Leur travail consiste à designer une solution par-rapport à un problème
identifié en se concentrant sur l’expérience utilisateur. Pour cela, ils proposent aux
consommateurs de vivre une expérience et une histoire à part à travers une interface
pensée et réfléchie. Le but étant de maximiser l’expérience utilisateur. Certains
établissements, tels que le CELSA ou l’École des Gobelins à Paris, proposent des
formations pour se former à ces nouveaux métiers. Selon Manuel Diaz, président de
l’agence Emakina, nous assistons aujourd’hui à une cohabitation de métiers
« traditionnels » et émergents dans la mise en place de projets web. Le chef de projets
web doit désormais composer avec des ergonomes, des sémiologues, des architectes, des
stratèges, des développeurs, des webdesigners, des UX/UI designers,... Certains métiers
sont sur le point de connaître une réelle croissance. La difficulté sera alors de trouver les
meilleurs professionnels au bon moment afin de composer une équipe efficace et
réunissant toutes les compétences requises pour l’accomplissement d’un projet web.
L’écosystème numérique est bel et bien impacté par l’émergence du web sémantique. Les
premières pratiques apparaissent, des outils intelligents se mettent en place et de
nouveaux métiers intègrent le paysage polymorphe du web. Malgré le fait que Google va
imposer petit à petit le web sémantique aux utilisateurs, nous pouvons dire que le web 3.0
est un dispositif socio-technique, qui selon moi va permettre une optimisation de nos
pratiques sur le web.
46
Vidéo Youtube réalisée par Mushroom Conseil, cabinet de chasseurs de têtes, et diffusée sur la web TV Mushroom TV.
Découverte des nouvelles tendances, des nouveaux métiers et des nouveaux acteurs du secteur de la communication. Épisode 1 :
UX DESIGNER. URL : http://youtu.be/KKoayiQbUc0
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 20
22. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 21
Le début d’un long chantier…
L’histoire du web rapportée à l’échelle humaine est quasi-inexistante. Pourtant, depuis
son apparition dans la société, dans les années 1990, rares ont été les secteurs comme
celui-ci à évoluer autant sur le court terme. Tout d’abord, le web 1.0 a ouvert une
nouvelle manière de communiquer avec l’apparition des sites Internet, des campagnes
d’e-mailing, des pages HTML*, etc. Puis le web social et mobile s’est imposé au cours
des années 2000, offrant davantage d’interactivité, de contenu, de fonctionnalités et
d’usages qu’auparavant. Aujourd’hui, le web sémantique vient compléter ce vaste
épouvantail de possibilités qu’offre le web en complexifiant un peu plus les mécanismes
et les techniques utilisées pour son bon fonctionnement.
Le web sémantique n’en est qu’à ses balbutiements mais ses effets se font déjà ressentir
sur l’écosystème numérique ainsi que sur les enjeux communicationnels. La relation
homme / machine n’a jamais été aussi développée dans le web que maintenant, à tel point
que ces agents logiciels peuvent désormais comprendre le sens des contenus et l’exploiter
de manière réfléchie et pertinente. Nous sommes passés d’une relation unilatérale à
bilatérale : le web sémantique permet l’optimisation de la coopération homme / machine.
Les deux entités travaillent simultanément et de manière intelligente et efficace.
La mouvance du « future friendly web » ajoute au web 3.0 un aspect futuriste,
ergonomique et ubiquitaire. Le contenu est amené à naviguer partout et à être exploité à
tout moment par les machines pour répondre à nos désirs et besoins de manière
instantanée. Les CMS « COPE » sont une première réponse à ce constat et n’ont pas fini
de se développer et de se complexifier avec l’apparition de terminaux plus petits, mobiles
et inattendus. Les métiers de stratèges et architectes de contenu vont se répandre et
intégrer progressivement le paysage numérique afin de préparer le contenu pour le futur.
Les interfaces et expériences utilisateurs vont être amenés à considérablement évoluer
jusqu’à en devenir presque volatiles. Le jour où nous porterons des lunettes de vue
connectées est bientôt arrivé. Nous serons alors continuellement connectés à la réalité
augmenté, au monde virtuel. Les informations viendront à nous naturellement, au bon
moment et au bon endroit afin d’enrichir notre quotidien et faciliter tous nos faits et
gestes, et parfois même en les anticipant.
Parler d’intelligence artificielle dans une synthèse portant sur le web sémantique
peut paraître exagérée mais nous sommes véritablement à l’aube d’une explosion
de l’intelligence. Le web sémantique offre des interactions encore jamais
rencontrées et permet petit à petit aux machines de s’immiscer dans notre
environnement intime, cognitif et communicationnel…
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 21
23. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 22
Lexique
Community manager : Terme anglophone pour désigner un gestionnaire de communauté
sur Internet à travers les médias sociaux.
CSS: Abréviation pour « Cascading Style Sheets ». Il s’agit d’un langage Internet, utilisé
en parallèle du langage HTML, permettant de mettre en forme les pages d’un site
Internet. Il permet ainsi de paramétrer une couleur de fond, une typographie, et bien
d’autres éléments.
HTML : Abréviation pour « Hyper Text Markup Language ». Il s’agit d’un
langage Internet qui permet de créer des pages et sites Internet. Ce langage est constitué
de balises permettant ainsi de structurer les pages et d’organiser le contenu en ligne.
Référencement naturel : Ensemble de pratiques qui consiste à rendre un site le plus
visible possible sur les résultats de recherches Internet. Il s’agit d’associer des
métadonnées aux pages du site Internet. De nombreux paramètres sont pris en compte
pour favoriser le référencement, à savoir le nom des page HTML, les balises H1, le nom
des images, le contenu textuel des pages, les liens hypertextes,...
UGC : Abréviation pour « User Generated Content ». Il s’agit du contenu généré par les
internautes sur les réseaux sociaux et autres plateformes de partage.
URI : Abréviation de « Uniform Resource Identifier ». Identifiant propre et unique à
chaque ressource caractérisé par une chaine de caractères. Les URI sont enregistrés
auprès de l’organisme IANA (Internet Assigned Numbers Authority) afin de s’assurer
qu‘il soit unique.
W3C : Abréviation de « World Wide Web Consortium ». Institution en charge du
développement et de la standardisation des langages et technologies du web au niveau
international.
Web design : Conception graphique des différentes pages d’un site Internet, réalisé par
un web designer. Il est réalisé en phase de conception puis est intégré par les
développeurs en phase de dévelppement.
Wiki : Plateforme Internet pouvant être modifiée par les internautes. Les wikis reposent
sur le principe de la collaboration : ils permettent aux utilisateurs d’apporter leurs
connaissances sur des sujets et thématiques précises. Le wiki le plus connu est
Wikipedia. Ces plateformes sont également développées au sein de certaines entreprises,
ce qui permet aux salariés d’accéder et d’apporter des mises à jour sur le contenu.
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 22
24. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 23
Bibliographie
OUVRAGES
• BOUGHANEM Mohand, SAVOY Jacques, AUSSENAC-GILLES Nathalie.
Recherche d’informations, état des lieux et perspectives. Lavoisier, 2008, 342
pages.
• FAYON David. Web 2.0 et au-delà . Nouveaux internautes : du surfeur à l’acteur.
Édition ECONOMICA, 2010, 2ème édition, 190 pages.
• GANDON Fabien, CORBY Olivier, FARON-ZUCKER Catherine. Le web
sémantique : Comment lier les données et les schémas sur le web ? Éditions
Dunod, 2012, 206 pages.
• PÉDAUQUE Roger T. La redocumentarisation du monde. Édition Cépaduès,
2007, 212 pages.
• PÉDAUQUE Roger T. Le Document à la lumière du numérique :forme, texte,
médium : comprendre le rôle du document numérique dans l'émergence d'une
nouvelle modernité. CF éditions, 2006, 218 pages.
• FLICHY Patrice. L’innovation technique. Récents développements en sciences
sociales. Vers une nouvelle théorie de l’innovation. Éditions La Découverte,
1995, 256 pages.
MAGAZINES // REVUES
• DOCUMENTALISTE, SCIENCES DE L’INFORMATION n°48/4. Dossier :
Web sémantique, web de données… Quelle nouvelle donne ? Enjeux et
technologies. Approches documentaires. ADBS, Décembre 2011, pages 20 à 61.
• LA LETTRE ÉMERITE n°57. Le web 2.0, un phénomène de sociét é. FTU
Centre de Recherche Travail Technologies, Premier 2009, 8 pages.
THESE
• DIOUF, Mouhamed. Spécification et mise en œuvre d’un formalisme de règles
métier. Université Bordeaux 1. Soutenance présentée le 10 Décembre 2007. 244
pages.
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 23
25. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 24
Sitographie
SITES WEB
• NOVIUS OS. CMS Open Source nouvelle génération [en ligne]. Disponible sur :
http://www.novius-os.org/
• FUTURE FRIENDLY. Collectif américain défendant les valeurs du « Future
friendly web » [en ligne]. Consultable sur : http://futurefriend.ly/
• BRAD FROST WEB. Site de Brad Frost, spécialite de la stratégie web mobile et
fondateur du « future friendly web » [en ligne]. Consultable sur :
http://bradfrostweb.com/
• THE UNDERSTANDING GROUP. Agence américaine spécialisée dans
l’architecture de l’information et les prestations numériques [en ligne].
Consultable sur : http://understandinggroup.com/
• NEALITE. Agence française de design de services et d’expérience utilisateur [en
ligne]. Consultable sur : http://www.nealite.fr/
• KNOWLEDGE GRAPH. Moteur de recherche sémantique de Google [en ligne].
Consultable sur :
http://www.google.com/insidesearch/features/search/knowledge.html
• WOLFRAM ALPHA. Moteur de recherche sémantique [en ligne]. Consultable
sur : http://www.wolframalpha.com/
• SCHEMA.ORG. Bibliothèque de microdonnées établit par Google, Yahoo et
Bing [en ligne]. Consultable sur : http://schema.org/
• MICROFORMATS. Site, blog et wiki sur les microformats [en ligne].
Consultable sur : http://microformats.org/
PAGES INTERNET
• PROGRAMMABLE WEB. COPE : Create Once, Publish Everywhere [en ligne].
Octobre 2009. Disponible sur :
http://blog.programmableweb.com/2009/10/13/cope-create-once-publish-
everywhere/
• A LIST APART. Future-ready content [en ligne]. Février 2012. Disponible sur :
http://www.alistapart.com/articles/future-ready-content/ .
• FRED CAVAZZA. L’art de la taxonomie [en ligne]. Mai 2004. Disponible sur :
http://www.fredcavazza.net/2004/05/21/lart-de-la-taxonomie/
• LA GRANGE. Ontologies, thésaurus, taxonomie et web sémantique [en ligne].
Disponible sur : http://www.la-grange.net/2004/03/19.html#ontologies
• TNS SOFRES. Mobinautes et tablonautes accélèrent leur percée [en ligne].
Disponible sur : http://www.tns-sofres.com/points-de-
vue/71C211C357D44CB1A21D88B7EEA29197.aspx
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 24
26. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 25
PRESENTATION SLIDESHARE
• CREATE ONCE, PUBLISH EVERYWHERE (version française). Présentation
SlideShare réalisée par Novius OS [en ligne]. Octobre 2012. Disponible sur :
http://fr.slideshare.net/novius-os/create-once-publish-everywhere-anytime
• LES MOTEURS DE RECHERCHE SÉMANTIQUE :
CONTEXTUALISATION, SÉMANTISATION ET RÉNOVATION.
Présentation SlideShare réalisée par Sylvain Gateau [en ligne]. Novembre 2012.
Disponible sur :
http://fr.slideshare.net/Cerise_sur_le_Gateau/les-moteurs-de-recherche-
smantique
• FOR A FUTURE FRIENDLY WEB. Présentation SlideShare réalisée par Brad
Frost [en ligne]. Disponible sur :
http://fr.slideshare.net/bradfrostweb/for-a-futurefriendly-web
VIDEOS YOUTUBE
• PROJECT GLASS : ONE DAY… Vidéo prospective réalisée par Google [en
ligne]. Avril 2012. Disponible sur : http://youtu.be/9c6W4CCU9M4
• MUSHROOM TV : UX DESIGNERS (épisode 1). Vidéo-reportage sur le métier
d’UX Designer réalisée par le cabinet de chasseurs de têtes Mushroom [en ligne].
Disponible sur : http://youtu.be/KKoayiQbUc0
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 25
27. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 26
Annexe n°1 : Retranscription d’interview - Antoine Lefeuvre,
responsable RD chez Novius Labs
Entretien téléphonique réalisé le Vendredi 7 Décembre 2012 de 17h30 à 19h.
Question 1
Quelle est la place du web sémantique (WS) dans l’agence Novius à l’heure actuelle ?
Réponse d’Antoine Lefeuvre
Chez Novius, il faut tout d’abord discerner l’activité « agence » de l’activité « laboratoire ».
Dans l’un comme dans l’autre, le WS est intégré dans la vision de l’agence. Je vais parler
dans un premier temps du WS au sein de l’activité « agence ».
Aujourd’hui, nous pouvons voir apparaître la mention de WS dans certains cahiers des
charges. Le WS sera intégré aux projets en fonction de la sensibilité des chefs de projets. Le
WS est principalement traité pour ses caractéristiques de référencement. Chez Novius, nous
n’avons pas de politique de référencement dans nos offres. Nous travaillons donc avec des
référenceurs, sous forme de prestations.
Nous avons déjà collaboré sur quelques projets tels que le site de Bjorg, la marque
agroalimentaire. Nous avons élaboré une base de recette, enrichie par des microformats et
notamment l’attribut « hrecepe ». Il faut savoir qu’aujourd’hui des moteurs de recherche
comme Google sont capables de choisir et privilégier des attributs sémantiques et de se les
approprier afin d’afficher des résultats de recettes directement dans leur page de résultat par
exemple. D’où l’intérêt pour ce client d’intégrer des microformats.
Question 2
Pratiquez-vous une politique de tarification spécifique pour ces prestations liées au WS
?
Réponse d’Antoine Lefeuvre
Nous n’appliquons pas de tarification spécifique. Les tarifs seront pris en compte dans la
prestation d’optimisation de référencement, sans en être séparée. Cependant, il peut nous
arriver d’ajouter une phase de référencement pendant ou après la conception du projet. Dans
quel cas nous prévoyons un devis à part.
Je suis convaincu que le WS sera de plus en plus présent dans les projets web, mais pas
uniquement pour des problématiques de référencement.
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 26
28. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 27
Question 3
Quelle est la place du contenu dans le WS ? Les produits conçus par Novius Labs sont-
ils optimisés pour le WS ?
Réponse d’Antoine Lefeuvre
Nous avons la particularité d’avoir ce laboratoire dans lequel nous avons déjà conçu une suite
d’outils que nous commercialisons auprès de nos clients. Depuis plus d’un an maintenant, je
me suis penché sur le WS pour notre nouveau projet Novius OS, lancé au cours de l’année
2012. Novius OS est un CMS nouvelle génération permettant de gérer du contenu multicanal.
Notre problématique de départ était la suivante : qu’est ce que gérer du contenu aujourd’hui,
à l’heure du multicanal ?
Pour répondre à cela, je me suis intéressé à l’apparition de nouveaux métiers aux États-Unis :
les architectes de contenu et les stratèges de contenu. Ces professionnels pensent l’Internet
comme étant de plus en plus polymorphe, notamment avec l’avènement des tablettes tactiles,
des Smartphones et même des consoles de jeu qui représentent un pourcentage très élevé du
trafic sur Internet aux États-Unis. La nouvelle génération sera les lunettes, comme nous l’a
présenté Google avec son projet « Google Glass ».
Tout cela nous indique que le contenu est actuellement présenté sous différentes formes et
que cela va s’accroitre dans les années à venir. Le contenu est la valeur principale pour une
entreprise et il doit être structuré. On parle de design de taxonomie : le contenu est classé
selon du vocabulaire et il est ainsi structuré.
Question 4
Quelle est la place du chef de projet dans cette mouvance ? Comment intégrer ces
nouveaux métiers dans une équipe ou dans une agence « digitale » ?
Réponse d’Antoine Lefeuvre
Le chef de projet restera selon moi un chef d’orchestre des différents métiers de son équipe. Il
devra composer avec ces nouveaux métiers. Cela sous entend être au courant de ce qu’il se
passe. Mais il ne devra pas en être un spécialiste, car il ne peut pas maitriser toutes les
compétences de son équipe, et cela n’est pas nouveau. Au moment venu, il devra être capable
de s’entourer de professionnels (stratèges et architectes). S’il n’en trouve pas, il sera
certainement amené à composer par lui-même, avec ses connaissances.
Les métiers d’architecture de contenu et de stratège de contenu se font de plus en plus
présents. Leur travail consiste à recenser le contenu dans les entreprises et à en donner une
structure. Pour le moment, ce sont des professionnels qui interviennent à la journée et qui
sont payés très chers.
Le « responsive design » n’est que le commencement de cette mouvance. En 2012, cette
pratique permet de répondre efficacement aux besoins d’adaptabilité sur différents supports.
Mais il ne suffira plus en 2015. Les contenus d’une entreprise vivent deux à trois ans en
moyenne. Le travail des stratèges est donc de les conseiller dès aujourd’hui afin de les
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 27
29. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 28
préparer à structurer leur contenu. Il s’agit d’un courant nommé le « future-ready »,
autrement dit, accepter le fait que le contenu va changer et faire en sorte qu’il soit prêt à être
mis en place sur plusieurs canaux de nature différente.
En France, une agence est connue pour la structuration de contenu : Nealite. Mais une des
plus connues est sans doute Under Standing Group aux USA. Il y a une émergence de ces
nouveaux métiers et ces professionnels seront progressivement intégrés dans des agences
digitales.
Question 5
Quelle est la place / l’importance des moteurs de recherche dans ce contexte ?
Réponse d’Antoine Lefeuvre
Les moteurs de recherche vont exiger de plus en plus la sémantisation des contenus car le
web sémantique représente, pour eux, une réelle aubaine : la sémantisation des contenus
facilitent la structuration des données et donc le travail de ces objets.
Les moteurs de recherche sont divisés entre 2 forces :
• Les utilisateurs, qui demandent à accéder aux informations et qui n’ont pas de réel
jugement sur la forme que cela doit prendre.
• Les moteurs de recherche eux même, qui vont exiger de plus en plus une meilleure
sémantisation des ressources chez les éditeurs s’ils veulent bénéficier d’un bon
référencement.
Grâce aux moteurs de recherche sémantique, les utilisateurs ont accès à l’information
correspondant à leur requête sans même avoir à consulter plusieurs pages. Il s’agit d’un gain
de temps et d’une optimisation de la collaboration entre l’homme et sa machine.
Question 6
Nous pouvons donc imaginer que le trafic sur les sites Internet des éditeurs sera amené
à diminuer considérablement ? On peut parler d’une redéfinition du système
économique numérique ?
Réponse d’Antoine Lefeuvre
Oui, il y aura très certainement une baisse de trafic, mais est-ce une rupture ? Aujourd’hui, un
site comme Facebook s’avère être un agrégateur de flux de données très performants. Les
utilisateurs de ce réseau social, plus d’un milliard à ce jour, publient et consomment
quotidiennement du contenu sans forcément se diriger sur les sites Internet des éditeurs. Cela
est difficile à maitriser pour les éditeurs mais le phénomène n’est pas nouveau et il faudra
composer de plus en plus avec cela. Il y aura un report du trafic et non une baisse : les médias
sociaux n’ont pas fait disparaître les sites Internet. Ce qui est certain, c’est que nous assistons
à un changement du modèle économique. Toute l’offre de référencement va être affectée dans
un premier temps.
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 28
30. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 29
Question 7
Google a récemment lancé « Knowledge Graph », un moteur de recherche sémantique.
Le WS est-il imposé à l’utilisateur ou est-ce une réponse à ses besoins ? Comment voyez-
vous l’évolution, à court terme, du WS ?
Réponse d’Antoine Lefeuvre
L’utilisateur n’a pas la notion de HTML*, de CSS*. Ce qu’il lui importe, c’est d’accéder à
l’information et de trouver des réponses à ses requêtes. Les sites web ne sont pas une fin en
soi à ses yeux. Il n’aura probablement aucun problème à s’adapter car il s’est très bien adapté
aux médias sociaux et notamment à Facebook, qui agrège les contenus.
La notion de web 3.0 a véritablement décollé en 2008 / 2009. Le web sémantique est
désormais très présent, le mouvement est bien enclenché mais peu de gens l’utilisent. Je
pense que dans les trois années à venir, le WS va considérablement s’envoler.
Question 8
Il y a t-il des secteurs d’activité dans lesquels le WS aura une importance considérable ?
Réponse d’Antoine Lefeuvre
Il y a une réelle pression exercée par les moteurs de recherche sur certains domaines tels que
les transports, la cuisine, la documentation (très en avance sur ce sujet avec notamment le
projet DITA), ainsi que les réseaux de présentation d’expériences professionnelles (LinkedIn
se base aujourd’hui sur le microformat « hresume »). Un secteur comme celui de la cuisine
est aujourd’hui très normalisé, d’où l’apport de sémantisation dans le projet de Bjorg
(précédemment cité). Dans le domaine des transports, il est nécessaire de fournir des flux de
données aux moteurs de recherche (quel vol en partance de Paris pour New-York
aujourd’hui ? Pour quel prix ? À quelle heure ?). L’utilisateur d’aujourd’hui ne va pas
consulter les sites de chaque compagnie aérienne afin de trouver son billet. Il va plutôt
privilégier les comparateurs de prix. Cela est d’autant plus important que le domaine du
transport sera de plus en plus imposé par l’ouverture de ses données publiques (Open Data).
Question 9
Une dernière question : qu’entendez-vous par le terme « digitale » ?
Réponse d’Antoine Lefeuvre
Il s’agit en réalité d’un effet de mode. C’est un anglicisme du terme « numérique ».
Aujourd’hui, les agences l’utilisent, il faut donc « s’aligner » et utiliser ce terme. Il y a
quelques temps, le terme « web agency » ou agence web a disparu car comme je le disais, le
web est polymorphe et sous entend des formes différentes. Or, le terme « web » est souvent
assimilé aux sites Internet, alors que les applications mobiles et tablettes ne cessent de
croitre : c’est réducteur et peu représentatif des prestations proposées en agence. D’où
l’utilisation du mot « digitale ».
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 29
31. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 30
Annexe 2 : Interface d’administration du CMS COPE Novius OS
Interface d’administration du CMS COPE développé par Novius. Sur cette interface, nous avons accès à un
seul et même contenu concernant la venue d’un nouveau Gorille. Le contenu est entré selon différents
champs (titre, images, lien hypertexte, Description,…). Il suffit alors de sélectionner l’affichage de contenu
en fonction de la diffusion souhaitée (sur Twitter, Facebook, l’application mobile,…) et de publier le
contenu. Ce dernier est alors adapté au terminal / réseau sélectionné. Il peut par la suite être publié sur
divers canaux, en utilisant ce même contenu. Ce CMS reflète donc bien le courant « Create Once, Publish
Everywhere ».
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 30
32. GATEAU Sylvain – Le web sémantique pour mieux anticiper le futur… - page 31
Résumé
Après le web 1.0 et le web 2.0, place au web sémantique. Jusque là encore unilatérale, la
relation homme / machine prend une nouvelle dimension avec la sémantisation des
contenus : les machines sont désormais capables de comprendre et d’exploiter le contenu.
Pour notre plus grand bien ?
Le web sémantique est en marche pour nous préparer au futur. Des courants de pensées,
tels que le « Future friendly web », prônent un web propre, structuré, et véhiculant du
contenu porteur de sens, prêt à s’adapter et à être diffusé n’importe où, n’importe quand.
À la croisée des Sciences Sociales et Humaines et des Sciences de l’Information et de la
Communication, le web sémantique est donc sur le point de redéfinir nos relations
communicationnelles ainsi que l’organisation de l’écosystème numérique.
Vers de nouveaux métiers ? De nouveaux acteurs ? De nouvelles pratiques ? Une chose
est sûre, c’est qu’à partir d’aujourd’hui, la machine entre un peu plus dans notre sphère
intime, relationnelle et communicationnelle. Un pas de plus vers l’intelligence
artificielle ?
Mots-clés
Web sémantique
Graphe de triplets
Sémantisation des contenus
« Responsive design »
« Future friendly web »
« Future-ready content »
« COPE »
Stratège de contenu
Architecte de contenu
UI / UX design
UNIVERSITÉ STENDHAL -UFR LLASIC –Département Sciences de l’information et de la communication -Master 2 AVMN - 2012-2013 31