l’avenir du web
au prisme de la ressource
Nicolas Delaforge, Fabien Gandon et Alexandre Monnin
cinq objectifs
• présenter
(un web de ressources computationnelles)
• résumer, rappeler
(web de données, web sémantique)
•...
architecture web
trois composants de l’architecture du web
• identification (URI) & adressage (URL)
http://www.inria.fr
http://ns.inria.fr/...
UR*
 pas pour les gens… et pourtant…
 URI: identification de n’importe qu’elle ressource
 URL=URI + Localisation URL=UR...
la syntaxe des URIS
qui et quand ?
URI aux jointures
• entre les assertions
même si elles sont distribuées
• entre les couches réseau
(Internet, Web, Web sém...
web documentaire « REST in peace »
• REST(ful): invocation et composition d’applications
distribuées sur le web
• primitiv...
trois composants de l’architecture du web
• identification de la ressource (URI)
• accès à une représentation (HTTP URI)
•...
ressource
HTTP Range 14
Code HTTP Résultat Indication
200 (OK) Représentation
Ressource informationnelle (IR) et
non informationnell...
uri, ressource, ombre, objet
• identification
• individuation/
objectivation
zèbre (à défaut d’antilope )
ressource• tout ce que l’on sait identifier
• pierre angulaire de l’architecture de tout le web
• concept unificateur de s...
Généalogie : du document (B.B.) à la
ressource
Bruno Bachimont : Archivage audiovisuel et numérique: les enjeux de la long...
 l’objet
 la ressource
 l’état de la ressource
 l’état représentationnel
ou une représentation de la ressource
ressour...
rappel et parallèle
• sans notice pas d’existence dans la collection
• sans ressource pas d’existence sur le web
toile de calculs

appearences database
1991-1993 System 33: un prédécesseur
méconnu du conneg + services de rendu
Electronic
documents
Ren...
moteur et CGI
personnalisation, adaptation
« Filter Bubble » Eli Pariser
Fabien Gandon: Wed, Jul 18, 2012 at 9:48 AM, Inria, Sophia Antipolis, France, Dell
6200, Windows 7, Anglais
Alexandre Monnin: Alienware, Chromium SRware Iron, Windows 7, Paris
Adrien Basse: 17h57mn à 18h07mn GMT, Dakar/Sénégal, Mac book pro, Mac os X
(10.6.8), french
Yves Raimond: Firefox 13.0.1, Ubuntu 12.04, in London
Antoine Isaac: 10h45pm, Amsterdam, Prins Hendrikkade 129, MacBook Pro, English
OS: MacOs X 10.6.8, Firefox
Rémi Trichet: 12:41pm 7/18/2012, Los Angeles, Intel Xeon 3,6 Ghz, Windows 7
Professional, English
il cherche « bmw »,
« mahler » et « gay »
? = !
BMW
« Je m’intéresse aux BMW »
Allo Google ? C’est la Noiraude…
United States Flu Activity - Influenza estimate
● Google Flu Trends ● U.S. Centers for Di...
« document sur lui-même »
document vivant, chaque consultation
change le document
900 millions
Chine: 1 600 millions
Inde: 1 200 millions
acebook
PORTÉE
externaliser la socialité d’un site
intérêt et danger
OGP v2
actions typées
OGP schémas…
code dans votre page
<html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US"
xmlns:fb="https://www.facebook.com/...
Face… it
changing interface…
crowdsourcing crawling & indexing
affiliation social sub-networks
analyse réseaux sociaux web 2.0 & dynamique
© FriendViz © Obama’s network, Recorded Future
© Egyptian Revolution on Twitte...
une représentation est
modifiée par un
commentaire
contenu essentiel, lié à une
ressource spécifique (un article)
vs
conte...
une ressource change : une question
devient une réponse parfois… ?  !
suppression définitive
ni ressource, ni représentation
gérér sa bibliographie : Zotero et Coins
extraction de données
« page » donnant l’analyse du texte d’une autre « page »
made in web
auteurs?
journal
confusion des genres?
permanence/
non permanence
raccourcisseur d’URL
et re-captcha…
des jeux utiles au crowdsourcing
le web comme une plateforme d’externalisation
distribuée de masse.
Fold It
temps facebook
16.2 millions secondes/seconde
x 16 203 703
253
l’utilisateur utilisé
le web comme une
machine universelle
de moteurs à pulsions
(méta)-données
application web
jeuHTML5
Mario Kart en HTML5 (ouf !)
…
jouer dans le navigateur : le cloud
© HTML5Rocks
download
upload
drag & drop
© HTML5Rocks
speech input
geolocation
© HTML5Rocks
html & js html & svg
WebGL
inputs, text, email, number, phone
©HTML5Rocks
HTML pages
of specifications
39 pages 963 pages
HTML 1
Ligne de
Temps
annotations des éléments multimédia
• description sémantique de ressources
multimedia [Media Annotation]
• adressage d’élé...
fragment multimédia
• partie fragment de l’URL = après le #
http://www.example.com/example.ogv#track=audio&t=10,20
• dimen...
ontologies des ressources multimédias
ontology for Media Resources 1.0
<video.ogv> a ma:MediaResource ;
ma:hasTrack <video...
universelle
une interface programmatique
serveur application
HTTP HTTP
application
navigateur
HTTP
design & affordance
ceci est un ovetto
affordance sémantique
SAWSDLsemantic annotation of WSDL (W3C Rec. 2007)
SAWSDL…
sémantiquement
services annotés et recherchés
fournisseurserviceclientdemandeur
annuaire
3
12
pre-populating…
entrée
sortie
assistant’s phone phone  namename phone name
employee assistant
workflows scientifiques
• composer des données et traitements distribués
• échanger et comparer les traitements et leurs
c...
se lierau monde
Le bug de l’an…
2020
( inspiration Gérard Berry)
SSRSSLSSS
SSLSSLSSS

1 sec. battement de cœur
1/2 sec. double click
24 images/sec. film
500 000 décisions / sec. algorithmes boursiers« Aliénat...
http://mon.org/ma/ressource
 règles négociation
calculs
composition
rendu
…
…
…
…
…
…
…
DNS, TCP/IP, Web
…
http://mon.org/ma/ressource
 règles négociation
calculs
composition
rendu
…
…
…
…
…
…
…
…
DNS, TCP/IP, Web
GET
30 min…
5 jours…
le livre n’est pas recréé à chaque page
Stéphane Crozat:
« le document numérique n'existe pas, ce qui
existe ce sont des constructions numériques
dont le traiteme...
Le juridique aussi souffre
de l’héritage documentaire
des données
nouveaux engagements, contrats
• contrats de lecture + computationnel
• contrats d’identification + computationnel
• contr...
tant à venir
le web entre nous et le monde
• documents & données augmentent nos perceptions
• services & applications augmentent nos ac...
réalité augmentée par le web
& augmentation du web par le réel
• vers une réalité augmentée par le web
• diversité des res...
google glass project
chaque utilisateur est un détecteur
web de « consommacteurs » mobiles, « crawlers »
du web & du monde physique
ex. Wikimap...
Image,T. Berners-Lee, RuleML kickoff, 2005
une toile de données multiples
entre différents barreaux de l’échelle des sphèr...
web…devices
… Web Phone
… Web TV
… Web Radio
… Web Car
… Web Tablet
… Web eBook
… Web Watch
… Web GPS
…
[Web of Devices]
cintre Facebook chez C&A Brésil
nouvelles topologies du web
ex. « near field communication »
Open Street Map dans le métro
navigateur web = interface universelle
ex. domotique
Web 2.0 & Web Physique
RFID&URI ex. Live Social Semantics
fabien
Janet Echelman, “Her Secret is Patience”, Civic Space Park,
Phoenix, AZ, USA, 2009
plusieurs évolutions concourantes
• explosion multimédia et multi-modalité
• toile de ressources computationnelles liées
•...
l’effet diligenceJacques Perriault
(méta) web
liens d’association
du mémex entre les informations qui nous importent
[Vannevar Bush, 1945]
hypertexte, hypermédia
une structure de fichier pour l’information
complexe, changeante et indéterminée
[Ted Nelson, 1965]
à travers le réseau
liens utilisant des références
http://www.
[Tim Berners-Lee, 1989]
hypertexte et document sur le Web :
de la nécessité de les reconstruire par
assemblages
Hypertexte : Google
Document : Sce...
structuré
vers un web
séparer
forme et contenu
2008 XML a eu dix ans <balise>…</balise>
XML en 10 points http://www.w3.org/XML/1999/XML-in-10-points.fr.html
structurer
d...
XMLbien formé
<racine>...</racine>
<x>...</x> ou <x/>
<a><b></a></b>
<x> <X>
<1an> <xmla> <bla bla>
<a b='c'></a> ou <a b=...
de langages
Scalable Vector
Graphics (SVG)
XML Topic
Maps (XTM)
Synchronized
Multimedia Integration
Language (SMIL)
eXtens...
namespace
• espaces de nommage
• éviter les collision de noms
• associer un préfixe de balise à un URI
• exemple
• définit...
ontos logos
être / êtres discours / science
“JacobLorhard's"OgdoasScholastica"(1606)containsthefirstoccurrenceoftheterm
‘o...
->
Ontologie ontologie
votre réponse est basée sur une
ontologie partagée
je peux comprendre
vous pouvez raisonner
Document
Book
Novel Short story
sous
type
sous
type
#12
#21
#47 #48
"document"
"book"
"livre"
"novel"
"roman"
"short story"
"nouvelle"
#21  #12
#48  #21#47  #21
#21  #12
#48  #21#47  #21
connaissanceontologique formalisée
#12
#21
#47 #48
ontologie
n’est pas un synonyme de
taxinomie
la connaissance
taxinomique
est une connaissance
ontologique
parmi d’autres
partie
de
carbone hydrogèneoxygène
dioxyde de carbone dioxygène ozone dihydrogène
méthane éthane méthanol éthanol
eauphéno...
combiner
différents types de connaissances ontologiques
Hierarchical model of the shape of the human body. D. Marr and H.K...
couverture
dans quelle mesure les primitives mobilisées par
les scénarios sont couvertes par l’ontologie
spécificité dans quelle mesure
les primitives sont
précisément déclarées
dans l’ontologie
granularité
dans quelle mesure les primitives
sont détaillées
exemple granularité [Charlet - RFIA 2002]
1. Patient-Masculin
Patient-Féminin
2. [Patient]  (chrc)  [Masculin]
[Patient]...
dans quelle mesure les
primitives sont décrites
dans un langage formel
formalité
méthodes
ex. rigidité dans Onto Clean [Guarino & Welty]
Rigid +R
 is a necessary property for all its instances
Anti-Rig...
structurer une “folksonomie”
folksonomies platesweb 2.0
pollution
pollution des sols
has narrower
polluant énergie
related...
combinaison espaces métriques
distances d’édition
Monge-Elkan Soundex, JaroWinkler,
asymétrie Monge-Elkan Qgram
métrique c...
83 027 relations / 9 037 tags
 68 633 related
 11 254 hyponyms
 3 193 spelling variants
ex. ademe TheseNet
recherches & retours
ex. propagation sémantique
sel, eau
poivre, vin
moutarde
rugby, foot
foot, ciné
hockey sport sport
sport
condiment
condime...
ex. Ademe 1 pollution ; 2 développent durable ;
3 énergie ; 4 chimie ; 5 pollution de l’air ;
6 métaux ; 7 biomasse ; 8 dé...
langages
de formalisation
d’ontologies
exemple
(define-class humain (?humain)
:def (animal ?humain))
subsomption dans les frames
exemple
(defprimconcept MALE)
(defprimconcept FEMELLE)
(disjoint MALE FEMELLE)
classes disjointes en logiques de descripti...
exemple
[Concept: Directeur]->(Def)->
[LambdaExpression:
[Personne: ]->(Dirige)->[Groupe]]
classe définie en graphes conc...
sémantique
vers un web
le web originel
liens typés…
web sémantique
mentionné par Tim BL
en 1994 à WWW
[Tim Berners-Lee 1994, http://www.w3.org/Talks/WWW94Tim/]
RDF, toute connaissance est décomposée en
triplets ( sujet , prédicat , objet )
arcs ( nœud, arête , nœud )
ex : doc.html a pour auteur Fabien
et a pour thème la Musique
doc.html a pour auteur Fabien
doc.html a pour thème Musique
Fabien
auteur
doc.html
thème
Musique
<RDF/> une syntaxe XML pour mieux
échanger ces graphes
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-
rdf-syntax-ns#"
xmlns:inria="http://inria.fr/schema#" >
<rdf:Description...
nœuds anonymes (blank nodes)
http://bu.ch/l23.html
auteur
"Les zélés faons roses"
titre
"Laurent"
nom
"Trichard"
prenom
qu...
interroger avec SPARQL
SPARQL Protocol and RDF
Query Language
exemple
personne ayant au moins 18 ans
PREFIX ex: <http://inria.fr/schema#>
SELECT ?person ?name
WHERE {
?person rdf:type ...
web de données
première vague de déploiement
du web sémantique (RDF, SPARQL)
May 2007 April 2008 September 2008
March 2009
September 2010
Linking Open Data
Linking Open Data cloud diagram, by Richard...
e.g. DBpedia
CORESE/ KGRAM
contenus et thématiques
Domaines Nombre de jeux
de données Triplets % Liens sortants %
Media 25 1 841 852 061 5,82 % 50 44...
data.ratatouille.com
principes
 utiliser le format RDF
 utiliser des URI pour nommer
 utiliser des URI HTTP (URL) pour que l’on puisse les s...
DNScelui qui contrôle le nom
de domaine contrôle le
déréférencement.
ex. bit.ly & Lybie
.fr
*
.inria
isicil
(June 2012)
le cas de la France
mouvement d'ouverture
des données mais…
• redondance des identifiants
• hétérogénéité des formats
• di...
publication
processus démo
• installation en un
click
• import de données
trouvées en ligne
• transformation en
RDF
• publ...
RDFS pour définir les classes de
ressources, leurs propriétés,
et organiser leur hiérarchie
Document
Rapport
créateur
aute...
OWLin one…
par énumération
par intersection
par union
par complément
 la disjonction
par restriction!
par cardinalité
1.....
alignements et liage
ontologies et entités nommées
• « Ontology Alignment
Evaluation Initiative »
• reconnaissance d’entit...
OKKAM et owl:sameAs 1
“The logical consequences are the heart of the conceptual problem raised by the use of owl:sameAs. I...
OKKAM et owl:sameAs 2
« when owl:sameAs is not the same »
(H. Halpin, I. Herman, P. Hayes)
des représentations de ressources jugées identiques
p...
chaine GATE : exemple en biologie…
thesaurus,
classifications,
sujets, taxinomies,
folksonomies, ...
vocabulaires
contrôlés
expression naturelle pour
dénoter un concept
inria:CorporateSemanticWeb
skos:prefLabel "corporate semantic web"@en;
skos:p...
entre conceptsinria:CorporateSemanticWeb
skos:broader w3c:SemanticWeb;
skos:narrower inria:CorporateSemanticWiki;
skos:rel...
inria:CorporateSemanticWeb
skos:scopeNote "only within KM community";
skos:definition "a semantic web on an intranet";
sko...
beaucoup de données
dans beaucoup de pages
R2RML
une transformation standard
d’une base relationnelle en RDF
schéma
mapping
Triplets produits :
• cellules d’une ligne  sujet commun
• noms des colonnes  prédicats
• une cellule  un objet
• liens...
exemple de mapping
ISBN Author Title Year
0006511409X id_xyz The Glass Palace 2000
ID Name Homepage
id_xyz Ghosh, Amitav h...
(1) transformation
table personnes
ISBN Author Title Year
0006511409X id_xyz The Glass Palace 2000
ID Name Homepage
id_xyz...
(2) transformation
table livres
ISBN Author Title Year
0006511409X id_xyz The Glass Palace 2000
ID Name Homepage
id_xyz Gh...
(3) lier les tables
ISBN Author Title Year
0006511409X id_xyz The Glass Palace 2000
ID Name Homepage
id_xyz Ghosh, Amitav ...
RDFa signifie
RDF dans des attributs de HTML
<div xmlns:dc="http://purl.org/dc/elements/1.1/">
<h2 property="dc:title">The...
provenance, confiance, explication,
“At the toolbar (menu,
whatever) associated with a
document there is a button
marked "...
en insérant des étiquettes
émises par des autorités
dans les pages
protéger les enfants
<meta http-equiv="pics-label" cont...
VoID: décrire des sources de données
schéma pour annoter des jeux de données
:DBpedia a void:Dataset .
et des jeux de lien...
:DBpedia a void:Dataset;
void:sparqlEndpoint <http://dbpedia.org/sparql>;
void:feature :RDFXML ;
void:subset :DBpedia2Geon...
provenance & traçabilité[Provenance WG]
PROV-DM & PROV-O OWL2 ontology
décrire les entités et activités impliquées dans la
production, livraison, etc. d’un objet
...
description
authentifiée
plusieurs
ressources
listes
domaines, chemins
expressions régulières
grouping mechanisms...
... list URIs
... domain names, paths
... regular expressions on URIs
exemple de description POWDER
« toute ressource dont l’URI commence par
http://www-sop.inria.fr/fr/ concerne le centre
de ...
préjugés, fausses idées
boite noire
éviter de construire une
explicites
rendre les conceptualisations
à base d’ontologie
ne signifie pas que l’on
a besoin d’un moteur
d’inférence.
de l'intérêt d'un à peu près…
ma montre n'a qu'une aiguille
mais elle n'est pas cassée.
sens et position
d’une taxonomie à une vue
ar
a=120° 360°0°
“semantic web”
and not
“semanticweb”
[C. Welty, ISWC 2007]
“a lightweight ontology
allows us to do
lightweight reasoning”
...
66 FOAF primitives 3 475 908 348 references (2)
x 52 millions
“a small tree ruling a big graph”(1)
(1) Franck Van Harmelen...
le piège du domaine
le domaine d’application n’est pas
forcément celui de l’ontologie
universelle
je n’ai jamais vu une ontologie
Trouble dans la classification
(F. Rastier)
la vache folle
ou l’ontologue végétarien
s:MadCow rdfs:subClassOf s:Cow
gestion
besoin
conception
diffusion
utilisationévaluer
évolution
cycle
vie
modèle changeant
brique de construction
vs.
tri sélectif sémantique
le web est une poubelle,
le web sémantique sera une poubelle sémantique.
et pour nous
hyper-documentaire
de l’article scientifique à l’hyper-article multi-public
plus vieille facette, mais encore sous exploit...
donnez des URL aux contenus
une URL est un nom, sans URL pas de nom,
sans nom je ne peux pas en parler
• référence
• granu...
nouvelles formes de rédaction…
• systématiquement enrichir de liens
• identifier des cibles internes et externes
• identif...
forme / fond, structure, sémantique
• jeux de données scientifiques
entrées et sorties
• des schémas de données
développer...
utilités ? scénarios ?
• reproductibilité et comparatifs
• permettre d’autres expérimentations / algo
• ex. OAEI:
– Visibi...
le web comme écriture collective
• ouverture en écriture... collective
– ne plus centraliser la rédaction: distribuer, aid...
nouvelles formes de publication…
• soumissions immédiatement publiques
• revues sollicitées et processus rendus publics
• ...
nouvelles
conférences
• suivre l’ensemble de
la conférence
• percevoir les avis,
réactions, questions
• interroger, réagir...
socialité centrée ressource
• objets cristallisant une activité sociale et vice-versa
• bis repetita placent… « online or ...
au-delà du Buzz
• orchestrer la communication et sa contagion
• gérer notre présence en ligne
• faire explicitement appel ...
nos algorithmes
en ligne
• fournisseurs de services de haut niveau
(bibliothèque, QoS, certification, etc.)
• démonstrateu...
label sur des ressources web
• authentifier des ressources
• valider des données
• sécuriser des accès
• certifier des ser...
interfaces et utilisateurs partout
• HTML5: de la page à l’application
nouvelles formes de production et consultation
• co...
doggy-bags
web 1, 2
price convert?
person homepage?
more info?
web 1, 2, 3
lier le monde
lier les données
webrecommandations
html
http
url html httpurl
uri
iri
ataguaagwcag aria
mwbpearlra cc/pp assxcss
ddrsa xml eve. exi geo ap...
Leçon 1: faire une application web
o HTML 5
o CSS 2.1
o CSS 3 Selectors
o CSS 3 Media Queries
o CSS 3 Text
o CSS 3 Backgro...
i=j;réplication et bien anti-rival… à l’échelle du monde.
socialisation intensive de nos activités.
WEBscience
263
informel
formel
usage représentation
un et un seul web…
données
personnes documents
programmes
un espace unique dans tous ...
demain,celui qui contrôlera les métadonnées,
contrôlera le web.
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
L avenir du web au prisme de la resource
Prochain SlideShare
Chargement dans…5
×

L avenir du web au prisme de la resource

4 385 vues

Publié le

De plus en plus fréquemment, le web s’intercale entre nous et le monde. Le web des documents et des données augmente nos perceptions de la réalité quand dans le même temps le web d'applications et de services accroît l’emprise que nous exerçons sur elle en multipliant les tâches que nous pouvons accomplir. Devenu incontournable dans nos activités quotidiennes, il est également difficilement gérable.
Sur le web, une ressource peut être n’importe quoi et, à mesure que le réseau s’étend, tout, dans notre environnement, est susceptible de se muer en ressource. Certes, on parle maintenant de « réalité augmentée » par le web mais, à mesure que la toile se déploie, il faut également noter à quel point la réalité vient l’augmenter elle-même, en raison de la quantité et de la diversité de ressources identifiées en son sein.

0 commentaire
2 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
4 385
Sur SlideShare
0
Issues des intégrations
0
Intégrations
139
Actions
Partages
0
Téléchargements
27
Commentaires
0
J’aime
2
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

L avenir du web au prisme de la resource

  1. 1. l’avenir du web au prisme de la ressource Nicolas Delaforge, Fabien Gandon et Alexandre Monnin
  2. 2. cinq objectifs • présenter (un web de ressources computationnelles) • résumer, rappeler (web de données, web sémantique) • discuter, provoquer (le document n’existe pas) • orienter (et pour nous alors) • conclure, ouvrir (ce n’est que le début)
  3. 3. architecture web
  4. 4. trois composants de l’architecture du web • identification (URI) & adressage (URL) http://www.inria.fr http://ns.inria.fr/fabien.gandon#me ldap://[2001:db8::7]/c=GB?objectClass?one • communication / protocole (HTTP) GET /centre/sophia HTTP/1.1 Host: www.inria.fr User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X; de-de) AppleWebKit/523.10.3 (KHTML, like Gecko) Version/3.0.4 Safari/523.10 Accept-Encoding: gzip Accept: text/html,application/xhtml+xml,application/xml Accept-Language: en,en-us;q=0.8,fr;q=0.5,fr-fr;q=0.3 Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7 Referer: http://fabien.info/ • langage de représentation (HTML / RDF) Fabien travaille chez <a href="http://www.inria.fr">Inria</a> <http://www.inria.fr> foaf:member data:fabien
  5. 5. UR*  pas pour les gens… et pourtant…  URI: identification de n’importe qu’elle ressource  URL=URI + Localisation URL=UR(I+L)  HTTP URI: URI déréférençable selon HTTP « follow your nose » / naviguer au flair (wikipedia)
  6. 6. la syntaxe des URIS qui et quand ?
  7. 7. URI aux jointures • entre les assertions même si elles sont distribuées • entre les couches réseau (Internet, Web, Web sémantique) 1 physique 2 données 3 réseau 4 transport 5 session 6 présentation 7 application
  8. 8. web documentaire « REST in peace » • REST(ful): invocation et composition d’applications distribuées sur le web • primitives HTTP, actions sur la ressource GET, HEAD, POST, OPTIONS, CONNECT, TRACE, PUT, DELETE • le web ne fut jamais vraiment documentaire • web… – application centrée ressources (identifiées par URI) – architecture orientée ressource (localisables URL) – toile de calculs liés et non de documents
  9. 9. trois composants de l’architecture du web • identification de la ressource (URI) • accès à une représentation (HTTP URI) • codage de la représentation (HTML , RDF, etc)
  10. 10. ressource
  11. 11. HTTP Range 14 Code HTTP Résultat Indication 200 (OK) Représentation Ressource informationnelle (IR) et non informationnelle (NIR) ? 303 (voir autre) URI Tout type de ressource notamment des NIR 4XX, 5XX (erreur) Message d’erreur Aucune déduction possible « ce n’est peut-être pas le problème de HTTP ou des URI » ils n’en ont pas parlé ils en ont parlé
  12. 12. uri, ressource, ombre, objet • identification • individuation/ objectivation zèbre (à défaut d’antilope )
  13. 13. ressource• tout ce que l’on sait identifier • pierre angulaire de l’architecture de tout le web • concept unificateur de ses facettes « ressource » HTTP URI requête HTTP erreur HTTP représentation
  14. 14. Généalogie : du document (B.B.) à la ressource Bruno Bachimont : Archivage audiovisuel et numérique: les enjeux de la longue durée Ressource : Manipulation indirecte « … » locus
  15. 15.  l’objet  la ressource  l’état de la ressource  l’état représentationnel ou une représentation de la ressource ressources computationnelles « … » règles
  16. 16. rappel et parallèle • sans notice pas d’existence dans la collection • sans ressource pas d’existence sur le web
  17. 17. toile de calculs
  18. 18.  appearences database 1991-1993 System 33: un prédécesseur méconnu du conneg + services de rendu Electronic documents Rendering service Computers Servicing Client Application Other encoding formats RPC Psychophysically equivalents client serveur conneg http
  19. 19. moteur et CGI
  20. 20. personnalisation, adaptation « Filter Bubble » Eli Pariser
  21. 21. Fabien Gandon: Wed, Jul 18, 2012 at 9:48 AM, Inria, Sophia Antipolis, France, Dell 6200, Windows 7, Anglais
  22. 22. Alexandre Monnin: Alienware, Chromium SRware Iron, Windows 7, Paris
  23. 23. Adrien Basse: 17h57mn à 18h07mn GMT, Dakar/Sénégal, Mac book pro, Mac os X (10.6.8), french
  24. 24. Yves Raimond: Firefox 13.0.1, Ubuntu 12.04, in London
  25. 25. Antoine Isaac: 10h45pm, Amsterdam, Prins Hendrikkade 129, MacBook Pro, English OS: MacOs X 10.6.8, Firefox
  26. 26. Rémi Trichet: 12:41pm 7/18/2012, Los Angeles, Intel Xeon 3,6 Ghz, Windows 7 Professional, English
  27. 27. il cherche « bmw », « mahler » et « gay »
  28. 28. ? = ! BMW « Je m’intéresse aux BMW »
  29. 29. Allo Google ? C’est la Noiraude… United States Flu Activity - Influenza estimate ● Google Flu Trends ● U.S. Centers for Disease Control.
  30. 30. « document sur lui-même » document vivant, chaque consultation change le document
  31. 31. 900 millions Chine: 1 600 millions Inde: 1 200 millions acebook
  32. 32. PORTÉE
  33. 33. externaliser la socialité d’un site intérêt et danger
  34. 34. OGP v2 actions typées
  35. 35. OGP schémas…
  36. 36. code dans votre page <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US" xmlns:fb="https://www.facebook.com/2008/fbml"> <head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns# YOUR_NAMESPACE: http://ogp.me/ns/apps/YOUR_NAMESPACE#"> <meta property="fb:app_id" content="YOUR_APP_ID" /> <meta property="og:type" content="YOUR_NAMESPACE:recipe" /> <meta property="og:title" content="Stuffed Cookies" /> <meta property="og:image" content="http://example.com/cookie.jpg" /> <meta property="og:description" content="The Turducken of Cookies" /> <meta property="og:url" content="http://example.com/cookie.html"> <script type="text/javascript"> function postCook() { FB.api('/me/YOUR_NAMESPACE:cook' + '?recipe=http://example.com/cookie.html','post', (…) }); } </script> </head> <body> (…) <form> <input type="button" value="Cook" onclick="postCook()" /> </form> </body> </html>
  37. 37. Face… it
  38. 38. changing interface…
  39. 39. crowdsourcing crawling & indexing affiliation social sub-networks
  40. 40. analyse réseaux sociaux web 2.0 & dynamique © FriendViz © Obama’s network, Recorded Future © Egyptian Revolution on Twitter, A. Panisson, Gephi © Facebook
  41. 41. une représentation est modifiée par un commentaire contenu essentiel, lié à une ressource spécifique (un article) vs contenu accessoire, lié à une règle non-essentielle (un commentaire)
  42. 42. une ressource change : une question devient une réponse parfois… ?  !
  43. 43. suppression définitive ni ressource, ni représentation
  44. 44. gérér sa bibliographie : Zotero et Coins
  45. 45. extraction de données « page » donnant l’analyse du texte d’une autre « page »
  46. 46. made in web
  47. 47. auteurs?
  48. 48. journal confusion des genres?
  49. 49. permanence/ non permanence
  50. 50. raccourcisseur d’URL et re-captcha…
  51. 51. des jeux utiles au crowdsourcing le web comme une plateforme d’externalisation distribuée de masse. Fold It
  52. 52. temps facebook 16.2 millions secondes/seconde x 16 203 703 253
  53. 53. l’utilisateur utilisé le web comme une machine universelle de moteurs à pulsions (méta)-données
  54. 54. application web
  55. 55. jeuHTML5
  56. 56. Mario Kart en HTML5 (ouf !) …
  57. 57. jouer dans le navigateur : le cloud
  58. 58. © HTML5Rocks download upload drag & drop
  59. 59. © HTML5Rocks speech input geolocation
  60. 60. © HTML5Rocks html & js html & svg WebGL
  61. 61. inputs, text, email, number, phone ©HTML5Rocks
  62. 62. HTML pages of specifications 39 pages 963 pages HTML 1
  63. 63. Ligne de Temps
  64. 64. annotations des éléments multimédia • description sémantique de ressources multimedia [Media Annotation] • adressage d’éléments internes aux ressources [Media Fragment]
  65. 65. fragment multimédia • partie fragment de l’URL = après le # http://www.example.com/example.ogv#track=audio&t=10,20 • dimensions: – temporelle: t=10,20 / t=npt:,0:02:01.5 / t=clock:2009-07-26T11:19:01Z – spatiale: xywh=pixel:160,120,320,240 / xywh=percent:25,25,50,50 – track: track=1 / track=video&track=subtitle / track=Wide – nommée: id=chapter-1 • fragment non transmis par le navigateur: encodage dans la requête HTTP
  66. 66. ontologies des ressources multimédias ontology for Media Resources 1.0 <video.ogv> a ma:MediaResource ; ma:hasTrack <video.ogv#track=audio>, <video.ogv#track=subtitle>; ma:hasSubtitling <video.ogv#track=subtitle> ; ma:hasSigning <video.ogv#xywh=percent:70,70,90,90> . <video.ogv#track=audio> a ma:AudioTrack ; ma:hasLanguage [ rdfs:label "en-GB" ] ; ma:hasFragment <video.ogv#track=audio&t=10,20> . <video.ogv#track=audio&t=10,20> a ma:MediaFragment ; ma:hasLanguage [ rdfs:label "fr" ] . <video.ogv#track=subtitle> a ma:DataTrack ; ma:hasLanguage [ rdfs:label "es" ] . <video.ogv#xywh=percent:70,70,90,90> a ma:MediaFragment ; ma:hasLanguage [ rdfs:label "bfi" ] .
  67. 67. universelle une interface programmatique serveur application HTTP HTTP application navigateur HTTP
  68. 68. design & affordance ceci est un ovetto
  69. 69. affordance sémantique
  70. 70. SAWSDLsemantic annotation of WSDL (W3C Rec. 2007)
  71. 71. SAWSDL…
  72. 72. sémantiquement services annotés et recherchés fournisseurserviceclientdemandeur annuaire 3 12
  73. 73. pre-populating…
  74. 74. entrée sortie
  75. 75. assistant’s phone phone  namename phone name employee assistant
  76. 76. workflows scientifiques • composer des données et traitements distribués • échanger et comparer les traitements et leurs compositions
  77. 77. se lierau monde
  78. 78. Le bug de l’an… 2020 ( inspiration Gérard Berry) SSRSSLSSS SSLSSLSSS 
  79. 79. 1 sec. battement de cœur 1/2 sec. double click 24 images/sec. film 500 000 décisions / sec. algorithmes boursiers« Aliénation et accélération. » Hartmut Rosa
  80. 80. http://mon.org/ma/ressource  règles négociation calculs composition rendu … … … … … … … DNS, TCP/IP, Web …
  81. 81. http://mon.org/ma/ressource  règles négociation calculs composition rendu … … … … … … … … DNS, TCP/IP, Web GET
  82. 82. 30 min…
  83. 83. 5 jours…
  84. 84. le livre n’est pas recréé à chaque page
  85. 85. Stéphane Crozat: « le document numérique n'existe pas, ce qui existe ce sont des constructions numériques dont le traitement calculatoire simule un ordre documentaire. »
  86. 86. Le juridique aussi souffre de l’héritage documentaire des données
  87. 87. nouveaux engagements, contrats • contrats de lecture + computationnel • contrats d’identification + computationnel • contrats d’accès + computationnel • contrats de publication + computationnel • contrats de stockage + computationnel • etc. « il n’y a plus de documents, le besoin de documentariser n’en n’est que plus fort. »
  88. 88. tant à venir
  89. 89. le web entre nous et le monde • documents & données augmentent nos perceptions • services & applications augmentent nos actions • incontournable &… ingérable?
  90. 90. réalité augmentée par le web & augmentation du web par le réel • vers une réalité augmentée par le web • diversité des ressources web augmentée par diversité des ressources de notre réalité • « documentarisation non documentaire » de la réalité par le web • modèle documentaire rendu minoritaire / modèle calculatoire • limite de la métaphore de la bibliothèque • une toile de ressources informatiques
  91. 91. google glass project
  92. 92. chaque utilisateur est un détecteur web de « consommacteurs » mobiles, « crawlers » du web & du monde physique ex. Wikimapia, OpenStreetMap , etc. © Medialab Prado © GeoSensor
  93. 93. Image,T. Berners-Lee, RuleML kickoff, 2005 une toile de données multiples entre différents barreaux de l’échelle des sphères « small data & big data »
  94. 94. web…devices … Web Phone … Web TV … Web Radio … Web Car … Web Tablet … Web eBook … Web Watch … Web GPS … [Web of Devices]
  95. 95. cintre Facebook chez C&A Brésil
  96. 96. nouvelles topologies du web ex. « near field communication »
  97. 97. Open Street Map dans le métro
  98. 98. navigateur web = interface universelle ex. domotique
  99. 99. Web 2.0 & Web Physique
  100. 100. RFID&URI ex. Live Social Semantics fabien
  101. 101. Janet Echelman, “Her Secret is Patience”, Civic Space Park, Phoenix, AZ, USA, 2009
  102. 102. plusieurs évolutions concourantes • explosion multimédia et multi-modalité • toile de ressources computationnelles liées • ressources comme locus de calcul • assimilation de tous les objets à des ressources web
  103. 103. l’effet diligenceJacques Perriault
  104. 104. (méta) web
  105. 105. liens d’association du mémex entre les informations qui nous importent [Vannevar Bush, 1945]
  106. 106. hypertexte, hypermédia une structure de fichier pour l’information complexe, changeante et indéterminée [Ted Nelson, 1965]
  107. 107. à travers le réseau liens utilisant des références http://www. [Tim Berners-Lee, 1989]
  108. 108. hypertexte et document sur le Web : de la nécessité de les reconstruire par assemblages Hypertexte : Google Document : Scenari Le Web à la base n’est pas un hypertexte : il ne relie pas des documents. mais il peut le devenir ou accueillir des documents car c’est aussi une plateforme ouverte… …
  109. 109. structuré vers un web
  110. 110. séparer forme et contenu
  111. 111. 2008 XML a eu dix ans <balise>…</balise> XML en 10 points http://www.w3.org/XML/1999/XML-in-10-points.fr.html structurer des données en utilisant des balises dans un format textuel construction modulaire une famille de langages un format ouvert non propriétaire
  112. 112. XMLbien formé <racine>...</racine> <x>...</x> ou <x/> <a><b></a></b> <x> <X> <1an> <xmla> <bla bla> <a b='c'></a> ou <a b='c'/>
  113. 113. de langages Scalable Vector Graphics (SVG) XML Topic Maps (XTM) Synchronized Multimedia Integration Language (SMIL) eXtensible Access Control Markup Language (XACML) OpenOffice Schemas MusicML MathML Financial products Markup Language (FpML) GPS Exchange format (GPX) NewsML WSDL Chemical Markup Language (CML)XHTML famille
  114. 114. namespace • espaces de nommage • éviter les collision de noms • associer un préfixe de balise à un URI • exemple • définitions héritées dans l’arbre XML • namespace par défaut xmlns="…" <ugb:note xmlns:ugb='http://www.ugb.sn/'>18</ugb:note> <bla:note xmlns:bla='http://www.ugb.sn/'>18</bla:note>
  115. 115. ontos logos être / êtres discours / science “JacobLorhard's"OgdoasScholastica"(1606)containsthefirstoccurrenceoftheterm ‘ontologia’”RaulCorazzononformalontology.it
  116. 116. -> Ontologie ontologie
  117. 117. votre réponse est basée sur une ontologie partagée je peux comprendre vous pouvez raisonner
  118. 118. Document Book Novel Short story sous type
  119. 119. sous type #12 #21 #47 #48 "document" "book" "livre" "novel" "roman" "short story" "nouvelle" #21  #12 #48  #21#47  #21
  120. 120. #21  #12 #48  #21#47  #21 connaissanceontologique formalisée #12 #21 #47 #48
  121. 121. ontologie n’est pas un synonyme de taxinomie
  122. 122. la connaissance taxinomique est une connaissance ontologique parmi d’autres
  123. 123. partie de carbone hydrogèneoxygène dioxyde de carbone dioxygène ozone dihydrogène méthane éthane méthanol éthanol eauphénol méthyle
  124. 124. combiner différents types de connaissances ontologiques Hierarchical model of the shape of the human body. D. Marr and H.K. Nishihara, Representation and recognition of the spatial organization of three-dimensional shapes, Proc. R. Soc. London B 200, 1978, 269-294). LimbIndividual Cat Organic object
  125. 125. couverture dans quelle mesure les primitives mobilisées par les scénarios sont couvertes par l’ontologie
  126. 126. spécificité dans quelle mesure les primitives sont précisément déclarées dans l’ontologie
  127. 127. granularité dans quelle mesure les primitives sont détaillées
  128. 128. exemple granularité [Charlet - RFIA 2002] 1. Patient-Masculin Patient-Féminin 2. [Patient]  (chrc)  [Masculin] [Patient]  (chrc)  [Féminin] 3. [Patient]  (attr)  [Sexe]  (val)  [Masculin] [Patient]  (attr)  [Sexe]  (val)  [Féminin]
  129. 129. dans quelle mesure les primitives sont décrites dans un langage formel formalité
  130. 130. méthodes ex. rigidité dans Onto Clean [Guarino & Welty] Rigid +R  is a necessary property for all its instances Anti-Rigid ~R  is an optional property for all its instances Person is y+R, Student is ~R Constraint: ~R can't subsume y+R
  131. 131. structurer une “folksonomie” folksonomies platesweb 2.0 pollution pollution des sols has narrower polluant énergie related related thesaurus ? SKOS
  132. 132. combinaison espaces métriques distances d’édition Monge-Elkan Soundex, JaroWinkler, asymétrie Monge-Elkan Qgram métrique contextuelle cosinus vecteur de cooccurrences de tags métriques sociales inclusion de communautés d’intérêt
  133. 133. 83 027 relations / 9 037 tags  68 633 related  11 254 hyponyms  3 193 spelling variants ex. ademe TheseNet
  134. 134. recherches & retours
  135. 135. ex. propagation sémantique sel, eau poivre, vin moutarde rugby, foot foot, ciné hockey sport sport sport condiment condiment condiment from RAK/LP to SemTagP
  136. 136. ex. Ademe 1 pollution ; 2 développent durable ; 3 énergie ; 4 chimie ; 5 pollution de l’air ; 6 métaux ; 7 biomasse ; 8 déchets.
  137. 137. langages de formalisation d’ontologies
  138. 138. exemple (define-class humain (?humain) :def (animal ?humain)) subsomption dans les frames
  139. 139. exemple (defprimconcept MALE) (defprimconcept FEMELLE) (disjoint MALE FEMELLE) classes disjointes en logiques de description
  140. 140. exemple [Concept: Directeur]->(Def)-> [LambdaExpression: [Personne: ]->(Dirige)->[Groupe]] classe définie en graphes conceptuels
  141. 141. sémantique vers un web
  142. 142. le web originel liens typés…
  143. 143. web sémantique mentionné par Tim BL en 1994 à WWW [Tim Berners-Lee 1994, http://www.w3.org/Talks/WWW94Tim/]
  144. 144. RDF, toute connaissance est décomposée en triplets ( sujet , prédicat , objet ) arcs ( nœud, arête , nœud )
  145. 145. ex : doc.html a pour auteur Fabien et a pour thème la Musique
  146. 146. doc.html a pour auteur Fabien doc.html a pour thème Musique
  147. 147. Fabien auteur doc.html thème Musique
  148. 148. <RDF/> une syntaxe XML pour mieux échanger ces graphes
  149. 149. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22- rdf-syntax-ns#" xmlns:inria="http://inria.fr/schema#" > <rdf:Description rdf:about="http://inria.fr/rr/doc.html"> <inria:author rdf:resource= "http://inria.fr/~fabien#me" /> <inria:theme>Music</inria:theme> </rdf:Description> </rdf:RDF>
  150. 150. nœuds anonymes (blank nodes) http://bu.ch/l23.html auteur "Les zélés faons roses" titre "Laurent" nom "Trichard" prenom quantification existentielle il existe une ressource telle que… {  r ; …} <rdf:Description rdf:about="http://bu.ch/123.html "> <auteur> <rdf:Description> <nom>Trichard</nom> <prenom>Laurent</prenom> </rdf:Description> </auteur> <titre>Les zélés faons roses</titre> </rdf:Description>  x ; auteur(http://bu.ch/123.html,x) nom(x,"Trichard") prenom(x,"Laurent")
  151. 151. interroger avec SPARQL SPARQL Protocol and RDF Query Language
  152. 152. exemple personne ayant au moins 18 ans PREFIX ex: <http://inria.fr/schema#> SELECT ?person ?name WHERE { ?person rdf:type ex:Person ?person ex:name ?name . ?person ex:age ?age . FILTER (?age > 17) }
  153. 153. web de données première vague de déploiement du web sémantique (RDF, SPARQL)
  154. 154. May 2007 April 2008 September 2008 March 2009 September 2010 Linking Open Data Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/ September 2011 0 100 200 300 400 10/10/2006 28/04/2007 14/11/2007 01/06/2008 18/12/2008 06/07/2009 22/01/2010 10/08/2010 26/02/2011 14/09/2011 01/04/2012
  155. 155. e.g. DBpedia
  156. 156. CORESE/ KGRAM
  157. 157. contenus et thématiques Domaines Nombre de jeux de données Triplets % Liens sortants % Media 25 1 841 852 061 5,82 % 50 440 705 10,01 % Géographique 31 6145 532 484 19,43 % 35 812 328 7,11 % Gouvernement 49 13 315 009 400 42,09 % 19 343 519 3,84 % Publications 87 2 950 720 693 9,33 % 139 925 218 27,76 % Inter-domaine 41 4 184 635 715 13,23 % 63 183 065 12,54 % Sciences de la vie 41 3 036 336 004 9,60 % 191 844 090 38,06 % Contenu utilisateur 20 134 127 413 0,42 % 3 449 143 0,68 % 295 31 634 213 770 503 998 829 42% 20% 13% 10% 9% 6% 0% Gouvernement Géographique Inter-domaine Sciences de la vie Publications Media Contenu utilisateur
  158. 158. data.ratatouille.com
  159. 159. principes  utiliser le format RDF  utiliser des URI pour nommer  utiliser des URI HTTP (URL) pour que l’on puisse les suivre  lorsqu’un URI est suivi donner des informations (HTML, RDF)  inclure dans ces informations des liens vers d’autres données
  160. 160. DNScelui qui contrôle le nom de domaine contrôle le déréférencement. ex. bit.ly & Lybie .fr * .inria isicil
  161. 161. (June 2012)
  162. 162. le cas de la France mouvement d'ouverture des données mais… • redondance des identifiants • hétérogénéité des formats • diversité des vocabulaires • hétérogénéité des accès
  163. 163. publication processus démo • installation en un click • import de données trouvées en ligne • transformation en RDF • publication sur le web • interrogation directe
  164. 164. RDFS pour définir les classes de ressources, leurs propriétés, et organiser leur hiérarchie Document Rapport créateur auteur Document Personne
  165. 165. OWLin one… par énumération par intersection par union par complément  la disjonction par restriction! par cardinalité 1..1 prop. algébriques par équivalence [>18] union disjointe restrict. valeur prop. disjointes cardinalité qualifiée 1..1 ! négation prop. indiv prop. chainées   clefs …
  166. 166. alignements et liage ontologies et entités nommées • « Ontology Alignment Evaluation Initiative » • reconnaissance d’entités nommées • liage de ressources
  167. 167. OKKAM et owl:sameAs 1 “The logical consequences are the heart of the conceptual problem raised by the use of owl:sameAs. In fact, suppose one wants to answer the query: where does John teach and what? One will make the following query on the merge of the two datasets: < x , y >: http : // U NI1 / resource / John @ : af f iliation x ∧ http : // U NI1 / resource / John @ : teaching y Certainly, if the query is processed on the merge of the two datasets of John’s academic profiles, one would get the expected results, i.e., that John teaches philosophy of language at UNI1 and logic at UNI2. 22 The problem is that one would also get the unwanted results that John teaches logic at UNI1 and philosophy of language at UNI2.” (Web of Data and Web of Entities: Identity and Reference in Interlinked Data in the Semantic Web Paolo Bouquet · Heiko Stoermer · Massimiliano Vignolo)
  168. 168. OKKAM et owl:sameAs 2
  169. 169. « when owl:sameAs is not the same » (H. Halpin, I. Herman, P. Hayes) des représentations de ressources jugées identiques peuvent néanmoins diverger. ex. : si ma ressource est l’élément sodium… • OpenCyc : un élément est l’ensemble de tous les fragments de cet élément à l’état pur • DBpedia : inclut en outre les isotopes de sodium (nombre de neutrons différent)  deux vue sur la même chose ou deux objets différents ?
  170. 170. chaine GATE : exemple en biologie…
  171. 171. thesaurus, classifications, sujets, taxinomies, folksonomies, ... vocabulaires contrôlés
  172. 172. expression naturelle pour dénoter un concept inria:CorporateSemanticWeb skos:prefLabel "corporate semantic web"@en; skos:prefLabel "web sémantique d'entreprise"@fr; skos:altLabel "corporate SW"@en; skos:altLabel "CSW"@en; skos:hiddenLabel "web semantique d'entreprise"@fr. labels
  173. 173. entre conceptsinria:CorporateSemanticWeb skos:broader w3c:SemanticWeb; skos:narrower inria:CorporateSemanticWiki; skos:related inria:KnowledgeManagement. relations
  174. 174. inria:CorporateSemanticWeb skos:scopeNote "only within KM community"; skos:definition "a semantic web on an intranet"; skos:example "Nokia's internal use of RDF gateway"; skos:historyNote "semantic intranet until 2006"; skos:editorialNote "keep wikipedia def. uptodate"; skos:changeNote "acronym added by fabien".
  175. 175. beaucoup de données dans beaucoup de pages
  176. 176. R2RML une transformation standard d’une base relationnelle en RDF schéma mapping
  177. 177. Triplets produits : • cellules d’une ligne  sujet commun • noms des colonnes  prédicats • une cellule  un objet • liens entre tables nom prenom age filar alain 34 seger thomas 45 #s1 :nom "filar" #s1 :prenom "alain" #s1 :age "34" #s2 :nom "seger" #s2 :prenom "thomas" #s2 :age "45" #s3 …
  178. 178. exemple de mapping ISBN Author Title Year 0006511409X id_xyz The Glass Palace 2000 ID Name Homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com http://…isbn/000651409X Ghosh, Amitav http://www.amitavghosh.com The Glass Palace 2000 a:name a:homepage a:author I. Herman, W3C
  179. 179. (1) transformation table personnes ISBN Author Title Year 0006511409X id_xyz The Glass Palace 2000 ID Name Homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com http://…isbn/000651409X Ghosh, Amitav http://www.amitavghosh.com The Glass Palace 2000 a:name a:homepage a:author :P_Table rdf:type rr:TriplesMap ; rr:subjectMap [ rr:termtype "BlankNode" ; rr:column "ID" ; ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate a:name ]; rr:objectMap [ rr:column "Name" ] ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate a:homepage ]; rr:objectMap [ rr:column "Homepage" ; rr:termtype "IRI" ] ] ; I. Herman, W3C
  180. 180. (2) transformation table livres ISBN Author Title Year 0006511409X id_xyz The Glass Palace 2000 ID Name Homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com http://…isbn/000651409X Ghosh, Amitav http://www.amitavghosh.com The Glass Palace 2000 a:name a:homepage a:author I. Herman, W3C :B_Table rdf:type rr:TriplesMap ; rr:subjectMap [ rr:template "http://...isbn/{ISBN}"; ]; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate a:title ]; rr:objectMap [ rr:column "Title" ] ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate a:year ]; rr:objectMap [ rr:column "Year" ; ] ] ;
  181. 181. (3) lier les tables ISBN Author Title Year 0006511409X id_xyz The Glass Palace 2000 ID Name Homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com http://…isbn/000651409X Ghosh, Amitav http://www.amitavghosh.com The Glass Palace 2000 a:name a:homepage a:author I. Herman, W3C :B_Table a rr:TriplesMap ; ... rr:refPredicateObjectMap [ rr:refPredicateMap [ rr:predicate a:author ]; rr:refObjectMap [ rr:parentTriplesMap :P_Table ; rr:joinCondition "{child}.Author = {parent}.ID" ] ] ].
  182. 182. RDFa signifie RDF dans des attributs de HTML <div xmlns:dc="http://purl.org/dc/elements/1.1/"> <h2 property="dc:title">The trouble with Bob</h2> <h3 property="dc:creator">Alice</h3> ... </div>
  183. 183. provenance, confiance, explication, “At the toolbar (menu, whatever) associated with a document there is a button marked "Oh, yeah?". You press it when you loses that feeling of trust. It says to the Web, "so how do I know I can trust this information?". The software then goes directly or indirectly back to metainformation about the document, which suggests a number of reasons.” Tim Berners-Lee, Consistent User Interface, W3C Design Issues, 1997 Oh,yeah?
  184. 184. en insérant des étiquettes émises par des autorités dans les pages protéger les enfants <meta http-equiv="pics-label" content='(PICS-1.1 "http://www.icra.org/ratingsv02.html" labels for "http://mm.256.com/" generic true ratings (cz 1 la 1 lb 1 lc 1 nz 1 oz 1 vz 1) "http://www.rsac.org/ratingsv01.html" labels for "http://mm.256.com/" generic true ratings (n 0 s 0 v 0 l 4) )' />
  185. 185. VoID: décrire des sources de données schéma pour annoter des jeux de données :DBpedia a void:Dataset . et des jeux de liens :DBpedia_Geonames a void:Linkset .
  186. 186. :DBpedia a void:Dataset; void:sparqlEndpoint <http://dbpedia.org/sparql>; void:feature :RDFXML ; void:subset :DBpedia2Geonames ; void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ; dcterms:modified "2008-11-17"^^xsd:date; dcterms:title "DBPedia"; dcterms:description "RDF data extracted from Wikipedia"; dcterms:publisher :DBpedia_community; dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>; dcterms:source <http://dbpedia.org/resource/Wikipedia>. :Geonames a void:Dataset; void:sparqlEndpoint <http://geosparql.appspot.com/query>; void:triples "107983838"^^xsd:integer ; dcterms:subject <http://dbpedia.org/resource/Location> . :DBpedia2Geonames a void:Linkset ; void:linkPredicate owl:sameAs ; void:target :DBpedia ; void:target :Geonames . ex. DBpedia dataset
  187. 187. provenance & traçabilité[Provenance WG]
  188. 188. PROV-DM & PROV-O OWL2 ontology décrire les entités et activités impliquées dans la production, livraison, etc. d’un objet ex1:aggregated prov:used ex1:dataSet2, ex1:regionList2 . ex1:aggregate2 prov:wasGeneratedBy ex1:aggregated . ex1:illustrated prov:used ex1:aggregate2 . ex1:chart2 prov:wasGeneratedBy ex1:illustrated . ex1:aggregated prov:wasControlledBy ex1:derek . ex1:dataSet2 prov:wasRevisionOf ex1:dataSet1 . ++
  189. 189. description authentifiée plusieurs ressources listes domaines, chemins expressions régulières
  190. 190. grouping mechanisms... ... list URIs ... domain names, paths ... regular expressions on URIs
  191. 191. exemple de description POWDER « toute ressource dont l’URI commence par http://www-sop.inria.fr/fr/ concerne le centre de recherche de l’INRIA géographiquement situé à Sophia Antipolis et est en français » certifié par inria.fr
  192. 192. préjugés, fausses idées
  193. 193. boite noire éviter de construire une
  194. 194. explicites rendre les conceptualisations
  195. 195. à base d’ontologie ne signifie pas que l’on a besoin d’un moteur d’inférence.
  196. 196. de l'intérêt d'un à peu près… ma montre n'a qu'une aiguille mais elle n'est pas cassée.
  197. 197. sens et position d’une taxonomie à une vue ar a=120° 360°0°
  198. 198. “semantic web” and not “semanticweb” [C. Welty, ISWC 2007] “a lightweight ontology allows us to do lightweight reasoning” [J. Hendler, ISWC 2007]
  199. 199. 66 FOAF primitives 3 475 908 348 references (2) x 52 millions “a small tree ruling a big graph”(1) (1) Franck Van Harmelen, ISWC 2011 (2) Libby Miller, 2009
  200. 200. le piège du domaine le domaine d’application n’est pas forcément celui de l’ontologie
  201. 201. universelle je n’ai jamais vu une ontologie
  202. 202. Trouble dans la classification (F. Rastier)
  203. 203. la vache folle ou l’ontologue végétarien s:MadCow rdfs:subClassOf s:Cow
  204. 204. gestion besoin conception diffusion utilisationévaluer évolution cycle vie
  205. 205. modèle changeant brique de construction vs.
  206. 206. tri sélectif sémantique le web est une poubelle, le web sémantique sera une poubelle sémantique.
  207. 207. et pour nous
  208. 208. hyper-documentaire de l’article scientifique à l’hyper-article multi-public plus vieille facette, mais encore sous exploitée
  209. 209. donnez des URL aux contenus une URL est un nom, sans URL pas de nom, sans nom je ne peux pas en parler • référence • granularité • vues
  210. 210. nouvelles formes de rédaction… • systématiquement enrichir de liens • identifier des cibles internes et externes • identifier les persona de notre public • permettre des parcours multimédias idoines « produire une hyper-ressource, c’est hyper long… c’est même jamais vraiment fini. »
  211. 211. forme / fond, structure, sémantique • jeux de données scientifiques entrées et sorties • des schémas de données développer http://ns.inria.fr • Ex en biologie: HCLS IG • SPARQL: recherche de liens, motifs et chaines • référentiels métiers et domaines nos termes, nos définitions, nos thésaurus, ... ex. SHOINQ < ALC < Logique de Description < Langage Logique <XML/>
  212. 212. utilités ? scénarios ? • reproductibilité et comparatifs • permettre d’autres expérimentations / algo • ex. OAEI: – Visibilité et citation – Alignement de domaines, sources, résultats, etc. • journalisme de données • génération de liens, restructuration, ranking
  213. 213. le web comme écriture collective • ouverture en écriture... collective – ne plus centraliser la rédaction: distribuer, aider, … – « utilisacteur »: nos lecteurs peuvent aider à vulgariser, reformuler, enrichir • ouverture en écriture collective ... – ne plus centraliser la rédaction: animer, solliciter – participer à d’autres sites: ex. wikipedia (édition, ref.)
  214. 214. nouvelles formes de publication… • soumissions immédiatement publiques • revues sollicitées et processus rendus publics • ouvert aux commentaires et revues spontanés • éditeur scientifiques vs. web ouvert • nouveaux modes opératoires, nouveaux critères
  215. 215. nouvelles conférences • suivre l’ensemble de la conférence • percevoir les avis, réactions, questions • interroger, réagir • compléter, traduire, augmenter
  216. 216. socialité centrée ressource • objets cristallisant une activité sociale et vice-versa • bis repetita placent… « online or invisible » • e.g. médiathèque sociale (vidéos, images, etc.) – commentaires, tagging, etc. site ouvert à tous – contributions ouvertes en interne • e.g. « e-CRDP » – cartographie intervenants et matériels pédagogiques – ex. un compte slideshare, service interne… + animation • interstice socialisé: réactions, tagging, etc. …
  217. 217. au-delà du Buzz • orchestrer la communication et sa contagion • gérer notre présence en ligne • faire explicitement appel au peuple (sondages, campagnes de test, etc.) • faire implicitement appel au peuple (tagging, bookmarking, etc.) • cartographie interne et externe de nos réseaux
  218. 218. nos algorithmes en ligne • fournisseurs de services de haut niveau (bibliothèque, QoS, certification, etc.) • démonstrateurs / testeurs ex. traitement d’image • services, API et widgets • galerie, maintenance, serveur application HTTP HTTP application navigateur HTTP ex. « pseudo haptic »…
  219. 219. label sur des ressources web • authentifier des ressources • valider des données • sécuriser des accès • certifier des services …
  220. 220. interfaces et utilisateurs partout • HTML5: de la page à l’application nouvelles formes de production et consultation • consommation opportuniste, contextuelle, etc. • contenus multi-formats (ex. podcasts interstices) • Accessibilité ? • App. INRIA ?
  221. 221. doggy-bags
  222. 222. web 1, 2
  223. 223. price convert? person homepage? more info? web 1, 2, 3
  224. 224. lier le monde lier les données
  225. 225. webrecommandations html http url html httpurl uri iri ataguaagwcag aria mwbpearlra cc/pp assxcss ddrsa xml eve. exi geo apidom xform grddl inkml its cmwww ruby an.xhtml rdfa ets omr m. ok emma p3pmath ml mf pics qa rif sec cont. sawsdlpng powder sml soap wsdl svg awwwttml smile rdf owlrdfssparql etc. woff webcgm xbl xkms xlinkwscdl wsp skos ns canon. x dtxml xproc xfragxml xbase xschema xml:id xpath xpointer xqueryxsignat. xbop xslt xslfo …
  226. 226. Leçon 1: faire une application web o HTML 5 o CSS 2.1 o CSS 3 Selectors o CSS 3 Media Queries o CSS 3 Text o CSS 3 Backgrounds and Borders o CSS 3 Colors o CSS 3 2D Transformations o CSS 3 3D Transformations o CSS 3 Transitions o CSS 3 Animations o CSS 3 Multi-Columns o CSS Namespaces o SVG 1.1 o WAI-ARIA 1.0 o MathML 2.0 o ECMAScript 5 o 2D Context o WebGL o Web Storage o Indexed Database o Web Workers o Web Sockets Protocol/API o Geolocation o Server-Sent Events o Element Traversal o DOM Level 3 Events o Media Fragments o XMLHttpRequest o Selectors API o CSSOM View Module o File API o RDFa o Microdata o WOFF o HTTP 1.1 o TLS 1.2 (updated) o IRI (updated) o … W3C
  227. 227. i=j;réplication et bien anti-rival… à l’échelle du monde.
  228. 228. socialisation intensive de nos activités.
  229. 229. WEBscience 263
  230. 230. informel formel usage représentation un et un seul web… données personnes documents programmes un espace unique dans tous les sens du terme, une toile hybride metadata gestion-orientée métadonnée • diversité de ressources (données ou non) • métadonnées & schéma pour leur gestion • importance du web sémantique dans ce contexte
  231. 231. demain,celui qui contrôlera les métadonnées, contrôlera le web.

×