Cette contribution au Web social sémantique examine l'usage des ontologie pour un système identifiant des relations sémantiques à partir de la cooccurrence de mots clics dans l'environnement Twitter.
Émergence de liens sémantiques à partir du marquage social
1. Émergence de liens sémantiques à
partir du marquage social
– une contribution au web social sémantique
ACFAS 2017
Colloque: Le Web sémantique, à l’intersection du Web des
données et de l’intelligence artificielle
1
Sylvain Rocheleau et Gilbert Paquette
Laboratoire d’ingénierie cognitive et éducative (LICÉ)
www.lice.licef.ca
Centre de recherche LICEF. TELUQ
2. Travaux au LICÉ en ingénierie
cognitive
Éditeurs
GMOT+OWL
GMOT+RDFS
GOWL
Gestion des
ressources
COMÈTE
Ateliers d’IC
ADISA
TELOS
Taxonomies MISA
(16) ontologies
COMP et SCEN
3. Vers le Web social sémantique
3
Dimension communication
Dimensionconnaissances
2.0
Web social
(Wikis, blogues, réseaux,…)
1.0
Web de documents
(URIs, HTML, HTTP)
4.0
Web social sémantique
3.0
Web sémantique
(RDF, RDFS, OWL, SKOS,
SPARQL)
C
S
9. De la nature « libertine » du taggage
social
9
#BonneChancePourManalyserphrase
#jamaisVuSteMotDansUnDictagglutination
#IoTacronyme
abréviation #Prom
fourre-tout #OMDcéCompliqué
Comment tirer un sens de tout ça?
17. 17
Résultats d‘expérimentation
1. Augmentation du nombre de contenus
recueillis de 65% à 75%
2. Validation des données recueillies
auprès de 2 évaluateurs externes
3. Cohérence thématique maintenue
19. Applications de la recherche
19
1. Suivi de discussion sur Twitter
2. Expansion de requêtes en recherche
d'informations
3. Création d'ontologies
4. Mise en place d'outils de suggestions
de contenu
5. Organisation d'archives.
Notes de l'éditeur
Le web social sémantique constitue une évolution récente visant l’analyse des données générées par l’interaction entre les usagers des médias sociaux en utilisant les ontologies et les langages de représentation des connaissances du web sémantique.
D’entrée de jeu, nous survolerons les principales ontologies du web des données ouvertes et liées (FOAF, SIOC et SCOT), utiles au traitement des données du web social, ainsi que les apports mutuels de ces deux types de technologies web au sein de quelques applications.
Puis, nous présenterons les résultats d’une recherche durant laquelle nous avons observé la formation de champs lexicaux à l’intérieur de folksonomies en fonction de la cooccurrence entre mots-clés. Notre expérimentation a également démontré qu’il est possible d’établir des liens sémantiques de type partie-tout entre mots-clés faisant partie d'un même champ lexical.
Notre plus grand défi a consisté à établir ces liens sémantiques en l'absence de ressources linguistiques telles que des dictionnaires ou des thésaurus puisque souvent les mots-clics utilisés par les utilisateurs sont des néologismes, des abréviations ou encore des mots composés.
Les applications de la découverte de liens sémantiques entre mots-clés appartenant à une folksonomie sont vastes et pourraient être utiles entre autres à l'expansion de requêtes en recherche d'informations, à la création d'ontologies, à la mise en place d'outils de suggestions de contenu ou encore à l'organisation d'archives.
Brève présentation du LICÉ
Principales réalisations.
Évolution du Web.
Le web social sémantique est un évolution relativement récente visant
-l’analyse des données générées par l’interaction entre les usagers des médias sociaux
-en utilisant les ontologies et les langages de représentation des connaissances du web sémantique.
Nous allons vous présenter un premier travail de doctorat réalisé au LICÉ dans ce domaine.
Vocabulaires: Cartes conceptuelles
Taxonomie, EX: tables des matières
Thésaurus: concepte hierarchique ou associatifs (SKOS)
Ontologies: un vocabulaire auquel on aura rajouté un certain nombre d'axiomes sur les classes RDFS ou OWL
Ex: tous les livres ont un auteur.
GMOT: cartes conceptuelles + Versions RDFS et OWL
GOWL
MONTRER UN EXEMPLE: LOM
Utilisation des standard du Web sémantique
Accessibilité via un espace de noms
Faire référence à d'autres vocabulaires
Vocabulaire bien documenté
Métadonnées
Un exemple important de vocabulaire est l'ontologie SIOC qui visent à décrire les composantes des communautés sur le Web social et leurs interactions.
SIOC se compose de 12 classes et 79 propriétés dont voici les principales. Commencer par USER GROUP
Décrire le graphe.
Il utilise principalement les schéma de données RDFS, FOAF, DCTERMS et RDF et est très largement utilisés par d'autres vocabulaires (21 dans LOV).
SCOT est centrée sur l’annotation (marquage ou « taggage ») dans les média sociaux .
3 classes et 36 propriétés en RDFS
Une extension de SIOC utilisant les schémas de données FOAF, DCTERM, XSD,....
Pas réutilisé dans le LOV
Graphe réalisé dans GMOT-RDFS à partir de la spécification SCOT
Décrire le Graphe et son écosystème: RDFS, SIO, FOAF, XSD
Utilisation dans des environnements comme Twitter, Facebook, Utube, Flicker, ....
Passer la parole à Sylvain