QWAM CONTENT INTELLIGENCE
Aproged – 9 Juin 2015
Les technologies liées à la gestion de
contenus professionnels, levier de la
transformation numérique
AGENDA DE LA SESSION
 Les nouvelles tendances générales et technologiques
liées à la gestion de contenus professionnels (textuels)
• Gestion de flux numériques (textuels et multimédia)
• Enrichissement de contenus
• Moteur de recherche spécialisé
• Agrégation et extraction d’informations web
 Présentation des solutions Qwam
 Cas d’usage
QWAM CONTENT INTELLIGENCE
Tendances générales
ETAT DES LIEUX
MULTIPLICATION DES FLUX NUMÉRIQUES
 Flux externes
Fournisseurs de
contenus spécialisés
Flux RSS
Flux presse
et média
Revues et journaux
électroniques
Sites web
Moteurs
web
Bases de
données web
ETAT DES LIEUX
MULTIPLICATION DES FLUX NUMÉRIQUES
 Flux internes
Flux et échanges
partenaires
Systèmes
éditoriaux
Publications internes
(mktg, com, …)
CMS, GED diverses
Sites et flux
intranet
Moteurs intranet
Bases de
données métier
TECHNOLOGIES LIÉES AUX CONTENUS
Quatre familles de
problématiques dans les
applications
- Gestion des flux textuels et
multimédia
- Enrichissement de contenus
- Moteur de recherche
- Agrégation et extraction
d’informations web
GESTION DES FLUX TEXTUELS ET MULTIMÉDIA
LES TENDANCES GÉNÉRALES
 Flux multiples textuels/media hétérogènes en
croissance
• Applications internes
• Web
• Fournisseurs de contenus et d’applications (via le web)
 Flux continu
 Multimédia, multilingue
ENRICHISSEMENT DE CONTENUS
LES TENDANCES GÉNÉRALES
 Transition de l’enrichissement manuel historique (via
GED) à l’enrichissement semi-automatique ou
automatique
• Concerne les éditeurs/fournisseurs de contenus et les
« grands » utilisateurs
 Généralisation des technologies d’enrichissement de
type sémantique ou autres
 Contribution utilisateurs
MOTEUR DE RECHERCHE
LES TENDANCES GÉNÉRALES
 Les fonctions de recherche sont présentes dans de
nombreuses applications web
 La navigation à facettes se généralise
 Les profils de recherche se multiplient
AGRÉGATION ET EXTRACTION D’INFORMATIONS WEB
LES TENDANCES GÉNÉRALES
 Généralisation sur le web des flux RSS et assimilés
 Multiplication des applications d’agrégation de flux
• Applications autonomes (lecteur de flux)
• Au sein d’application métier
• « Tout le monde fait de la veille »
 De nombreux fournisseurs de solutions
professionnelles (veille, social média, etc.)
QWAM CONTENT INTELLIGENCE
Tendances
technologiques
GESTION DES FLUX TEXTUELS ET MULTIMÉDIA
LES TENDANCES TECHNOLOGIQUES
 Flux multiples hétérogènes en croissance
GESTION DES FLUX TEXTUELS ET MULTIMÉDIA
LES TENDANCES TECHNOLOGIQUES
 Peu de solutions spécialisées sur la
rationalisation des flux
 Nécessité d’industrialisation
 Composants :
• Repository
• Annotateur/enrichissement
• Moteur d’indexation
• Séquenceur de tâches
• GED
• Workflow
ENRICHISSEMENT DE CONTENUS
LES TENDANCES TECHNOLOGIQUES
• Annoter (enrichir de méta-données) les documents pour :
 Les rendre plus aisément manipulables
 Les structurer
 Les rassembler
 Les lier
 Les classer
 Les contextualiser
ENRICHISSEMENT DE CONTENUS
LES TENDANCES TECHNOLOGIQUES
• Annoter intelligemment :
 Utiliser au maximum ce qui vient des chaines éditoriales et de
production
 Préserver les données déjà présentes : Edition, Auteur, Type
d’article/document
 Ne porter que sur des champs plein texte : Titre, Sous titre,
Chapeau, Texte
ENRICHISSEMENT DE CONTENUS
LES TENDANCES TECHNOLOGIQUES
 Jusqu’à présent surtout des solutions d’éditeurs de
logiciels (text mining)
 Emergence de framework open source
• Considéré comme une brique
• Effort de constitution de vocabulaire moins poussé
• Prix plus attractif
ENRICHISSEMENT DE CONTENUS
LES TENDANCES TECHNOLOGIQUES
 Produire des facettes pour plusieurs usages :
• Aide à la lecture
• Raffinage (Drill down)
• Top 10
ENRICHISSEMENT DE CONTENUS
LES TENDANCES TECHNOLOGIQUES
 Produire des facettes pour plusieurs usages :
• Graphiques camembert ou barres
• Analytics / Mining
• Geolocalisation
• Linked data
ENRICHISSEMENT DE CONTENUS
LES TENDANCES TECHNOLOGIQUES
 Les entités nommées : Personnes, organisations,
lieux, événements
 Les ontologies
• Pour enrichir
• Pour classer
ENRICHISSEMENT DE CONTENUS
LES TENDANCES TECHNOLOGIQUES
 Les concepts :
• Clustering décevant => Aller vers une méthode de N-grams
• Détection de thématiques émergentes
• Référentiel d’annotation : ex: E.I, Etat islamique, Daesh ?
• Agnostique et/ou supervisé
ENRICHISSEMENT DE CONTENUS
LES TENDANCES TECHNOLOGIQUES
 Le croisement avec l’ « usage » utilisateur
• Moteur de recommandation
• Les plus consultés
• Documents liés
• Ce que dit le web
ENRICHISSEMENT DE CONTENUS
LES TENDANCES TECHNOLOGIQUES
 Le machine learning
• Classement
• Screening
MOTEUR DE RECHERCHE
LES TENDANCES TECHNOLOGIQUES
 La brique de moteur d’indexation est disponible en
open source
 La différenciation se fait par les composants et
fonctions périphériques
 L’équation devient :
• Moteur sémantique = Moteur booléen + annotation +
synonymes + lemmatisation
AGRÉGATION ET EXTRACTION D’INFORMATIONS WEB
LES TENDANCES TECHNOLOGIQUES
 Généralisation des flux RSS et assimilés
• Un canal privilégié par les diffuseurs
• Dialogue machine-humain et machine-machine
• Un document garanti au bout
• Des méta-données de qualité
QWAM CONTENT INTELLIGENCE
Qwam en bref :
- Création en 2006
- Entreprise spécialisée dans les
solutions logicielles de veille,
recherche, gestion et diffusion de
contenus électroniques
- Membre de Cap Digital «Pôle de
compétitivité » des technologies
numériques
- 2 projets de R&D « Investissements
d’Avenir » en cours
QUI SOMMES NOUS ?
 Entreprise spécialisée dans les solutions logicielles de veille,
recherche, gestion et diffusion de contenus électroniques
 Plus de 150 clients utilisent les solutions Qwam
 Projets R&D collaboratifs
• Qwam s’est vu attribuer début 2013 un projet de R&D au titre
du Fonds de Soutien Numérique (FSN) « Investissements
d’avenir »
• Début 2015, un nouveau projet de Qwam est retenu dans
l’appel à projets «Big data» des « Investissements d’Avenir »
LES OFFRES QWAM
Qwam Content Intelligence propose un ensemble d’offres et solutions logicielles
autour de la gestion d’informations, des moteurs de recherche et de la veille
 QES InfoMedia Suite : Plateformes d’agrégation, gestion, recherche et diffusion de flux
et d’archives presse et media :
 Gestion documentaire de flux numériques de tout type : presse et media (articles,
dépêches, web, etc.) audio, vidéo, études, rapports, etc. ; module d’enrichissement
sémantique et règles métier ; modules de qualification pour administrateurs et
contribution des utilisateurs
 Module de gestion des articles et retombées presse (QES PressReview)
 Module de gestion des informations web (QES WebMonitor)
 Portail et moteur de recherche et de navigation sur flux numériques presse, media et web
 QES InfoMonitor & KM Suite : Plateformes de capitalisation, recherche, veille et gestion
et diffusion d’information R&D/innovation, scientifique et technique et concurrentielle
 Agrégation de tout type d’information scientifique et technique (brevets, articles IST, news
spécialisées, etc.) et stratégique pour la R&D et l’innovation ; veille web avec Ask’n’Read
 Module de recherche et surveillance de bases de données scientifiques (QES Biblio)
 Module de gestion des informations web (QES WebMonitor)
 Capitalisation et gestion d’informations externes et internes pour gestion des
connaissances
 Portail et moteur de recherche et de navigation sur bases de connaissances
LES OFFRES QWAM
Qwam Content Intelligence propose un ensemble d’offres et solutions logicielles
autour de la gestion d’informations, des moteurs de recherche et de la veille
 Ask'n'Read : Solutions de veille web en temps réel
 Pour la veille en continu de toute l'information sur le web
• Surveillance : médias web, actualités, communiqués de presse, sites d’entreprises et institutionnels, blogs,
forums, réseaux sociaux, sites de recrutement, annonces, etc.
• Gestion et diffusion : sélection de l’information ; newsletters et listes de diffusion ; tableaux de bord
 Modules complémentaires WebMonitor :
• Base de connaissance, portails d’informations, solutions personnalisées
 QES GED Suite : Organiser et gérer les ressources documentaires de l’entreprise
 Centraliser les documents produits par les collaborateurs (études, rapports, etc.), les
documents numérisés, etc. dans un espace unique quelque soit leur format (texte, PDF, image)
 Gérer simplement les documents via des référentiels métier (liste d’autorité, plan de
classement, etc.) et sémantiques dans un environnement sécurisé et organisé (workflow)
 Diffuser et partager : portail ergonomique avec interfaces et widgets personnalisés permettant
d’accéder aux documents suivant les profils utilisateur
 Moteur de recherche évolué (navigation à facettes) et navigation guidée dans bases
documentaires
QWAM CONTENT INTELLIGENCE
Les besoins clients en
gestion, agrégation,
diffusion de flux
Les solutions Qwam
LES SOLUTIONS QWAM
 Une solution de gestion des flux internes
 Une solution de gestion des flux web
 Une solution d’intégration des flux internes et flux web
(contextualisation, intégration des contenus sur un
même métier, etc.)
PRODUCTION INTERNE
QES
LE DATACENTER
ASK’N’READ
LE DATACENTER
ASK’N READ
INTÉGRATION FLUX INTERNES-EXTERNES
CONTEXTUALISATION
INTÉGRATION FLUX INTERNES-EXTERNES
QES + ASK’N’READ
CAS D’USAGE 1
- Gestion des flux textuels
et multimédia pour
capitalisation,
consultation et diffusion ;
moteur de recherche
associé
CAS D’USAGE 1
FLUX INTERNES
CAS D’USAGE 2
- Enrichissement
documentaire (règles
métier, sémantique) et
génération automatique
de concepts et
documents liés
CAS D’USAGE 2
AIDE À L’ANNOTATION
SUR
CHAINE ÉDITORIALE
CAS D’USAGE 3
- Agrégation de flux web
contextuels autour de
contenus éditoriaux ;
création de services à
valeur ajoutée autour
des contenus éditoriaux
CAS D’USAGE 3
FLUX INTERNES +
FLUX WEB
CAS D’USAGE 4
- Extraction sélective de
contenus web :
informations d’entreprise,
informations sectorielles,
flux d’actualités web en
temps réel, génération de
leads, etc.
CAS D’USAGE 4
CONTENUS WEB CIBLÉS
CAS D’USAGE 5
- Flux de veille et
d’information
scientifique et technique
CAS D’USAGE 5
FLUX WEB
NOUS CONTACTER
INFORMATIONS COMPLÉMENTAIRES & DÉMONSTRATIONS EN LIGNE
Qwam Content Intelligence
22 rue Chauchat
75009 Paris
info@qwamci.com
Tel : 01.44.69.59.20
www.qwamci.com @qwamCI

Les technologies liées à la gestion de contenus professionnels, levier de la transformation numérique ? Petit Déj. Expert Aproged animé par Christian Langevin et Ivan Monnier de Qwam

  • 1.
    QWAM CONTENT INTELLIGENCE Aproged– 9 Juin 2015 Les technologies liées à la gestion de contenus professionnels, levier de la transformation numérique
  • 2.
    AGENDA DE LASESSION  Les nouvelles tendances générales et technologiques liées à la gestion de contenus professionnels (textuels) • Gestion de flux numériques (textuels et multimédia) • Enrichissement de contenus • Moteur de recherche spécialisé • Agrégation et extraction d’informations web  Présentation des solutions Qwam  Cas d’usage
  • 3.
  • 4.
    ETAT DES LIEUX MULTIPLICATIONDES FLUX NUMÉRIQUES  Flux externes Fournisseurs de contenus spécialisés Flux RSS Flux presse et média Revues et journaux électroniques Sites web Moteurs web Bases de données web
  • 5.
    ETAT DES LIEUX MULTIPLICATIONDES FLUX NUMÉRIQUES  Flux internes Flux et échanges partenaires Systèmes éditoriaux Publications internes (mktg, com, …) CMS, GED diverses Sites et flux intranet Moteurs intranet Bases de données métier
  • 6.
    TECHNOLOGIES LIÉES AUXCONTENUS Quatre familles de problématiques dans les applications - Gestion des flux textuels et multimédia - Enrichissement de contenus - Moteur de recherche - Agrégation et extraction d’informations web
  • 7.
    GESTION DES FLUXTEXTUELS ET MULTIMÉDIA LES TENDANCES GÉNÉRALES  Flux multiples textuels/media hétérogènes en croissance • Applications internes • Web • Fournisseurs de contenus et d’applications (via le web)  Flux continu  Multimédia, multilingue
  • 8.
    ENRICHISSEMENT DE CONTENUS LESTENDANCES GÉNÉRALES  Transition de l’enrichissement manuel historique (via GED) à l’enrichissement semi-automatique ou automatique • Concerne les éditeurs/fournisseurs de contenus et les « grands » utilisateurs  Généralisation des technologies d’enrichissement de type sémantique ou autres  Contribution utilisateurs
  • 9.
    MOTEUR DE RECHERCHE LESTENDANCES GÉNÉRALES  Les fonctions de recherche sont présentes dans de nombreuses applications web  La navigation à facettes se généralise  Les profils de recherche se multiplient
  • 10.
    AGRÉGATION ET EXTRACTIOND’INFORMATIONS WEB LES TENDANCES GÉNÉRALES  Généralisation sur le web des flux RSS et assimilés  Multiplication des applications d’agrégation de flux • Applications autonomes (lecteur de flux) • Au sein d’application métier • « Tout le monde fait de la veille »  De nombreux fournisseurs de solutions professionnelles (veille, social média, etc.)
  • 11.
  • 12.
    GESTION DES FLUXTEXTUELS ET MULTIMÉDIA LES TENDANCES TECHNOLOGIQUES  Flux multiples hétérogènes en croissance
  • 13.
    GESTION DES FLUXTEXTUELS ET MULTIMÉDIA LES TENDANCES TECHNOLOGIQUES  Peu de solutions spécialisées sur la rationalisation des flux  Nécessité d’industrialisation  Composants : • Repository • Annotateur/enrichissement • Moteur d’indexation • Séquenceur de tâches • GED • Workflow
  • 14.
    ENRICHISSEMENT DE CONTENUS LESTENDANCES TECHNOLOGIQUES • Annoter (enrichir de méta-données) les documents pour :  Les rendre plus aisément manipulables  Les structurer  Les rassembler  Les lier  Les classer  Les contextualiser
  • 15.
    ENRICHISSEMENT DE CONTENUS LESTENDANCES TECHNOLOGIQUES • Annoter intelligemment :  Utiliser au maximum ce qui vient des chaines éditoriales et de production  Préserver les données déjà présentes : Edition, Auteur, Type d’article/document  Ne porter que sur des champs plein texte : Titre, Sous titre, Chapeau, Texte
  • 16.
    ENRICHISSEMENT DE CONTENUS LESTENDANCES TECHNOLOGIQUES  Jusqu’à présent surtout des solutions d’éditeurs de logiciels (text mining)  Emergence de framework open source • Considéré comme une brique • Effort de constitution de vocabulaire moins poussé • Prix plus attractif
  • 17.
    ENRICHISSEMENT DE CONTENUS LESTENDANCES TECHNOLOGIQUES  Produire des facettes pour plusieurs usages : • Aide à la lecture • Raffinage (Drill down) • Top 10
  • 18.
    ENRICHISSEMENT DE CONTENUS LESTENDANCES TECHNOLOGIQUES  Produire des facettes pour plusieurs usages : • Graphiques camembert ou barres • Analytics / Mining • Geolocalisation • Linked data
  • 19.
    ENRICHISSEMENT DE CONTENUS LESTENDANCES TECHNOLOGIQUES  Les entités nommées : Personnes, organisations, lieux, événements  Les ontologies • Pour enrichir • Pour classer
  • 20.
    ENRICHISSEMENT DE CONTENUS LESTENDANCES TECHNOLOGIQUES  Les concepts : • Clustering décevant => Aller vers une méthode de N-grams • Détection de thématiques émergentes • Référentiel d’annotation : ex: E.I, Etat islamique, Daesh ? • Agnostique et/ou supervisé
  • 21.
    ENRICHISSEMENT DE CONTENUS LESTENDANCES TECHNOLOGIQUES  Le croisement avec l’ « usage » utilisateur • Moteur de recommandation • Les plus consultés • Documents liés • Ce que dit le web
  • 22.
    ENRICHISSEMENT DE CONTENUS LESTENDANCES TECHNOLOGIQUES  Le machine learning • Classement • Screening
  • 23.
    MOTEUR DE RECHERCHE LESTENDANCES TECHNOLOGIQUES  La brique de moteur d’indexation est disponible en open source  La différenciation se fait par les composants et fonctions périphériques  L’équation devient : • Moteur sémantique = Moteur booléen + annotation + synonymes + lemmatisation
  • 24.
    AGRÉGATION ET EXTRACTIOND’INFORMATIONS WEB LES TENDANCES TECHNOLOGIQUES  Généralisation des flux RSS et assimilés • Un canal privilégié par les diffuseurs • Dialogue machine-humain et machine-machine • Un document garanti au bout • Des méta-données de qualité
  • 25.
    QWAM CONTENT INTELLIGENCE Qwamen bref : - Création en 2006 - Entreprise spécialisée dans les solutions logicielles de veille, recherche, gestion et diffusion de contenus électroniques - Membre de Cap Digital «Pôle de compétitivité » des technologies numériques - 2 projets de R&D « Investissements d’Avenir » en cours
  • 26.
    QUI SOMMES NOUS?  Entreprise spécialisée dans les solutions logicielles de veille, recherche, gestion et diffusion de contenus électroniques  Plus de 150 clients utilisent les solutions Qwam  Projets R&D collaboratifs • Qwam s’est vu attribuer début 2013 un projet de R&D au titre du Fonds de Soutien Numérique (FSN) « Investissements d’avenir » • Début 2015, un nouveau projet de Qwam est retenu dans l’appel à projets «Big data» des « Investissements d’Avenir »
  • 27.
    LES OFFRES QWAM QwamContent Intelligence propose un ensemble d’offres et solutions logicielles autour de la gestion d’informations, des moteurs de recherche et de la veille  QES InfoMedia Suite : Plateformes d’agrégation, gestion, recherche et diffusion de flux et d’archives presse et media :  Gestion documentaire de flux numériques de tout type : presse et media (articles, dépêches, web, etc.) audio, vidéo, études, rapports, etc. ; module d’enrichissement sémantique et règles métier ; modules de qualification pour administrateurs et contribution des utilisateurs  Module de gestion des articles et retombées presse (QES PressReview)  Module de gestion des informations web (QES WebMonitor)  Portail et moteur de recherche et de navigation sur flux numériques presse, media et web  QES InfoMonitor & KM Suite : Plateformes de capitalisation, recherche, veille et gestion et diffusion d’information R&D/innovation, scientifique et technique et concurrentielle  Agrégation de tout type d’information scientifique et technique (brevets, articles IST, news spécialisées, etc.) et stratégique pour la R&D et l’innovation ; veille web avec Ask’n’Read  Module de recherche et surveillance de bases de données scientifiques (QES Biblio)  Module de gestion des informations web (QES WebMonitor)  Capitalisation et gestion d’informations externes et internes pour gestion des connaissances  Portail et moteur de recherche et de navigation sur bases de connaissances
  • 28.
    LES OFFRES QWAM QwamContent Intelligence propose un ensemble d’offres et solutions logicielles autour de la gestion d’informations, des moteurs de recherche et de la veille  Ask'n'Read : Solutions de veille web en temps réel  Pour la veille en continu de toute l'information sur le web • Surveillance : médias web, actualités, communiqués de presse, sites d’entreprises et institutionnels, blogs, forums, réseaux sociaux, sites de recrutement, annonces, etc. • Gestion et diffusion : sélection de l’information ; newsletters et listes de diffusion ; tableaux de bord  Modules complémentaires WebMonitor : • Base de connaissance, portails d’informations, solutions personnalisées  QES GED Suite : Organiser et gérer les ressources documentaires de l’entreprise  Centraliser les documents produits par les collaborateurs (études, rapports, etc.), les documents numérisés, etc. dans un espace unique quelque soit leur format (texte, PDF, image)  Gérer simplement les documents via des référentiels métier (liste d’autorité, plan de classement, etc.) et sémantiques dans un environnement sécurisé et organisé (workflow)  Diffuser et partager : portail ergonomique avec interfaces et widgets personnalisés permettant d’accéder aux documents suivant les profils utilisateur  Moteur de recherche évolué (navigation à facettes) et navigation guidée dans bases documentaires
  • 29.
    QWAM CONTENT INTELLIGENCE Lesbesoins clients en gestion, agrégation, diffusion de flux Les solutions Qwam
  • 30.
    LES SOLUTIONS QWAM Une solution de gestion des flux internes  Une solution de gestion des flux web  Une solution d’intégration des flux internes et flux web (contextualisation, intégration des contenus sur un même métier, etc.)
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
    CAS D’USAGE 1 -Gestion des flux textuels et multimédia pour capitalisation, consultation et diffusion ; moteur de recherche associé
  • 38.
  • 39.
    CAS D’USAGE 2 -Enrichissement documentaire (règles métier, sémantique) et génération automatique de concepts et documents liés
  • 40.
    CAS D’USAGE 2 AIDEÀ L’ANNOTATION SUR CHAINE ÉDITORIALE
  • 41.
    CAS D’USAGE 3 -Agrégation de flux web contextuels autour de contenus éditoriaux ; création de services à valeur ajoutée autour des contenus éditoriaux
  • 42.
    CAS D’USAGE 3 FLUXINTERNES + FLUX WEB
  • 43.
    CAS D’USAGE 4 -Extraction sélective de contenus web : informations d’entreprise, informations sectorielles, flux d’actualités web en temps réel, génération de leads, etc.
  • 44.
  • 45.
    CAS D’USAGE 5 -Flux de veille et d’information scientifique et technique
  • 46.
  • 47.
    NOUS CONTACTER INFORMATIONS COMPLÉMENTAIRES& DÉMONSTRATIONS EN LIGNE Qwam Content Intelligence 22 rue Chauchat 75009 Paris info@qwamci.com Tel : 01.44.69.59.20 www.qwamci.com @qwamCI