LINGWAY e-Reputation
Analyser les thématiques et les tonalités qui circulent
            dans la conversation Internet




www.lingway.com
> Qui sommes nous ?

Une société spécialisée sur l’analyse des données textuelles
   Transformer une information non structurée en des données utilisables par des
   logiciels
   En se basant sur les technologies d’analyse du langage

Dans différents domaines
   Les brevets, l’information scientifique et technique
   Le recrutement ( CV, offres d’emploi )
   La veille et la e-Reputation

Une centaine de clients
   Toyota, Ministère de la Culture, Agences Marketing, Etudes, Communication.
   AXA, Accor, Bull, La Poste, etc.
e-Réputation: un enjeu incontournable
Selon plusieurs études concordantes, en gros:

Les 3/4 des français sont des internautes

Les 3/4 des internautes consultent Internet avant
d’acheter un produit

La moitié des internautes consultent les avis des
autres avant de choisir un produit
Une idée simple
Il « suffit » d’ observer ce qui se dit sur Internet
pour avoir une perception de l’opinion des
consommateurs, électeurs, influenceurs,…

Cette information est gratuite et spontanée

Donc on pourrait passer progressivement d’un
modèle d’études basé sur les sondages à un
modèle basé sur l’observation d’Internet et des
réseaux sociaux
Mais une réalisation (très) complexe
Que faut-il surveiller ?
   Qu’est-ce qu’un échantillon représentatif sur Internet ??
Comment analyser les contenus ?
   Informations hétérogènes, non structurées, difficiles à identifier,
   récupérer, trier, analyser
Faire « à la main » n’est plus possible
   Ou alors on est obligé de réduire à quelques centaines ou
   milliers de messages, non significatifs
Donc il faut analyser de très grands volumes
d’information et se faire aider par des logiciels
   Notamment pour identifier des « signaux faibles »
Ce qui est possible avec LINGWAY e-Reputation

De qui parle t-on ?
   Quelles marques, produits, personnes, sociétés ?
De quels sujets ?
   Quelles thématiques ? Quelle actualité ? Quelles offres ?
Où en parle t-on ?
   Dans quels médias ? Quels réseaux sociaux ? Quel sites ?
   Quels blogs ? Quels forums ?
Qui parle ?
   Quel internaute ? Quel bloggeur ? Quel journaliste ?
Quels jugements ?
   Quels avis ? Quelles recommandations ? Quelles tonalités ?
Deux exemples
L’actualité politique
  Presse en ligne, Twitter, Facebook, etc.


Les médicaments mis sous surveillance par
l’AFSSAPS
  Blogs et Forums


Tous les exemples qui suivent sont produits
avec Lingway eReputation AVANT
REVISION
Pages et
                                                                                       messages
                                                                                          non
                                                                                       structurés




                                     Transformation en données structurées
                                 Analyse du contenu: personnes, lieux, marques,
                                          thèmes, tonalités, avis, etc.
                                        Analyse des liens : réseaux d’influences, de
Analyseurs sémantiques
            =
                                            personnes, de sites, etc
Logiciels + dictionnaires




                    Base de
                  données de
                     textes
                   enrichis et
                   structurés
Analyse du contenu: page Internet typique
Document après analyse par le logiciel
Analyse du contenu: exemple sur un forum
Contenu analysé, structuré automatiquement
1 - De qui parle t-on ?

Quelles personnes, quels candidats… ?
Quelles marques , quels médicaments ?
  Quelles sociétés ? Quels partis ?
                etc…
Pharma: de quels médicaments parle-t-on?
Elections: De qui parle t-on ? Où en parle t-on ?


   Twitter              Presse nationale en ligne
Evolution de la visibilité (ici sur Twitter)
Qui est associé à qui ?

                            Personnalités citées en
                          réponse à « impôts » entre
                              le 26/10 et le 31/10
2 - De quels sujets parle t-on ?

      Quelles thématiques ?
        Quelles offres ?
        Quelle actualité ?
Quelles thématiques associées à une marque ou produit ?
Quels thématiques associées à un sujet donné ?
Quelles personnes associées à un sujet ?
3 – Où en parle t-on ?

   Quels médias ?,
Quels réseaux sociaux ?
     Quels sites ?
     Quels blogs ?
  Quels forums ? etc.
Où en parle t-on ?
Où en parle-t-on ?
4 – Qui parle ?

Quel bloggeur ?
Quel internaute ?
Quel journaliste ?
Qui parle des médicaments sous surveillance ?
Qui parle à la fois du Rivotril et du Lyrica ?
Où parlent ceux qui parlent du Stilnox ?
4 – Quelles opinions ?

        Quels avis ?
Quelles recommandations ?
    Quelles tonalités ?
Quelles tonalités sur quels produits ?
Quels avis liés au Subutex ?
Quels conseils sur la méthadone ?
Synthèse des tonalités observées sur les forums
10 points forts de LINGWAY e-Reputation V2.0

Indexation temps réél
Recherche avec expansion sémantique multilingue
Extraction de métadonnées, entités nommées, thèmes
Analyse linguistique des tonalités et avis
Outils de classement automatique ou assisté
Aide à la lecture
Alertes, Annotations, tagging
Cartographie
Exports multi-formats, listes de diffusion
Gestion des dictionnaires
Tarification
Accès à la plateforme
  Abonnement 12.000 euros par an
Incréments
  en fonction des volumes > 100.000 documents
  En fonction du nombre de langues suivies
  En fonction du nombre d’utilisateurs > 3
Services et support
  Quelques jours pour paramétrer une application
Niveaux de prestations
Accès à la plateforme
  Mode SaaS
  Ou licence sur site
Paramétrage et support
  Périmètre de la veille, mot-clés, filtrage, etc.
Veille externalisée
  Rapports réguliers
  Quotidiens, hebdomadaires, mensuels
What’s next ?…
Avec Pikko et SciencesPo, projet iPinion
MERCI…

Semo 2.0 atelier lingway

  • 1.
    LINGWAY e-Reputation Analyser lesthématiques et les tonalités qui circulent dans la conversation Internet www.lingway.com
  • 2.
    > Qui sommesnous ? Une société spécialisée sur l’analyse des données textuelles Transformer une information non structurée en des données utilisables par des logiciels En se basant sur les technologies d’analyse du langage Dans différents domaines Les brevets, l’information scientifique et technique Le recrutement ( CV, offres d’emploi ) La veille et la e-Reputation Une centaine de clients Toyota, Ministère de la Culture, Agences Marketing, Etudes, Communication. AXA, Accor, Bull, La Poste, etc.
  • 3.
    e-Réputation: un enjeuincontournable Selon plusieurs études concordantes, en gros: Les 3/4 des français sont des internautes Les 3/4 des internautes consultent Internet avant d’acheter un produit La moitié des internautes consultent les avis des autres avant de choisir un produit
  • 4.
    Une idée simple Il« suffit » d’ observer ce qui se dit sur Internet pour avoir une perception de l’opinion des consommateurs, électeurs, influenceurs,… Cette information est gratuite et spontanée Donc on pourrait passer progressivement d’un modèle d’études basé sur les sondages à un modèle basé sur l’observation d’Internet et des réseaux sociaux
  • 5.
    Mais une réalisation(très) complexe Que faut-il surveiller ? Qu’est-ce qu’un échantillon représentatif sur Internet ?? Comment analyser les contenus ? Informations hétérogènes, non structurées, difficiles à identifier, récupérer, trier, analyser Faire « à la main » n’est plus possible Ou alors on est obligé de réduire à quelques centaines ou milliers de messages, non significatifs Donc il faut analyser de très grands volumes d’information et se faire aider par des logiciels Notamment pour identifier des « signaux faibles »
  • 6.
    Ce qui estpossible avec LINGWAY e-Reputation De qui parle t-on ? Quelles marques, produits, personnes, sociétés ? De quels sujets ? Quelles thématiques ? Quelle actualité ? Quelles offres ? Où en parle t-on ? Dans quels médias ? Quels réseaux sociaux ? Quel sites ? Quels blogs ? Quels forums ? Qui parle ? Quel internaute ? Quel bloggeur ? Quel journaliste ? Quels jugements ? Quels avis ? Quelles recommandations ? Quelles tonalités ?
  • 7.
    Deux exemples L’actualité politique Presse en ligne, Twitter, Facebook, etc. Les médicaments mis sous surveillance par l’AFSSAPS Blogs et Forums Tous les exemples qui suivent sont produits avec Lingway eReputation AVANT REVISION
  • 8.
    Pages et messages non structurés Transformation en données structurées Analyse du contenu: personnes, lieux, marques, thèmes, tonalités, avis, etc. Analyse des liens : réseaux d’influences, de Analyseurs sémantiques = personnes, de sites, etc Logiciels + dictionnaires Base de données de textes enrichis et structurés
  • 10.
    Analyse du contenu:page Internet typique
  • 11.
    Document après analysepar le logiciel
  • 12.
    Analyse du contenu:exemple sur un forum
  • 13.
  • 14.
    1 - Dequi parle t-on ? Quelles personnes, quels candidats… ? Quelles marques , quels médicaments ? Quelles sociétés ? Quels partis ? etc…
  • 15.
    Pharma: de quelsmédicaments parle-t-on?
  • 16.
    Elections: De quiparle t-on ? Où en parle t-on ? Twitter Presse nationale en ligne
  • 17.
    Evolution de lavisibilité (ici sur Twitter)
  • 18.
    Qui est associéà qui ? Personnalités citées en réponse à « impôts » entre le 26/10 et le 31/10
  • 19.
    2 - Dequels sujets parle t-on ? Quelles thématiques ? Quelles offres ? Quelle actualité ?
  • 20.
    Quelles thématiques associéesà une marque ou produit ?
  • 21.
    Quels thématiques associéesà un sujet donné ?
  • 22.
  • 23.
    3 – Oùen parle t-on ? Quels médias ?, Quels réseaux sociaux ? Quels sites ? Quels blogs ? Quels forums ? etc.
  • 24.
  • 25.
  • 26.
    4 – Quiparle ? Quel bloggeur ? Quel internaute ? Quel journaliste ?
  • 27.
    Qui parle desmédicaments sous surveillance ?
  • 28.
    Qui parle àla fois du Rivotril et du Lyrica ?
  • 29.
    Où parlent ceuxqui parlent du Stilnox ?
  • 30.
    4 – Quellesopinions ? Quels avis ? Quelles recommandations ? Quelles tonalités ?
  • 31.
    Quelles tonalités surquels produits ?
  • 32.
    Quels avis liésau Subutex ?
  • 33.
    Quels conseils surla méthadone ?
  • 34.
    Synthèse des tonalitésobservées sur les forums
  • 35.
    10 points fortsde LINGWAY e-Reputation V2.0 Indexation temps réél Recherche avec expansion sémantique multilingue Extraction de métadonnées, entités nommées, thèmes Analyse linguistique des tonalités et avis Outils de classement automatique ou assisté Aide à la lecture Alertes, Annotations, tagging Cartographie Exports multi-formats, listes de diffusion Gestion des dictionnaires
  • 36.
    Tarification Accès à laplateforme Abonnement 12.000 euros par an Incréments en fonction des volumes > 100.000 documents En fonction du nombre de langues suivies En fonction du nombre d’utilisateurs > 3 Services et support Quelques jours pour paramétrer une application
  • 37.
    Niveaux de prestations Accèsà la plateforme Mode SaaS Ou licence sur site Paramétrage et support Périmètre de la veille, mot-clés, filtrage, etc. Veille externalisée Rapports réguliers Quotidiens, hebdomadaires, mensuels
  • 38.
  • 39.
    Avec Pikko etSciencesPo, projet iPinion
  • 40.