Nous avons mis à jour notre politique de confidentialité. Cliquez ici pour consulter les détails. Cliquez ici pour consulter les détails.
Activez votre essai gratuit de 30 jours pour accéder à une lecture illimitée
Activez votre essai gratuit de 30 jours pour continuer votre lecture.
Télécharger pour lire hors ligne
Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu
I: Topic Modeling
* Nature et applications
* Approche Deterministe: LSA
* Approche Probabiliste: LDA
* Quelques librairies en R et python
II: Le package STM en R
* Parametres
* Métriques: exclusivité et cohérence sémantique
* Appliqué a un corpus propre
LAB - R STM
* Le corpus: résumés d'articles tech, IEEE et Arstechnica
* Le package STM en R
* Comment determiner le nombre optimal de topics?
* Comment interpreter les résultats?
* Jupyter Notebook et Script R
III: forum Alt-right sur Facebook
* 500.000 commentaires provenant du forum alt-right God Trump Emperor
* De la nécessité de travailler le contenu
* Filtrer le bruit avec
* Lemmatization, tokenization
* Part of Speech tagging
* Named entity recognition
* Jupyter Notebook et Script R
IV: Application au Francais
* Quelles sont les librairies pour:
* Part of Speech
* Tokenization
* Lemmatization
V: Resources
* Articles et blogs
Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu
I: Topic Modeling
* Nature et applications
* Approche Deterministe: LSA
* Approche Probabiliste: LDA
* Quelques librairies en R et python
II: Le package STM en R
* Parametres
* Métriques: exclusivité et cohérence sémantique
* Appliqué a un corpus propre
LAB - R STM
* Le corpus: résumés d'articles tech, IEEE et Arstechnica
* Le package STM en R
* Comment determiner le nombre optimal de topics?
* Comment interpreter les résultats?
* Jupyter Notebook et Script R
III: forum Alt-right sur Facebook
* 500.000 commentaires provenant du forum alt-right God Trump Emperor
* De la nécessité de travailler le contenu
* Filtrer le bruit avec
* Lemmatization, tokenization
* Part of Speech tagging
* Named entity recognition
* Jupyter Notebook et Script R
IV: Application au Francais
* Quelles sont les librairies pour:
* Part of Speech
* Tokenization
* Lemmatization
V: Resources
* Articles et blogs
Il semblerait que vous ayez déjà ajouté cette diapositive à .
Vous avez clippé votre première diapositive !
En clippant ainsi les diapos qui vous intéressent, vous pourrez les revoir plus tard. Personnalisez le nom d’un clipboard pour mettre de côté vos diapositives.La famille SlideShare vient de s'agrandir. Profitez de l'accès à des millions de livres numériques, livres audio, magazines et bien plus encore sur Scribd.
Annulez à tout moment.Lecture illimitée
Apprenez plus vite et de façon plus astucieuse avec les meilleurs spécialistes
Téléchargements illimités
Téléchargez et portez vos connaissances avec vous hors ligne et en déplacement
Vous bénéficiez également d'un accés gratuit à Scribd!
Accès instantané à des millions de livres numériques, de livres audio, de magazines, de podcasts, et bien plus encore.
Lisez et écoutez hors ligne depuis n'importe quel appareil.
Accès gratuit à des services premium tels que TuneIn, Mubi, et bien plus encore.
Nous avons mis à jour notre politique de confidentialité pour nous conformer à l'évolution des réglementations mondiales en matière de confidentialité et pour vous informer de la manière dont nous utilisons vos données de façon limitée.
Vous pouvez consulter les détails ci-dessous. En cliquant sur Accepter, vous acceptez la politique de confidentialité mise à jour.
Merci!