Nos formations : www.jedha.co
Projet IA de Hugo Terrien
En prenant une base de données de la CNN et du Daily News, Hugo nous présente les modèles de Traitement du langage naturel pour faire des résumés automatiques de documents.
4. Qu’est-ce qu’un bon résumé ?
Volume de compression (objectif)
Qualité de l’information (subjectif)
5. Un premier modèle basé sur PageRank
Ranking de page web
Visibilité d’une page
Base : probabilité de
passer d’une page à
une autre en suivant
un lien cliquable
6. Un second modèle basé sur LDA
Document1
Document2
Thème1
Thème3
Thème2
Mot1
Mot2
Mot3
Mot4
7. Comparatif des modèles
Non guidé vs guidé
Systèmes de
mesure de
l’information
différents
Dépendance de
modèles pré-
entraînés différents