Stocker de l’information inutile coûte cher aux entreprises et devient de plus en plus risqué au vu des nouvelles réglementations comme RGPD. La part de données ROT (redondantes, obsolètes, triviales) est considérable. Elle représente jusqu’à 80 % de l’ensemble des données stockées dans les systèmes d’information. Les espaces de stockage sont donc devenus de gigantesques fourre-tout, que les DSI ont tendance à conserver et à backuper pour toujours, au cas où des données importantes y seraient encore stockées.
Comment alors séparer le bon grain de l’ivraie ? Comment remettre de l’ordre dans ce chaos informationnel ? Comment automatiser la détection de documents sensibles, engageants ou contenant des données personnelles sans devoir re-classer, à la main, l’ensemble de ces corpus documentaires ?
Grâce à ses fonctionnalités natives d’intelligence artificielle et d’apprentissage automatique everteam.discover vous aide en trois phases :
Analyse et extraction automatique des données sensibles
Classification automatique ou par suggestion selon votre typologie documentaire
Prise d’action et applications des bonnes politiques de rétention ou de sécurisation
Vos déchets informationnels vous coûtent de plus en plus cher et les risques de fuites de données sensibles deviennent plus importants si votre information n’est pas correctement assainie et gouvernée. Le deuxième webinar de la série “La Gouvernance de l’Information en pratique” vous aide à reprendre le contrôle de vos disques réseaux grâce à la catégorisation automatique.
280219 Webinar Reprenez le Contrôle de Vos Disques Réseaux
1. 1
28 Février 2019
« Reprenez le contrôle de vos disques réseaux grâce à la catégorisation
automatique. »
everteam.discover
La Gouvernance de l’Information en Pratique
2. 2
Nous mettrons les participants en mode
« mute » ou silencieux pour le confort de
tous.
Vous avez une question ? Posez-la ! Nous y
répondrons à la fin du webinar.
1. Cliquez sur l'icône de question dans la
barre d'outils.
1. Entrez votre question dans le champ
texte situé dans le bas, puis appuyez
sur Entrée sur votre clavier.
QUELQUES PRECISIONS
3. 3
Stéphane Croisier – CTO Everteam
● Plus de 15 ans d’expérience dans le domaine de la
Gouvernance de l’Information, le Web Content Management
(CMS/WCM) et les ECM
● Co-Fondateur de Jahia, un éditeur de WCM
● VP Product Manager chez RSD, un éditeur de SAE suisse
● CEO de GlassIG depuis 2016
● Acquisition par Everteam du logiciel GlassIG en 2018
INTERVENANT
5. 5
Everteam est un éditeur de logiciels de gestion
des informations d’entreprise (EIM)
spécialisé dans la Gouvernance de
l’Information. Nous aidons nos clients à se
connecter, découvrir, organiser et préserver
leurs actifs informationnels afin d’augmenter
leur valeur, minimiser leurs risques et
réduire leurs coûts.
6. 6
● Plus de 25 ans d’expertise dans le domaine
de l’ECM et la Gouvernance de
l’information
● 1300+ Clients sur les 5 continents
● ~600 employés dans le monde
● Bureaux à Boston, Paris, Lyon, Dubai,
Beyrouth, Bangalore et Genève
● Reconnu parmi les leaders par des
cabinets d’analystes dont Gartner et
Forrester
● “2018 Best Information Governance
Company Award” aux USA
+25Années d’expertise
+1300
Clients
EVERTEAM EN BREF
8. 8
Pourquoi nous sommes différents
+25 ans d’expérience
Avec plus de 25 ans
d’expérience dans la gestion
de contenu d’entreprise et des
centaines de projets réussis,
Everteam est capable de vous
apporter l’expertise et les
insights dont vous avez besoin.
Socle logiciel unique
L’offre Everteam est composée
d’une gamme de solutions pré-
packagées et établies à partir
d’un socle logiciel unique
orienté « Gouvernance de
l’Information »
Architecture
microservices
moderne
Une plateforme évolutive,
moderne et flexible capable de
s’adapter à vos besoins.
L’innovation continue
d’everteam.lab
Everteam possède un laboratoire
de R&D dédié à l’Intelligence
Artificielle pour équiper ses
clients de solutions à la pointe de
l’innovation.
Interface
ergonomique,
simple & robuste
Des interfaces utilisateurs
simples mais puissantes
10. 10
Le problème que nous adressons: le déluge informationnel
Source : AIIM, 2018
Quel est le niveau de sévérité du problème de
déluge et de chaos informationnel dans votre
organisation?
Un problème
critique
Un problème
significatif
Un problème Pas vraiment
un problème
Un problème
marginal
Qu’attendez-vous comme facteur de multiplication
de vos données et de vos informations dans les
deux prochaines années?
75% 35%
12. 12
Efficacité globale des entreprises
Sur une échelle de 1 (terrible)
à 10 (excellent), veuillez
évaluer l'efficacité globale de
votre organisation à gérer,
contrôler et utiliser
l'information électronique
13. 13
Comment éliminer les données qui ne sont plus
nécessaires ?
C'est un processus complètement automatisé
C'est surtout un processus automatisé
C'est surtout un processus manuel
C'est un processus manuel
Nous gardons tout
14. 14
Pour répondre aux problèmes modernes, nous
devons revoir notre gestion de l’information
Complètement en désaccord
Plutôt en désaccord
Pas d’opinion
Plutôt d’accord
Complètement d’accord
15. 15
Quelles technologies à la rescousse?
Classification des documents et identification des
renseignements personnels
Gestion des métadonnées et de la taxonomie
Reconnaissance, extraction et normalisation des données
Intelligence artificielle, analyse de contenu et sémantique
Aucun Plan ou Réduction Identique Plus Beaucoup plus
17. 17
Ce que nous faisonsU
Migration &
Décommissionnement
Assainissement Gestion Documentaire &
Case Management
Archivage &
Record Management
Recherche Cognitive &
Vues à 360o
Conformité
(RGPD, RM)
POUR LES PROFESSIONNELS DE L’INFORMATION POUR LES UTILISATEURS
18. 18
Fonctions clés
CONNECTER
Se connecter
au sein de
différents
référentiels de
contenu au
sein de
l’organisation
GOUVERNER
Définir
les règles de
rétention et
gérer les
cycles de vie
documentaires
ANALYSER
Détecter des
informations
sensibles,
reconnaître les
documents
engageants et
identifier les
déchets
informationnels
RECHERCHER
Améliorer la
productivité en
facilitant les
recherches et la
création de vues
personnalisées
sur l'ensemble
des actifs
informationnels
où qu'ils se
trouvent
AGIR
Convertir,
Migrer,
supprimer les
contenus
et leurs
métadonnées
dans les
systèmes cibles
ARCHIVER
Préserver et
sécuriser
les documents
engageants et
les informations
sensibles
UTILISER
Fournir
les outils de
gestion des
informations
demandées par
les utilisateurs
métiers
19. 19
Suite InfoGov: Fonctions Clés
everteam.
policy
everteam.
archive
everteam.
discover
Everteam.policy
● Définition de votre Registre Informationnel (Plan de classement et
durée de conservation, Art.30 RGPD ou ISO27K)
● Partager et propager vos politiques informationnelles
Everteam.discover
● Catalogue Documentaire Unifié (Disques Réseaux, ECM, RDBMS,…)
● Indexation Plein Texte avec recherche cognitive multilangue (NLP)
● Extraction et Enrichissement des Métadonnées avec autoclassification
par règle ou par apprentissage (ML)
● Tableaux de bord d’analyse “Self-Service”
● Application des règles de rétention ou de destruction au plus tôt (RGPD)
Everteam.archive
● SAE à valeur probatoire (Conforme NF Z42-013)
● Sécurisation et préservation des données sensibles (PII & Records)
● Décommissionnement de données applicatives
21. 21
Un volume toujours croissant de données
Une approche multi-source unifiée
Définir Classer Agir
Créer
Classer
Maintenir
Mesurer Alerter
Définir
Appliquer
Partager Propager
Agir AuditerDécouvrir
Auditer
Everteam.archive File Shares, ECM, … O365, GSuite
Gouvernez vos données où qu’elles se
trouvent, tout au long de leur cycle de vie en
appliquant les bonnes politiques
informationnelles
● Une approche unifié de définition des
politiques informationnelles
● Une application multi-source au sein de notre
propre SAE ou de manière fédérée
● Des règles fournies par défaut pour détecter
au plus vite vos données sensibles
● La possibilité de classer manuellement ou
automatiquement, avec ou sans validation, par
des règles ou par apprentissage automatique
Gouvernance de l’Info : notre Approche
22. 22
Précision Adhésion Moyenne
90% 50% 45%
60-90% 100% 60-90%
L’Automatisation de la Gouvernance
Humain
= référence
Machine-Learning
= challenger
Tous les contenus ne sont pas égaux
Définissez, par topologie documentaire:
● Classement manuel uniquement
● Classement par règle
● Classement par apprentissage selon les
similarités
Fixer vos critères de précision et d’exhaustivité
selon le niveau de risque de la catégorie
Décider de valider ou non les recommandations
du système
Auditer l’origine et les critères de classification
Ne laissons pas la précision être l’ennemi du bien
23. 23
Extraction de texte : le Deep scan
● Extraction des contenus des documents de type texte (Microsoft Office, Open Office, PDF texte,
emails…)
● Les textes extraits sont stockés dans l’index de discover afin d’en faciliter l’exploitation sans
altérer les documents originaux
24. 24
Natural language processing : NLP
● Traitement et analyse du langage naturel basé sur la syntaxe et autres éléments du langage
humain
● Extraction du sens et des concepts des contenus textuels stockés dans des fichiers
25. 25
Extraction d’entités nommées et reconnaissance de chaînes
● Entraîner un ordinateur pour reconnaître des
mots ou des phrases comme des objets
spécifiques
● Les entités nommées peuvent être spécifiques à
un projet pour reconnaître des termes métiers
(projets, produits, annuaires de collaborateurs…)
26. 26
Classification par règles
● Ensemble de requêtes préétablies permettant de classer, de valoriser et de définir la nature des
documents en fonction d’un contexte client précis.
27. 27
Apprentissage automatique : Machine learning
● Techniques statistiques qui fournissent à discover la capacité “d’apprendre” et de s’améliorer
progressivement au fil du temps
28. 28
FR
Processus d’indexation et d’enrichissement
par itération successive
Indexation
Cognitive
Enrichissement
du contenu
Entités nommées &
Expressions Régulières
Classificateurs
Indexation Sémantique Plein Texte
(Deep Scan)
Extraction des concepts
Indexation des Métadonnées (Light Scan)
Attributs Système, Métadonnées Fichiers, Empreinte Documentaire
29. 29
15% des données
peuvent être
classées par des
règles
5% des données
peuvent être
classées par un
utilisateur Etiquettage manuel
Etiquettage par des règles
Règles standards Règles spécifiques
Autoclassification par apprentissage
Politiques Informationnelles
Données initiales Evaluation Validation Amélioration Continue
Données classées servant à l’apprentissage automatique
Synthèse: Automatisation de la Gouvernance
La plupart des données ne sont
pas inventoriées : on les
appelle «Dark Data»
32. 32
Pour en apprendre plus à notre sujet, visitez notre site web:
www.everteam.com
Ou contactez-nous directement:
info@everteam.com
Merci
Des questions?