Découvrez les nouveautés
produits Nuxeo
Alain ESCAFFRE
VP, Product Management
Juillet 2020
Agenda
Dernières
nouveautés
• Nuxeo Insight
• Nuxeo Retention Management
• Direct Transfer avec Nuxeo
Drive
• Tests de performance
1
Dernières
améliorations
• Amélioration du formulaire
d’upload sur Web UI
• Amélioration sur le fil
d’historique
• Flow de création de
formulaires optimisé
• Transfert de contenus
optimisé
2
À venir
3
• Connecteur Salesforce
• Connecteur Outlook
• Travailler avec beaucoup de
métadonnées
Nuxeo Insight
Une IA qui comprend vos
enjeux métiers
Elaborée
spécialement
pour vous
Ne s’adresse pas
uniquement aux
experts du
machine learning
Vérifiable &
compréhensible
CAS D’USAGE
Enrichissement
des métadonnées
• Utilisation des plans
classement propres aux
métiers
• Prédiction des
métadonnées depuis du
contenu textuel et visuel
(image & vidéos)
• Remplissage en massse
des métadonnées
Les résultats
Performance
La plupart des algorithmes
ont obtenu entre
85%et
97+%
Volume
Des résultats significatifs
obtenus avec seulement
50
par catégorie
Documents
Agilité
85% de
atteints avec
seulement 10% de
contenu annoté
performance
Adapté au métier
& à l’entreprise
Apprentissage continu
Une évolution constante des
algorithmes grâce à un cycle
d’apprentissage automatisé.
Suggestions de contenu
Remplissage automatique des
formulaires pour une productivité
accrue.
Déploiement en 1 click
Déploiement facile des bots en
production ou dans des
environnements multiples.
Vérifiable
Tous les jeux de données sont
conservés par version d’algorithme
Apprentissage actif
L’apprentissage des algorithmes
est piloté par des humains avec
ludification
Création de contenu
Traçage du contenu
(métadonnées) généré par la
machine et corrections.
Supervision
Une vision claire de la
performance du bot et de son
impact.
Pas d’erreur
Toute action est réversible et les
modèles disposent de plusieurs
versions, qui peuvent être
restaurées.
Gestion de la
rétention
Gestion de la conservation
Gouvernance
• Des règles spécifiques à la
nature des documents
• Support des règles
événementielles
• Action post-rétention
configurable
• Organisation arborescente
des règles de conservation
possible
Reporting
• Révision des documents étant
sur le point d’être supprimés
• Contrôle des ressources par
étape de cycle de vie
Conformité
• Conforme SEC-17a-4 sur S3
• Une base solide pour des
efforts de conformité
supplémentaires
• Implémenté sur les dernières
briques « scalables » de
Nuxeo Platform: Nuxeo
Stream, Bulk Action
Framework
• Testé sur des bases
documentaires à plus de 2
milliards de documents
Robustessse
Gestion des politiques de stockage et
des normes légales
Nuxeo Drive
Direct Transfer
Direct Transfer
Asynchrone
Ne restez jamais bloqué :
continuez de travailler pendant
que le document est en transfert
Robuste Rapide
Une application enrichie d’un outil
puissant de transfert de fichiers
Transférez tous vos fichiers
avec succès même en cas de
perte de réseau, d’une mise en
veille de l’ordinateur, d’un arrêt
volontaire ou d’ajouts de
fichiers supplémentaires
pendant le transfert
Transférez vos fichiers sur la
plateforme rapidement et
efficacement grâce au Cloud
Chronologie
• Gestion avancée des transferts
JUIN JUILLET SEPTEMBRE NOVEMBREOCTOBRE 2021
Upload de fichiers Edition des métadonnées en
masse sur Web UI
Upload de dossiers
• Support du
téléchargement
• Ecrans de gestion
des erreurs
L’expérience utilisateur
 Gestion des transferts
 Pause / reprise
 Traitement des erreurs
 Priorisation
Tests de performance
Comment avons-nous conduit ce
test de performance ?
1/ Se poser les bonnes questions
• Quelle configuration matérielle et logicielle pour une base documentaire d’un
milliard de documents ? Et jusqu’à 10 milliards ?
• Quelles sont les étapes clés d’adaptabilité et les critères associés ?
• Quel est l’impact opérationnel d’une base de 10 milliards de documents ?
2/ Effectuer le test en contexte
• Un modèle de métadonnées complexe
• Index plein texte actif
• Une variété de types de fichiers
• Un test effectué sur Nuxeo Cloud
• Une validation standardisée de chaque étape:
import/édition/suppression/déplacements de masse
3/ Présenter les résultats et continuer les tests
• Présentation du test en démo
• Tests de performance réguliers
De 0 à 1M+ de documents
Crud REST / API
Temps de réponse < 200ms
Navigation
Temps de réponse < 700ms
Recherche (plain texte)
Temps de réponse < 2s
Import de masse
Débit > 5,000 docs/s
Indexation de masse
Débit > 14,000 docs/s
Lecture en masse
Débit > 50,000 docs/s
- 100 m
- 300 m
- 500 m
- 750 m
- 1M
Charge mixe à 1,5 milliards CRUD vs Bulk import
■ Tests CRUD longs
■ Import de masse
avec throttle
Résultats
■ Un temps de réponse
accru (+20%) mais
toujours bon
■ L’import de masse
tourne à 2.3 K docs/s
■ Un million de
documents importés
en moins de 8
minutes
Import de 2.5M de documents
Quelques exemples
d’enseignements
1/ 1,5 puis 2 puis 3 milliards
• Ré-indexation 1,5 milliards en 16h(27 000 docs / seconde)
• Ré-indexation 3 milliards en 24h (36 000 docs/seconde) (9 noeuds Nuxeo)
2/ Scénario de « Scale down » Elasticsearch
• 16 M5.4xlarge  12 R5.2xlarge
• 1h
• Aucun changement sur les Create , Read, Update, + 30% sur la recherche
pendant le scale down
3 / Bulk edit
• 14M documents, 3 propriétés éditées incl. complexes
• 1000 doc/secondes mise à jour
• 14 000 de docs en 4h
• 25% des ressources Nuxeo utilisées
4 / Tests import journalier
• Import de 15M de docs en moins de 45 minutes
• Temps de réponse +3.8%
• Import à 5.5 K docs/s
Améliorations
Les dernières
améliorations Amélioration du formulaire
d’upload Web UI
Fil d’historique
Transfert de contenu optimisé
pour Nuxeo Enhanced Viewer
Flow amélioré de création de
formulaires
A venir …
A venir
Outlook
Transferts d’Outlook à Nuxeo
facilités
1
Salesforce
Afficher le bon contenu aux bons
utilisateurs
2
Recherche
Amélioration de la recherche même
avec des dizaines de métadonnées
impliquées
3
Aspera
Support de l’upload de dossiers,
amélioration d’expérience
utilisateur
4

Découvrez les nouveautés produits Nuxeo

  • 1.
    Découvrez les nouveautés produitsNuxeo Alain ESCAFFRE VP, Product Management Juillet 2020
  • 2.
    Agenda Dernières nouveautés • Nuxeo Insight •Nuxeo Retention Management • Direct Transfer avec Nuxeo Drive • Tests de performance 1 Dernières améliorations • Amélioration du formulaire d’upload sur Web UI • Amélioration sur le fil d’historique • Flow de création de formulaires optimisé • Transfert de contenus optimisé 2 À venir 3 • Connecteur Salesforce • Connecteur Outlook • Travailler avec beaucoup de métadonnées
  • 3.
  • 4.
    Une IA quicomprend vos enjeux métiers Elaborée spécialement pour vous Ne s’adresse pas uniquement aux experts du machine learning Vérifiable & compréhensible
  • 5.
    CAS D’USAGE Enrichissement des métadonnées •Utilisation des plans classement propres aux métiers • Prédiction des métadonnées depuis du contenu textuel et visuel (image & vidéos) • Remplissage en massse des métadonnées
  • 6.
    Les résultats Performance La plupartdes algorithmes ont obtenu entre 85%et 97+% Volume Des résultats significatifs obtenus avec seulement 50 par catégorie Documents Agilité 85% de atteints avec seulement 10% de contenu annoté performance
  • 7.
    Adapté au métier &à l’entreprise Apprentissage continu Une évolution constante des algorithmes grâce à un cycle d’apprentissage automatisé. Suggestions de contenu Remplissage automatique des formulaires pour une productivité accrue. Déploiement en 1 click Déploiement facile des bots en production ou dans des environnements multiples. Vérifiable Tous les jeux de données sont conservés par version d’algorithme Apprentissage actif L’apprentissage des algorithmes est piloté par des humains avec ludification Création de contenu Traçage du contenu (métadonnées) généré par la machine et corrections. Supervision Une vision claire de la performance du bot et de son impact. Pas d’erreur Toute action est réversible et les modèles disposent de plusieurs versions, qui peuvent être restaurées.
  • 8.
  • 9.
    Gestion de laconservation Gouvernance • Des règles spécifiques à la nature des documents • Support des règles événementielles • Action post-rétention configurable • Organisation arborescente des règles de conservation possible Reporting • Révision des documents étant sur le point d’être supprimés • Contrôle des ressources par étape de cycle de vie Conformité • Conforme SEC-17a-4 sur S3 • Une base solide pour des efforts de conformité supplémentaires • Implémenté sur les dernières briques « scalables » de Nuxeo Platform: Nuxeo Stream, Bulk Action Framework • Testé sur des bases documentaires à plus de 2 milliards de documents Robustessse Gestion des politiques de stockage et des normes légales
  • 10.
  • 11.
    Direct Transfer Asynchrone Ne restezjamais bloqué : continuez de travailler pendant que le document est en transfert Robuste Rapide Une application enrichie d’un outil puissant de transfert de fichiers Transférez tous vos fichiers avec succès même en cas de perte de réseau, d’une mise en veille de l’ordinateur, d’un arrêt volontaire ou d’ajouts de fichiers supplémentaires pendant le transfert Transférez vos fichiers sur la plateforme rapidement et efficacement grâce au Cloud
  • 12.
    Chronologie • Gestion avancéedes transferts JUIN JUILLET SEPTEMBRE NOVEMBREOCTOBRE 2021 Upload de fichiers Edition des métadonnées en masse sur Web UI Upload de dossiers • Support du téléchargement • Ecrans de gestion des erreurs
  • 13.
    L’expérience utilisateur  Gestiondes transferts  Pause / reprise  Traitement des erreurs  Priorisation
  • 14.
  • 15.
    Comment avons-nous conduitce test de performance ? 1/ Se poser les bonnes questions • Quelle configuration matérielle et logicielle pour une base documentaire d’un milliard de documents ? Et jusqu’à 10 milliards ? • Quelles sont les étapes clés d’adaptabilité et les critères associés ? • Quel est l’impact opérationnel d’une base de 10 milliards de documents ? 2/ Effectuer le test en contexte • Un modèle de métadonnées complexe • Index plein texte actif • Une variété de types de fichiers • Un test effectué sur Nuxeo Cloud • Une validation standardisée de chaque étape: import/édition/suppression/déplacements de masse 3/ Présenter les résultats et continuer les tests • Présentation du test en démo • Tests de performance réguliers
  • 16.
    De 0 à1M+ de documents Crud REST / API Temps de réponse < 200ms Navigation Temps de réponse < 700ms Recherche (plain texte) Temps de réponse < 2s Import de masse Débit > 5,000 docs/s Indexation de masse Débit > 14,000 docs/s Lecture en masse Débit > 50,000 docs/s - 100 m - 300 m - 500 m - 750 m - 1M
  • 17.
    Charge mixe à1,5 milliards CRUD vs Bulk import ■ Tests CRUD longs ■ Import de masse avec throttle Résultats ■ Un temps de réponse accru (+20%) mais toujours bon ■ L’import de masse tourne à 2.3 K docs/s ■ Un million de documents importés en moins de 8 minutes Import de 2.5M de documents
  • 18.
    Quelques exemples d’enseignements 1/ 1,5puis 2 puis 3 milliards • Ré-indexation 1,5 milliards en 16h(27 000 docs / seconde) • Ré-indexation 3 milliards en 24h (36 000 docs/seconde) (9 noeuds Nuxeo) 2/ Scénario de « Scale down » Elasticsearch • 16 M5.4xlarge  12 R5.2xlarge • 1h • Aucun changement sur les Create , Read, Update, + 30% sur la recherche pendant le scale down 3 / Bulk edit • 14M documents, 3 propriétés éditées incl. complexes • 1000 doc/secondes mise à jour • 14 000 de docs en 4h • 25% des ressources Nuxeo utilisées 4 / Tests import journalier • Import de 15M de docs en moins de 45 minutes • Temps de réponse +3.8% • Import à 5.5 K docs/s
  • 19.
  • 20.
    Les dernières améliorations Améliorationdu formulaire d’upload Web UI Fil d’historique Transfert de contenu optimisé pour Nuxeo Enhanced Viewer Flow amélioré de création de formulaires
  • 21.
  • 22.
    A venir Outlook Transferts d’Outlookà Nuxeo facilités 1 Salesforce Afficher le bon contenu aux bons utilisateurs 2 Recherche Amélioration de la recherche même avec des dizaines de métadonnées impliquées 3 Aspera Support de l’upload de dossiers, amélioration d’expérience utilisateur 4