3. Lagardere Active Groupe de média Lagardère Active est devenu en 2006 une entité réunissant les activités d’éditeur de magazines et les activités audiovisuelles et numériques. Un des premiers éditeurs de magazines grand public au monde 2ème radio d’information généraliste privée avec Europe 1 2ème groupe de média français sur Internet avec près de 16 millions de VU par mois 2ème groupe de production audiovisuelle en France (fiction, flux, animation) 1er groupe français producteur de fictions (7 fictions dans le top 100 et 111h de programmes) November 2010 3
4. Content & production Distribution Channels The Digital Factory Magazines Print TV Audio video Production Digitize and manage all the content of Lagardère Active Radios Radios Internet Site Rights purchase Internet Mobile Objectifs de la Digital Factory
5. Objectifs du projet Faciliter l’accès aux différents contenus diffusables, du groupe Lagardère Active, au pôle numérique. Fournir des flux rich-média, structurés au mieux, sans perturber les productions actuelles. Anticiper la demande de flux de données thématiques du pôle numérique.
7. Cartographie :Contenus Topics Story Other Events People Oeuvre Diffusion TV Business CTS ADeuxI ICM Grille ICM Doc CINDOC CHAMAN Radio E-News STAN WEB Music Brand Press PIXBOW Text Documentation Editorial system Flat Plan WEB Print Brand Cellfish Lifestyle Mobile Web Agency Plurimedia Spectacles Cellfish Mobile Agences TV
8. Cartographie : Technique Conteneur Interface Interface Conteneur HTTP Client/serveur MySQL Oracle XML TV Pôles CTS ADeuxI / Louise ICM Grille ICM Doc Radio CHAMAN CINDOC E-News WEB Music Brand STAN Press PIXBOW Doc. Texte Flat Plan Editorial system WEB Pôle Magazine Mobile Web Agence Cellfish Lifestyle Plurimedia Spectacles (Postgres/java/rmi) Cellfish Mobile Agences TV (MSQL) Agences TV
9. IPTC AFP Reuters Vodafone IBM ITune Adobe IPTC TVAnytime IPTC Core PDF/A AdsML MPEG-7 MPEG-21 XMP Exif Tiff Adobe NewsML JPX XrML ID3 AAF vCard vCal IPTC EXIF MPEG HTML TIFF Adobe DPRL RDF NON XML standards Cartographie des vocabulaires XML LASER : Lagardere Active Schema for Exchange ofResources WEB Google FaceBook Technocrati Flickr… Microsoft Major Players using Metadata μF RSS OOXML ODF hCard hCal PRISM hAtom xfn Dublin core XML schema XHTML RDF/XML XML standards or recommendations
10. Etudes de cas Modifier les flux de travail November 2010 10
11. KiosqueNum Premiere.fr Je récupère automatiquement les critiques de films et recherche le reste à un seul endroit Je recherche et copie-colle le texte à partir des éléments de la rédaction ou des PDF du pré-presse Rédaction Prépresse
12. KiosqueNum Pages programmes de Télé 7 Jours Je récupère automatiquement un choix d’images de Pixbow d’après la liste de Plurimedia Je reçois une liste de films ou d ’émissions en Word et cherche dans Pixbow les images Je finalise les pages avec les images déjà placées. Je renomme les images pour les monter dans les pages programmes Rédaction Prépresse J’indexe les images parues et les lie aux pages J’indexe les nouvelles images (mise à jour automatique des autres)
13. ELLE international Io scrivo un articolo su Eva Mendes a Venezia per ELLE.it Je retrouve tous les articles sur Eva Mendes à Venise J'écris un article sur Eva Mendes à Venise pour ELLE.fr
14. Alerte sur des news pour Europe 1 Je suis alerté qu’un nouveau contenu LA, sur un sujet qui m’intéresse, est arrivé. Je suis alerté quand une dépêche de l’AFP ou Reuters tombe! Rédaction
16. Evolution du projet et des contenus Montrer Agréger Diffuser Forte Données numériques Volume Exhaustivité Faible Forte Faible Structuration Structuration 2008 2011
18. Digital Factory : Montrer Publication Digital Print Radio Video Find Load Existing Content
19. Principes de base Les bases sources exposent elles-mêmes leurs données d’après leurs règles métiers Pas de duplication des ressources (image, son, vidéo, PDF…) Les bases sources conservent la gestion des règles de sécurité. La Digital Factory conserve le contenu source sans interprétation propose une interface simplede recherche et de découvertedes contenus Les modifications de contenus sont réalisées dans les bases sources November 2010 19
20. Principes techniques Utilisation au maximum des normes et des standards La base source doit : Exposer ses données via sitemap(Google) Exporter ou exposer les métadonnées et textes au format XML sans contrainte de vocabulaire mais bien formé et bien encodé Exposer ses ressources (images, son, vidéo, PDF) via des URL Proposer une URLpour accéder aux ressources en conservant les règles de sécurité. Digital Factory doit : Rapatrier les contenus XML en gérant le différentiel si possible Découper, transcoder et structurer le XML (NewsML, Xquery, XSL) Identifier de façon uniqueles contenus (URNet UID) Filtrer les données (Xpath) Indexer le contenu (Exalead, moteur de recherche utilisé par le web) Quadro Flow November 2010 20
21. Résultat de Montrer Syndication Internationale FRANCE (44%) ITALY (16%) UK (15%) USA (7%) SPAIN (5%) GERMANY (5%) NLD (3%) Documentation texte PARIS MATCH (32%) TELE 7 JOURS (18%) ELLE (18%) JDD (17%) FRANCE DIMANCHE (9%) PREMIERE (1%) PSYCHOLOGIES (0.3%) Documentation TELE 7 JOURS (21%) ONZE MONDIAL (21%) AUTO MOTO (19%) PARIS MATCH (13%) ARCHIVES FILIPACCHI (9%) FRANCE DIMANCHE (7%) ICI PARIS (3%) PARENTS (1%) FICTIONS TV (0.6%) JEUNE ET JOLIE ISA CANAL J (31%) GULLI (24%) TIJI (18%) Filles TV (8%) MCMB (6%) MCM (5%) Virgin 17 (2%) Mezzo (2%) Escoop + Docs Images Travel Magazine Network
25. Digital Factory : Montrer Publication Editors Digital Print Radio Video Find Existing content Load Existing Content
26. Content Factory : Agréger Publications Editors Digital Print Radio Video Customers Find & Select Content Existing content Product feed Load Existing Content Render Internet content Internet Blogs RSS feeds
27. Agréger du contenu : Exemple Plurimedia : « Ce film sort en salle à telle date et a pour acteur cette personne » Europe 1 : « Cette personne est invitée à cette émission » Production antenne : « Voici le son de cette émission » Base images presse : « Voici les images de cette personne et de ce film » Règle d’agrégation : Si une personne est invitée à une émission de radio aux alentours de la date de sortie d’un film dont il est acteur; il y a toutes les chances que nous parlions du film dans cette émission. Résultat : Contenu agrégé : Fiche descriptive film Fiche descriptive acteur Son de l’émission Images du film November 2010 27
30. Les principes de base La Content Factory est une usine à agréger et non un magasin Pourvoir indexer la structure et le contenu sans définir un format Pivot et en gardant la structure d’origine (ex: Pièce de théâtre) Mixerdes recherches full-text et de structures XML Traduire les règles d’agrégation dans un vocabulaire standard Tester des règles d’agrégation avant de créer les indexes Gérer les scores de confiance des règles d’agrégation et d’extractions d’entités nommées Pouvoir modifier les indexes sans réimporter tous les contenus November 2010 30
31. Le choix de MarkLogic Les critères Base native XML Xqueryenrichi de fonctions de recherche full-text Gestion des indexes, Lexicon, Dictionnaire… Module d’administration pour l’exploitation Choix 4D Concept Les bonnes surprises… Gérer les documents Xpress (DOM) et InDesign (archive IDML) Alertes (Reverse Query) Gérer une succession de transformations (Content Processing Framework) Application Builder Geospatial Library November 2010 31
33. La solution cible Mise à jour de l’import Montrer Recherche simple Recherche avancée avec jointures et agrégation Mêmes modules que l’import
34. La recherche avancée Une interface dédiée dans un premier temps à toutes les personnes de la Direction des Technologies Sélectionner les sources Définir les jointures Définir les critères de recherche Trier Formater le contenu Résultat : Xquery pour le module d’export November 2010 34
38. Flux iPad : Paris Match & Elle à table Objectifs : Etre présent à la sortie de l’iPad aux US. Edition numérique et interactive créée par l’équipe print avec ses outils (Xpress) Maquettage du flux et tests via MarkLogic Flux développé avec Quadro Flow par 4D Concept Résultats : Première version gratuite pour le lancement de l’iPad au Etats-Unis Version payante hebdomadaire pour le lancement français November 2010 38
39. Flux iPad : Paris Match & Elle à Table Flux génération de l’édition iPad Quark Xpress sans Xtension : Mise en page et ajout de l’interactivité Digital Factory + Xpress Server : Converti et agrège les médias EZ Publish Back-office : CMS et In-App Purchase November 2010 39
40. Et aussi… Echanges PQN-PHN v2 Spectacles : Premiere.fr Journal du Dimanche : Flux de news Elle.fr : Fiches cuisine, Critique Livres (Amazone)… November 2010 40
41. 41 Merci de votre attention Vincent.mas@lagardere-active.com