Back to the future : SQL 92 for Elasticsearch @nosqlmatters ParisLucian Precup
This document summarizes a presentation comparing SQL 92 to Elasticsearch querying. It discusses how:
- Elasticsearch gives developers more power over query optimization compared to SQL/RDBMS which empowers database administrators. Developers must handle optimization, data storage, consistency, etc.
- Many common SQL operations like filtering, aggregations, sorting, pagination have direct counterparts in Elasticsearch querying, though implementations may differ.
- Joins are challenging in Elasticsearch due to its document-oriented model. Solutions include duplicating joined data, using parent/child relations, or issuing multiple queries and combining results.
- Operations like GROUP BY and HAVING can be implemented in Elasticsearch by combining aggregation and filtering operations.
The overall
TDC2016POA | Trilha BigData - Respostas em tempo real para perguntas complexa...tdc-globalcode
O documento apresenta uma introdução sobre agregações no Elasticsearch, explicando que agregações permitem analisar e classificar completamente um grupo de dados ao invés de apenas documentos individuais. É descrito alguns tipos comuns de buckets e métricas para agregação de dados e exemplos práticos são apresentados para ilustrar o agrupamento de cervejas por marca e tamanho.
01 Allocution du President du FCE Mr Ahmed TibaouiOUADA Yazid
communications données lors des journées de l’entreprise algérienne organisée par le FCE sur le thème «les normes, outils de compétitivité, de croissance et de protection » a l’hotel EL AURASSI le 11 novembre 2014.
Los doce apóstoles no fueron enviados a predicar a los gentiles, sino a las "ovejas perdidas de la casa de Israel", que se referían a las diez tribus perdidas de Israel. Pablo fue el apóstol escogido específicamente para llevar el evangelio a los gentiles. El documento analiza pasajes bíblicos y la historia de la iglesia primitiva para argumentar que los doce apóstoles predicaron principalmente a las diez tribus perdidas de Israel y no se quedaron en Jerusalén.
Le groupe C2C est venu présenté en avant-première la première application tactile de mixage sur tablette Windows 8. Une application qui a été développée spécifiquement en prenant en compte leurs besoins très particuliers de mixage : https://www.youtube.com/watch?v=c_hhOz-eHZs
Campagne présentée lors de l'aprés midi de paris 2.0 du 6 mars animée par Arnaud Hacquin.
PARIS 2.0 : 60 campagnes de branded entertainment http://fr.amiando.com/brandedentertainment.htm. Organisé par jeremy dumont; planneur strategique http://pourquoitucours.fr
Plus d'informations : http://www.psst.fr
Back to the future : SQL 92 for Elasticsearch @nosqlmatters ParisLucian Precup
This document summarizes a presentation comparing SQL 92 to Elasticsearch querying. It discusses how:
- Elasticsearch gives developers more power over query optimization compared to SQL/RDBMS which empowers database administrators. Developers must handle optimization, data storage, consistency, etc.
- Many common SQL operations like filtering, aggregations, sorting, pagination have direct counterparts in Elasticsearch querying, though implementations may differ.
- Joins are challenging in Elasticsearch due to its document-oriented model. Solutions include duplicating joined data, using parent/child relations, or issuing multiple queries and combining results.
- Operations like GROUP BY and HAVING can be implemented in Elasticsearch by combining aggregation and filtering operations.
The overall
TDC2016POA | Trilha BigData - Respostas em tempo real para perguntas complexa...tdc-globalcode
O documento apresenta uma introdução sobre agregações no Elasticsearch, explicando que agregações permitem analisar e classificar completamente um grupo de dados ao invés de apenas documentos individuais. É descrito alguns tipos comuns de buckets e métricas para agregação de dados e exemplos práticos são apresentados para ilustrar o agrupamento de cervejas por marca e tamanho.
01 Allocution du President du FCE Mr Ahmed TibaouiOUADA Yazid
communications données lors des journées de l’entreprise algérienne organisée par le FCE sur le thème «les normes, outils de compétitivité, de croissance et de protection » a l’hotel EL AURASSI le 11 novembre 2014.
Los doce apóstoles no fueron enviados a predicar a los gentiles, sino a las "ovejas perdidas de la casa de Israel", que se referían a las diez tribus perdidas de Israel. Pablo fue el apóstol escogido específicamente para llevar el evangelio a los gentiles. El documento analiza pasajes bíblicos y la historia de la iglesia primitiva para argumentar que los doce apóstoles predicaron principalmente a las diez tribus perdidas de Israel y no se quedaron en Jerusalén.
Le groupe C2C est venu présenté en avant-première la première application tactile de mixage sur tablette Windows 8. Une application qui a été développée spécifiquement en prenant en compte leurs besoins très particuliers de mixage : https://www.youtube.com/watch?v=c_hhOz-eHZs
Campagne présentée lors de l'aprés midi de paris 2.0 du 6 mars animée par Arnaud Hacquin.
PARIS 2.0 : 60 campagnes de branded entertainment http://fr.amiando.com/brandedentertainment.htm. Organisé par jeremy dumont; planneur strategique http://pourquoitucours.fr
Plus d'informations : http://www.psst.fr
Voici le nouvel Artimag de septembre. Votre mensuel dédié aux informations et bons plans dans le Béarn. Sans oublier l'agenda des sorties du mois pour que vous n'ayez aucune excuse en cas d'ennui !
Communication : La norme, Levier de régulation pour le commerce extérieur, Mr...OUADA Yazid
communications données lors des journées de l’entreprise algérienne organisée par le FCE sur le thème «les normes, outils de compétitivité, de croissance et de protection » a l’hotel EL AURASSI le 11 novembre 2014.
Proyecto de una izquierda popular globalAnneo Cruz
Este documento presenta una discusión sobre la necesidad de construir un proyecto de izquierda popular global en el contexto de la globalización. Plantea que a pesar de existir diversos movimientos sociales que luchan contra el neoliberalismo, hace falta una articulación entre ellos y un proyecto alternativo unificado. También analiza la relación entre los partidos políticos de izquierda, los Estados y las clases dominantes, señalando la importancia de mantener una comunicación constante con las bases populares.
Este documento describe la insuficiencia cardíaca, incluyendo su definición como la incapacidad del corazón para mantener un volumen minuto adecuado para satisfacer las necesidades metabólicas del organismo. Explica la insuficiencia cardíaca izquierda y derecha, los criterios mayores y menores para diagnosticar la insuficiencia cardíaca, y las clasificaciones de fallo cardíaco retrogrado y anterógrado, de bajo gasto y alto gasto, y sistólico versus diastólico.
AVISO: Los documentos no me pertenecen, son propiedad de los docentes de la carrera de Medicina de la Fundación Barceló. Las faltas de ortografía y/o errores gramaticales también pertenecen a los respectivos autores.
Le CETIC organisait le mardi 24 novembre 2015 à 14h une après-midi dédiée au Big Data. Cet événement prenait place au sein de la programmation de la Big Data Week 2015, consacrée aux retours d'expérience du Big Data. J'Robert Viseur introduisait l'après-midi avec la présentation d'une première version d'une cartographie des prestataires belges / wallons en Big Data.
Résumé des présentations et ressources de l'événement "Parcours Big Data" organisé par @Cetic dans la cadre de la Big Data Week 2014, en collaboration avec @awtbe
Voici le nouvel Artimag de septembre. Votre mensuel dédié aux informations et bons plans dans le Béarn. Sans oublier l'agenda des sorties du mois pour que vous n'ayez aucune excuse en cas d'ennui !
Communication : La norme, Levier de régulation pour le commerce extérieur, Mr...OUADA Yazid
communications données lors des journées de l’entreprise algérienne organisée par le FCE sur le thème «les normes, outils de compétitivité, de croissance et de protection » a l’hotel EL AURASSI le 11 novembre 2014.
Proyecto de una izquierda popular globalAnneo Cruz
Este documento presenta una discusión sobre la necesidad de construir un proyecto de izquierda popular global en el contexto de la globalización. Plantea que a pesar de existir diversos movimientos sociales que luchan contra el neoliberalismo, hace falta una articulación entre ellos y un proyecto alternativo unificado. También analiza la relación entre los partidos políticos de izquierda, los Estados y las clases dominantes, señalando la importancia de mantener una comunicación constante con las bases populares.
Este documento describe la insuficiencia cardíaca, incluyendo su definición como la incapacidad del corazón para mantener un volumen minuto adecuado para satisfacer las necesidades metabólicas del organismo. Explica la insuficiencia cardíaca izquierda y derecha, los criterios mayores y menores para diagnosticar la insuficiencia cardíaca, y las clasificaciones de fallo cardíaco retrogrado y anterógrado, de bajo gasto y alto gasto, y sistólico versus diastólico.
AVISO: Los documentos no me pertenecen, son propiedad de los docentes de la carrera de Medicina de la Fundación Barceló. Las faltas de ortografía y/o errores gramaticales también pertenecen a los respectivos autores.
Le CETIC organisait le mardi 24 novembre 2015 à 14h une après-midi dédiée au Big Data. Cet événement prenait place au sein de la programmation de la Big Data Week 2015, consacrée aux retours d'expérience du Big Data. J'Robert Viseur introduisait l'après-midi avec la présentation d'une première version d'une cartographie des prestataires belges / wallons en Big Data.
Résumé des présentations et ressources de l'événement "Parcours Big Data" organisé par @Cetic dans la cadre de la Big Data Week 2014, en collaboration avec @awtbe
Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le KioskJedha Bootcamp
Nos formations : www.jedha.co
De plus en plus demandés par les recruteurs de tous types d'entreprises, les Data Scientists ont pris une importance considérable dans leurs processus de décision. Lors de cette session Ask My Anything, nous répondrons à toutes vos questions sur le métier de Data Scientist après vous avoir donnés nos astuces et conseils.
20141216 La veille en TPE / PME by competiticCOMPETITIC
La veille : un véritable atout maître dans les mains du chef d’entreprise.
Au cours de cette séance seront abordés les points suivants :
- Bien comprendre la veille pour mieux l'utiliser
- Les étapes de mise en œuvre d’une activité de veille dans l’entreprise
- Présentation de différents outils de veille
Panorama comparatif des outils de reporting et Dashboarding Microsoft : Excel, SSRS et Power View. Les plus de chacun de ces outils de reporting pour répondre à tous vos besoins.
Speakers : Stéphane Vivien (GFI Informatique), Michael Nokhamzon (GFI Informatique), Laurent Miltgen-Delinchamp (Cumulos)
Avec Hadoop, Excel et… 1€, réalisez votre premier Mobile BigData Tracker en m...Microsoft
Si de plus en plus d'entreprises et d'organisations comprennent l'intérêt d'exploiter les Big Data pour se différencier et innover, beaucoup d'entre elles pensent également que le sujet reste totalement hors de leur portée : leurs applications mobiles génèrent par exemple déjà des tonnes de données encore inexploitées ! Big Data ne rime-t-il pas en effet avec "Big Investissements" et "Big Compétences" ? Et dans ce cas, comment justifier d'investir sur un projet Big Data avant même de savoir si ce dernier sera rentable ? Comment trouver le juste équilibre entre oser l'innovation et accepter de se tromper ? Au cours de cette session nous vous démontrerons qu'il n'en est rien ! Découvrez comment mettre en œuvre un projet Big Data à partir de donnnées venant d'applications Android / iOS / Windows Phone / Windows 8... avec Hadoop dans Windows Azure et rendre les données accessibles à n'importe quel utilisateur de l'entreprise au travers d'Excel et Power BI le tout pour… 1 € en moins de… 45 mn.
Speakers : Benjamin Guinebertière (Microsoft), Jean-David Benassouli (Accenture)
Océane consulting - Intégration de Luxid TEMIS dans Nuxeo Platform - Nuxeo ...Nuxeo
(French) Traditionnellement, le concept de métadonnées est utilisé pour affiner la recherche et l'exploitation des documents d'un système de gestion documentaire. Ces métadonnées sont renseignées manuellement par l'utilisateur, processus long et potentiellement générateur d'erreurs. La reconnaissance sémantique de documents permet d'injecter automatiquement des métadonnées reconnues dans le texte, voire d'automatiser leur classification. Océane Consulting présentera l'utilisation du moteur sémantique Luxid développé par la société TEMIS pour la reconnaissance sémantique de documents dans Nuxeo Platform.
Réussissez vos projets d’analytique self-service avec une couche de services ...Denodo
Watch full webinar here: https://bit.ly/3pjyzRY
Une initiative de self-service réussie signifie que les utilisateurs métiers ont accès à une vue complète et cohérente des données, indépendamment de leur emplacement, de leur source ou de leur type. Toutefois, les entreprises doivent également veiller à ce que, tout en exploitant le plein potentiel des données pour les utilisateurs métiers, elles respectent les exigences de sécurité.
La virtualisation des données en tant que couche de service de données gouvernée peut non seulement aider les organisations à mettre en place une couche d'accès aux données unifiée qui fournit des vues intégrées des données aux utilisateurs métiers en temps réel, mais permet également à l'organisation d'établir des protocoles de gouvernance et de spécifier des sources faisant autorité.
Les points clés du webinar:
- Les défis auxquels sont confrontés les utilisateurs métiers
- Comment la virtualisation des données permet l’analytique self-service
- Une démo live
- Des études de cas client
6 IT est une agence Web & Systèmes d'entreprise
Elle accompagne les PME dans leur transition numérique
Expertise dans les métiers du Négoce, e-Commerce, Distribution, Logistique et Transport, Services B2B et B2C
Joins in a distributed world Distributed Matters Barcelona 2015Lucian Precup
A lot of database related algorithms are more difficult to implement in a distributed environment. Quite often, the "distributed" version is far from the "classical" version : constraints are dropped (see the CAP theorem), only specific cases are supported (for example : the involved data needs to be co-located within the distributed system), etc. This talk focuses on joins.
We start by presenting join implementations in "classical" relational databases than we lead the audience through the challenges and solutions to make these functions available in a distributed environment. While we start with a theoretical point of view, we finish by giving real life examples from implementations in ETL systems (known for joining heterogeneous databases and therefore quite advanced in this area, but often not real-time) and some modern NoSQL databases (where most systems choose to offer less features with respect to joins).
Search and nosql for information management @nosqlmatters CologneLucian Precup
The document discusses using a search engine like Elasticsearch to power the search functionality for an information management application. It describes how Elasticsearch can provide benefits like fast full-text search, autocomplete, faceting and other features out of the box. It also addresses challenges of integrating the search index with relational data and solutions like using the service layer to handle synchronization between databases.
Back to the future : SQL 92 for Elasticsearch ? @nosqlmatters Dublin 2014Lucian Precup
What if we would try to make Elasticsearch SQL 92 compliant (http://www.contrib.andrew.cmu.edu/~shadow/sql/sql1992.txt)? This wouldn't serve that much nowadays, you would say. Well, we actually tried to do the exercise and we have some interesting conclusions. While we take Elasticsearch as an example for this "side by side", the issues we are addressing also apply to nosql in general. With this unusual exercise, we take the occasion to compare relational databases / sql with Elasticsearch / nosql on all the levels : functionality, semantics, performance and user experience.
Présentation faite à ScrumDay Paris en 2011
Les développeurs, les responsables qualité, les ScrumMasters, les ProductOwners ou les responsables des développements ont de plus en plus besoin d’intégrer leurs outils. Ceci s’inscrit dans une démarche Lean visant à donner un accès facile et immédiat à toute l’information, à éliminer les gaspillages et à détecter les problèmes le plus tôt possible dans le cycle de développement.
Alors que certaines plateformes, comme celle de Microsoft, sont déjà intégrées, beaucoup de systèmes sont construits sur mesure par les équipes de développement. Nous pouvons imaginer, par exemple, une plateforme intégrant Eclipse, Code Collaborator, Perforce, Hudson, Sonar, Jira, Project Server et Crystal Reports, solution intégrant des outils Open Source et propriétaires.
Cette session présentera différentes solutions ALM et la façon dont elles supportent une démarche agile. Pour mettre l’accent sur l’intégration entre les différents outils nous détaillerons une solution basée sur Mylyn, l’ALM Open Source pour Eclipse, s’intégrant à Microsoft TFS. Quelques fonctionnalités sympathiques comme la gestion très facile du backlog, le calcul automatique du burndown chart ou la gestion des revues de code seront également présentées.
Presentation faite à Agile France en 2011
La revue de code : c’est facile !
Cette présentation est la suite de la session « La revue de code : c’est agile, c’est lean, c’est indispensable ! » présentée à Agile France et Agile Tour en 2010.
Après avoir répondu aux idées reçues sur la revue de code et avoir montré combien une revue de code systématique soutient une démarche agile et lean, cette présentation se focalise sur la mise en place de la revue de code comme étape incontournable du processus de développement.
Nous évoquerons les bonnes pratiques, les difficultés à la mise en place, les pièges à éviter et aussi les outils qui facilitent la revue de code. Une grande partie de la présentation sera dédiée à plusieurs démonstrations, exemples et retours d’expérience.
La revue de code : agile, lean, indispensable !Lucian Precup
Présentation faite à Agile France en 2010 :
La revue de code : agile, lean, indispensable !
Alors que l’intégration continue ou les tests unitaires commencent à rentrer dans les "standards", la revue de code est souvent considérée comme optionnelle. Pourtant, les avantages d’une revue de code systématique sont multiples : détection des anomalies très tôt dans le cycle de développement, formation des membres de l’équipe, partage de la connaissance, meilleures solutions techniques par la conjonction des perspectives développeur/examinateur.
Cette présentation mettra en évidence les avantages de la revue du code en répondant aux idées reçues comme "la revue du code augmente la durée des développements", ou "nos développeurs sont très bons, ils n’ont pas besoin de revue de code" ou encore "il n’y a personne dans l’équipe qui puisse examiner mon code car je suis le seul à connaître Bash et Ant". En évoquant la revue de code dans l’univers open source, les différents moyens de la mettre en œuvre, ses compléments, les différents outils ; et terminant par une démonstration concrète en utilisant Eclipse, Bugzilla et Mylyn, cette présentation vous convaincra de mettre en place la revue de code systématique dans votre équipe sans attendre.
Déroulement :
1/ Avantages
2/ Idées reçues
3/ La revue de code dans l’univers open-source : de la revue du patch par le committeur aux procédures très élaborées comme celles de Mozilla Developer Center.
4/ Moyens de mise en œuvre : à partir de quelle taille des projets, par qui, comment, avant l’intégration ou après, ...
5/ Les compléments de la revue du code : analyse de la qualité du code, scripts pour les normes internes, ...
6/ Comparaison avec d’autres techniques : pair programming, ...
7/ Outils et intégration avec les autres outils de développement ou de gestion du cycle de vie (intégration continue, gestion des anomalies, ...)
8/ Démonstration des avantages sur un exemple concret en utilisant Eclipse, Bugzilla et Mylyn comme outils.
9/ Conclusion : comment la revue de code supporte une démarche agile et lean
Moteurs de recherche et Lucene at LorraineJUGLucian Precup
Présentation tenue à Lorraine JUG (http://lorrainejug.blogspot.fr/2012/11/moteurs-de-recherche-lucene-en-action.html):
<< Apache Lucene, la fameuse technologie pour l’indexation, la recherche et l’analyse du texte est la base de plusieurs serveurs Open Source. La présentation détaillera Solr et ElasticSearch sous la forme "Tools in Action" - démonstrations en direct des différents outils.
Allant au-delà du tutorial, cette session vous permettra de découvrir comment mettre en place des serveurs de recherche pertinents, robustes, performants et évolutifs en utilisant des approches NoSQL, Apache Lucene et bibliothèques Java Open Source. Des subtilités sur l’analyse du texte, la recherche approximative, l’auto-complétion seront abordées afin de montrer les forces mais aussi les limites de la magie Lucene.
Lucian est développeur, architecte et responsable des développements ayant évolué, depuis douze ans, du projet de recherche au grand éditeur de logiciels en passant par la start-up.
Depuis 2010 Lucian a acquis, à travers ses missions, une expertise sur les architectures NoSQL et les moteurs de recherche pour l’entreprise (Enterprise Search), expertise qu’il partage dans différents barcamps et conférences. >>
Solr and Elasticsearch in Action (at Breizhcamp)Lucian Precup
Lucene @ Breizhcamp
Lucene, la fameuse technologie pour l’indexation, la recherche et l’analyse du texte a été présente à l'édition 2012 de Breizhcamp à travers deux sessions « Tools In Action » : ElasticSearch et Solr.
Allant au-delà du tutorial, ces deux sessions ont permis de découvrir des patterns d’architecture pour l'intégration d'un moteur de recherche et navigation dans un SI ainsi que de comprendre l’alternative qu’offrent les moteurs de recherche et les approches NoSQL aux bases de données relationnelles. Des subtilités sur l’analyse du texte ont été abordées afin de montrer les forces mais aussi les limites de la magie Lucene. Les démonstrations de chaque technologie et des outils dans leur écosystème ont rendu la présentation plus interactive.
La vidéo de la présentation se trouve sur Parleys (http://www.parleys.com/#st=5&id=3351).
L'IA connaît une croissance rapide et son intégration dans le domaine éducatif soulève de nombreuses questions. Aujourd'hui, nous explorerons comment les étudiants utilisent l'IA, les perceptions des enseignants à ce sujet, et les mesures possibles pour encadrer ces usages.
Constat Actuel
L'IA est de plus en plus présente dans notre quotidien, y compris dans l'éducation. Certaines universités, comme Science Po en janvier 2023, ont interdit l'utilisation de l'IA, tandis que d'autres, comme l'Université de Prague, la considèrent comme du plagiat. Cette diversité de positions souligne la nécessité urgente d'une réponse institutionnelle pour encadrer ces usages et prévenir les risques de triche et de plagiat.
Enquête Nationale
Pour mieux comprendre ces dynamiques, une enquête nationale intitulée "L'IA dans l'enseignement" a été réalisée. Les auteurs de cette enquête sont Le Sphynx (sondage) et Compilatio (fraude académique). Elle a été diffusée dans les universités de Lyon et d'Aix-Marseille entre le 21 juin et le 15 août 2023, touchant 1242 enseignants et 4443 étudiants. Les questionnaires, conçus pour étudier les usages de l'IA et les représentations de ces usages, abordaient des thèmes comme les craintes, les opportunités et l'acceptabilité.
Résultats de l'Enquête
Les résultats montrent que 55 % des étudiants utilisent l'IA de manière occasionnelle ou fréquente, contre 34 % des enseignants. Cependant, 88 % des enseignants pensent que leurs étudiants utilisent l'IA, ce qui pourrait indiquer une surestimation des usages. Les usages identifiés incluent la recherche d'informations et la rédaction de textes, bien que ces réponses ne puissent pas être cumulées dans les choix proposés.
Analyse Critique
Une analyse plus approfondie révèle que les enseignants peinent à percevoir les bénéfices de l'IA pour l'apprentissage, contrairement aux étudiants. La question de savoir si l'IA améliore les notes sans développer les compétences reste débattue. Est-ce un dopage académique ou une opportunité pour un apprentissage plus efficace ?
Acceptabilité et Éthique
L'enquête révèle que beaucoup d'étudiants jugent acceptable d'utiliser l'IA pour rédiger leurs devoirs, et même un quart des enseignants partagent cet avis. Cela pose des questions éthiques cruciales : copier-coller est-il tricher ? Utiliser l'IA sous supervision ou pour des traductions est-il acceptable ? La réponse n'est pas simple et nécessite un débat ouvert.
Propositions et Solutions
Pour encadrer ces usages, plusieurs solutions sont proposées. Plutôt que d'interdire l'IA, il est suggéré de fixer des règles pour une utilisation responsable. Des innovations pédagogiques peuvent également être explorées, comme la création de situations de concurrence professionnelle ou l'utilisation de détecteurs d'IA.
Conclusion
En conclusion, bien que l'étude présente des limites, elle souligne un besoin urgent de régulation. Une charte institutionnelle pourrait fournir un cadre pour une utilisation éthique.
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)Laurent Speyser
(Conférence dessinée)
Vous êtes certainement à l’origine, ou impliqué, dans un changement au sein de votre organisation. Et peut être que cela ne se passe pas aussi bien qu’attendu…
Depuis plusieurs années, je fais régulièrement le constat de l’échec de l’adoption de l’Agilité, et plus globalement de grands changements, dans les organisations. Je vais tenter de vous expliquer pourquoi ils suscitent peu d'adhésion, peu d’engagement, et ils ne tiennent pas dans le temps.
Heureusement, il existe un autre chemin. Pour l'emprunter il s'agira de cultiver l'invitation, l'intelligence collective , la mécanique des jeux, les rites de passages, .... afin que l'agilité prenne racine.
Vous repartirez de cette conférence en ayant pris du recul sur le changement tel qu‘il est généralement opéré aujourd’hui, et en ayant découvert (ou redécouvert) le seul guide valable à suivre, à mon sens, pour un changement authentique, durable, et respectueux des individus! Et en bonus, 2 ou 3 trucs pratiques!
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...OCTO Technology
Par Nicolas Bordier (Consultant numérique responsable @OCTO Technology) et Alaric Rougnon-Glasson (Sustainable Tech Consultant @OCTO Technology)
Sur un exemple très concret d’audit d’éco-conception de l’outil de bilan carbone C’Bilan développé par ICDC (Caisse des dépôts et consignations) nous allons expliquer en quoi l’ACV (analyse de cycle de vie) a été déterminante pour identifier les pistes d’actions pour réduire jusqu'à 82% de l’empreinte environnementale du service.
Vidéo Youtube : https://www.youtube.com/watch?v=7R8oL2P_DkU
Compte-rendu :
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...OCTO Technology
par Claude Camus (Coach agile d'organisation @OCTO Technology) et Gilles Masy (Organizational Coach @OCTO Technology)
Les équipes infrastructure, sécurité, production, ou cloud, doivent consacrer du temps à la modernisation de leurs outils (automatisation, cloud, etc) et de leurs pratiques (DevOps, SRE, etc). Dans le même temps, elles doivent répondre à une avalanche croissante de demandes, tout en maintenant un niveau de qualité de service optimal.
Habitué des environnements développeurs, les transformations agiles négligent les particularités des équipes OPS. Lors de ce comptoir, nous vous partagerons notre proposition de valeur de l'agilité@OPS, qui embarquera vos équipes OPS en Classe Business (Agility), et leur fera dire : "nous ne reviendrons pas en arrière".
OCTO TALKS : 4 Tech Trends du Software Engineering.pdfOCTO Technology
En cette année 2024 qui s’annonce sous le signe de la complexité, avec :
- L’explosion de la Gen AI
-Un contexte socio-économique sous tensions
- De forts enjeux sur le Sustainable et la régulation IT
- Une archipélisation des lieux de travail post-Covid
Découvrez les Tech trends incontournables pour délivrer vos produits stratégiques.
4. Les moteurs de recherche sont partout
-- LucidWorks (http://www.lucidworks.com/)
5. Use case métier
• E-commerce
– Beaucoup de critères de pertinence métier à implémenter
• Ressources humaines
– Recherche de personnes
– Recherche full-texte (catalogues formation, CVs, compétences)
• Poste de travail
– Modèle métier complexe
– Indexation temps réel
• Portail intranet
– Hétérogénéité des sources données: annuaires, wikis, fichiers,
applications
• Internet
– Pertinence du premier résultat. Ex. : « I’m feeling lucky » de Google,
Siri, LeMoteur.fr
6. Recherche rapide
Recherche rapide
«« full-text »
full-text »
Auto-complétion
Auto-complétion
(suggestions de résultats)
(suggestions de résultats)
Surbrillance gérée par le
Surbrillance gérée par le
moteur
moteur
Accès aux recherches
Accès aux recherches
multicritères
multicritères
Recherche approximative et
Recherche approximative et
suggestions d’orthographe
suggestions d’orthographe
Nombre total
Nombre total
des résultats
des résultats
Résultats affichés
Résultats affichés
sous la forme de
sous la forme de
«« mini-fiches »
mini-fiches »
Navigation par facettes
Navigation par facettes
- - Calculées avec les résultats
Calculées avec les résultats
de recherche
de recherche
- - Filtres de recherche à
Filtres de recherche à
renseigner apostériori
renseigner apostériori
Pagination gérée par le moteur
Pagination gérée par le moteur
Tri sur l’ensemble des
Tri sur l’ensemble des
résultats (pas
résultats (pas
seulement page en
seulement page en
cours)
cours)
7. Use case : applications de gestion
•
Expérience utilisateur / Ergonomie de
l’application
–
–
–
–
–
•
•
Navigation « à la Google »
Accès quasi-direct à la donnée recherchée
Navigation par facettes
Pagination disponible « out of the box »
Performances maximisées impliquant une
fluidité accrue des applications
– Suggestions (auto-complétion) des termes à
rechercher
Fonctionnalités de recherche sémantique très
puissantes
– Recherche approximative, recherche
phonétique, correction grammaticale et
d’orthographe, gestion des mots techniques, des
synonymes et des mots composés
Plus rapide que les approches SQL traditionnels
8. Use case : recherche sémantique
••Identificationde la langue
Identification de la langue
••Segmentation––dans les langues sans
Segmentation dans les langues sans
espaces (chinois, japonais, coréen)
espaces (chinois, japonais, coréen)
••Décomposerles mots ––dans les langues qui
Décomposer les mots dans les langues qui
composent naturellement les mots (allemand,
composent naturellement les mots (allemand,
néerlandais, coréen
néerlandais, coréen
••Extractiond’entités : :noms, endroits,
Extraction d’entités noms, endroits,
entreprises, ... (ex. j’ai acheté du pain ààla
entreprises, ... (ex. j’ai acheté du pain la
boulangerie du Monsieur Du Pain)
boulangerie du Monsieur Du Pain)
-- Basis Technology (http://www.basistech.com/text-analytics/rosette/)
9. Use case : agrégations
– Groupement par un critère (ex. valeur du champ type
de garantie, ou thème, ou catégorie) et calcul des
statistiques sur un autre champ (ex. total du CA)
9
10. NoSQL ?
• En général
–
–
–
–
BDs non-traditionnelle
N’utilisent pas / ne sont pas construites autour de SQL
Distribués, architecture résistante aux pannes
Modèle allégé pour permettre la scalabilité horizontale
• Pour un moteur de recherche :
–
–
–
–
–
–
Indexation et recherche distribuées
Real-time Get, Versioning et Optimistic Locking
Durable updates (transaction log)
HA sans SPOF
Near Real-time Search
Options “schema-less”
11. NoSQL, Moteurs de Recherche et
SGBDs classiques
Synchronisation
Synchronisation
temps réel
temps réel
Fluidité des applications
Fluidité des applications
grâce ààla meilleure
grâce la meilleure
performance
performance
Accès quasi-direct ààla
Accès quasi-direct la
donnée recherchée
donnée recherchée
Facettes simples
Facettes simples
ou complexes
ou complexes
Alternative aux outils
Alternative aux outils
BI traditionnels
BI traditionnels
Suggestions temps
Suggestions temps
réel des termes àà
réel des termes
chercher
chercher
12. ••Backend Elasticsearch
Back end Elasticsearch
••Frontend Javascript
Front end Javascript
••Applicationdéveloppée
Application développée
en 8h
en 8h
••#nosql
#nosql
-- http://javaetmoi.com/2013/11/musicbrainz-elasticsearch-angularjs-openshift/
13. Big Data?
• Ensemble des données
tellement larges qu’il est
difficile de les exploiter
avec des bases de données
ou des outils traditionnels
• Les problématiques
incluent : l’acquisition, le
nettoyage, le stockage, la
recherche, le partage, le
transfert, l’analyse et la
visualisation
14. Big Data?
• Big Data et le marketing :-)
You don’t have a "Big Data"
problem, you have a big
"data problem" -- Twitter
• Ensemble des données
tellement larges qu’il est
difficile de les exploiter
avec des bases de données
ou des outils traditionnels
• Les problématiques
incluent : l’acquisition, le
nettoyage, le stockage, la
recherche, le partage, le
transfert, l’analyse et la
visualisation
15. Big Data en France
• « Tous les secteurs économiques, du commerce au
secteur automobile en passant par le secteur
énergétique, tous les domaines de la vie quotidienne
(santé, éducation...) sont concernés.»
• « Les enjeux sont considérables, d’abord sur un plan
économique : on évalue à 8% du PIB européen la
création de valeur liée aux Big Data à l’horizon 2020.»
• « L’objectif du plan "Big Data" est de faire de la
France la référence mondiale dans ce domaine. »
-- http://www.redressement-productif.gouv.fr/files/la-nouvelle-france-industrielle.pdf
16. Big Data en France
• « Tous les secteurs économiques, du commerce au
secteur automobile en passant par le secteur
énergétique, tous les domaines de la vie quotidienne
(santé, éducation...) sont concernés.»
• « Les enjeux sont considérables, d’abord sur un plan
économique : on évalue à 8% du PIB européen la
création de valeur liée aux Big Data à l’horizon 2020.»
• « L’objectif du plan "Big Data" est de faire de la France
la référence mondiale dans ce domaine. »
-- http://www.redressement-productif.gouv.fr/files/la-nouvelle-france-industrielle.pdf
17. Use case : analyse des données
-- http://www.elasticsearch.org/overview/kibana/
18. Use case : sémantique et visualisation
-- http://search.carrot2.org/stable/search
19. Elasticsearch @Github ::
Elasticsearch @Github
••20TB de données
20 TB de données
••1.3milliards de fichiers
1.3 milliards de fichiers
••130milliards de lignes
130 milliards de lignes
de code
de code
20. Search @Linkedin ::
Search @Linkedin
••238millions d’utilisateurs
238 millions d’utilisateurs
••5,7milliards de recherches de
5,7 milliards de recherches de
professionnels en 2012
professionnels en 2012
21. Big Data @Amazon ::
Big Data @Amazon
••Picsde 200 articles
Pics de 200 articles
vendus par seconde
vendus par seconde
Comment sont apparus les moteurs de recherche
Fonctions: indexation, recherche, analyse du texte!!!
Avant :
Information structurées par domaine applicatif ; base de données (table, colonne), FS (fichier, contenu), Site Web (Plan de site et pages)
process d’accès a l’information : naviguer / parcourir puis filtrer/trier navigation dans tout l’espace recherché
Apres :
Information non structurée et héterogènes : Process : Search puis filtrer / trier : navigation dans le résultat
Comment sont apparus les moteurs de recherche
Fonctions: indexation, recherche, analyse du texte!!!
Avant :
Information structurées par domaine applicatif ; base de données (table, colonne), FS (fichier, contenu), Site Web (Plan de site et pages)
process d’accès a l’information : naviguer / parcourir puis filtrer/trier navigation dans tout l’espace recherché
Apres :
Information non structurée et héterogènes : Process : Search puis filtrer / trier : navigation dans le résultat
Recherche rapide « full text »
Input: une zone de texte « à la Google » (un texte représentant un nom, un prénom, un identifiant quelconque, un numéro de téléphone, une adresse e-mail, etc.)
Output:
Résultats, surbrillance et facettes.
La liste de résultats n’est pas forcement homogène, chaque résultat pouvant être affiché sous forme de « mini-fiche »
L’utilisation des facettes lors de l’affichage du résultat rendra la recherche multicritères optionnelle.
Recherche multicritères (recherche avancée)
Input: termes de recherche par champ (nom, prénom, id, ville, code postal)
Output: liste (homogène) avec résultats de la recherche
Auto-complétion (suggestion des résultats)
Input: toute ou partie d’un terme recherché localisé à un champ de texte à remplir
Output: liste déroulante avec suggestions du terme recherché et surbrillance
Facettes
Groupement des résultats par catégorie en fonction de la valeur d’un champs (ex. Type Client, Profil client, Sexe)
Calculées et remontées en même temps que le résultat de recherche
Recherche approximative
Sources des erreurs de saisie: fautes de frappe, éléments mal compris par téléphone (phonétique), noms saisis partiellement, noms composés, caractères accentués
Suggestions « voulez-vous dire … »
Termes se rapprochant des termes initialement cherchés et pouvant remonter potentiellement plus de résultats.
Pagination
Le moteur gère la pagination
Chaque requête précise, en plus des critères de recherche, un indice de départ et une taille de la page
La première page est, en général, remontée le plus rapidement
La réponse contient le nombre total de résultats, permettant à l’IHM de proposer les liens vers toutes les pages suivantes
Tri
Le tri par défaut est le tri par pertinence moteur
D’autres tris peuvent être demandés (alphabétique par nom, par date de naissance, etc.). Dans ce cas, le tri se fait sur l’ensemble de résultats et pas seulement sur la page en cours.
Real-time Get + Versioning et Optimistic Locking => read-update-write functionality that ensures noconflicting changes were made concurrently by other clients
What is NoSQL?
- Wikipedia: A NoSQL database provides a mechanism for storage and retrieval of data that use looser consistency models than traditional relational databases in order to achieve horizontal scaling and higher availability. Some authors refer to them as "Not only SQL" to emphasize that some NoSQL systems do allow SQL-like query language to be used.
- non-traditional datastores
Doesn’t use / isn’t designed around SQL
May not give full ACID guarantees (offers other advantages such as greater scalability as a tradeoff)
Distributed, fault-tolerance architecture