Tips and tricks for getting the best out of solr on windows azurelucenerevolution
Presented by Brian Benz, Senior Technical Evangelist, Microsoft Open Technologies, Inc.
This session will cover tips and tricks for getting the most out of Solr in Windows Azure. Windows Azure enables quick and easy installation and setup of Solr search functionality in a variety of ways, and lets you focus on managing and operating Solr servers in our managed environment. We’ll cover multiple options for setting up Solr in Windows Azure, including working examples.
Recueil des mauvaises pratiques constatées lors de l'audit de sites Drupal 7OSInet
En 3 ans d'audit de sites Drupal 7 pour identifier des problèmes de performance, qualité, ou sécurité OSInet a identifié les causes d'erreurs les plus fréquentes : en règle général, chaque site audit présente au moins l'une d'entre elles.
Votre site est-il affecté par ces erreurs ?
Mix-IT 2013 - Agilistes : n'oubliez pas la technique - mix-it 2013Xavier NOPRE
Diaporama de ma présentation "Agilistes : n'oubliez pas la technique" le 25/04/2013 à Mix-IT 2013. N'hésitez pas à me faire des retours et me contacter !
Le CETIC organisait le mardi 24 novembre 2015 à 14h une après-midi dédiée au Big Data. Cet événement prenait place au sein de la programmation de la Big Data Week 2015, consacrée aux retours d'expérience du Big Data. J'Robert Viseur introduisait l'après-midi avec la présentation d'une première version d'une cartographie des prestataires belges / wallons en Big Data.
Tips and tricks for getting the best out of solr on windows azurelucenerevolution
Presented by Brian Benz, Senior Technical Evangelist, Microsoft Open Technologies, Inc.
This session will cover tips and tricks for getting the most out of Solr in Windows Azure. Windows Azure enables quick and easy installation and setup of Solr search functionality in a variety of ways, and lets you focus on managing and operating Solr servers in our managed environment. We’ll cover multiple options for setting up Solr in Windows Azure, including working examples.
Recueil des mauvaises pratiques constatées lors de l'audit de sites Drupal 7OSInet
En 3 ans d'audit de sites Drupal 7 pour identifier des problèmes de performance, qualité, ou sécurité OSInet a identifié les causes d'erreurs les plus fréquentes : en règle général, chaque site audit présente au moins l'une d'entre elles.
Votre site est-il affecté par ces erreurs ?
Mix-IT 2013 - Agilistes : n'oubliez pas la technique - mix-it 2013Xavier NOPRE
Diaporama de ma présentation "Agilistes : n'oubliez pas la technique" le 25/04/2013 à Mix-IT 2013. N'hésitez pas à me faire des retours et me contacter !
Le CETIC organisait le mardi 24 novembre 2015 à 14h une après-midi dédiée au Big Data. Cet événement prenait place au sein de la programmation de la Big Data Week 2015, consacrée aux retours d'expérience du Big Data. J'Robert Viseur introduisait l'après-midi avec la présentation d'une première version d'une cartographie des prestataires belges / wallons en Big Data.
#MOOC GdP – 14 - Retour d'expérience sur deux MOOC 24-10-2013Rémi Bachelet
La vidéo de l'intervention est disponible ici : http://goo.gl/09MZFa
Retour d'expérience sur deux premiers MOOC au Café pédagogique ECP
Centrale Paris 24 octobre 2013
Ressources et conseils dans la conception d'un MOOC : cahier des charges.
Pilotage d’un MOOC - quels points de surveillance ?
France Université Numérique : FUN vs. Coursera ?
Inscrire nos centraliens à un MOOC, quelles conséquences ?
Faire tourner le MOOC : quelles compétences, quelle équipe ?
Concrètement, comment gérer « ouvert » et « massif » ?
Différences entre MOOC francophone et anglophone. Est-il possible d’innover de différencier son MOOC / concurrents ?
Le modèle économique qui est en train d'être testé pour le MOOC GdP (examens en présentiel et à distance, reconnaissance par des ECTS...) sera-t-il viable ?
Lorsque des salariés suivent le MOOC GdP, quelle somme facturer? Quels sont les services associés ? Réaliser un « MOOC d'entreprise » ?
Au delà de ce buzz word :
Les grands concepts
Les étapes clés des projets Big Data et les technologies à utiliser (stockage, ingestion, …)
Les enjeux des architectures Big Data (architecture lambda, …)
L'intelligence artificielle (machine learning, deep learning, …)
Et un cas d'usage du big data sur AWS autour de l'utilisation des données gyroscopiques de vos internautes mobiles.
Presentation for a practical/theoretical session focused on easy to use tools to validate and clean datasets in three main categories: nomenclatural, format, and geographical.
---
Présentation pour une session pratique/théorique centrée sur des outils faciles d’utilisation pour valider et nettoyer les jeux de données dans trois catégories : nomenclature, format, et information géographique.
Retour d'expérience Devops Eurovision / EBU lors du Meetup DevOps Genève sponsorisé par Hidora et AdExcel le 15.06.2017 par Laurent Pythoud et Frédéric Deniger
Communautés Drupal et WordPress : le choc des titans ?Thierry Pigot
Les communautés Drupal et WordPress sont parmi les plus dynamiques au sein des communautés Open Source de gestion de contenu. Pourtant, à y regarder de plus près, de nombreuses différences les distinguent : les acteurs économiques ne sont pas les mêmes, les modes d’organisation et de gouvernance diffèrent, les logiques de contribution et d’accès à la communauté reposent sur des règles opposées, …
Nous vous proposons de scruter le fonctionnement de ces communautés au travers du regard de deux experts et membres actifs de ces communautés : Léon Cros (Président Drupal France) et Thierry Pigot (Président WordPress Paris), dans un objectif de partage et de retour d’expérience.
Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu
I: Topic Modeling
* Nature et applications
* Approche Deterministe: LSA
* Approche Probabiliste: LDA
* Quelques librairies en R et python
II: Le package STM en R
* Parametres
* Métriques: exclusivité et cohérence sémantique
* Appliqué a un corpus propre
LAB - R STM
* Le corpus: résumés d'articles tech, IEEE et Arstechnica
* Le package STM en R
* Comment determiner le nombre optimal de topics?
* Comment interpreter les résultats?
* Jupyter Notebook et Script R
III: forum Alt-right sur Facebook
* 500.000 commentaires provenant du forum alt-right God Trump Emperor
* De la nécessité de travailler le contenu
* Filtrer le bruit avec
* Lemmatization, tokenization
* Part of Speech tagging
* Named entity recognition
* Jupyter Notebook et Script R
IV: Application au Francais
* Quelles sont les librairies pour:
* Part of Speech
* Tokenization
* Lemmatization
V: Resources
* Articles et blogs
Ces dernières années, on parle beaucoup de l'intelligence artificielle et comment cette dernière va révolutionner le monde. Nous avons donc décidé de nous pencher sur le sujet afin de voir de quelle manière notre domaine de l'assurance qualité logicielle serait impacté. Nous avons pensé qu'il serait pertinent de venir te présenter le fruit de nos recherches et d'échanger avec toi à propos de notre vision de ce sujet, car tu dois certainement avoir les mêmes questionnements que nous.
Cette série d'événements sous forme d'atelier a pour but de créer un réel projet de modernisation de la pratique de l'assurance qualité à l'ère de l'intelligence artificielle.
Ce projet se veut être inclusif et un réel travail de collaboration.
Voici un aperçu des questions qui seront traitées au fil des événements qui se pencheront sur différents aspects du sujet de l'intelligence artificielle:
- Un rappel sur les principes de l’IA.
- Quel est l’impact de L’IA sur le métier des tests?
- C’est quoi un RPA?
- Quelles sont les pratiques prouvées?
- Quelles sont les options qui restent à explorer?
- Est-ce que l’avènement de l’IA implique réduction de testeurs dans les équipes?
- Comment teste-t-on les outils IA eux mêmes?
- De quoi sera fait l’avenir?
#MOOC GdP – 14 - Retour d'expérience sur deux MOOC 24-10-2013Rémi Bachelet
La vidéo de l'intervention est disponible ici : http://goo.gl/09MZFa
Retour d'expérience sur deux premiers MOOC au Café pédagogique ECP
Centrale Paris 24 octobre 2013
Ressources et conseils dans la conception d'un MOOC : cahier des charges.
Pilotage d’un MOOC - quels points de surveillance ?
France Université Numérique : FUN vs. Coursera ?
Inscrire nos centraliens à un MOOC, quelles conséquences ?
Faire tourner le MOOC : quelles compétences, quelle équipe ?
Concrètement, comment gérer « ouvert » et « massif » ?
Différences entre MOOC francophone et anglophone. Est-il possible d’innover de différencier son MOOC / concurrents ?
Le modèle économique qui est en train d'être testé pour le MOOC GdP (examens en présentiel et à distance, reconnaissance par des ECTS...) sera-t-il viable ?
Lorsque des salariés suivent le MOOC GdP, quelle somme facturer? Quels sont les services associés ? Réaliser un « MOOC d'entreprise » ?
Au delà de ce buzz word :
Les grands concepts
Les étapes clés des projets Big Data et les technologies à utiliser (stockage, ingestion, …)
Les enjeux des architectures Big Data (architecture lambda, …)
L'intelligence artificielle (machine learning, deep learning, …)
Et un cas d'usage du big data sur AWS autour de l'utilisation des données gyroscopiques de vos internautes mobiles.
Presentation for a practical/theoretical session focused on easy to use tools to validate and clean datasets in three main categories: nomenclatural, format, and geographical.
---
Présentation pour une session pratique/théorique centrée sur des outils faciles d’utilisation pour valider et nettoyer les jeux de données dans trois catégories : nomenclature, format, et information géographique.
Retour d'expérience Devops Eurovision / EBU lors du Meetup DevOps Genève sponsorisé par Hidora et AdExcel le 15.06.2017 par Laurent Pythoud et Frédéric Deniger
Communautés Drupal et WordPress : le choc des titans ?Thierry Pigot
Les communautés Drupal et WordPress sont parmi les plus dynamiques au sein des communautés Open Source de gestion de contenu. Pourtant, à y regarder de plus près, de nombreuses différences les distinguent : les acteurs économiques ne sont pas les mêmes, les modes d’organisation et de gouvernance diffèrent, les logiques de contribution et d’accès à la communauté reposent sur des règles opposées, …
Nous vous proposons de scruter le fonctionnement de ces communautés au travers du regard de deux experts et membres actifs de ces communautés : Léon Cros (Président Drupal France) et Thierry Pigot (Président WordPress Paris), dans un objectif de partage et de retour d’expérience.
Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu
I: Topic Modeling
* Nature et applications
* Approche Deterministe: LSA
* Approche Probabiliste: LDA
* Quelques librairies en R et python
II: Le package STM en R
* Parametres
* Métriques: exclusivité et cohérence sémantique
* Appliqué a un corpus propre
LAB - R STM
* Le corpus: résumés d'articles tech, IEEE et Arstechnica
* Le package STM en R
* Comment determiner le nombre optimal de topics?
* Comment interpreter les résultats?
* Jupyter Notebook et Script R
III: forum Alt-right sur Facebook
* 500.000 commentaires provenant du forum alt-right God Trump Emperor
* De la nécessité de travailler le contenu
* Filtrer le bruit avec
* Lemmatization, tokenization
* Part of Speech tagging
* Named entity recognition
* Jupyter Notebook et Script R
IV: Application au Francais
* Quelles sont les librairies pour:
* Part of Speech
* Tokenization
* Lemmatization
V: Resources
* Articles et blogs
Ces dernières années, on parle beaucoup de l'intelligence artificielle et comment cette dernière va révolutionner le monde. Nous avons donc décidé de nous pencher sur le sujet afin de voir de quelle manière notre domaine de l'assurance qualité logicielle serait impacté. Nous avons pensé qu'il serait pertinent de venir te présenter le fruit de nos recherches et d'échanger avec toi à propos de notre vision de ce sujet, car tu dois certainement avoir les mêmes questionnements que nous.
Cette série d'événements sous forme d'atelier a pour but de créer un réel projet de modernisation de la pratique de l'assurance qualité à l'ère de l'intelligence artificielle.
Ce projet se veut être inclusif et un réel travail de collaboration.
Voici un aperçu des questions qui seront traitées au fil des événements qui se pencheront sur différents aspects du sujet de l'intelligence artificielle:
- Un rappel sur les principes de l’IA.
- Quel est l’impact de L’IA sur le métier des tests?
- C’est quoi un RPA?
- Quelles sont les pratiques prouvées?
- Quelles sont les options qui restent à explorer?
- Est-ce que l’avènement de l’IA implique réduction de testeurs dans les équipes?
- Comment teste-t-on les outils IA eux mêmes?
- De quoi sera fait l’avenir?
10 jean-louis zimmermann - open streetmap france - lizmobility
6 scikit-learn - Data Tuesday 26 fev 2013
1. scikit-learn
Machine Learning in Python
Data Tuesday - Feb. 26 2013 - Paris
dimanche 24 février 13
2. • Library of Machine Learning models
• Simple fit / predict / transform API
• Python / NumPy / SciPy / Cython
& wrappers for libsvm / liblinear
• Model Assessment, Selection & Ensembles
• Some support for multi-core
dimanche 24 février 13
3. Possible Applications
• Text Classification / Sequence Tagging NLP
• Computer Vision / Robotics
• Learning To Rank - IR and advertisement
• Statistical Analysis of the Brain: fMRI / MEG
• Astronomy, Biology, Social Sciences...
dimanche 24 février 13
7. Example:
Training a Model for
Face Recognition
dimanche 24 février 13
8. Total dataset size:
n_samples: 1288, n_features: 1850, n_classes: 7
Extracting the top 150 eigenfaces from 966 faces
done in 0.466s
Projecting the input data on the eigenfaces orthonormal basis
done in 0.056s
Fitting the SVM classifier to the training set
done in 18.549s
Predicting people's names on the test set
done in 0.062s
precision recall f1-score support
Ariel Sharon 0.90 0.75 0.82 12
Colin Powell 0.78 0.94 0.85 62
Donald Rumsfeld 0.86 0.72 0.78 25
George W Bush 0.89 0.96 0.92 141
Gerhard Schroeder 0.92 0.74 0.82 31
Hugo Chavez 0.90 0.53 0.67 17
Tony Blair 0.81 0.74 0.77 34
avg / total 0.86 0.86 0.86 322
dimanche 24 février 13
11. Contributors
• GitHub-centric contribution workflow
• each pull request needs 2 x [+1] reviews
• code + tests + doc + example
• 92% test coverage / Continuous Integr.
• 4 major releases per years + 4 bugfix rel.
• 66 contributors for release 0.13
dimanche 24 février 13
12. Users
• We support users on & ML
• 200+ questions tagged with [scikit-learn]
• Many competitors + benchmarks
• 500+ answers on ongoing user survey
• 60% academics / 40% from industry
• Some data-drive Startups use sklearn
dimanche 24 février 13
13. Thank you!
• http://scikit-learn.org - Main Project + doc
• @ogrisel on twitter
• http://ogrisel.com - ML Consultancy (soon)
dimanche 24 février 13
15. Caveat Emptor
• Domain specific tooling kept to a minimum
• Some feature extraction for Bag of
Words Text Analysis
• Some functions for extracting image
patches
• Domain integration is the responsibility of
the user or 3rd party libraries
dimanche 24 février 13