Les moteurs de recherche proposent des outils gratuits pour les webmasters. Ces « Search Consoles » sont particulièrement utiles pour détecter les points bloquants au bon référencement de votre site. On pense souvent à la Search Console de Google, mais avez-vous déjà testé les outils de Bing ou Yandex ?
Surveillance de vos liens externes, alternative au « Not Provided », mise en place d’alertes, résolution de problèmes d’indexation, …Découvrez quelques astuces pour tirer parti de ces outils !
SEO Campus 2016 Oncrawl Open Source Log AnalysisCogniteev
Notre présentation au SEOCAMP'Us Paris par François Goube. Comment faire de l'analyse de logs gratuitement ? Les bonnes pratiques et outils disponibles.
L'AppStoreOptimization, ou plus basiquement : Le référencement d'Application dans les Stores, est une nouveau terrain de jeu pour les Référenceurs web ?
Intégrer Yandex dans sa stratégie Search Marketing - SEO Camp'us 2016iProspect France
Le jeudi 7 avril à 15H lors du SEO Camp'us 2016, Alexis Rylko interviendra en compagnie d’Olga Ruiz sur l'évolution et les mythes du moteur de recherche Yandex en SEO.
Présentation lors du SeoCamp'us 2016 il traite les sujet de la performance web de façon assez large :
- Usage du mobile
- L'importance et les contraintes liées au format mobile
- L'incidence du temps de chargement sur la conversion
- L'ultra fragmentation mobile
- Les solutions techniques identifier les mobiles (redirection/UA sniffing/serveur/JS)
- Real user monitoring
- Monitoring synthétique
- HTTPs et Perf
- HTTP/2 et antipattern de l'optimisation
- Objectif et budget de webperformance
- Outils de diagnostic et monitoring de la performance
Présenté par @tsoudaz et @dareboost
Seo campus 2016 : Comment faire du SEO sur Baidu, le moteur de recherche n°1...Veronique Duong
Dans cette conférence, nous allons faire le point sur l’histoire de Baidu, les particularités du SEO chinois et la manière de référencer un site web sur les moteurs de recherche chinois.
Baidu a été créé le 1er janvier 2000 par Eric Xu et Robin Li, deux ingénieurs informaticiens. Le moteur chinois le plus populaire dans l’Empire du Milieu a longtemps été considéré comme une copie de Google, surtout dans ses débuts. Mais depuis quelques années, avec les développements informatiques, Baidu a évolué vers le statut de « moteur de recherche créatif » …
Baidu propose de nombreux services : les plus connus sont Baike (Wikipedia chinois), Zhidao (une sorte de Yahoo! Questions / Réponses), Wengou (le Google Shopping chinois), Tieba (un moteur de forums chinois qui comptent plus de 10 000 sous-forums comme les bbs, etc.). Baidu propose des services plus complets que ses concurrents comme HaoSou (anciennement 360), Sogou, etc.
Et la concurrence est rude en Chine … pour en savoir plus sur les moteurs chinois, ne loupez pas ma conférence ! Vous y apprendrez quelques astuces de SEO chinois sans même à savoir parler le mandarin
Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016Search Foresight
OK GOOGLE: RECHERCHE VOCALE ET SEO SONT-ILS COMPATIBLES?
Avec l’avancée sans précédent des techniques de NLP (Natural Language Processing) et de TTS (Text-to-Speech) boostées par les algos de Deep Learning, la recherche vocale est en passe de devenir un usage de fond. Déjà largement utilisée sur Smartphone, elle sera demain sur tous les objets connectés. Cette montée en puissance de la recherche vocale a des impacts sur les usages Search à plusieurs niveaux : modification de la typologie des requêtes, transformation des attentes des internautes, dialogue avec le moteur de recherche.
Depuis Hummingbird, Google prend en compte cette transformation de fond et tente de répondre à ces nouvelles formulations, notamment en travaillant sur une meilleure interprétation de la requête et de l’intention qui se cache derrière chaque requête (reconnaissance d’entités, templates de questions, prise en compte du contexte, de la sémantique, de l’usage, …).
Mais cela va bien plus loin aujourd’hui. La recherche vocale se transforme en commande vocale permettant, entre autres, de se passer d’un site web et de réaliser des actions (réservations…) directement au sein des SERPs, de jongler d’App en App. La recherche vocale glisse progressivement vers un rôle d’assistant vocal devenant ainsi le fil conducteur de toutes nos actions, en particulier sur Smartphone.
Comment intégrer cette nouvelle vague vocale à votre SEO ? Nous ferons le point sur l’usage de la recherche vocale aujourd’hui, comment adapter son SEO en conséquence, et les nouveaux chantiers SEO associés au vocal, comme l’optimisation des actions (Voice Actions) au sein des APPs.
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016iProspect France
Le jeudi 7 avril à 11h45, Madeline Pinthon a donné une conférence sur les bonnes pratiques du Javascript pour indexer les pages sur les moteurs de recherche.
Les moteurs de recherche proposent des outils gratuits pour les webmasters. Ces « Search Consoles » sont particulièrement utiles pour détecter les points bloquants au bon référencement de votre site. On pense souvent à la Search Console de Google, mais avez-vous déjà testé les outils de Bing ou Yandex ?
Surveillance de vos liens externes, alternative au « Not Provided », mise en place d’alertes, résolution de problèmes d’indexation, …Découvrez quelques astuces pour tirer parti de ces outils !
SEO Campus 2016 Oncrawl Open Source Log AnalysisCogniteev
Notre présentation au SEOCAMP'Us Paris par François Goube. Comment faire de l'analyse de logs gratuitement ? Les bonnes pratiques et outils disponibles.
L'AppStoreOptimization, ou plus basiquement : Le référencement d'Application dans les Stores, est une nouveau terrain de jeu pour les Référenceurs web ?
Intégrer Yandex dans sa stratégie Search Marketing - SEO Camp'us 2016iProspect France
Le jeudi 7 avril à 15H lors du SEO Camp'us 2016, Alexis Rylko interviendra en compagnie d’Olga Ruiz sur l'évolution et les mythes du moteur de recherche Yandex en SEO.
Présentation lors du SeoCamp'us 2016 il traite les sujet de la performance web de façon assez large :
- Usage du mobile
- L'importance et les contraintes liées au format mobile
- L'incidence du temps de chargement sur la conversion
- L'ultra fragmentation mobile
- Les solutions techniques identifier les mobiles (redirection/UA sniffing/serveur/JS)
- Real user monitoring
- Monitoring synthétique
- HTTPs et Perf
- HTTP/2 et antipattern de l'optimisation
- Objectif et budget de webperformance
- Outils de diagnostic et monitoring de la performance
Présenté par @tsoudaz et @dareboost
Seo campus 2016 : Comment faire du SEO sur Baidu, le moteur de recherche n°1...Veronique Duong
Dans cette conférence, nous allons faire le point sur l’histoire de Baidu, les particularités du SEO chinois et la manière de référencer un site web sur les moteurs de recherche chinois.
Baidu a été créé le 1er janvier 2000 par Eric Xu et Robin Li, deux ingénieurs informaticiens. Le moteur chinois le plus populaire dans l’Empire du Milieu a longtemps été considéré comme une copie de Google, surtout dans ses débuts. Mais depuis quelques années, avec les développements informatiques, Baidu a évolué vers le statut de « moteur de recherche créatif » …
Baidu propose de nombreux services : les plus connus sont Baike (Wikipedia chinois), Zhidao (une sorte de Yahoo! Questions / Réponses), Wengou (le Google Shopping chinois), Tieba (un moteur de forums chinois qui comptent plus de 10 000 sous-forums comme les bbs, etc.). Baidu propose des services plus complets que ses concurrents comme HaoSou (anciennement 360), Sogou, etc.
Et la concurrence est rude en Chine … pour en savoir plus sur les moteurs chinois, ne loupez pas ma conférence ! Vous y apprendrez quelques astuces de SEO chinois sans même à savoir parler le mandarin
Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016Search Foresight
OK GOOGLE: RECHERCHE VOCALE ET SEO SONT-ILS COMPATIBLES?
Avec l’avancée sans précédent des techniques de NLP (Natural Language Processing) et de TTS (Text-to-Speech) boostées par les algos de Deep Learning, la recherche vocale est en passe de devenir un usage de fond. Déjà largement utilisée sur Smartphone, elle sera demain sur tous les objets connectés. Cette montée en puissance de la recherche vocale a des impacts sur les usages Search à plusieurs niveaux : modification de la typologie des requêtes, transformation des attentes des internautes, dialogue avec le moteur de recherche.
Depuis Hummingbird, Google prend en compte cette transformation de fond et tente de répondre à ces nouvelles formulations, notamment en travaillant sur une meilleure interprétation de la requête et de l’intention qui se cache derrière chaque requête (reconnaissance d’entités, templates de questions, prise en compte du contexte, de la sémantique, de l’usage, …).
Mais cela va bien plus loin aujourd’hui. La recherche vocale se transforme en commande vocale permettant, entre autres, de se passer d’un site web et de réaliser des actions (réservations…) directement au sein des SERPs, de jongler d’App en App. La recherche vocale glisse progressivement vers un rôle d’assistant vocal devenant ainsi le fil conducteur de toutes nos actions, en particulier sur Smartphone.
Comment intégrer cette nouvelle vague vocale à votre SEO ? Nous ferons le point sur l’usage de la recherche vocale aujourd’hui, comment adapter son SEO en conséquence, et les nouveaux chantiers SEO associés au vocal, comme l’optimisation des actions (Voice Actions) au sein des APPs.
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016iProspect France
Le jeudi 7 avril à 11h45, Madeline Pinthon a donné une conférence sur les bonnes pratiques du Javascript pour indexer les pages sur les moteurs de recherche.
Au Menu:
- Les données indispensables au SEO
- Comment les rendre actionnables?
- Pourquoi utiliser un outil de crawling?
- Faire de l’analyse de logs (presque) gratuitement
Netlinking - Quelles stratégies gagnantes ont utilisées ces SEO ?Reputation VIP
Nicolas (co-fondateur de Reputation VIP et spécialiste des algorithmes de Google) analyse et décortique deux cas pratiques en SEO :
- Le SEO Hero, un concours SEO international organisé par le CMS WIX d'une durée de 4 mois avec 50 000$ de récompenses à la clé,
- Un site web dans le secteur de l'automobile qui génère 100k trafic SEO en 3 mois.
Optimiser son maillage interne pour booster son SEOGrégory Florin
Cette conférence a été présentée par Guillaume Madoux et moi même lors du SEOCamp'us de Lille.
A l’heure où le netlinking est clairement dans le viseur de Google, les optimisations onsite et plus particulièrement le maillage interne sont un très bon moyen accroître sa visibilité en limitant les risques. Bien loin du simple nuage de tag, un bon maillage interne permet d'améliorer le taux de crawl, régler les soucis de profondeurs des pages et même de d'améliorer l’expérience utilisateur si le boulot est bien fait. Comment auditer son maillage ? Quelles sont les solutions simples à mettre en place pour l'améliorer ? Comment fonctionnent les sites à plusieurs millions de pages ? Autant de questions qui seront soulevées lors de la présentation.
Comment prévenir ou sortir d'une pénalité Google ?semrush_webinars
Olivier Andrieu
Depuis quelques années, Google a déclaré la guerre aux techniques qui tentent de manipuler son algorithme. Il a donc mis en place des systèmes de pénalités pour "punir" les sites qui utilisent des systèmes interdits. Ce webinar sur les pénalités Google a pour ambition d'aborder les points suivants:
- Petit historique du spam aux moteurs de recherche (spamdexing)
- Quelles sont les techniques interdites aujourd'hui ?
- Pénalités manuelles
- Pénalités algorithmiques
- Comment prévenir les pénalités Google? Comment en sortir ?
Position 0 seocampus 2017 (Featured Snippets)DOUCET Raphael
Voici les slides de ma conférence sur les Featured Snippets (position 0) au SEO CAMPUS Paris 2017. Ne manquez pas d'ici quelques jours un billet complet sur le sujet avec encore plus d'infos et de chiffres pour les featured Snippets en France sur http://www.visibilite-referencement.fr/blog/
Etude de la position 0 (Featured Snippet) sur GoogleiProspect France
Il est fini le temps où Google ne proposait que des résultats textuels classiques. Les Featured Snippets offrent une visibilité maximale aux sites considérés comme des sources fiables d’informations.
MAILLAGE INTERNE ET SEO - Seo camp webismybusiness 5 oct 2013Philippe YONNET
Conférence SEO Camp et WEBISMYBUSINESS le 5 octobre 2013
Comment améliorer son SEO en optimisant son maillage interne ? Quelles sont les limites de la méthode ?
La casa de SEO : les questions à se poser pour le casse SEO parfaitAymeric Bouillat
Slide 7 accessible ici: https://imgur.com/a/Vmqjl2C
"Les questions à se poser en prévision du braquage de l'algo de Google". Indexation, Crawl, Pagination, Webperf: différents axes du SEO abordés sous la forme de questions réponses afin de parfaire sa stratégie SEO.
C'est toujours mieux avec les commentaires, il fallait être au #webcampday ;)
This document provides an overview of heterogeneous persistence and different database management systems (DBMS). It discusses why a single DBMS is often not sufficient and describes different types of DBMS including relational databases, key-value stores, and columnar databases. For each type, it outlines good and bad use cases, examples, considerations, and pros and cons. The document aims to help readers understand the different flavors of DBMS and how to choose the right ones for their specific data and access needs.
The document discusses online communities and why companies should have them. It notes that online communities give people a place to engage with a company, allow companies to get product feedback, help grow evangelists for products, and can drive brand loyalty. It emphasizes that online communities should be about the people in them. Companies should be sincere, focus on individuals rather than acting as a corporate entity, understand the community is not all about the company, be a part of the community, and recognize that all members are peers rather than positioning the company as an expert.
Working with big volumes of data is a complicated task, but it's even harder if you have to do everything in real time and try to figure it all out yourself. This session will use practical examples to discuss architectural best practices and lessons learned when solving real-time social media analytics, sentiment analysis, and data visualization decision-making problems with AWS. Learn how you can leverage AWS services like Amazon RDS, AWS CloudFormation, Auto Scaling, Amazon S3, Amazon Glacier, and Amazon Elastic MapReduce to perform highly performant, reliable, real-time big data analytics while saving time, effort, and money. Gain insight from two years of real-time analytics successes and failures so you don't have to go down this path on your own.
Docker Swarm: Docker Native ClusteringDocker, Inc.
from the Docker Mountain View Meetup on 2/24
Docker Swarm turns a pool of Docker hosts into a single, virtual Docker host. It's a different approach to clustering that aims for simplicity, flexibility and high scale.
This talk covers the new Swarm features and demonstrate a realistic microservice style application running on Swarm.
Topics:
• How to deploy a complex multi-container application on Swarm
• Deployment patterns for AWS or Vagrant
• Load balancing and scaling N web frontends with Interlock+ha_proxy
• Independently scaling backend workers
All code used in the demo is available at https://github.com/mgoelzer/swarm-demo-voting-app and can be used as a starting point for your own applications.
Learn more about Docker Swarm: https://www.docker.com/products/docker-swarm
Au Menu:
- Les données indispensables au SEO
- Comment les rendre actionnables?
- Pourquoi utiliser un outil de crawling?
- Faire de l’analyse de logs (presque) gratuitement
Netlinking - Quelles stratégies gagnantes ont utilisées ces SEO ?Reputation VIP
Nicolas (co-fondateur de Reputation VIP et spécialiste des algorithmes de Google) analyse et décortique deux cas pratiques en SEO :
- Le SEO Hero, un concours SEO international organisé par le CMS WIX d'une durée de 4 mois avec 50 000$ de récompenses à la clé,
- Un site web dans le secteur de l'automobile qui génère 100k trafic SEO en 3 mois.
Optimiser son maillage interne pour booster son SEOGrégory Florin
Cette conférence a été présentée par Guillaume Madoux et moi même lors du SEOCamp'us de Lille.
A l’heure où le netlinking est clairement dans le viseur de Google, les optimisations onsite et plus particulièrement le maillage interne sont un très bon moyen accroître sa visibilité en limitant les risques. Bien loin du simple nuage de tag, un bon maillage interne permet d'améliorer le taux de crawl, régler les soucis de profondeurs des pages et même de d'améliorer l’expérience utilisateur si le boulot est bien fait. Comment auditer son maillage ? Quelles sont les solutions simples à mettre en place pour l'améliorer ? Comment fonctionnent les sites à plusieurs millions de pages ? Autant de questions qui seront soulevées lors de la présentation.
Comment prévenir ou sortir d'une pénalité Google ?semrush_webinars
Olivier Andrieu
Depuis quelques années, Google a déclaré la guerre aux techniques qui tentent de manipuler son algorithme. Il a donc mis en place des systèmes de pénalités pour "punir" les sites qui utilisent des systèmes interdits. Ce webinar sur les pénalités Google a pour ambition d'aborder les points suivants:
- Petit historique du spam aux moteurs de recherche (spamdexing)
- Quelles sont les techniques interdites aujourd'hui ?
- Pénalités manuelles
- Pénalités algorithmiques
- Comment prévenir les pénalités Google? Comment en sortir ?
Position 0 seocampus 2017 (Featured Snippets)DOUCET Raphael
Voici les slides de ma conférence sur les Featured Snippets (position 0) au SEO CAMPUS Paris 2017. Ne manquez pas d'ici quelques jours un billet complet sur le sujet avec encore plus d'infos et de chiffres pour les featured Snippets en France sur http://www.visibilite-referencement.fr/blog/
Etude de la position 0 (Featured Snippet) sur GoogleiProspect France
Il est fini le temps où Google ne proposait que des résultats textuels classiques. Les Featured Snippets offrent une visibilité maximale aux sites considérés comme des sources fiables d’informations.
MAILLAGE INTERNE ET SEO - Seo camp webismybusiness 5 oct 2013Philippe YONNET
Conférence SEO Camp et WEBISMYBUSINESS le 5 octobre 2013
Comment améliorer son SEO en optimisant son maillage interne ? Quelles sont les limites de la méthode ?
La casa de SEO : les questions à se poser pour le casse SEO parfaitAymeric Bouillat
Slide 7 accessible ici: https://imgur.com/a/Vmqjl2C
"Les questions à se poser en prévision du braquage de l'algo de Google". Indexation, Crawl, Pagination, Webperf: différents axes du SEO abordés sous la forme de questions réponses afin de parfaire sa stratégie SEO.
C'est toujours mieux avec les commentaires, il fallait être au #webcampday ;)
This document provides an overview of heterogeneous persistence and different database management systems (DBMS). It discusses why a single DBMS is often not sufficient and describes different types of DBMS including relational databases, key-value stores, and columnar databases. For each type, it outlines good and bad use cases, examples, considerations, and pros and cons. The document aims to help readers understand the different flavors of DBMS and how to choose the right ones for their specific data and access needs.
The document discusses online communities and why companies should have them. It notes that online communities give people a place to engage with a company, allow companies to get product feedback, help grow evangelists for products, and can drive brand loyalty. It emphasizes that online communities should be about the people in them. Companies should be sincere, focus on individuals rather than acting as a corporate entity, understand the community is not all about the company, be a part of the community, and recognize that all members are peers rather than positioning the company as an expert.
Working with big volumes of data is a complicated task, but it's even harder if you have to do everything in real time and try to figure it all out yourself. This session will use practical examples to discuss architectural best practices and lessons learned when solving real-time social media analytics, sentiment analysis, and data visualization decision-making problems with AWS. Learn how you can leverage AWS services like Amazon RDS, AWS CloudFormation, Auto Scaling, Amazon S3, Amazon Glacier, and Amazon Elastic MapReduce to perform highly performant, reliable, real-time big data analytics while saving time, effort, and money. Gain insight from two years of real-time analytics successes and failures so you don't have to go down this path on your own.
Docker Swarm: Docker Native ClusteringDocker, Inc.
from the Docker Mountain View Meetup on 2/24
Docker Swarm turns a pool of Docker hosts into a single, virtual Docker host. It's a different approach to clustering that aims for simplicity, flexibility and high scale.
This talk covers the new Swarm features and demonstrate a realistic microservice style application running on Swarm.
Topics:
• How to deploy a complex multi-container application on Swarm
• Deployment patterns for AWS or Vagrant
• Load balancing and scaling N web frontends with Interlock+ha_proxy
• Independently scaling backend workers
All code used in the demo is available at https://github.com/mgoelzer/swarm-demo-voting-app and can be used as a starting point for your own applications.
Learn more about Docker Swarm: https://www.docker.com/products/docker-swarm
The document provides information about Hangul and questions related to it. Hangul is a subspecies of elk native to India and was previously believed to be a subspecies of red deer. It is found in Jammu and Kashmir and Himachal Pradesh. The IUCN will declare the Kashmiri Red Stag as critically endangered. Dachigram National Park is located in Jammu and Kashmir. The document aims to provide current affairs preparation for the civil services preliminary exam on topics related to environment and ecology through questions on Hangul.
Tubular Labs - Using Elastic to Search Over 2.5B VideosTubular Labs
This document discusses optimizing Elasticsearch to search over 2.5 billion videos. It describes 4 steps to improve the user experience and 4 patterns to simplify architecture and reduce costs. The data size is 2.5 billion documents totaling 4 terabytes, with 200 million daily updates. Hardware includes 52 nodes with 832 cores and 16 terabytes of SSD storage. Recommendations include using bulk indexing, increasing refresh intervals, monitoring rejected bulk operations, understanding hardware utilization, benchmarking different numbers of shards, splitting queries from aggregations, reducing data cardinality, and implementing denormalization and partial updates to improve performance and reduce costs.
The document discusses serverless logging with ELK (Elasticsearch, Logstash, Kibana) for monitoring Lambda functions. It provides an overview of serverless architecture, why it is useful for irregular traffic that auto-scaling cannot handle, and challenges like vendor lock-in. Typical use cases are real-time processing of files, streams, ETL, IoT backends, and APIs. The demo will show monitoring Lambda functions that generate Game of Thrones plot points using ELK for logging and monitoring.
Raymond Kuiper gave a presentation on automating interactions with Zabbix. He discussed how sysadmins like automation and different approaches to automating tasks in Zabbix including using the API directly, developing a custom tool, or using an existing CLI tool. He presented his solution of creating a set of Python scripts called Zabbix Gnomes that can be used together or individually to automate various Zabbix tasks like finding hosts in a group, getting graph IDs, and downloading graphs. The scripts are open source and available on GitHub.
Jilles is a freelance software developer and consultant based in Germany. The document discusses challenges with distributed software teams, including magnified communication issues. It advocates for keeping team sizes small to minimize dependencies and encourage asynchronous workflows to avoid bottlenecks. Overall, the document emphasizes that while distributed teams introduce new complexities, many of the same software engineering principles still apply.
Deploying services: automation with docker and ansibleJohn Zaccone
As micro-service architecture scales, the time spent provisioning new environments and deploying multiple services slows down feature development and increases time to market. In this session we will look at some ways to solve these problems- mainly using hot technologies: Docker and Ansible.
The document discusses microservices and their advantages over monolithic architectures. Microservices break applications into small, independent components that can be developed, deployed and scaled independently. This allows for faster development and easier continuous delivery. The document recommends using Spring Boot to implement microservices and Docker to deploy and manage the microservices as independent components. It provides an example of implementing an ELK stack as Dockerized microservices.
Open Secrets of the Defense Industry: Building Your Own Intelligence Program ...Sean Whalen
Respond proactively to threats like a defense contractor. It’s more realistic than you might think!
A practical guide of how to build intelligence-driven cyber defenses using open source software, based on real implementations of best practices, adapted from the Lockheed Martin Cyber Kill Chain model.
Adaptive Content Show & Tell - Austin Contentcdelk
This document discusses the need for adaptive, responsive, and future-friendly content. It emphasizes structuring content into discrete chunks with metadata so it can be displayed flexibly across different devices and platforms. Examples are given of restaurants that breakdown menu items into structured data elements like name, description, options, and sauces, enabling their content to adapt. The challenges of decomposing unstructured content into flexible fields is also addressed.
Docker is quickly becoming an invaluable development and deployment tool for many organizations. Come and spend the day learning about what Docker is, how to use it, how to integrate it into your workflow, and build an environment that works for you and the rest of your team. This hands-on tutorial will give you the kick-start needed to start using Docker effectively.
LJC Mashup "Building Java Microservices for the Cloud && Chuck Norris Doesn't...Daniel Bryant
The document discusses building microservices and Java applications for the cloud using DevOps principles. It introduces the Cloud DHARMA principles for building cloud apps, including being documented, highly cohesive/loosely coupled, automated from commit to cloud, resource aware, monitored, and antifragile. It also discusses moving to microservices architectures, challenges of cloud deployments, and the importance of culture in DevOps.
Bsides Delhi Security Automation for Red and Blue TeamsSuraj Pratap
Suraj Pratap discusses security automation for red and blue teams. He outlines how he automates the server and application lifecycles using open source tools to address challenges around human capacity, tool selection, time, and cost when managing 600+ servers and 10+ applications across cloud infrastructures. Some areas he has automated include infrastructure security using Ansible and CloudFormation, security auditing using Scout2 and Prowler, offensive security tests using OpenVAS and Jenkins, vulnerability management with Dradis and Vulnreport.io, and security information and event monitoring with Alienvault and ELK.
Qu'est ce que la Web perf ?
C'est un ensemble de :
Méthodes
Bonnes pratiques
Technologies
Outils
Permettant de maximiser l'expérience utilisateur d'un site web et de diminuer les ressources permettant de le produire.
C’est une culture, une attitude, une obsession …
Comment Rue Du Commerce est devenu le site e-commerce le plus rapide de France ?Fasterize
A l’ère du mobile-first, les utilisateurs s’attendent à naviguer et acheter de façon fluide n’importe où et n’importe quand. Le temps de chargement est donc devenu LE critère le plus important pour les utilisateurs et cette exigence se reflète dans vos taux de conversion mobile.
Depuis plus d'un an, RueDuCommerce est classé par le JDN comme le site mobile e-commerce le plus rapide de France. Comment les équipes de Rue Du Commerce ont-elles relevé ce défi ? Comment a-t-on mesuré les améliorations sur l’expérience utilisateur ? Quels sont les bénéfices sur les utilisateurs et sur le business ?
Stéphane Rios, CEO de Fasterize et Aniss Boumrigua, Responsable du site RueDuCommerce.fr, vous partagent leurs expériences et leurs bonnes pratiques.
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017Peak Ace
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Intervenants : Philippe Yonnet - Directeur Général et Cédric Rambaud, Consultant SEO, Search Foresight
Conférence sur l'outil Screaming Frog lors du SEOCampus Paris 2020.
Screaming Frog Seo Spider est un crawler qui est utilisé par de nombreux référenceurs. C'est un outil puissant pour effectuer des analyses SEO, mais il est parfois sous-exploité. En effet, cet outil est en constante évolution, et certaines nouveautés sont discrètes ert bien cachées dans le smultiples menus!
L'outil ne fait pas l'artisan : avoir des données c'est bien mais savoir les interpréter correctement c'est mieux ;)
Synodiance > SEO - Tendances SEO - French Web - 01/12/2014Search Foresight
Loin de se limiter à des recettes toutes faites, le métier de SEO se complexifie constamment. Encore efficaces il y a quelques mois, de nombreuses pratiques voient leurs poids diminuer dans l’algorithme, tandis que de nouvelles pratiques apparaissent en parallèle.
S’il y a une chose de sûre en SEO, c’est que ça bouge tout le temps !
Et 2014 n’a pas fait exception à la règle avec des mouvements majeurs.
Un point sur les grandes tendances SEO pour bien envisager 2015, avec au programme :
- la prise en compte de l'UX
- l’analyse de logs en must-have
- la montée inexorable du mobile
- la sémantique
- la nouvelle donne du linking, …
Présentation réalisée lors d'une webconférence French Web animée le 01/12/2014.
Yann Sauvageon - https://twitter.com/yahn
Les chantiers indispensables à glisser dans votre roadmap 2018 - Petit-déjeun...Peak Ace
AMP, recherche vocale, mobile first index, bots, http2, Ajax ... Nous ferons le point sur les évolutions importantes du SEO attendues en 2018.
Intervenant : Philippe Yonnet - Directeur Général - Search Foresight
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...Peak Ace
“Comment bien référencer un site fait avec un framework javascript (angularJS, ReactJS, etc.) ?”
L’occasion de faire le point sur la façon dont Google prend en compte les contenus générés en javascript, l’Ajax, et sur les différentes méthodes pour mieux référencer les pages web réalisées à partir de Frameworks Javascript comme AngularJS ou EmberJS crawlables…
Intervenant : Philippe Yonnet, Directeur Général Search Foresight
- Diagnostiquer des problèmes de performance
- Les bonnes pratiques pour améliorer les performances d'un site :
==> temps de téléchargement
==> temps de rendition.
Webperf et SEO : quelles métriques suivre ? Quelles optimisations privilégier ?Fasterize
Tout le monde est d’accord sur le fait qu’un site qui répond vite est crawlé plus facilement. Mais encore ? La vitesse de chargement est-elle un réel atout SEO et comment établir une corrélation ? Quelles sont les optimisations webperf efficaces pour votre site et celles qui sont contre-productives ? TTFB, Speed Index, PagesSpeed Insights et CrUX… Quels indicateurs suivre et à quels outils se fier ? Présentation de Stéphane Rios, CEO de Fasterize.
Monitoring applicatif : Pourquoi et comment ?Kenny Dits
Vous êtes développeur, chef de projet technique ou même responsable et vous souhaitez avoir de la visibilité sur le fonctionnement de vos applicatifs, ou sur la plateforme sur laquelle ils sont hébergés ?
Nous étudierons comment, grâce à des outils simples (StatD / Graphite / Log BDD) et nos expériences chez M6Web, mettre en place un monitoring applicatif ultra complet.
Ce monitoring vous permettra de retrouver la vue sur vos projets, pour mieux anticiper la charge, detecter la root cause en cas d'incident et connaitre l'état de chacun de vos services ...
Webconférence SEO le 22 Novembre : Comment optimiser un site Demandware pour ...Peak Ace
Demandware (Salesforce Commerce Cloud) est une plateforme e-commerce de plus en plus populaire. Bien que cette solution se présente comme "SEO friendly", l'analyse des implémentations en situation réelle montre que la plateforme n'est pas exempte de défauts de conception dans ce domaine, et nous verrons lesquels et comment les corriger. En outre, de sérieux problèmes peuvent être causés par un mauvais travail d'intégration, et nous listerons aussi pendant la conférence les points d'attention à surveiller...
Durant ce webinar, nous vous proposons en 30 à 45 mn de faire le point sur ce sujet.
Intervenant : Philippe Yonnet, Directeur Général, Search Foresight
Google : Prise en charge de l'Ajax et de l'Angular JSPeak Ace
Slides présentées lors du Petit Déjeuner Search Foresight du 19 novembre 2015.
Google vient d'annoncer qu'ils cessaient de promouvoir la méthode des "hashbangs" et des "escaped fragments" pour rendre les sites faits en ajax crawlables.
Comment interpréter ce revirement, et comment Google se comporte vraiment avec des sites faits en Ajax.
Point sur les bonnes pratiques dans ce domaine, en particulier pour les sites faits avec des technologies nouvelles comme Angular JS
Les chantiers indispensables à ajouter à votre roadmap 2018 - Philippe Yonnet...Peak Ace
AMP, recherche vocale, mobile first index, bots, http2, Ajax … Nous ferons le point sur les évolutions importantes du SEO attendues en 2018.
Intervenant : Philippe Yonnet – Directeur Général – Search Foresight
Core Web Vitals : Comprendre, Mesurer, OptimiseriProspect France
En juin 2021, Google va intégrer les Core Web Vitals dans son algorithme pour classer les résultats dans son moteur de recherche.
Il s’agit d’un ensemble de 3 indicateurs décrivant 3 aspects de l’expérience utilisateur réelle sur une page web : Vitesse, Interactivité et Stabilité visuelle
Découvrez comment sont mesurés ces 3 indicateurs et les optimiser dans une présentation d’Alexis Rylko pour SEMRush.
Similaire à Evolutions et nouveaux outils SEO (20)
2. Qui suis-je ?
Dimitri Brunel
8 ans en Agence
Chez l’annonceur à date
Affinité Technique / outils startup
Affinité R&D / outils internes
Nouveau jouet SEO à date : Le langage R
https://www.linkedin.com/in/seoconsultantdimitribrunel
3. Sommaire
Web Performance
Crawls / Logs / RegEx
TextMining / Outils sémantiques
Moteurs de Recherche internes
API et KPI Dashboard Softwares
Le langage R / Data Science
La tendance ?
Une compréhension plus
scientifique des moteurs
4. Web Performance
Un peu d’historique
Les bons outils
Ce qu’il faudra retenir
TTFB
500ms
FEO
(HTTP/2)
5. Autrefois le focus était sur les “scorings”
On s’est tous acharné sur les :
- Scoring Yslow (Yahoo)
- Scoring PageSpeed (Google)
- Bonnes pratiques à la main
- On parlait un peu de cache Varnish
Mais pendant ce temps :
- Les corrélations entre Vitesse et
Positions ne sont pas très évidentes
https://webmasters.googleblog.com/2010/04/using-site-speed-in-web-search-ranking.html
Google commence à
évangéliser (Avril
2010)
6. Puis Zoompf met le doigt sur ça (Août 2013)...
“Using TTFB to determine the "performance" or
"speed" could perhaps be explainable by the
increased time and effort required to capture such
data from the Google crawler.
https://zoompf.com/search-ranking-factors
...puis nous SEO, qu’il
existe AUSSI une vraie
causalité entre crawl et
“render” à =<500ms
7. Et qui dit plus de vitesse dit plus de ...
- pages explorées
- pages découvertes
- pages indexées
- pages actives
- pages re re explorées
- grappillage de ranks
+
meilleure expérience
=
plus de conversions
“In 2006, Amazon presented a clear causation between page load
time and online customer revenue. Every 100ms delay costs 1% of
sales”
”Kyle Rush from the 2011 Obama campaign site showed through
A/B testing that a 3-seconds page time reduction (5>2) improved
onsite donations by 14%, (+ $34 million in election contributions.)”
“Amazon's calculated that a page load slowdown of just one second
could cost it $1.6 billion in sales each year”
”Google has calculated that by slowing its search results by just four
tenths of a second (40ms!!!) they could lose 8 million searches per
day—meaning they'd serve up many millions fewer online adverts”
etc...
8. Enfin Google a redit “make the web faster”
Avec :
- PageSpeed Insight
- PageSpeed Modules (Apache / Nginx)
- Format WebP (image)
- SPDY (pré-HTTP2 par google)
- W3C Web Perf Working Group
Les enjeux sont forts.
Les objectifs sont ambitieux.
Le mobile nous occupe en plus en plus.
Objectifs :
=<100ms TTFB
500ms StartRender
Comment booster ?
Comment monitorer ?
9. Petite parenthèse : Google met les moyens…
Ce serait dommage de ne pas s’en servir ?
Ferme de serveurs (au dessus / Iowa)
Data Center à Hanima (à gauche / Finlande)
https://www.google.com/about/datacenters/efficiency/internal/index.html#servers
Sea Cooling Water
10. Petite parenthèse bis : Imaginons que …
Vous êtes CEO d’un moteur de recherche
Vous avez des crawlers, Des Data centers, etc.
Vous garderiez dans votre index...
Des sites très lent ?
Avec des URLs qui tappent dans le vide ?
14. Mesure l’impact des perf :
- l’acquisition (par medium)
- les chemins de conversions
- l’animation commercial (alertes)
- par device (ex: mobile)
- analyse les pages
- propose des solutions A/B
- etc
WEBPERF.IO
(web performance monitoring)
http://webperf.io/
15. TAG PERFORMANCE (tags monitoring)
http://fr.slideshare.net/TagCommander/tag-performance-slidesharefr
Situation à date :
- Le nombre de tags croit
- Ils peuvent ralentir les
chargements utilisateurs
- GoogleBot peut crawler
(abusivement) des ressources
externes dont les JS donc aussi
des tags...
La vision de TagCommander :
- Mesurer vos tags
- Sur vos visiteurs / toutes pages
- Sans échantillonage
- Brique de “Tag Commander”
Pour identifier les soucis :
- par conteneur, page, ou device
- sur le chargement du DOM
- entre deux mise en production
17. Analyseurs de
Crawls et Logs
Un peu d’historique
Les bons outils
Les RegEx
Ce qu’il faudra retenir
Taux de crawls
Taux de pages actives
Codes HTTP
18. Un peu d’historique La tendance actuelle ?
- Quelques crawlers
(XENU, Link Examiner)
- Gros besoins en RAM
- Peu de solutions SaaS
- Des analyses incomplètes
- Peu d’informations en sortie
- Des graph à refaire
- Les limites de Excel (sans
power pivot + langage DAX)
(je force un peu le trait mais à peine…)
- Startups et levées de fonds
- QUE des solutions SaaS
- Critères en expansions
- Dataset “XXL” / Délégation
- Explorateurs d’URLs
- Dashboards typé “Bootstrap”
- Possibilités “custom”
Et aussi :
- Des APIs (= nouveaux usages)
- Tests de papiers de recherche
19. Y a t’il encore de la place pour eux ?
Peuvent-ils crawler de grosse structure ? (ex: 150K URLs)
Oui et Oui ! et sont très bien pour des actions “one shot”
Software à l’ancienne ?
20. - Gratuit ! (pour l’instant)
- 150.000 URLs crawlables
- 2GB de RAM suffisent
- Analyse les basiques
- Crawl l’AJAX
- Crawls parallélisables
- Intégration SearchConsole
- Intégration BingWT
- Intégration YandexWT (en cours)
Sinon vous avez un MAC ?
Dont’ panic ! (slide suivante)
Visual Seo Studio (desktop - win)
http://visual-seo.com/SEO-Software-Features/Development-Status
21. - Peu couteux !
- Crawl l’AJAX
- Accept-Language Header
- Extraction par patterns
- Template d’exports
- Simulation de snippets
- Support Robots.txt
- Intégration Google Analytics
- Intégration Search Console
- NoMatch GA et GSC
- Amélioration en continue
Screaming Frog (desktop - win/mac)
https://www.screamingfrog.co.uk/seo-spider-5-0/
22. Vous avez 10 marques ? 15 boutiques ?
Des gros catalogues ? Des milliers de produits ?
Ou xxx langues / régions ?
Quoi de plus “scalable” ?
24. BOTIFY ANALYTICS (crawls + Google Analytics)
https://www.botify.com/support/videos/
https://developers.botify.com/api/
- Intégration GA
- Main HTML Tags
- Load Time Performance
- Liens internes / sortant
- Exploreur d’URLs (dataset)
- Calcul du PageRank interne
- Catégorisations et Filtres
- Comparaison de crawls
- Virtual Robots
- Custom HTTP Headers
- Planification, Plugin Chrome
25. BOTIFY LOG ANALYSER (crawls + logs)
https://www.botify.com/log-analyzer/
- Les features des CRAWLS
plus
- Suivi bots moteurs majeurs
- Catégorisation transversales
- Codes HTTP, Pages orphelines
- Lost / Recovered URLs
- Taux de crawls (hits)
- Taux de pages actives (visits)
- Fenêtre de crawls
- Rapports journaliers
- et bien d’autre features encore
26. BOTIFY REST API
Application Programming Interface
REST (via HTTP / en client-serveur)
OBJECTIFS :
- créer de nouveaux usages
- des usages “url centric”
POSSIBILITÉS :
- métriques crawl accessibles
- métriques logs en cours
- SDK JS (les autres arrivent)
Exemple d’usages ?
Dashboard
URL centric
Search Console
- mot clé
- URL active
G-Analytics
- URL active
- sessions
- transact°
BOTIFY
- URL crawlé
- URL active
Majestic SEO
- URL linké
- trust flow
- citat° flow
28. ONCRAWL (crawls)
http://fr.oncrawl.com/knowledge-base/
- Editorial Insights
=> words count, schema
=> OG, twitter cards
=> extraction de n-grams
- Duplicate content
=> par similarité (simhash)
=> par tags par clusters
- Architecture (Inlinks, Outlinks,
flux de page rank)
- Performance (load, weight, etc)
29. ONCRAWL ADVANCED PLATFORM (crawls + logs)
http://www.slideshare.net/Cogniteev/seo-breakfast-toulouse-analyse-de-logs
- Open Source ! https://github.com/cogniteev/oncrawl-elk
ou
- Hosted Version : chez Cogniteev
- Suivi des bots courants
- Analyse croisé (crawls + logs)
- Nb. et Taux de crawls / Pages actives
- Nb. et Taux de pages orphelines
- Catégorisations et Distribution
- Graph historisés, Fenêtre de crawls
30. KELOGS (logs)
http://kelo.gs/
- Une interface claire (highchart)
- Vision KPI / crawl / hits / bots
- Synthèse par métriques site
- Des rapports par cat (regex)
- Explorateur de logs puissant
- Robuste (1 milliard de lignes)
- Prix doux :)
31. REG EX (catégoriser vos URLs est obligatoire)
http://regexr.com/ https://regex101.com/
32. TextMining et
Outils Sémantiques
Un peu d’historique
La fouille de texte
Situation à date ?
Ce qu’il faudra retenir
Quantification sémantique
Score sémantique
Affiné sémantique
Cocon sémantique
Word Embedding
Mots en relations
Fichier de vocabulaire
33. TextMining / DataMining
Pouvait déjà servir en SEO ...
Un peu d’historique SEO
Quelques tentatives sur :
- Analyse de texte ou URLs
- Fréquence de mots
- Densité selon tag, pertinence
- Paires de mots, proximité
Quelques outils :
- Textalyser
- Alyse
- et Rapidminner (2006) !
34. « Extraction de connaissances » dans les textes
Désigné sous l'anglicisme “text mining“
Les disciplines impliquées : linguistique informatique,
l'ingénierie du langage (TAL), l'apprentissage artificiel et les statistiques
Fouille de texte ?
35. Rapidminer : “Text Processing”
Traitement de texte :
- création de corpus (n doc => BDD)
- tokenisation (découpe éléments)
- stopwords (suppression)
- stemming (racine des mots)
- lemmatisation (mot simplifié)
- n-grams (séquences contiguës)
=> table de fréquences des mots
Via du TextMining, puis applications d’
algo, on peut simuler les documents
36. Rapidminer : “Association Rules with text”
Apprentissage Règles Associations
(=trouver relations ayant un intérêt)
- en explorant un corpus
- en traitant les textes
- en créant des “vecteurs”
- en trouvant les items fréquents
(algo FP-Growth. Il en existe des
tas => APriori, Eclat, GUHA…)
- trouver ces règles d’association
- et visualiser ces règles
{onion, potatoes} => burger
{data, mining} => rapidminer
https://en.wikipedia.org/wiki/Association_rule_learning#Definition
37. Rapidminer : “Similar documents and Clustering”
Calcul de Similarité et Partitionnement
- Calculer la similarité entre une
requête et documents
(= vecteur mot / score TF-IDF)
- Calculer la similarité entre doc
(=similarité cosinus)
- Partionnement de documents
(=K-means clustering)
38. RapidMiner a évolué
et en parallèle
Des outils de “quantification sémantique” pour nous SEO !
Situation à date ? (2016)
39. Rapidminer 2016 ? (version 5.3 full - gratuite)
Open Source Predictive Analytics Platform
- Web Scrapping et tjs du TextMining
- Corrélation (facteurs / forces)
- Régles d’association (système de reco)
- Partitionnement (k-means)
- Cat auto docs (avis / spam / arbo ! :)
- Régression linéaire (formule prédictive)
- Arbre de décision (gagnant / perdant)
Open (csv, excel, mysql, postgre ...)
Interface R et Python
40. 1.FR (score sémantique)
L’idée ? Trouver des relations entre termes,
et regrouper (=créer champs sémantiques)
Comment ? Un corpus (millier de pages), un
apprentissage (créer la BDD des champs)
L’app ? Audit les textes, donne des scorings
(vs concurrents), trouve des mots proches
Pour action ? Sculpter les champs lexicaux
=> affiner / ajouter (termes absents)
=> suppression (hors sujet, diluants)
=> contrôler avec le scoring (0 à 100%)
41. VISIBLIS V2 (affinité sémantique et cocon)
L’idée initiale ? Un corpus de 17 millions de
doc. Des algo de traitement du langage.
Pourquoi Visiblis V2 est très très fort ?
- analyse (TAL) de structure en silo
- n-grams (avec synapsie par ex)
- visualisation des liens internes
- visualisation des clusters sémantiques
- corpus visiblis / corpus perso
- API V2 en dev / à venir
- Analyse sémantique TOP10 à venir https://fr.wikipedia.org/wiki/Synapsie
https://en.wikipedia.org/wiki/N-gram
n-gram
= séquence contiguë n-items
{paire = AGC, GCT, CTT}
{lettre = to_, o_b, _be,}
{mot = to be, be or, or not}
synapsie
= liaison par joncteurs (ex: de, à)
{pomme de terre}
42. Autres modèles vectoriels :
TF-IDF, BM25, BOW
VISIBLIS V2 (Outils > Affinité Sémantique)
C’est quoi ? La similarité entre une requête
=> et un document (vecteur G.Salton)
=> et une cooccurrence (n-gram) du corpus
TitrAlyser : mesure l’affinité requête > titre,
suggère des opti, simule l’affichage
TextAlyser : mesure l’affinité requête >
phrases, suggère des opti d’affinité
WebAlyser : fait la synthèse (requête > url),
par affinité titre et contenus, diagnostique
et re suggère des coocurrences
https://fr.wikipedia.org/wiki/Synapsie
https://fr.wikipedia.org/wiki/Formation_des_mots
43. VISIBLIS V2 (Outils > Cocon sémantique)
C’est quoi ? Des pages hiérarchisés en un silo étanche
remontant vers un mot clé.
TreeAlyser : visualise le PR et Semantic
Rank (titre / texte) dans un réseau de pages
ClustAlyser : mesure l’affinité sémantique
entre pages, “clusterize”, puis visualise
SlideAlyser : affinité et complémentarité
sémantique entre pages (diagramme venn)
Proximité à 10% Proximité à 50% Proximité à 80%
Rien en commun Glissement possible Duplication possible
44. COCON.SE (des cocons moins con)
Des outils pour visualiser des pages bien
organisés en silo (cocon, wordpress, etc.)
- Maillages sous une forme lisible
- Vision crawler (1er lien suivi)
- Vision hiérarchisé (selon arborescence)
- Colorisation topologique (pages / liens)
- Diamètres apparenté au PageRank
- Éventails (liens intra-silo / fuites)
Simuler la structure permet de pousser les
pages utiles, et supprimer les liens inutiles
http://cocon.se/visualisation/visu-cmap
45. Si l’on avait eu plus de temps pour discuter :
Alternative en Text Mining / Data Mining :
- KNIME https://en.wikipedia.org/wiki/KNIME
(merci à Aurélien Berrut http://www.htitipi.com/ )
Traitement du langage et Analyse du sentiment :
- INBENDA https://www.inbenta.com/fr/solutions
(merci à la personne qui m’en a parlé après la conf)
48. WORD2VEC ?
D’abord un papier de recherche en 2013 :
- Efficient Estimation of Word Representations in Vector Space, by Tomas
Mikolov, Kai Chen, Greg S. Corrado, Jeffrey Dean [ICLR Workshop 2013]
Puis une version (pas la vraie en fait) open-source :
- https://code.google.com/archive/p/word2vec/
Enfin de gros Dataset rendus accessibles :
- FREEBASE a pré-entraîné WORD2VEC
- GoogleNews a été rendu public et a aussi pré-entraîné WORD2VEC
49. WORD2VEC, c’est quoi ?
Nouvelle approche simple et rapide pour
entraîner des “machine learning” à faire du
“word embedding” = représentations
vectorielles (nombre) des mots par rapport
aux autres mots voisins un large corpus.
Word2Vec s'entraîne à reconnaître :
=> d’un contexte des mots => Sac de mots
=> des mots un contexte => Skip-gram
DeepLearning4J obtient des résultats plus
précis sur de gros dataset via skip-gram
50. WORD2VEC, représentation de vecteurs
Source : TensorFlow (Google Machine Learning 2nd Gen / DistBelief 1st Gen)
https://www.tensorflow.org/versions/r0.7/tutorials/word2vec/index.html
http://download.tensorflow.org/paper/whitepaper2015.pdf
51. WORD2VEC, concrètement ça fait quoi ?
Les vecteurs capturent avec une forte
régularité, la sémantique et la syntaxe des
mots du corpus.
Au final, Word2Vec renvoie des distances
cosinus entre les mots en relation.
Les vecteurs ont certaines propriétés comme
la correspondance entre langues
France
Word Cosine distance
spain 0.678515
belgium 0.665923
netherlands 0.652428
italy 0.633130
switzerland 0.622323
luxembourg 0.610033
portugal 0.577154
russia 0.571507
germany 0.563291
catalonia 0.534176
52. WORD2VEC, concrètement ça fait quoi ?
Les vecteurs ont des propriétés linguistiques
aussi ! Des calculs simples permettent de
résoudre analogies, antinomies, etc :
- vector('Paris') - vector('France') + vector('Italy') =
vector('Rome')
Les modèles peuvent être entraînés sur d’
énorme dataset (100 millards de mots)
L’entrainement peut être pré-processé (mots
vers phrases) et partitionnés sur les vecteurs
hauts (=K-means => fichiers de vocabulaire).
san_francisco
Word Cosine distance
los_angeles 0.666175
golden_gate 0.571522
oakland 0.557521
california 0.554623
san_diego 0.534939
pasadena 0.519115
seattle 0.512098
taiko 0.507570
Vocabulary file
acceptance 412 argue 412 argues 412 arguing
412 argument 412 arguments 412 belief 412
believe 412 challenge 412 claim 412
53. WORD2VEC, librairies et applications ?
Comment jouer avec ?
- en Java => DeepLearning4JS
- en Python => Gensim
- en R => wordVectors
Quatre applications connus avec Word2Vec?
- Traduction de langues
- Analyse du sentiment
- Reconnaissance d’entités nommées
- Semantic-role labeling
Pourquoi donc
ne pas essayer
d’utiliser ceci
en SEO !?
54. WORD2VEC, quelles utilisations pour nous SEO ?
- Suggérer des mots clés, des analogies (vecteurs proches)
- Sortir des fichiers de vocabulaire (vecteurs partitionnés)
- Itérer par langue simplement (vecteurs très proches)
- Interroger Word2Vec sur des entités nommées (entraînement freebase)
- Dérouler un graph de connaissance ensuite
- Calculer la similarité entre mot ⇔ documents (index inversé)
- Calculer la similarité entre syntagmes, phrases, docs (doc2vec + gensim)
http://stackoverflow.com/a/31417164
- Entraîner l’outil sur des DataSet perso => qualité du corpus indispensable
55. Moteurs de
recherche interne
Rapport avec le SEO ?
Moteur indexé
Moteur non indexé
Ce qu’il faudra retenir
Moteur non indexé
Milliseconds matter
Indexation SEO
56. Pourquoi vous s'intéresser à la recherche interne ?
- Recherche Interne / SEO reposent sur de même briques du TAL (ex TF-IDF)
- Vous captez de nouvelles recherches (mots clés)
- Vous devriez mailler / indexer certaines de ces recherches
- Vous voulez récupérer / garder vos visiteurs seo mobiles / desktop
- Vous ne voulez pas qu’un collègue indexe 1M de page de recherche...
- Votre moteur à facettes est fermé sur des requêtes marques / génériques
=> la recherche interne peut aider temporairement (mode pansement)
57. MOTEURS indexés et MOTEURS non indexés
Moteur indexé
(ex: elastic search)
- basé sur du crawl de docs
- basé sur des index (lucène)
- scalable (architecture adaptable)
- possède la recherche à facettes
- quasi temps réel (latence faible)
Moteur non indexé
(ex: json et attributs)
- zéro crawl = pas d’index de docs
- seemless indexing
Seemless Indexing ?
- index JSON
- on the fly (MAJ temps réèl)
- attributs (détection auto)
- reindexing (modif de conf)
61. ALGOLIA (milliseconds matter) / non indexé
Out of the box :
Seamless indexing : vous poussez un JSON, c’est prêt !
Intuitive ranking : vous réglez VOTRE moteur de recherche (TAL / Business)
API REST, 13 clients : Ruby, Rails, Python, PHP, JS, Java, Android, ...
Lighting-fast back-end : répond entre 6ms et 9ms
Distributed Search Network (DSN) : 30 data centers / 14 régions
MAI 2015 : 18,3 M$ de levée de fonds chez Accel Partners !
62. ALGOLIA (milliseconds matters) / aspects saillants
Instant Search :
c’est un package UX “all-in-one” avec
- widget slider (prix)
- widger search (auto complete)
- widget grid (tuiles de produits)
- widget filter (facettes
Au final c’est un moteur à facettes
ultra complet, qui s'intègre en 2J, et
que vous pouvez indexer (au choix)
avec votre dev full-stack interne
https://community.algolia.com/instantsearch.js/
63. ALGOLIA (milliseconds matters) / aspects saillants
Intuitive Ranking :
Agit sur la pertinence via des curseurs
DISPLAY
- attribut : catégories, rayons
- attribut : facettes x y z
RANKING
- attribut : état du catalogue produits
BUSINESS
- attribut : prix, ventes, geoloc, etc
66. Situation à date et REST ?
Google fait des API pour tout :
- Search Console
- Google Analytics
- Google Trends
- Google Chart
- ...
Chaque startup se doit de
créer son API REST !
SEOtools pour Excel intègre les
plus spécifiques au SEO
API REST (representational state
transfer). A la mode, car très
pratique à utiliser :
- via des URI
- via HTTP
- via des VERBES (get, …)
- via des JETONS (token)
- via des XML ou JSON
67. CATALISIO > API Google Search Console V3
Résout le “not provided” via :
- données par PAGE
- dimension par MOT CLÉS
- dimension par DEVICES
- dimension par X ou Y DATA
- A haut volume (récolte tout)
L’outil étant “URL centric” :
- volume de recherche sont alignés
- trafic et conversions sont alignés
Connecteurs GA / eulerian / adwords
Des “dashboard” clairs
Des “score cards” par KPIs
https://www.catalisio.com/fonctionnalites/
68. CATALISIO > API Google Search Console V3
Vision apporte une vision ROI-ste :
- estimer l’acquisition Ranks / CTR
- estimer l’acquisition Mots / €€
Mais aussi insciter des “pour actions” :
- activer potentiels sous-exploités
- activer potentiels à conquérir
Catalisio connecte tout. Vous pouvez
vous recentrer sur votre plan d’action.
Vision par Mots Clés
Suggestions d'Opportunités
https://www.catalisio.com/fonctionnalites/
69. GA DASHBOARD (with R) > API Google Analytics
Enhance Your GA Data with R
Interactive trend graph
Auto-update of GA data for last 3 years
Zoomable heatmap for Day of week analysis.
YoY, MoM, Last Month vs Last Year.
MySQL persistant storage (blending your data with GA data)
Upload option to update MySQL data stored.
Analysis of impact of events via Google's CausalImpact
Detection of unusual timepoints using Twitter's AnomalyDetection
https://github.com/MarkEdmondson1234/ga-dashboard-demo
70. GA DASHBOARD (with R) > API Google Analytics
http://markedmondson.me/enhance-your-google-analytics-data-with-r-and-shiny-free-online-dashboard-template
Heatmaps (Twitter algo) AnomalityDetection
71. TextMining (for Google Sheets) > API dandelion
Le plus utile pour nous SEO :
- extraction d’entités nommées
(nom, lieux, concept, etc)
- analyse du sentiment (positif,
négatif, neutre)
Autred fonctionnalités via l’API :
- similarité de texte (BOW,
langues, etc)
- classification de texte (modèle de
taxons ou personnalisable)
https://dandelion.eu/
72. Plugin et WebApp se multiplient à tour de bras
Exemples
API Search Gonsole :
- searchConsoleR (R package)
- SearchAnalytics (GoogleSheets)
- SuperMetrics (GoogleSheets)
- SEOtools (Excel)
Exemples
API Google Analytics :
- googleAuthR (R package)
- GA Dashboard (R Shiny App)
- GA Effect (R Shiny App)
- GA Rollup (R Shiny App)
- GA Meta (R Shiny App)
- Analytics Canvas (GoogleSheets)
- SuperMetrics (GoogleSheets)
- SEOtools (Excel)
74. KLIPFOLIO
Create dashboards using data
from 100s of services
- alexa
- adobe analytics
- google analytics
- google adwords
- search console
- MOZ
- Searchmetrics
- etc...
https://www.klipfolio.com/integrations
75. CYFE
Des connecteurs (=widgets)
- adwords
- googla analytics
- moz
- alexa
- search console
et des custom widgets
- Push API
- Donut, Funnel, etc
http://www.cyfe.com/custom
76. PERISCOPE DATA(Type SQL, Get Charts)
Imaginons vous stockiez en
vrac (= data lake) des data
issues de :
- “google search console”
- “google analytics”
- “crawls”
Application :
2-3 lignes de SQL et vous
avez des graphs sur une
jointure au choix
https://www.geckoboard.com/integrations/
77. Le langage
R
Pourquoi c’est bien ?
Après avoir parlé des API...
...que faire avec R en SEO ?
Ce qu’il faudra retenir
Rstudio
R + Shiny + SEO
ALGO
78. Introduction sur R
Le langage d’analyse statistique
- Utilisé par tous les chercheurs
- +2 millions users et ça augmente
- votre ami le Data Scientist l’utilise
Open source, il y a des “packages” sur TOUT :
- collecter / visualiser de la data (ggplot2)
- interroger des “machine learning” (word2vec, glove)
- lancer des “deep learning framework” (Tensorflow, MXNet)
- appliquer des tas d’algo (BM25, Apriori, K-means, C4.5, CausualImpact)
- déployer des web app sans aligner une ligne de CSS et de JS (seriously)
2015 2014
79. D’être un expert en math
D’être un expert en algorithmes
D’être un expert en programmation
exemples ?
Avec pas besoin...
80. Mark Edmondson (Data Insight Dev / IIH Nordic)
A créé des interface R (API Google) et contribué à de nombres de packages :
- googleAuthR (interface R pour OAuth 2)
- googleAnalyticsR_public (interface R pour GA)
- dygraphs : lib R pour diagramme avec tracé des zone de confiance
- ggraph : add-on R pour le librairie de dataviz ggplot2
Puis des applications R avec Shiny Dashboard proche et utilisable en SEO :
- searchConsoleR (APP search console)
- GoogleTrendsDashboard (APP google trends)
- GA Dashboard (APP google analytics console)
- GA Effect (implémentation de CasualImpact (structures bayésiennes))
81. Mark Edmondson > POC searchConsoleR
- WebApp en R
- Connecteur Search Console
- Fonction search_analytics()
(celle qui nous intéresse le plus)
- Croissement page ⇔ keyword
Ne demande qu’à évoluer évoluer :
- stockage en base
- croisements avec GA
- application d’algo en statistiques
http://markedmondson.me/automating-google-search-analytics-data-downloads-with-r-and-searchconsoler
82. Mark Edmondson > POC GA Effect
Implémentation Google CasualImpact
(structures temporelles bayésiennes))
- WebApp en R
- Connecteur Google Analytics
- Charge tous types de Sources
- Charge tous types de métriques
Permet de prédire si un évènement
passé à un impact sur le présent.
ex : changement de balises <TITLE>
http://online-behavior.com/analytics/statistical-significance
http://markedmondson.me/finding-the-roi-of-title-tag-changes-using-googles-causalimpact-r-package
83. Mark Edmondson > POC GoogleTrendsDashboard
- WebApp en R
- Connecteur Google Trends
- Basé sur la lib GTrendsR
- Permet d’interroger
- Permet d’extraire
De là à en faire un outil SaaS pour
vos collègues rédacteur web semble
envisageable...
84. Débuter avec R
1/ Installer un IDE : Rstudio
2/ Installer les packages utiles
- Shiny web app framework
- Shiny Dashboard
- htmlwidget
- ggplot2
- readr
3/ Déployer votre Web App SEO :
- Shiny App IO
85. R > d’autres “packages” à connaître
gTrendR : interface R pour récupérer / afficher des informations GG Trends.
googleVis : interface R pour utiliser Google Chart API
DiagrammeR : lib R pour diagrammes sous Rstudio très simplement
CasualImpact : prédire le présent avec les structures temporelles bayésiennes
AnomalyDetection : trending topics / marronniers / points sous-jacents
et les packages en fouille de textes comme Aylien
87. Il existe un algo ! et ça peut servir aussi en SEO !
Et votre collègue data scientist en connaît des tas ...
- TD-IDF, BM25
- BOW
- n-grams
- PageRank
- C4.5
- APriori
- K-means
- Google CasualImpact
- Twitter AnomalyDetection
- Twitter BreackoutDetection
http://scikit-learn.org/stable/tutorial/machine_learning_map/index.html
http://rayli.net/blog/data/top-10-data-mining-algorithms-in-plain-english/