5. 5#seocam
Rédaction web
Etat des lieux 2018 avec retours de Scribeur.com
Fiche produit
Longueur 100 à 200 mots
Structure h1 à h2 et §
Maillage interne pertinent
Articles (blog/actu)
Longueur 400 à 500 mots
Structure h1 à h2 et §
Maillage interne pertinent
Corporate (entreprise, association,
pro)
Longueur 300 à 1000 mots
Structure h1 à h2 et §
Maillage interne pertinent
++ Recherche et enrichissement de mots clés et de sémantique
www.scribeur.com
6. 6#seocam
Sur l’analyse du trafic :
Google adwords, Semrush, Yooda Insight, …
Sur des algorithmes d’analyse (la plupart basé sur des dérivés de
l’algorithme WDF*IDF qui malgré les arguments commerciaux sont en aucun cas de
l’intelligence artificielle mais de simples algorithmes informatiques)
Sur le feeling ou le hasard ou l’espoir…
(bof bof et pourtant beaucoup dans ce cas…)
Pour trouver les bons mots
clefs chacun sa méthode…
+80
%
Des personnes qui achètent
du texte
à des rédacteurs
N’UTILISE PAS D’OUTIL !!
CAR NE LES CONNAISSENT PAS ou ESPERENT
QUE LE REDACTEUR S’EN OCCUPE
www.scribeur.com
8. 8#seocam
Quelques exemples de méthodes d’IA
Créée pour le plongement lexical (ou Word Embedding)
par une équipe de recherche chez Google sous la
direction de Tomas Mikolov en 2013. Cette dernière
repose sur deux couches de réseaux de neurones dont
une cachée, entraîné pour reconstruire le contexte
linguistique des mots
Word2vec
Global Vectors for Word Représentation, créé à
l’Université de Stanford. À partir d’un corpus de texte
(limité au carré de la taille du vocabulaire) et d’une taille
de fenêtre contextuelle, il met en lumière les similarités
linguistiques et sémantiques en analysant les plus
proches voisins ainsi que les sous structures linéaires.
GloVe
Latent Semantic Analysis. Comme Word2vec, il prend en entrée un corpus
de texte et permet d’obtenir une représentation vectorielle de l’analyse du
corpus. À partir de cette analyse, il est alors possible d’obtenir la similarité
sémantique entre deux mots. Cet algorithme apparaît comme plus pertinent
que Word2vec uniquement dans le cas de corpus de taille moyenne ou
inférieure à 10 millions de mots.
LSA
Projet Open Source de Facebook Research pour une analyse rapide des
structures de mots et de la classification de texte implémenté en C++. Plus
performant que Word2vec pour des tâches d’analyse syntaxique mais
moins performant pour une analyse sémantique.
FastText
www.scribeur.com
9. 9#seocam
Quelques exemples de méthodes d’IA
Analyser d’énormes volumes de données pour en déduire des
rapprochements.
Exemple :
Roi + homme = Reine + ?? (femme)
Afrique > Maroc > Marrakech
Le principe d’une IA
L’IA permet d’enrichir considérablement un texte au
niveau sémantique mais aussi au niveau des idées à
développer !
L’IA permet d’enrichir considérablement un texte au
niveau sémantique mais aussi au niveau des idées à
développer !
www.scribeur.com
11. 11#seocam
Mise en place de processus pour entrainer l’IA sur des domaines et
langues ciblées
Scribeur.com et l’IA
Partenariat avec une grande école d’ingénieur française et un laboratoire de recherche en IA.
=> Aboutissement à une version Beta d’IA 100% orientée sémantique SEO : Mantiks
Ne pas faire abstraction des méthodes actuelles (non
IA) mais utiliser l’IA pour renforcer de manière
significative l’impact des textes
2017 / 2018
2012 / 2013
Développement et mise en place d’un des premiers
algorithmes WDF*IDF disponibles pour le SEO (non ouvert
car usage strictement interne pour nos clients grands
comptes)
Les algos classiques comme WDF*IDF ne suffisent plus car 2018 est le début de l’ère de l’IA !!
L’Intelligence Artificielle est la nouvelle révolution du SEO en 2018
(le passage doit se faire maintenant dans les entreprises)
www.scribeur.com
12. 12#seocam
IA dépendant de la langue (nécessite
des entrainements longs et coûteux)
IA doit être entrainée par corpus volumineux donc
aussi par langue
Performances des machines
Pour développer et héberger une IA, cela nécessite
des machines capables d’analyser de très gros
volumes de données (milliard de data)
Financier
Coût global de lancer un tel projet qui nécessite des
investissements conséquents (humain, matériel…)
Difficulté pour mettre en place une IA
Disponibilités des compétences
Manque de profil compétant si on veut acquérir le
savoir en interne (internalisé)
Complexité à prendre en main en solo
Niveau poussé (bac+5 grandes écoles +
accompagnement de labos, chercheurs…)
Couplage à nos attentes de SEO
Comment utiliser les retours de l’IA dans un context
SEO ? Calibrage du poids de l’IA dans le texte à
produire
www.scribeur.com
13. 13#seocam
Pour résumer :
Développer sa propre Intelligence Artificielle
demande
des ressources importantes
et des compétences des plus pointues !
(sont donc éliminés 99% des TPE/PME, malheureusement…)
www.scribeur.com
14. 14#seocam
Utiliser une IA avec intelligence…
Une IA est un outil des plus puissants qui a une éducation…
elle apprend dans le cadre que nous lui imposons
Exemple :
Norman, la première IA (développée par le MIT) à avoir été classée comme psychopathe à l’issu des tests de Rorschach !!
car entrainée uniquement sur la base d’image de morts et de cadavres… elle ne connait donc rien d’autres…
Le problème est identique au niveau SEO, tout projet d’IA est confronté à la contextualisation pour pouvoir être utilisable notamment
dans un usage SEO (sémantique plus ciblée).
Exemple sur « rédacteur », je cherche des idées de mots sémantiques :
IA - avec affinage du corpus
éditorialiste
rédaction
rédactrice
rédacteurs
éditorial
collaborateur
journaliste
IA - sans affinage du corpus
éditorialiste
éditorial
collaborateur
rédactrice
avanti
pistolin
spectator
Sans IA – WDF*IDF
rédacteur
définition
actualités
région
métiers
littéraire
publications
www.scribeur.com
15. 15#seocam
Utiliser une IA avec intelligence…
Le corpus doit donc être le plus ciblé possible tout en ayant un maximum de contenus en entrée
(des milliards de mots).
Nos tests ont montré qu’il faut 1 milliard de mots à minima,
400 mots / article en moyenne sur le web, nous arrivons à :
2 500 000 articles à analyser
pour l’apprentissage de l’IA dans un corpus donné…
Il faut donc utiliser l’IA avec :
- une vraie méthodologie en entrée privilégiant le contexte ou corpus
- et une analyse des résultats
www.scribeur.com
16. 16#seocam
L’IA, la clé du SEO ?
Scribeur.com a décidé de miser sur des algos améliorés par 5 années d’optimisation ET sur
l’intelligence artificielle pour ses clients “gestion de projet” mais aussi de proposer ses algorithmes
en accès direct en septembre.
Pourquoi ? Car les retours de l’IA sont très prometteurs !
www.scribeur.com
17. 17#seocam
L’IA la clef du SEO ?
Scribeur en est convaincu !
Notre point de vue
L’IA ne doit pas être utilisée de manière aveugle mais couplée
à des techniques ayant fait leur preuves afin de renforcer les
résultats. Chaque cas client devra (devrait) être étudié au
niveau de la cible et du contexte en amont.
WDF*IDF est toujours d’actualité, mais ne suffit plus à lui seul
et devrait être complété par l’analyse IA telle que nous avons
développé et que nous testons depuis 2 mois en conditions
réelles.
Scribeur proposera à la rentrée son IA et ses algos à tous
ceux souhaitant améliorer leurs textes de manière
intelligente !
www.scribeur.com
Faisons travailler notre IA « MANTIKS »
pour enrichir en mots et idées :
18. 18#seocam
La suite ?
Ouverture en septembre/octobre 2018 du service d’intelligence artificielle : MANTIKS
Nous mettrons à disposition l’ensemble de notre savoir-faire à disposition afin que toutes les entreprises et consultants puissent les utiliser.
Nous sommes en cours de réflexion sur les packaging
Rentrée 2018, scribeur.com vous proposera une vraie IA puissante et orientée SEO
N’hésitez pas à prendre contact avec nous pour avoir un accès en avant première…
www.scribeur.com
19. 19#seocam
Question Mug
● Combien de mots sont nécessaires
pour entrainer une IA de manière
efficace ?
● Alors ???.........................
www.scribeur.com