La facilità di lettura influenza il modo in cui i MdR percepiscono una pagina web? Dalla descrizioni di cos'è la 'Readability', agli indici più noti, agli indici tarati sulla lingua Italiana, alla relazione tra leggibilità e Motori di ricerca. Fatti, studi, indizi, e qualche opinione personale.
Presentazione "Search Marketing Connect 2016", Rimini 16-17 Dicembre 2016
2. #SMConnect
Federico Sasso @vseostudio
Mi presento
Federico Sasso
● Sviluppatore Software
● SEO
● Moderatore Forum GT
● Imprenditore
● ...
● Autore di
Visual SEO Studio
3. #SMConnect
Federico Sasso @vseostudio
Alzate la mano
● Chi siete?
SEO, Copywriter, Blogger, Web developer,
altro?
● Chi ha idea di che sia la “Leggibilità”?
(en: “Readability”?)
● Chi la misura?
4. #SMConnect
Federico Sasso @vseostudio
Obiettivo di oggi
● Definire la Leggibilità
● Capire Formule e
Indici di Leggibilità, e
loro limiti
● Cercare di rispondere
alla domanda
“Serve per la SEO”?
5. #SMConnect
Federico Sasso @vseostudio
Un po’ di definizioni
Il termine Italiano “Leggibilità” è ambiguo.
In Inglese si può tradurre in due modi:
● Legibility
● Readability
7. #SMConnect
Federico Sasso @vseostudio
Un po’ di definizioni
Il livello di scolarizzazione necessario perché
il lettore possa leggere / comprendere il testo
senza difficoltà.
Readability
10. #SMConnect
Federico Sasso @vseostudio
Un po’ di definizioni
Dizionario di Frequenza
Si ottiene da un Corpus
È la base dei modelli
statistici usati per
creare le formule di
leggibilità
11. #SMConnect
Federico Sasso @vseostudio
Un po’ di Storia
900 a.C. circa
gli studiosi del
Talmud iniziano la
pratica di contare
parole e
frequenze di
termini insoliti
nella Torah.
13. #SMConnect
Federico Sasso @vseostudio
Un po’ di Storia
religiosi:
dimostrare che testi
sacri fossero eretici in
base a quanto si
discostavano da quelli
ufficiali ...
15. #SMConnect
Federico Sasso @vseostudio
Un po’ di Storia
1889
Primo studio formale di leggibilità
di Nikolai Aleksandrovich Rubakin.
Stila il primo dizionario di
frequenza di 1500 lemmi d’uso
comune.
Individua in parole rare e frasi
lunghe le difficoltà di lettura.
16. #SMConnect
Federico Sasso @vseostudio
Un po’ di Storia
1893
Lucius Adelno Sherman pubblica analisi spettrale
lunghezze sentenze (in parole).
Scopre “firme” di
autori, e testo minimo
per caratterizzarle.
17. #SMConnect
Federico Sasso @vseostudio
Un po’ di Storia
1921
Edward Thorndike costruisce il primo dizionario di
frequenza della lingua Inglese, di 10.000 lemmi.
20.000 lemmi nel 1931
30.000 lemmi nel 1944
1923 Lively and Pressey
Prima formula di leggibilità
basata sulla lista Thornidike
18. #SMConnect
Federico Sasso @vseostudio
Un po’ di Storia
1948
Flesch Reading Ease Formula
(che produce il Flesch Reading Ease Score,
FRES)
Ne parleremo in dettaglio presto
19. #SMConnect
Federico Sasso @vseostudio
Un po’ di Storia
1975
Flesch-Kincaid Formula
Una delle tante, sebbene una delle più famose.
Invece di una scala 0-100 propone come risultato
un "US grade level".
26. #SMConnect
Federico Sasso @vseostudio
Indici di Leggibilità
si basano su modelli statistici e su delle assunzioni:
● il testo sia inglese corretto
● il testo sia di lunghezza sufficiente
● la tipologia del testo sia quella su cui l'indice è stato
costruito
● la lingua (e le sue statistiche) non sia cambiata
troppo nel tempo!
27. #SMConnect
Federico Sasso @vseostudio
Flesch Reading Ease
Nota come
“Formula di Flesch”
Produce un punteggio “FRES”
da 0 a 100
Richiede almeno 100 parole
Calibrata per testi per adulti
(no, non quei testi!)
30. #SMConnect
Federico Sasso @vseostudio
Flesch Reading Ease
Le regole di sillabazione spesso non coprono tutti i casi,
o più versioni sono accettabili.
Es. (in Italiano):
tran-sa-tlan-ti-co, su-pe-rat-ti-co, di-su-gua-le
trans-a-tlan-ti-co, su-per-at-ti-co, dis-u-gua-le
A volte sono accettabili sia la regola ortografica che
quella fonetica.
Es. (in Italiano):
mi-o, mio
31. #SMConnect
Federico Sasso @vseostudio
Flesch Reading Ease
Anche computare il numero corretto di frasi non
è sempre banale
Es.:
Dr. Fox and Mr. Brown
è una frase sola, non tre
Occorre conoscere le abbreviazioni tipiche della
lingua, saper riconoscere gli acronimi, etc...
32. #SMConnect
Federico Sasso @vseostudio
Flesch Reading Ease
Pubblicata nel 1948 da
Rudolf Franz Flesch
Basata su modelli statistici
forniti dalla “lista Thorndike”
(1921/31) e le ricerche di
Sherman (1893)
È usata ancora oggi!
34. #SMConnect
Federico Sasso @vseostudio
Flesch Reading Ease
La lingua è cambiata rispetto a 100 anni fa.
È ancora valida?
A quanto pare sì:
La frequenza di una singola parola non ha effetto,
e il numero dei neologismi rispetta la distribuzione
originaria.
35. #SMConnect
Federico Sasso @vseostudio
Flesch-Kincaid formula
Commissionata nel 1975 dalla U.S. Navy
Produce un “US grade level”
Grade level =
Deve parte della sua fortuna all’inclusione in
vecchie versioni di MS Word
36. #SMConnect
Federico Sasso @vseostudio
US grade level
Per chi che come me ha
difficoltà a ragionare in termini
di “US grade level”:
All’anno di scolarizzazione
sommate 5, e avrete l’età
dello studente!
37. #SMConnect
Federico Sasso @vseostudio
Altre formule
Per la lingua Inglese ce ne sono davvero tante
● Flesch / Flesch-Kincaid
● ARI
● Dale-Chall
● Gunning Fog
● SMOG
● Fry
● Forcast
● Atos
● …
● Vacca, Gulpease, Szigriszt, Huerta
● Kandel-Mole, Wiener, Amstad, ...
Per le altre lingue di solito sono adattamenti di FRE
39. #SMConnect
Federico Sasso @vseostudio
E per l’Italiano?
1972 – Formula di Vacca-Franchina
S = 100 x (totale sillabe / totale parole)
P = totale parole / totale frasi
È la formula di Flesch cui sono stati adattati i pesi
alle statistiche della lingua Italiana.
40. #SMConnect
Federico Sasso @vseostudio
E per l’Italiano?
1972 – Formula di Vacca-Franchina
Valori di 0 – 100
La leggibilità è alta se F è superiore a 60, media
se fra 50 e 60, bassa sotto 50.
I pesi sono più arrotondati rispetto a FRE.
Vacca secondo me era un po’ troppo empirico.
42. #SMConnect
Federico Sasso @vseostudio
Un indice tutto Italiano
1988 Indice Gulpease
Indice concepito per la lingua Italiana.
Fornisce un punteggio 0-100
Indice =
< 80 difficile per chi ha la licenza elementare
< 60 difficile per chi ha la licenza media
< 40 difficile per chi ha un diploma superiore
44. #SMConnect
Federico Sasso @vseostudio
Indici di Leggibilità
Posso "falsare" in indice di leggibilità con
testo costruito apposta?
“Sì. Sì. Sì. Sì. Sì. Sì. Sì. Sì. Sì.”
Ricorda:
l’indice si basa su delle assunzioni, sta a
te rispettarle!
46. #SMConnect
Federico Sasso @vseostudio
Indici di Leggibilità
Posso costruire un testo ad alto indice,
illeggibile?
“U. Pòu. l’es. Snaz. Brut. E. Il. Leg. Gi.
Bi. Le. cha. FRES. Alto.”
Ricorda:
l’indice si basa su delle assunzioni, sta a te
rispettarle!
48. #SMConnect
Federico Sasso @vseostudio
Indici di Leggibilità
Non esiste un valore assoluto ottimale
cui puntare.
Un testo per bambini e un testo
accademico avranno per forza una
“Leggibilità” diversa
51. #SMConnect
Federico Sasso @vseostudio
Testi più leggibili
Fonte: Nielsen 2015
https://www.nngroup.com/articles/legibility-readability-comprehension/
● parole semplici e comuni
● frasi brevi che non impegnino
troppo la memoria a breve termine
● poche forme passive
● Mirare a un 8th grade reading level
● Per testi dedicati a audience più
scolarizzata o specializzata B2B,
12th grade (college readers)
● stile adatto alla platea
(ragazzini, teenagers, millenials...)
53. #SMConnect
Federico Sasso @vseostudio
Memoria a breve termine, aiutala
● Frasi corte
● Uso paragrafi e spaziature
● Evidenzia i concetti in
grassetto
● Immagini d’aiuto
● Grafici e tabelle d’ausilio
● Spezzare il ritmo narrativo
● Elenchi puntati (mai nelle
slide!)
● Un po’ d’umorismo
54. #SMConnect
Federico Sasso @vseostudio
Lo stile è adatto alla platea?
“Ti si è incantato il disco”
“Alza la cornetta”
“Non ho una lira”
“Salta ancora la cavallina”
“Dove hai la manopola del
volume?”
57. #SMConnect
Federico Sasso @vseostudio
Strumenti per la Leggibilità
Pre-pubblicazione (EN): Il famigerato semaforo di Yoast SEO
Non amo l’approccio bianco/nero, ma è impossibile non citarlo
58. #SMConnect
Federico Sasso @vseostudio
Strumenti per la Leggibilità
Pre-pubblicazione (IT): plug-in “WP Readability Analysis”
Incluso sulla fiducia perché unico che include Gulpease.
Sviluppato da Salvatore Della Pepa
https://it.wordpress.org/plugins/wp-readability-analysis/
59. #SMConnect
Federico Sasso @vseostudio
Strumenti per la Leggibilità
Per Content Auditing: Visual SEO Studio (EN, IT, FR, ES)
IT: Vacca72, Vacca 86, Gulpease. - EN: FRE, Flesch-Kincaid, Fog, Smog, ARI, Coleman-Liau, Avg
http://visual-seo.com/it/
60. #SMConnect
Federico Sasso @vseostudio
Strumenti per la Leggibilità
Per Content Auditing: URL Profiler (EN)
Non mi è chiaro come siano rappresentati i risultati.
EN: FRE, Flesch-Kincaid, Fog, Smog, Coleman-Liau
http://urlprofiler.com/
61. #SMConnect
Federico Sasso @vseostudio
Strumenti per la Leggibilità
Per Content Auditing: Raven Tools (EN)
Non mi è chiaro come siano rappresentati i risultati. Non mi è chiaro se usa un’API esterna.
EN: un solo indice, forse Flesch-Kincaid
https://raventools.com/blog/raven-adds-scribe-4-to-content-tools/
62. #SMConnect
Federico Sasso @vseostudio
Esempio di Audit Leggibilità
Dalla Search Console esporto i dati di ricerca
Esporto su
CSV di dati con
URL, Clic,
Impressioni,
CTR e
Posizione
63. #SMConnect
Federico Sasso @vseostudio
Esempio di Audit Leggibilità
● Importo in Excel (o LibreOffice, o OpenOffice)
● Elimino pagine non interessanti (tags,
categorie, root, etc..) da foglio elettronico
● Copio tutti gli URL
● Importo lista URL in Visual SEO Studio
"Visita lista URL"
● Attendo che lo spider completi la visita
64. #SMConnect
Federico Sasso @vseostudio
Esempio di Audit Leggibilità
Lancio la
Analisi di
Leggibilità
ed esporto su
foglio elettronico
(notare che alcuni
contenuti hanno
Gulpease < 50, bassa
leggibilità)
65. #SMConnect
Federico Sasso @vseostudio
Esempio di Audit Leggibilità
● Nel foglio elettronico con gli indici di leggibilità
importo in un secondo sheet l’esportazione
dei valori di Search Console
● Lavorando di VLOOKUP riporto i valori di
Clic, Impressioni, CTR e Posizione
● Elimino URL non interessanti (< 100 parole,
tag, noindex...)
67. #SMConnect
Federico Sasso @vseostudio
Esempio di Audit Leggibilità
● Ordino per valore crescente di leggibilità (su Gulpease
per esempio: più basso è, meno è leggibile)
● Per le pagine con bassa leggibilità, individuo quelle al
limite della seconda pagina (es. 11a, 12a, 13a posizione)
● Su queste vado a vedere su Search Console le chiavi di
ricerca. Spesso sono interessanti.
● Prioritizzando così, dò indicazione di migliorare la
leggibilità degli articoli individuati.
68. #SMConnect
Federico Sasso @vseostudio
Esempio di Audit Leggibilità
Questo è un esempio semplificato!
Più dati si hanno su cui ragionare, meglio si può
decidere le priorità.
Per esempio si potrebbero includere:
● Dati di Analytics (comportamento del visitatore)
● Metriche di link (Majestic, Moz, aHrefs, …)
● Dati di Condivisioni Social
71. #SMConnect
Federico Sasso @vseostudio
I “Reading Levels” di Google
Basic: testi elementari
Intermediate: (tutto quanto è in mezzo)
Advanced: livello “Google Scholar”
72. #SMConnect
Federico Sasso @vseostudio
I “Reading Levels” di Google
Non è più disponibile nell'interfaccia, non vuole dire non
sia più computata (PageRank è un esempio)
73. #SMConnect
Federico Sasso @vseostudio
I “Reading Levels” di Google
Google sviluppò un suo sistema. Non diede troppi
dettagli:
● Basato su modelli statistici
(nulla di nuovo)
● Classificazione guidata da indicazione
insegnanti
(addestramento reti neurali?)
74. #SMConnect
Federico Sasso @vseostudio
I “Reading Levels” di Google
Google ha a disposizione il
corpus più ampio del pianeta,
solide competenze di
Intelligenza Artificiale, talenti e
soldi.
77. #SMConnect
Federico Sasso @vseostudio
Leggibilità e MdR
Non lo sappiamo!
Difficile paragonare un valore 1-3 con uno 1-100 (o 1-
12/16)
Oggi non è più possibile fare
una verifica indipendente
(perché non sono più visibili)
Chi provo a misurare la
correlazione non ne cavò
un ragno dal buco
82. #SMConnect
Federico Sasso @vseostudio
Leggibilità e MdR
Google ha ancora forti interessi nel campo dell'analisi dei testi
● google translate
● riconoscimento vocale
● riconoscimento query intent
● analisi semantica del testo
● spinned text detection
● OCR per indicizzazione pdf
● OCR riconoscimento segnali stradali
● etc...
85. #SMConnect
Federico Sasso @vseostudio
Leggibilità e MdR
Non sono un fan degli studi di correlazione.
(causa/effetto? Due fenomeni influenzati da una
terza variabile? Casualità invece di causalità?)
...ma la ricerca di SearchMetrics suggerisce possa
esserci “qualcosa”
88. #SMConnect
Federico Sasso @vseostudio
Leggibilità e MdR
Manca la pistola fumante, tuttavia vi sono forti
indizi che suggeriscono sia meglio scrivere
leggibile anche per i MdR.
(img CC: https://www.flickr.com/photos/theknowlesgallery/4657423808)
91. #SMConnect
Federico Sasso @vseostudio
Di cosa abbiamo parlato
● Definito la Leggibilità
● Illustrato Formule e Indici di
Leggibilità, e loro limiti
● Cercato di rispondere alla
domanda “Serve per la SEO”?
92. #SMConnect
Federico Sasso @vseostudio
Riferimenti
● Wikipedia: Readability (e pagine collegate) https://en.wikipedia.org/wiki/Readability
● Indice Gulpease http://www.okpedia.it/indice_di_gulpease
● SearchMetrics Ranking Factors 2015
http://www.searchmetrics.com/wp-content/uploads/Ranking-Factors-2015-Whitepaper-US.pdf
● Szigriszt, Sistemas Predictivos de Legibilidad del mensaje escrito: Formula de Perspicuidad
http://biblioteca.ucm.es/tesis/19911996/S/3/S3019601.pdf
● Comparing Google’s Readability of Search Results to the Flesch Readability Formulae
● http://onlinelibrary.wiley.com/doi/10.1002/meet.14505001094/pdf
● Google Reading Levels
http://searchresearch1.blogspot.com/2011/02/search-by-reading-level.html
● WP Readability Analysis https://www.salvatoredp.it/wp-readability-analysis
● Analisi di Leggibilità in Visual SEO Studio
http://visual-seo.com/it/SEO-Software-Features/Readability-Analysis
● Quantitative Semantics in 18th century Sweden
https://www.corwin.com/sites/default/files/upm-binaries/23161_Chapter_1.pdf
● Belles lettres Meets Big Data
http://www.americanscientist.org/libraries/documents/201461312335910468-2014-07CompSci.pd
f
● Google.com is your friend :)