Successfully reported this slideshow.
Video & Speech Processing
SEO Campus 2015
Intro
< Disclaimer >
Nous n’allons pas parler des techniques
habituelles liées au VSEO.
Intro
Jérôme Rocheteau Yann Sauvageon
Intro
Video is BIG !
Etat de l’art
Speech Processing
Enjeux SEO
1/ Video is BIG !
VIDEO IS BIG !
oto : https://www.flickr.com/photos/photochiel/83361761
VIDEO IS BIG !
Source : http://www.ibtimes.co.uk/future-5g-barcelonas-mobile-world-congress-1490484
ème moteur
VIDEO IS BIG !
Source : http://www.alexa.com/topsites
VIDEO IS BIG !
Source : http://www.mediametrie.fr/internet/communiques/l-audience-de-la-video-sur-internet-en-france-en-ja...
Un usage majeur !
Consommation hebdo de vidéo online
71%
74%
75%
77%
78%
80%
84%
85%
90%
92%
96%
Germany Japan France Australia United
State...
80%du trafic internet
mondial en 2018.
Source : Cisco – Juin 2014
Ça va s’accélerer avec le mobile !
Source : http://go.ooyala.com/rs/OOYALA/images/Ooyala-Global-Video-Index-Q4-2014.pdf
Source : http://www.cisco.com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/white_paper_c11-52...
2020
Synodiance
Source : http://www.cnet.com/news/how-5g-will-push-a-supercharged-network-to-your-phone-home-and-car/
5G
Un film de 2H téléchargé
en moins de 5 sec. !
“make all information
universally accessible”
Video & Audio
2/ Etat de l’art
Juillet 2008
“Google Elections Video Search gadget”
Mars 2009
“Google Voice”
Mars 2009
“Google Voice”
Novembre 2009
“Automatic Captions in YouTube”
Novembre 2012
“Automatic Captions” > Français
“Automatic Captions”
Allemand
Anglais
Coréen
Espagnol
Français
Italien
Japonais
Néerlandais
Portugais
Russe
« et puis on surveille et on voit si ça se passe bien »
« Tu écris et tu suis ton script ou c'est le script qui te suit ! »
C’est loin d’être parfait.
“We know there are issues.
But going back to our very long-term goal
of making every video understandable to every
user, t...
“Our goal in Speech Technology Research is
twofold: to make speaking to your phones and
computers ubiquitous and seamless,...
http://research.microsoft.com/en-us/projects/mavis/
http://www.vocapia.com/
http://voxolab.com/
Des limitations !
« Tu écris et tu suis ton script ou c'est le script qui te suit ! »
Source : http://www.3playmedia.com/2009/04/23/on-accuracy-part-i/
Taux de précision
mot clé
Mots clés incorrects
> 1 sur x...
3/ Speech Processing
Next Level > Le « Deep Learning »
Andrew NG
Prof Stanford
Responsable du projet “Google Brain”
Depuis 2014 > Directeur scientifique pour Baidu
4/ Enjeux SEO
Aujourd’hui
Google utilise-t-il les sous-titres
automatiques pour le ranking que ce
soit sur Google ou YouTube ?
NON
“YouTube’s automatic captions do not
get indexed by Google because they are
so error prone.”
“The only way for your captions to be
indexed is to upload them yourself.”
2 enjeux SEO
Transcript
Video Fiable
Catégorisation
SEO
Fournir un transcript fiable à 100%
Speech
Processing
Humains
Fiabilité
100%
0,80 € < Tarif/min < 2,5 €
Uploadez ce transcript
sur votre vidéo YouTube
HTML5 > Balise <Track>
<Video> <Track>
subtitles
Captions
descriptions
chapters
metadata
<video id="video" controls preload="metadata">
<source src="video/sintel-short.mp4" type="video/mp4">
<source src="video/s...
Catégorisation SEO
Plus de 700 vidéos
rubrique « Food »
“Turmeric, Cinnamon, Cayenne, Paprika”
Catégorisation SEO
Détecter les
thématiques saillantes
/ les mots clés
principaux
Sous catégoriser
Catégoriser à la volée
...
Speech to Text
• Fichier Brut
Filtrage
thématique
• Onthologies
• Knowledge
graph
Optimisation
VSEO
• Taggage
automatique
...
Conclusion
“make all information
universally accessible”
Video & Audio
Conclusion
Google n’indexe pas les contenus audio.
Il a un terrain de jeu sans précédent : YouTube.
Le système s’enrichie ...
Source : http://googleresearch.blogspot.fr/2014/11/a-picture-is-worth-thousand-coherent.html
MERCI !
Questions / Réponses
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015
Prochain SlideShare
Chargement dans…5
×

Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015

4 207 vues

Publié le

Video is BIG ! Les chiffres sont vertigineux : YouTube est le 2ème moteur de recherche au monde, les Canadiens passent près de 30% de leurs temps online à visionner des vidéos et Cisco prédit que, d’ici 2019, près de 75% de la data échangée sur mobile sera vidéo… et Gangnam Style dépasse les 2 milliards de vues sur YouTube ! Impossible pour Google de passer à côté de cet usage majeur et croissant. L’extraction et l’indexation des données contenues dans les vidéos (et plus globalement dans tout contenu audio – type podcasts) représentent un enjeu clé pour Google. Jérôme Rocheteau (Enseignant-Chercheur à l’ICAM et spécialiste du Natural Language Processing) et Yann Sauvageon (Directeur de l’Expertise, Synodiance) ont fait le point sur le sujet lors du SEO Campus Paris 2015 : contexte, état de l’art, Speech Processing & difficultés, enjeux SEO d’aujourd’hui et de demain, solutions actuelles.

Publié dans : Technologie
  • Soyez le premier à commenter

Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015

  1. 1. Video & Speech Processing SEO Campus 2015
  2. 2. Intro < Disclaimer > Nous n’allons pas parler des techniques habituelles liées au VSEO.
  3. 3. Intro Jérôme Rocheteau Yann Sauvageon
  4. 4. Intro Video is BIG ! Etat de l’art Speech Processing Enjeux SEO
  5. 5. 1/ Video is BIG !
  6. 6. VIDEO IS BIG ! oto : https://www.flickr.com/photos/photochiel/83361761
  7. 7. VIDEO IS BIG ! Source : http://www.ibtimes.co.uk/future-5g-barcelonas-mobile-world-congress-1490484 ème moteur
  8. 8. VIDEO IS BIG ! Source : http://www.alexa.com/topsites
  9. 9. VIDEO IS BIG ! Source : http://www.mediametrie.fr/internet/communiques/l-audience-de-la-video-sur-internet-en-france-en-janvier-2015.php
  10. 10. Un usage majeur !
  11. 11. Consommation hebdo de vidéo online 71% 74% 75% 77% 78% 80% 84% 85% 90% 92% 96% Germany Japan France Australia United States United Kingdom India Canada China Spain South Korea Source : Juin 2014 - eMarketer; TNS - http://www.emarketer.com/Article/Where-Digital-Video-Viewing-Most-Popular/1011140
  12. 12. 80%du trafic internet mondial en 2018. Source : Cisco – Juin 2014
  13. 13. Ça va s’accélerer avec le mobile !
  14. 14. Source : http://go.ooyala.com/rs/OOYALA/images/Ooyala-Global-Video-Index-Q4-2014.pdf
  15. 15. Source : http://www.cisco.com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/white_paper_c11-520862.html % vidéo dans la data échangée sur Mobile 50% 55% 72% 2012 2014 2019
  16. 16. 2020
  17. 17. Synodiance Source : http://www.cnet.com/news/how-5g-will-push-a-supercharged-network-to-your-phone-home-and-car/
  18. 18. 5G Un film de 2H téléchargé en moins de 5 sec. !
  19. 19. “make all information universally accessible” Video & Audio
  20. 20. 2/ Etat de l’art
  21. 21. Juillet 2008 “Google Elections Video Search gadget”
  22. 22. Mars 2009 “Google Voice”
  23. 23. Mars 2009 “Google Voice”
  24. 24. Novembre 2009 “Automatic Captions in YouTube”
  25. 25. Novembre 2012 “Automatic Captions” > Français
  26. 26. “Automatic Captions” Allemand Anglais Coréen Espagnol Français Italien Japonais Néerlandais Portugais Russe
  27. 27. « et puis on surveille et on voit si ça se passe bien »
  28. 28. « Tu écris et tu suis ton script ou c'est le script qui te suit ! »
  29. 29. C’est loin d’être parfait.
  30. 30. “We know there are issues. But going back to our very long-term goal of making every video understandable to every user, technology is the only way that we can scale” Brad Ellis, YouTube Product Manager Streaming Media West Conference, Nov. 2013
  31. 31. “Our goal in Speech Technology Research is twofold: to make speaking to your phones and computers ubiquitous and seamless, and to help make videos on the web accessible and searchable.”
  32. 32. http://research.microsoft.com/en-us/projects/mavis/
  33. 33. http://www.vocapia.com/
  34. 34. http://voxolab.com/
  35. 35. Des limitations !
  36. 36. « Tu écris et tu suis ton script ou c'est le script qui te suit ! »
  37. 37. Source : http://www.3playmedia.com/2009/04/23/on-accuracy-part-i/ Taux de précision mot clé Mots clés incorrects > 1 sur x Précision sur un texte de 8 mots Précision sur un texte de 10 mots 50% 1 sur 2 0% 0% 67% 1 sur 3 4% 2% 75% 1 sur 4 10% 6% 85% 1 sur 7 27% 20% 90% 1 sur 10 43% 35% 95% 1 sur 20 66% 60% 99% 1 sur 100 92% 90%
  38. 38. 3/ Speech Processing
  39. 39. Next Level > Le « Deep Learning »
  40. 40. Andrew NG Prof Stanford Responsable du projet “Google Brain” Depuis 2014 > Directeur scientifique pour Baidu
  41. 41. 4/ Enjeux SEO
  42. 42. Aujourd’hui Google utilise-t-il les sous-titres automatiques pour le ranking que ce soit sur Google ou YouTube ? NON
  43. 43. “YouTube’s automatic captions do not get indexed by Google because they are so error prone.”
  44. 44. “The only way for your captions to be indexed is to upload them yourself.”
  45. 45. 2 enjeux SEO Transcript Video Fiable Catégorisation SEO
  46. 46. Fournir un transcript fiable à 100% Speech Processing Humains Fiabilité 100%
  47. 47. 0,80 € < Tarif/min < 2,5 €
  48. 48. Uploadez ce transcript sur votre vidéo YouTube
  49. 49. HTML5 > Balise <Track> <Video> <Track> subtitles Captions descriptions chapters metadata
  50. 50. <video id="video" controls preload="metadata"> <source src="video/sintel-short.mp4" type="video/mp4"> <source src="video/sintel-short.webm" type="video/webm"> <track label="English" kind="captions" srclang="en" src="captions/vtt/sintel-en.vtt" default> <track label="Deutsch" kind="captions" srclang="de" src="captions/vtt/sintel-de.vtt"> <track label="Español" kind="captions" srclang="es" src="captions/vtt/sintel-es.vtt"> </video>
  51. 51. Catégorisation SEO
  52. 52. Plus de 700 vidéos rubrique « Food »
  53. 53. “Turmeric, Cinnamon, Cayenne, Paprika”
  54. 54. Catégorisation SEO Détecter les thématiques saillantes / les mots clés principaux Sous catégoriser Catégoriser à la volée (News)
  55. 55. Speech to Text • Fichier Brut Filtrage thématique • Onthologies • Knowledge graph Optimisation VSEO • Taggage automatique • Deep Linking
  56. 56. Conclusion
  57. 57. “make all information universally accessible” Video & Audio
  58. 58. Conclusion Google n’indexe pas les contenus audio. Il a un terrain de jeu sans précédent : YouTube. Le système s’enrichie de jour en jour. De nombreux challenges et un objectif à long terme. Aujourd’hui, le texte reste roi. Aidez Google ! Transcript Texte, Balisage HTML5 Track, Deep Linking, Catégorisation.
  59. 59. Source : http://googleresearch.blogspot.fr/2014/11/a-picture-is-worth-thousand-coherent.html
  60. 60. MERCI ! Questions / Réponses

×