Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015

4 381 vues

Publié le

Video is BIG ! Les chiffres sont vertigineux : YouTube est le 2ème moteur de recherche au monde, les Canadiens passent près de 30% de leurs temps online à visionner des vidéos et Cisco prédit que, d’ici 2019, près de 75% de la data échangée sur mobile sera vidéo… et Gangnam Style dépasse les 2 milliards de vues sur YouTube ! Impossible pour Google de passer à côté de cet usage majeur et croissant. L’extraction et l’indexation des données contenues dans les vidéos (et plus globalement dans tout contenu audio – type podcasts) représentent un enjeu clé pour Google. Jérôme Rocheteau (Enseignant-Chercheur à l’ICAM et spécialiste du Natural Language Processing) et Yann Sauvageon (Directeur de l’Expertise, Synodiance) ont fait le point sur le sujet lors du SEO Campus Paris 2015 : contexte, état de l’art, Speech Processing & difficultés, enjeux SEO d’aujourd’hui et de demain, solutions actuelles.

Publié dans : Technologie
  • Soyez le premier à commenter

Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015

  1. 1. Video & Speech Processing SEO Campus 2015
  2. 2. Intro < Disclaimer > Nous n’allons pas parler des techniques habituelles liées au VSEO.
  3. 3. Intro Jérôme Rocheteau Yann Sauvageon
  4. 4. Intro Video is BIG ! Etat de l’art Speech Processing Enjeux SEO
  5. 5. 1/ Video is BIG !
  6. 6. VIDEO IS BIG ! oto : https://www.flickr.com/photos/photochiel/83361761
  7. 7. VIDEO IS BIG ! Source : http://www.ibtimes.co.uk/future-5g-barcelonas-mobile-world-congress-1490484 ème moteur
  8. 8. VIDEO IS BIG ! Source : http://www.alexa.com/topsites
  9. 9. VIDEO IS BIG ! Source : http://www.mediametrie.fr/internet/communiques/l-audience-de-la-video-sur-internet-en-france-en-janvier-2015.php
  10. 10. Un usage majeur !
  11. 11. Consommation hebdo de vidéo online 71% 74% 75% 77% 78% 80% 84% 85% 90% 92% 96% Germany Japan France Australia United States United Kingdom India Canada China Spain South Korea Source : Juin 2014 - eMarketer; TNS - http://www.emarketer.com/Article/Where-Digital-Video-Viewing-Most-Popular/1011140
  12. 12. 80%du trafic internet mondial en 2018. Source : Cisco – Juin 2014
  13. 13. Ça va s’accélerer avec le mobile !
  14. 14. Source : http://go.ooyala.com/rs/OOYALA/images/Ooyala-Global-Video-Index-Q4-2014.pdf
  15. 15. Source : http://www.cisco.com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/white_paper_c11-520862.html % vidéo dans la data échangée sur Mobile 50% 55% 72% 2012 2014 2019
  16. 16. 2020
  17. 17. Synodiance Source : http://www.cnet.com/news/how-5g-will-push-a-supercharged-network-to-your-phone-home-and-car/
  18. 18. 5G Un film de 2H téléchargé en moins de 5 sec. !
  19. 19. “make all information universally accessible” Video & Audio
  20. 20. 2/ Etat de l’art
  21. 21. Juillet 2008 “Google Elections Video Search gadget”
  22. 22. Mars 2009 “Google Voice”
  23. 23. Mars 2009 “Google Voice”
  24. 24. Novembre 2009 “Automatic Captions in YouTube”
  25. 25. Novembre 2012 “Automatic Captions” > Français
  26. 26. “Automatic Captions” Allemand Anglais Coréen Espagnol Français Italien Japonais Néerlandais Portugais Russe
  27. 27. « et puis on surveille et on voit si ça se passe bien »
  28. 28. « Tu écris et tu suis ton script ou c'est le script qui te suit ! »
  29. 29. C’est loin d’être parfait.
  30. 30. “We know there are issues. But going back to our very long-term goal of making every video understandable to every user, technology is the only way that we can scale” Brad Ellis, YouTube Product Manager Streaming Media West Conference, Nov. 2013
  31. 31. “Our goal in Speech Technology Research is twofold: to make speaking to your phones and computers ubiquitous and seamless, and to help make videos on the web accessible and searchable.”
  32. 32. http://research.microsoft.com/en-us/projects/mavis/
  33. 33. http://www.vocapia.com/
  34. 34. http://voxolab.com/
  35. 35. Des limitations !
  36. 36. « Tu écris et tu suis ton script ou c'est le script qui te suit ! »
  37. 37. Source : http://www.3playmedia.com/2009/04/23/on-accuracy-part-i/ Taux de précision mot clé Mots clés incorrects > 1 sur x Précision sur un texte de 8 mots Précision sur un texte de 10 mots 50% 1 sur 2 0% 0% 67% 1 sur 3 4% 2% 75% 1 sur 4 10% 6% 85% 1 sur 7 27% 20% 90% 1 sur 10 43% 35% 95% 1 sur 20 66% 60% 99% 1 sur 100 92% 90%
  38. 38. 3/ Speech Processing
  39. 39. Next Level > Le « Deep Learning »
  40. 40. Andrew NG Prof Stanford Responsable du projet “Google Brain” Depuis 2014 > Directeur scientifique pour Baidu
  41. 41. 4/ Enjeux SEO
  42. 42. Aujourd’hui Google utilise-t-il les sous-titres automatiques pour le ranking que ce soit sur Google ou YouTube ? NON
  43. 43. “YouTube’s automatic captions do not get indexed by Google because they are so error prone.”
  44. 44. “The only way for your captions to be indexed is to upload them yourself.”
  45. 45. 2 enjeux SEO Transcript Video Fiable Catégorisation SEO
  46. 46. Fournir un transcript fiable à 100% Speech Processing Humains Fiabilité 100%
  47. 47. 0,80 € < Tarif/min < 2,5 €
  48. 48. Uploadez ce transcript sur votre vidéo YouTube
  49. 49. HTML5 > Balise <Track> <Video> <Track> subtitles Captions descriptions chapters metadata
  50. 50. <video id="video" controls preload="metadata"> <source src="video/sintel-short.mp4" type="video/mp4"> <source src="video/sintel-short.webm" type="video/webm"> <track label="English" kind="captions" srclang="en" src="captions/vtt/sintel-en.vtt" default> <track label="Deutsch" kind="captions" srclang="de" src="captions/vtt/sintel-de.vtt"> <track label="Español" kind="captions" srclang="es" src="captions/vtt/sintel-es.vtt"> </video>
  51. 51. Catégorisation SEO
  52. 52. Plus de 700 vidéos rubrique « Food »
  53. 53. “Turmeric, Cinnamon, Cayenne, Paprika”
  54. 54. Catégorisation SEO Détecter les thématiques saillantes / les mots clés principaux Sous catégoriser Catégoriser à la volée (News)
  55. 55. Speech to Text • Fichier Brut Filtrage thématique • Onthologies • Knowledge graph Optimisation VSEO • Taggage automatique • Deep Linking
  56. 56. Conclusion
  57. 57. “make all information universally accessible” Video & Audio
  58. 58. Conclusion Google n’indexe pas les contenus audio. Il a un terrain de jeu sans précédent : YouTube. Le système s’enrichie de jour en jour. De nombreux challenges et un objectif à long terme. Aujourd’hui, le texte reste roi. Aidez Google ! Transcript Texte, Balisage HTML5 Track, Deep Linking, Catégorisation.
  59. 59. Source : http://googleresearch.blogspot.fr/2014/11/a-picture-is-worth-thousand-coherent.html
  60. 60. MERCI ! Questions / Réponses

×