Le contenu web, quant à lui, se définit généralement selon deux points de vue: l’un technique, l’autre purement éditorial. D’un point de vue purement technique, pour un moteur de recherche, le contenu web est la donnée textuelle brute contenue dans le code source d’une page (url). Le moteur reconnait ainsi le texte même, les balises méta, title et alt ; il ne reconnaîtra pas en revanche des images ni le flash contenu dans des javascripts. D’un point de vue strictement éditorial en revanche, le contenu d’un site web sera constitué du corpus de texte (sous toutes natures), de vidéos, d’images, photos, dessins, contenus audios composant chacune des pages d’un site web.