2. Задачи поиска – счастье пользователя
Просто релевантных результатов не достаточно
1 Отсутствие не релевантных результатов
2 Отсутствие порно по многозначным запросам
3 Приоритет более удобным сайтам
3. Если бы не было антиспама…
1 По некоммерческим запросам в выдаче были бы дорвеи
2 По коммерческим запросам те кто больше заплатил за SEO
или сильнее заспамил вебмастеров с предложениями об
обмене ссылками
5. Жизненый цикл документа в поиске
1 Робот (скачивание документов)
2 База (хранилище)
3 Факторы (присваиваются каждому документу или хосту)
4 Запрос пользователя
5 Формула ранжирования, сортировка по релевантности
6 Твики на этапе отображения результатов поиска
7 Ответ на запрос пользователя
6. Борьба с поисковым спамом. Этапы.
1 Индексация
2 Скрытый индекс
3 Ранжирование
4 Фильтры
11. Какой бывает спам
1 Махровый (абсолютно черные техники)
2 Серая зона
3 Виртуальный
12. Махровый спам
Задача - показать роботу не то что пользователю, привлечь трафик
- Клоакинг
- Редирект
- Скрытый текст:
- скрытый слой
- несколько экранов прокрутки вниз
13. Серая зона
Задача – прямая монетизация
- MFA
- Ссылки
- Партнерки
15. Какой бывает спам
1 Отдельный документ или группа документов
2 Отдельный сайт
3 Группа сайтов - кластер
16. Отдельный документ или группа документов
1 Переоптимизированный контент
- Keyword stuffing
- Список поисковых запросов
- Спам в урлах и названии доменов
2 Мусорный контент
- Немодерируемый каталог
- Результаты поиска
- Форум со спамом
17. Отдельный сайт
1 Сателлит – создан с целью:
- Продажа рекламы
- Продажа ссылок
- Партнерская программа
2 Аффилированный сайт
18. Группа сайтов
1 Ссылочная поддержка основного сайта
2 Массовая продажа рекламы или ссылок
3 Взломаные сайты – привлечение трафика
засчет авторитетности взломанного
домена
19. Спам на коммерческих сайтах
1 Списки запросов
2 Ссылочный обмен
3 Переоптимизация
4 Накрутка цитируемости
5 Накрутка ПФ
20. Санкции
1 Ты последний
2 Минус в релевантность или позиции
3 Обнуление входящих ссылок
4 Обнуление исходящих ссылок (в том числе внутренних)
5 Ограничение на количество проиндексированных страниц
21. Методика выявления спама
1 Прикинуться пользователем
2 Кластеризация (netcomber.com)
3 Машинное обучение (АГС)
4 Лингвистический анализ
5 Анализ структуры сайта