SlideShare une entreprise Scribd logo
1  sur  17
Биграммы, пассажи
Леонид Гроховский, руководитель учебного центра ТопЭксперт


                      Часть 1
Леонид Гроховский




   Леонид Гроховский
 В SEO с 2005 года

 Опыт работы – более 500
  проектов, среди которых
  panasonic.ru, championat.com,
  komandirovka.ru, cian.ru,
  automobile.ru, rabota.ru, aforex.ru.

 Работая в агентстве ArrowMedia,
  создал с нуля отдел SEO и вывел
  компанию в топ-5 рейтинга
  качества продвижения от SeoNews
  по оценке клиентов
Леонид Гроховский




  ТопЭксперт – это
 Учебный центр по SEO с
  эффективной программой
  обучения.

 Образовательный сайт,
  содержащий справочную
  информацию.

 Группа экспертов,
  оказывающих услуги аудита,
  консультаций и продвижения
  сайтов.
Леонид Гроховский




    Миссия
Повышать квалификацию участников отрасли интернет-маркетинга,
соединяя специалистов, экспертов и работодателей в образовательную
среду и упорядочивая и структурируя информацию в доступные
масштабируемые образовательные продукты, адаптированные для
дистанционного обучения.

• Для специалистов: предоставить возможность получения доступного
  дистанционного профессионального образования в сфере IT.
• Для компаний: поставлять квалифицированные кадры, обучать
  сотрудников.
• Для экспертов: предоставить возможность экспертам быть понятыми и
  услышанными, способствовать повышению дохода и востребованности.
• Для технологий: создать среду для роста специалистов, способных
  создавать новые технологии.
Леонид Гроховский




Цели вебинара


Дать актуальную информацию о некоторых способах
обработки текста
Леонид Гроховский




Биграмма


Интерпретация каждой пары последовательных терминов
как фразы, представление пар как термина словаря
Леонид Гроховский




Частота биграммы
Леонид Гроховский




Область применения


- Борьба с текстовым спамом
- Ранжирование документов
- Статистика устойчивости словосочетаний в тексте
Леонид Гроховский




Пассажи


Пассаж – это последовательность слов заданной величины.
Пассаж может быть ограничен количеством слов, знаками
препинания, элементами <HTML> и даже количеством
символов.
Леонид Гроховский




Применение пассажей


- Поиск информации
- Определение уникальности контента
- Формирование сниппетов
Леонид Гроховский




Шинглы
Шинглы (англ) — чешуйки, выделенные из статьи
подпоследовательности слов. Необходимо из сравниваемых
текстов выделить подпоследовательности слов, идущих
друг за другом по 10 штук (длина шингла). Выборка
происходит внахлест, а не встык. Таким образом, разбивая
текст на подпоследовательности, мы получим набор
шинглов в количестве равному количеству слов минус
длина шингла плюс один (кол_во_слов — длина_шингла +
1).
Леонид Гроховский




Алгоритм шинглов
1.   Канонизация текста
2.   Разбиение на шинглы
3.   Вычисление хэшей шинглов
4.   Случайная выборка 84 значений контрольных сумм
5.   Сравнение, определение результата
Леонид Гроховский




Применение шинглов


- Определение уникальности контента
Леонид Гроховский




http://topexpert.pro/seo-kurs.html
Леонид Гроховский




http://topexpert.pro/seo-kurs.html
Леонид Гроховский




http://topexpert.pro/seo-kurs.html
Леонид Гроховский




«Изучайте, внедряйте,
 зарабатывайте!»
 Леонид Гроховский, руководитель учебного центра ТопЭксперт
 • grohovskiy@yandex.ru
 • skype:grohovskiy
 • http://гроховский.рф/

Contenu connexe

Tendances

Урок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар Полех
Урок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар ПолехУрок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар Полех
Урок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар Полех
Леонид Гроховский
 
Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".
Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".
Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".
seeduru
 

Tendances (20)

Урок 24: Проектирование сайта - Лукьянчук Алексей
Урок 24: Проектирование сайта - Лукьянчук АлексейУрок 24: Проектирование сайта - Лукьянчук Алексей
Урок 24: Проектирование сайта - Лукьянчук Алексей
 
Как продвинуть сайт самостоятельно - Леонид Гроховский
Как продвинуть сайт самостоятельно - Леонид ГроховскийКак продвинуть сайт самостоятельно - Леонид Гроховский
Как продвинуть сайт самостоятельно - Леонид Гроховский
 
Урок 23: Операторы поиска - Леонид Гроховский
Урок 23: Операторы поиска - Леонид ГроховскийУрок 23: Операторы поиска - Леонид Гроховский
Урок 23: Операторы поиска - Леонид Гроховский
 
Урок 4: Источники поисковых запросов - Евгений Концевой
Урок 4: Источники поисковых запросов - Евгений КонцевойУрок 4: Источники поисковых запросов - Евгений Концевой
Урок 4: Источники поисковых запросов - Евгений Концевой
 
Урок 22: Веб аналитика - Алексей Лукьянчук
Урок 22: Веб аналитика - Алексей ЛукьянчукУрок 22: Веб аналитика - Алексей Лукьянчук
Урок 22: Веб аналитика - Алексей Лукьянчук
 
О компании
О компанииО компании
О компании
 
Урок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар Полех
Урок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар ПолехУрок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар Полех
Урок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар Полех
 
Урок 5: Инструменты для работы с семантическим ядром - Евгений Концевой
Урок 5: Инструменты для работы с семантическим ядром - Евгений КонцевойУрок 5: Инструменты для работы с семантическим ядром - Евгений Концевой
Урок 5: Инструменты для работы с семантическим ядром - Евгений Концевой
 
Урок 30: Создание сайта - Лукьянчук Алексей
Урок 30: Создание сайта - Лукьянчук АлексейУрок 30: Создание сайта - Лукьянчук Алексей
Урок 30: Создание сайта - Лукьянчук Алексей
 
Урок 6: Изменение структуры сайта - Эдгар Полех
Урок 6: Изменение структуры сайта - Эдгар ПолехУрок 6: Изменение структуры сайта - Эдгар Полех
Урок 6: Изменение структуры сайта - Эдгар Полех
 
SEOhide - Антон Иванов
SEOhide - Антон ИвановSEOhide - Антон Иванов
SEOhide - Антон Иванов
 
Лекция по SEO
Лекция по SEOЛекция по SEO
Лекция по SEO
 
Леонид Гроховский - Продвижение порталов и крупных интернет-магазинов
Леонид Гроховский - Продвижение порталов и крупных интернет-магазиновЛеонид Гроховский - Продвижение порталов и крупных интернет-магазинов
Леонид Гроховский - Продвижение порталов и крупных интернет-магазинов
 
Результаты выпускников ТопЭксперт
Результаты выпускников ТопЭкспертРезультаты выпускников ТопЭксперт
Результаты выпускников ТопЭксперт
 
Как создавать и дистрибутировать текстовый контент в 2017
Как создавать и дистрибутировать текстовый контент в 2017Как создавать и дистрибутировать текстовый контент в 2017
Как создавать и дистрибутировать текстовый контент в 2017
 
новые технологии в SEO
новые технологии в SEOновые технологии в SEO
новые технологии в SEO
 
Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".
Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".
Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".
 
Вебинар «Продвижение информационного сайта»
Вебинар «Продвижение информационного сайта»Вебинар «Продвижение информационного сайта»
Вебинар «Продвижение информационного сайта»
 
Урок 36: Хостинг: устройство, технологии - Лукьянчук Алексей
Урок 36: Хостинг: устройство, технологии - Лукьянчук АлексейУрок 36: Хостинг: устройство, технологии - Лукьянчук Алексей
Урок 36: Хостинг: устройство, технологии - Лукьянчук Алексей
 
Вебинар "SEO-анализ конкурентов. Удачные решения для достижения ТОПа".
Вебинар "SEO-анализ конкурентов. Удачные решения для достижения ТОПа".Вебинар "SEO-анализ конкурентов. Удачные решения для достижения ТОПа".
Вебинар "SEO-анализ конкурентов. Удачные решения для достижения ТОПа".
 

En vedette

En vedette (12)

You Can't Type a Concept: Why Keywords Still Matter
You Can't Type a Concept: Why Keywords Still MatterYou Can't Type a Concept: Why Keywords Still Matter
You Can't Type a Concept: Why Keywords Still Matter
 
Кейс "Рекламные кампании на 47 стран"
Кейс "Рекламные кампании на 47 стран"Кейс "Рекламные кампании на 47 стран"
Кейс "Рекламные кампании на 47 стран"
 
Кейс ArrowMedia и Avalux
Кейс ArrowMedia и AvaluxКейс ArrowMedia и Avalux
Кейс ArrowMedia и Avalux
 
Кейс ArrowMedia интернет-магазина одежды для беременных и кормящих
Кейс ArrowMedia интернет-магазина одежды для беременных и кормящихКейс ArrowMedia интернет-магазина одежды для беременных и кормящих
Кейс ArrowMedia интернет-магазина одежды для беременных и кормящих
 
Кейс ArrowMedia // автономная газификация
Кейс ArrowMedia // автономная газификацияКейс ArrowMedia // автономная газификация
Кейс ArrowMedia // автономная газификация
 
Кейс ArrowMedia (септики)
Кейс ArrowMedia (септики)Кейс ArrowMedia (септики)
Кейс ArrowMedia (септики)
 
Совместный кейс ArrowMedia и Laptop
Совместный кейс ArrowMedia и LaptopСовместный кейс ArrowMedia и Laptop
Совместный кейс ArrowMedia и Laptop
 
Кейс ArrowMedia и Olissys
Кейс ArrowMedia и OlissysКейс ArrowMedia и Olissys
Кейс ArrowMedia и Olissys
 
Кейс ArrowMedia: продажа питьевой воды
Кейс ArrowMedia: продажа питьевой водыКейс ArrowMedia: продажа питьевой воды
Кейс ArrowMedia: продажа питьевой воды
 
Кейс ArrowMedia строительство домов
Кейс ArrowMedia строительство домовКейс ArrowMedia строительство домов
Кейс ArrowMedia строительство домов
 
Кейс ArrowMedia: "Результативность от инструмента к инструменту"
Кейс ArrowMedia: "Результативность от инструмента к инструменту"Кейс ArrowMedia: "Результативность от инструмента к инструменту"
Кейс ArrowMedia: "Результативность от инструмента к инструменту"
 
Emerging Trends in Online Search
Emerging Trends in Online SearchEmerging Trends in Online Search
Emerging Trends in Online Search
 

Similaire à Урок 9: Биграммы, пассажи - Леонид Гроховский

Как делать ресерч так, чтобы с максимальной вероятностью сделать ТОП
Как делать ресерч так, чтобы с максимальной вероятностью сделать ТОПКак делать ресерч так, чтобы с максимальной вероятностью сделать ТОП
Как делать ресерч так, чтобы с максимальной вероятностью сделать ТОП
NaZapad
 
Hrm вчера, сегодня, завтра 2013
Hrm вчера, сегодня, завтра 2013Hrm вчера, сегодня, завтра 2013
Hrm вчера, сегодня, завтра 2013
Edward Babushkin
 
Поисковое продвижение - Михаил Федоринин
Поисковое продвижение - Михаил ФедорининПоисковое продвижение - Михаил Федоринин
Поисковое продвижение - Михаил Федоринин
MyAcademy
 
Системный подход к контент-маркетингу: клиенты через экспертность
Системный подход к контент-маркетингу: клиенты через экспертностьСистемный подход к контент-маркетингу: клиенты через экспертность
Системный подход к контент-маркетингу: клиенты через экспертность
Комплето
 
Стратегия самообмана: когда SEO и PPC для интернет-магазина не работают
Стратегия самообмана: когда SEO и PPC для интернет-магазина не работаютСтратегия самообмана: когда SEO и PPC для интернет-магазина не работают
Стратегия самообмана: когда SEO и PPC для интернет-магазина не работают
Promodo
 
Низкобюджетное продвижение сайта
Низкобюджетное продвижение сайтаНизкобюджетное продвижение сайта
Низкобюджетное продвижение сайта
imba_ru
 

Similaire à Урок 9: Биграммы, пассажи - Леонид Гроховский (20)

Коммерческая аналитика для интернет-бизнеса
Коммерческая аналитика для интернет-бизнесаКоммерческая аналитика для интернет-бизнеса
Коммерческая аналитика для интернет-бизнеса
 
Урок 67 анализ конкурентов
Урок 67 анализ конкурентовУрок 67 анализ конкурентов
Урок 67 анализ конкурентов
 
Seo 2018
Seo 2018 Seo 2018
Seo 2018
 
Урок 84 анализ логов сервера для SEO
Урок 84 анализ логов сервера для SEOУрок 84 анализ логов сервера для SEO
Урок 84 анализ логов сервера для SEO
 
Как делать ресерч так, чтобы с максимальной вероятностью сделать ТОП
Как делать ресерч так, чтобы с максимальной вероятностью сделать ТОПКак делать ресерч так, чтобы с максимальной вероятностью сделать ТОП
Как делать ресерч так, чтобы с максимальной вероятностью сделать ТОП
 
School IT recruiting
School IT recruiting School IT recruiting
School IT recruiting
 
Гроховский SEO апгрейд
Гроховский SEO апгрейд Гроховский SEO апгрейд
Гроховский SEO апгрейд
 
Cтратегии в Seo. кейсы, кейсы, кейсы.
Cтратегии в Seo. кейсы, кейсы, кейсы.Cтратегии в Seo. кейсы, кейсы, кейсы.
Cтратегии в Seo. кейсы, кейсы, кейсы.
 
SEO-аналитика: находим, анализируем, используем, усовершенствуем - 07.11.17 -...
SEO-аналитика: находим, анализируем, используем, усовершенствуем - 07.11.17 -...SEO-аналитика: находим, анализируем, используем, усовершенствуем - 07.11.17 -...
SEO-аналитика: находим, анализируем, используем, усовершенствуем - 07.11.17 -...
 
Hrm вчера, сегодня, завтра 2013
Hrm вчера, сегодня, завтра 2013Hrm вчера, сегодня, завтра 2013
Hrm вчера, сегодня, завтра 2013
 
Поисковое продвижение - Михаил Федоринин
Поисковое продвижение - Михаил ФедорининПоисковое продвижение - Михаил Федоринин
Поисковое продвижение - Михаил Федоринин
 
Системный подход к контент-маркетингу: клиенты через экспертность
Системный подход к контент-маркетингу: клиенты через экспертностьСистемный подход к контент-маркетингу: клиенты через экспертность
Системный подход к контент-маркетингу: клиенты через экспертность
 
Презентация SEO - все что нужно знать про поисковую оптимизацию сайта
Презентация SEO - все что нужно знать про поисковую оптимизацию сайтаПрезентация SEO - все что нужно знать про поисковую оптимизацию сайта
Презентация SEO - все что нужно знать про поисковую оптимизацию сайта
 
SEO-специалист — ключевой сотрудник отдела маркетинга
SEO-специалист — ключевой сотрудник отдела маркетингаSEO-специалист — ключевой сотрудник отдела маркетинга
SEO-специалист — ключевой сотрудник отдела маркетинга
 
Е.Трепачева. Seo. Контент. Контекст. Как продвинуться, если в ТОПе Онлайнер
Е.Трепачева. Seo. Контент. Контекст. Как продвинуться, если в ТОПе ОнлайнерЕ.Трепачева. Seo. Контент. Контекст. Как продвинуться, если в ТОПе Онлайнер
Е.Трепачева. Seo. Контент. Контекст. Как продвинуться, если в ТОПе Онлайнер
 
А. Колб про стратегию самообмана: когда SEO и PPC для интернет-магазина не ра...
А. Колб про стратегию самообмана: когда SEO и PPC для интернет-магазина не ра...А. Колб про стратегию самообмана: когда SEO и PPC для интернет-магазина не ра...
А. Колб про стратегию самообмана: когда SEO и PPC для интернет-магазина не ра...
 
Стратегия самообмана: когда SEO и PPC для интернет-магазина не работают
Стратегия самообмана: когда SEO и PPC для интернет-магазина не работаютСтратегия самообмана: когда SEO и PPC для интернет-магазина не работают
Стратегия самообмана: когда SEO и PPC для интернет-магазина не работают
 
SEO без покупки ссылок
SEO без покупки ссылокSEO без покупки ссылок
SEO без покупки ссылок
 
Низкобюджетное продвижение сайта
Низкобюджетное продвижение сайтаНизкобюджетное продвижение сайта
Низкобюджетное продвижение сайта
 
Вебинар «Продвижение лендинг-пейдж в поисковых системах. Получаем бесплатный ...
Вебинар «Продвижение лендинг-пейдж в поисковых системах. Получаем бесплатный ...Вебинар «Продвижение лендинг-пейдж в поисковых системах. Получаем бесплатный ...
Вебинар «Продвижение лендинг-пейдж в поисковых системах. Получаем бесплатный ...
 

Plus de Леонид Гроховский

Plus de Леонид Гроховский (14)

Веб-аналитика с Google Tag Manager, Алексей Данилин, NetPeak
Веб-аналитика с Google Tag Manager, Алексей Данилин, NetPeakВеб-аналитика с Google Tag Manager, Алексей Данилин, NetPeak
Веб-аналитика с Google Tag Manager, Алексей Данилин, NetPeak
 
Модуль автоматической генерации страниц
Модуль автоматической генерации страницМодуль автоматической генерации страниц
Модуль автоматической генерации страниц
 
презентация курса
презентация курсапрезентация курса
презентация курса
 
10 способов
10 способов10 способов
10 способов
 
Levitas
LevitasLevitas
Levitas
 
л.гроховскй 8p
л.гроховскй   8pл.гроховскй   8p
л.гроховскй 8p
 
Урок 91: Социальные и поведенческие факторы - Морозов Роман
Урок 91: Социальные и поведенческие факторы - Морозов РоманУрок 91: Социальные и поведенческие факторы - Морозов Роман
Урок 91: Социальные и поведенческие факторы - Морозов Роман
 
Алгоритм HITS - Евгений Федулов
Алгоритм HITS - Евгений ФедуловАлгоритм HITS - Евгений Федулов
Алгоритм HITS - Евгений Федулов
 
Html для чайников - Евгений Концевой
Html для чайников - Евгений КонцевойHtml для чайников - Евгений Концевой
Html для чайников - Евгений Концевой
 
Seo плагины - Иванов Антон
Seo плагины - Иванов АнтонSeo плагины - Иванов Антон
Seo плагины - Иванов Антон
 
Урок 89: Микроформаты - Евгений Концевой
Урок 89: Микроформаты - Евгений КонцевойУрок 89: Микроформаты - Евгений Концевой
Урок 89: Микроформаты - Евгений Концевой
 
Чек-лист для успешного продвижения информационного проекта
Чек-лист для успешного продвижения информационного проектаЧек-лист для успешного продвижения информационного проекта
Чек-лист для успешного продвижения информационного проекта
 
Урок 29: Перелинковка - Евгений Концевой
Урок 29: Перелинковка - Евгений КонцевойУрок 29: Перелинковка - Евгений Концевой
Урок 29: Перелинковка - Евгений Концевой
 
Урок 20: Протокол HTTP - Евгений Концевой
Урок 20: Протокол HTTP - Евгений КонцевойУрок 20: Протокол HTTP - Евгений Концевой
Урок 20: Протокол HTTP - Евгений Концевой
 

Урок 9: Биграммы, пассажи - Леонид Гроховский

  • 1. Биграммы, пассажи Леонид Гроховский, руководитель учебного центра ТопЭксперт Часть 1
  • 2. Леонид Гроховский Леонид Гроховский  В SEO с 2005 года  Опыт работы – более 500 проектов, среди которых panasonic.ru, championat.com, komandirovka.ru, cian.ru, automobile.ru, rabota.ru, aforex.ru.  Работая в агентстве ArrowMedia, создал с нуля отдел SEO и вывел компанию в топ-5 рейтинга качества продвижения от SeoNews по оценке клиентов
  • 3. Леонид Гроховский ТопЭксперт – это  Учебный центр по SEO с эффективной программой обучения.  Образовательный сайт, содержащий справочную информацию.  Группа экспертов, оказывающих услуги аудита, консультаций и продвижения сайтов.
  • 4. Леонид Гроховский Миссия Повышать квалификацию участников отрасли интернет-маркетинга, соединяя специалистов, экспертов и работодателей в образовательную среду и упорядочивая и структурируя информацию в доступные масштабируемые образовательные продукты, адаптированные для дистанционного обучения. • Для специалистов: предоставить возможность получения доступного дистанционного профессионального образования в сфере IT. • Для компаний: поставлять квалифицированные кадры, обучать сотрудников. • Для экспертов: предоставить возможность экспертам быть понятыми и услышанными, способствовать повышению дохода и востребованности. • Для технологий: создать среду для роста специалистов, способных создавать новые технологии.
  • 5. Леонид Гроховский Цели вебинара Дать актуальную информацию о некоторых способах обработки текста
  • 6. Леонид Гроховский Биграмма Интерпретация каждой пары последовательных терминов как фразы, представление пар как термина словаря
  • 8. Леонид Гроховский Область применения - Борьба с текстовым спамом - Ранжирование документов - Статистика устойчивости словосочетаний в тексте
  • 9. Леонид Гроховский Пассажи Пассаж – это последовательность слов заданной величины. Пассаж может быть ограничен количеством слов, знаками препинания, элементами <HTML> и даже количеством символов.
  • 10. Леонид Гроховский Применение пассажей - Поиск информации - Определение уникальности контента - Формирование сниппетов
  • 11. Леонид Гроховский Шинглы Шинглы (англ) — чешуйки, выделенные из статьи подпоследовательности слов. Необходимо из сравниваемых текстов выделить подпоследовательности слов, идущих друг за другом по 10 штук (длина шингла). Выборка происходит внахлест, а не встык. Таким образом, разбивая текст на подпоследовательности, мы получим набор шинглов в количестве равному количеству слов минус длина шингла плюс один (кол_во_слов — длина_шингла + 1).
  • 12. Леонид Гроховский Алгоритм шинглов 1. Канонизация текста 2. Разбиение на шинглы 3. Вычисление хэшей шинглов 4. Случайная выборка 84 значений контрольных сумм 5. Сравнение, определение результата
  • 13. Леонид Гроховский Применение шинглов - Определение уникальности контента
  • 17. Леонид Гроховский «Изучайте, внедряйте, зарабатывайте!» Леонид Гроховский, руководитель учебного центра ТопЭксперт • grohovskiy@yandex.ru • skype:grohovskiy • http://гроховский.рф/