SlideShare une entreprise Scribd logo
1  sur  45
Télécharger pour lire hors ligne
Как работают Яндекс.Новости

    Лев Гершензон, Татьяна Исаева
Задачи Яндекс.Новостей
Миссия Яндекса – отвечать на заданные и
 незаданные вопросы пользователей
Яндекс.Новости:
• На главной странице Яндекса удовлетворяют
  потребность пользователей в актуальной
  информации
  Незаданный вопрос: «Что сейчас происходит?»
• В Поиске отвечают на явно сформулированные
  вопросы пользователей
  Заданные вопросы: «глава «Нафтогаза»,
    «Агафангел Измаильский», «Олесь Довгий»

                                                2
Принципы Яндекс.Новостей

• Полностью автоматический сервис
• Партнерский сервис
• Единые требования для всех партнеров
• Зеркало русскоязычной медиа-среды


 Цели:
 отразить новостную картину дня и дать ссылки
 на источники, содержащие наиболее полную
 информацию о событиях

                                                3
                                                    3
Модель сервиса

           • Обеспечивают быструю
           трансляцию контента
Издания    (40 тыс. сообщений в сутки)
           • Получают читателей
           (4 млн переходов в сутки)

           • Узнают новости на Яндексе
           (1-5 млн человек в сутки)
Читатели   • Читают подробности у
           источников (2 млн человек в
           сутки)
           • Задают вопросы о новостях
           (500 тыс. запросов в сутки)

                                         4
News.yandex.ua

           • Обеспечивают быструю
           трансляцию контента
Издания    (8 тыс. сообщений в сутки)
           • Получают читателей
           ( 500 тыс. переходов в сутки)

           • Узнают новости на Яндексе
           (1,2 млн человек в сутки)
Читатели   • Читают подробности у
           источников (150 тыс. человек
           в сутки)
           • Задают вопросы о новостях (
           10 тыс. запросов в сутки)

                                           5
Интересы участников
             • Все хотят трафика
             • Первоисточники хотят
             приоритетного размещения и
  Издания    подавления рерайтеров
             • Оптимизаторы хотят
             прозрачных правил



             • Хотят быстро узнавать, не
  Читатели   случилось ли чего
             • Если вдруг случилось,
             получить ссылку на статью от
             знакомого источника
             • Получить ссылку на
             первоисточник
                                            6
Интересы Яндекс.Новостей


• Расширение аудитории, повышение ее
  лояльности
 – качественный сервис
• Привлечение новых поставщиков
  интересной информации и сохранение
  существующих
 – выгодная для партнеров модель
  сотрудничества


                                       7
Релевантный новостной ответ

Алгоритм, формирующий ответ на новостные запросы
 пользователей, ориентируется на следующие
 свойства сообщений:
  – Первоисточник
  – Оперативность
  – Цитируемость
  – Информативность
Соответственно, источники, у которых доминируют
 такие сообщения, предлагаются пользователям в
 первую очередь.



                                                   8
Новостной контент

• Соответствие формату (не подходят для
  трансляции реклама, пресс-релизы компаний, блоги,
  тв-программа, гороскопы...)
• Технические требования (доступность сайта,
  отдельные адреса для каждого сообщения,
  индексируются сообщения только на русском
  языке...)
• Требования законодательства (защита прав на
  интеллектуальную собственность; противодействие
  терроризму; защита чести, достоинства,
  репутации…)


                                                      9
Наиболее часто встречающиеся
              проблемы
«
• Наше сообщение не попало в сюжет
• От помещения сообщения в экспортный файл до
  появления его в Яндекс.Новостях проходит слишком
  много времени
• В Яндекс.Новости попала перепечатка нашей заметки
• Мы изменили текст сообщения на своем сайте.
  Внесите эти изменения в вашу базу данных
»


                                                      10
Что такое «дубликат»
Дубликаты – документы, сильно совпадающие с
 оригинальным сообщением. В Яндекс.Новостях
 дубликаты автоматически определяются до
 формирования сюжета, не представлены в
 сюжетах и не участвуют в поиске по сервису.
Из каждой группы дубликатов остается по одному
 сообщению («мастеру»), которое может быть
 представлено на страницах сюжета и в
 результатах поиска. «Мастер» определяется:
  – по времени публикации сообщения на сайте;
  – по сравнительному анализу текстов;
  – по цитированию источника (учитываются гиперссылки,
    текстовые упоминания).

                                                         11
Специальный инструмент для
             партнѐров




Предназначен для поиска похожих новостных
сообщений (дубликатов, заимствований, цитат и т.п.)
Используются те же алгоритмы, что и в массовом
сервисе news.yandex.ru, что позволяет увидеть все
ошибки алгоритма в разметке дубликатов
Находит связи сообщения по заголовку или фрагменту
текста
                                                      12
Дефолтная страница
partner.news.yandex.ru/dups-form.xml




                                       13
Информация от партнеров

За достоверность информации отвечают наши
партнѐры.
Если информация на сайте изменена,
необходимо протранслировать в
Яндекс.Новости актуальный вариант.
Это касается любой части сообщения: ссылки
<link>, заголовка <title>, текста <yandex:full-text>,
времени публикации <pubDate>, etc.




                                                        14
Основные продукты
      Яндекс.Новостей

1. Страница сюжета
2. Новостной блок на главной странице
   Яндекса
3. Главная страница Новостей, страницы
   рубрик
4. Поиск по новостям (новостные
   результаты в поиске Яндекса)
5. Новости в основной выдаче Яндекса


                                         15
1. Сюжет. Основные задачи

Представление разных точек зрения на одно событие



 Отображение основных актуальных фактов сюжета



           Отражение развития событий



Предоставление аналитических материалов о событии

                                                    16
Схема создания сюжета
  Создание поискового запроса из ключевых слов
 документа, построение матрицы близости документов


Аннотирование сюжета: выбор заголовка и фрагментов
  сообщений, содержащих основные факты сюжета


        Выбор основных заголовков сюжета



             Выбор статей и интервью


                                                     17
Сюжет в Яндекс.Новостях




                          18
Выбор заголовка сюжета
• Соответствие региону пользователя
• Лексическая и фактологическая «ядерность»
• Актуальность фактов
• Информативность и читаемость

 Цель:
 первый по времени заголовок, наиболее
 полно отражающий актуальную фактическую
 сторону сюжета, не содержащий
 нехарактерных для сюжета слов и фактов.



                                              19
Создание аннотации сюжета
         (дайджеста)

Из всех сообщений сюжета автоматически
выделяются наиболее значимые объекты, имена
людей, названия организаций, географические
объекты, даты и числа. Они, наряду с ключевыми
словами сюжета и новостными запросами,
определяют выбор текстов для аннотации.


Цель:
показать предложения из сообщений,
содержащие основные факты события


                                                 20
Аннотация сюжета.
Информативность




                    21
Заголовок сюжета.
«Ядерность» лексики




                      22
Выбор основных заголовков
               сюжета
 Цитирование
  источника      Дата публикации   Вес источника
   в сюжете

Цель:
Должны быть представлены первоисточник(и),
наиболее цитируемые источники и заголовки,
отражающие актуальное состояние сюжета




                                                   23
Выбор заголовков для первой
страницы. Цитируемость в сюжете




                                  24
Определение рубрики и географии
            сюжета
• Тематическая рубрика
   –Специализация изданий
   –Рубрикация от источника
   –Лексические запросы

• География
  –Выделение обозначений географических
   объектов из сообщений сюжета
  –Автоматическое определение релевантных
   для сюжета географических объектов
  –Карта населенного пункта, адреса

   Цель: получить все новости рубрики и региона

                                                  25
Рубрикация
Сюжет на странице новостей региона




                                     26
                                      26
Региональные новости
На главной странице Яндекса




                              27
2. Выбор главных новостных
            сюжетов




Цель:
отобрать самые освещаемые в СМИ,
общезначимые, актуальные и вызывающие
интерес пользователей события.
                                        28
Определение веса сюжета

                                        Интерес
Вес отдельного       Динамика           пользователей
сообщения            сюжета             и медийность

• Время создания   • Плотность потока
                   сообщений            •Количество
• Вес источника    • Динамика           новостных
                   кликабельности       запросов
• Соответствие     новости на главной   к Яндексу
тематики сюжета    странице             • Записи в блогах
специализации      • Время жизни в      • Место новости
агентства          топе                 на сайтах
                                        партнѐров


                                                            29
Медийность – «коллективный топ»




                                  30
Вес источника

Цитируемость учитывает, насколько
часто ссылаются на источник другие
новостные ресурсы
Оперативность учитывает, насколько
часто источник быстро реагирует на
события


Вес источников пересчитывается каждую
неделю.


                                        31
Топ-10 самых цитируемых агентств
       (в алфавитном порядке)
«Ведомости»
«Интерфакс»
«ИТАР-ТАСС»
«Коммерсант»
«Комсомольская правда»
Lenta.ru
«Первый канал»
РБК
РИА «Новости»
«Российская газета»

По данным еженедельно обновляемого отчѐта, формируемого
роботом Яндекс.Новостей
                                                          32
Топ-10 самых цитируемых агентств (ua)
        (в алфавитном порядке)
    Интерфакс-Украина
    ICTV
    КоммерсантЪ (Украина)
    Корреспондент.Net
    ЛIГАБiзнесIнформ
    RBC.ua
    Сегодня
    УНИАН
    Украинская правда
    Football.ua

        Все ссылки на украинские источники + ссылки
        украинских источников в сюжетах про Украину
                                                      33
Украинский выпуск
Показывается по умолчанию пользователям из
   Украины
Отдельный расчет веса источника для украинского
   выпуска
Ранжирование и аннотация сюжетов: основывается
   на украинских весах источников
Выбор заголовков сюжетов: приоритет ― украинским
   источникам




Цель: представление новостной картины дня по
   версии русскоязычных СМИ Украины

                                                   34
3. Главная страница Яндекс.Новостей


 Цель:
 дать более развернутый и структурированный
 ответ на вопрос «что происходит». Главное в
 разных срезах (разные рубрики, жанры,
 ньюсмейкеры, …)




                                               35
Яндекс.Новости: главные события




                                  36
Яндекс.Новости: ньюсмейкеры,
         цитата дня




                               37
Яндекс.Новости: интервью и статьи




                                    38
4. Поиск по Яндекс.Новостям

• Выдача с группировкой по сюжетам
• Возможности расширенного поиска
• Фильтры по жанрам
• Поиск по
   - пресс-портретам
   - цитатам
   - архивным сюжетам
   - БД СМИ




                                     39
5. Новости в поиске по Яндексу

логика срабатывания, ранжирование и
заголовки из украинского выпуска




                                      40
Как правильно жить с нами


• Не оптимизировать контент под
  Яндекс.Новости
• Следить за представлением своих
  материалов в агрегаторе
• Стараться конвертировать трафик в
  лояльную аудиторию




                                      41
Что делать с агрегаторским трафиком?
• Монетизировать сразу
  –Завесить баннерами страницу с новостью

• Растить читательскую аудиторию
  –Для старых пользователей – не разочаровать;
  –Для новых – заинтересовать: картина дня,
   новостной контекст, дополнительные материалы

  Для посетителей с агрегаторов входная точка на
  новостной сайт не главная страница, а страница с
  текстом сообщения

                                                     42
Новостные виджеты на Яндексе

• Пользовательский виджет на главной странице
  портала – альтернативная точка входа на
  новостной сайт


• Если пользователь выбрал материал сайта в
  агрегаторе, надо предложить ему установить
  виджет




                                                43
Робот и человек в Яндекс.Новостях
     Человек                    Робот
1.   Принимает         1. Скачивает и индексирует новостные
     решение о            сообщения
     сотрудничестве
                        2. Определяет и исключает из поиска по
2.   Удаляет ссылку на     Яндекс.Новостям дубли
     сообщение из
     базы данных        3. Определяет жанр сообщения
     Яндекс.Новостей в
     случае, если текст 4. Выделяет ключевые слова и факты
     сообщения
                        5. Объединяет сообщения в сюжет
     изменѐн или
     отсутствует на     6. Определяет рубрику
     сайте источника
                        7. Ранжирует сюжеты


                                                              44
Спасибо за внимание! Вопросы?


     Лев Гершензон,

     Татьяна Исаева

     info@news.yandex.ru




                                45

Contenu connexe

En vedette

SEO 2014: Новые клиенты из поисковых систем
SEO 2014: Новые клиенты из поисковых системSEO 2014: Новые клиенты из поисковых систем
SEO 2014: Новые клиенты из поисковых системAstra Media Group, Russia
 
Яндекс.директ_обзор осенних новинок
Яндекс.директ_обзор осенних новинокЯндекс.директ_обзор осенних новинок
Яндекс.директ_обзор осенних новинокLena Frum
 
Новинки «1С-Битрикс: Управление сайтом» 16.5
Новинки «1С-Битрикс: Управление сайтом» 16.5Новинки «1С-Битрикс: Управление сайтом» 16.5
Новинки «1С-Битрикс: Управление сайтом» 16.5Наталья Сергеева
 
Обгони конкурентов: лучшие технологии борьбы за покупателя в Интернете
Обгони конкурентов: лучшие технологии борьбы за покупателя в ИнтернетеОбгони конкурентов: лучшие технологии борьбы за покупателя в Интернете
Обгони конкурентов: лучшие технологии борьбы за покупателя в Интернете1С-Битрикс
 
Яндекс.Директ: Секреты эффективности
Яндекс.Директ: Секреты эффективностиЯндекс.Директ: Секреты эффективности
Яндекс.Директ: Секреты эффективностиtoWave.ru
 
«1С-Битрикс: Управление сайтом» 15.5
«1С-Битрикс: Управление сайтом» 15.5«1С-Битрикс: Управление сайтом» 15.5
«1С-Битрикс: Управление сайтом» 15.51С-Битрикс
 
Современные технологии сайтостроения для решения бизнес-задач
Современные технологии сайтостроения для решения бизнес-задачСовременные технологии сайтостроения для решения бизнес-задач
Современные технологии сайтостроения для решения бизнес-задач1С-Битрикс
 

En vedette (11)

SEO 2014: Новые клиенты из поисковых систем
SEO 2014: Новые клиенты из поисковых системSEO 2014: Новые клиенты из поисковых систем
SEO 2014: Новые клиенты из поисковых систем
 
Seo Tools
Seo ToolsSeo Tools
Seo Tools
 
медиасфера рунета
медиасфера рунетамедиасфера рунета
медиасфера рунета
 
Как работают Яндекс.Новости
Как работают Яндекс.НовостиКак работают Яндекс.Новости
Как работают Яндекс.Новости
 
Kr seo-room
Kr seo-roomKr seo-room
Kr seo-room
 
Яндекс.директ_обзор осенних новинок
Яндекс.директ_обзор осенних новинокЯндекс.директ_обзор осенних новинок
Яндекс.директ_обзор осенних новинок
 
Новинки «1С-Битрикс: Управление сайтом» 16.5
Новинки «1С-Битрикс: Управление сайтом» 16.5Новинки «1С-Битрикс: Управление сайтом» 16.5
Новинки «1С-Битрикс: Управление сайтом» 16.5
 
Обгони конкурентов: лучшие технологии борьбы за покупателя в Интернете
Обгони конкурентов: лучшие технологии борьбы за покупателя в ИнтернетеОбгони конкурентов: лучшие технологии борьбы за покупателя в Интернете
Обгони конкурентов: лучшие технологии борьбы за покупателя в Интернете
 
Яндекс.Директ: Секреты эффективности
Яндекс.Директ: Секреты эффективностиЯндекс.Директ: Секреты эффективности
Яндекс.Директ: Секреты эффективности
 
«1С-Битрикс: Управление сайтом» 15.5
«1С-Битрикс: Управление сайтом» 15.5«1С-Битрикс: Управление сайтом» 15.5
«1С-Битрикс: Управление сайтом» 15.5
 
Современные технологии сайтостроения для решения бизнес-задач
Современные технологии сайтостроения для решения бизнес-задачСовременные технологии сайтостроения для решения бизнес-задач
Современные технологии сайтостроения для решения бизнес-задач
 

Similaire à как работают яндекс.новости

Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...
Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...
Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...Max Kornev
 
Масс Старт Минск. Презентация проекта 3click, for OfficeArt.by
Масс Старт Минск. Презентация проекта 3click, for OfficeArt.byМасс Старт Минск. Презентация проекта 3click, for OfficeArt.by
Масс Старт Минск. Презентация проекта 3click, for OfficeArt.byAnthony Marchenko
 
Glavcheva about metrics_20_02_2014
Glavcheva about metrics_20_02_2014Glavcheva about metrics_20_02_2014
Glavcheva about metrics_20_02_2014Yulia Glavcheva
 
Принципы работы поисковых систем
Принципы работы поисковых системПринципы работы поисковых систем
Принципы работы поисковых системСергей Кокшаров
 
Коллекции ресурсов. Наукометрические исследования. Глобальные идентификаторы...
Коллекции ресурсов. Наукометрические исследования. Глобальные идентификаторы...Коллекции ресурсов. Наукометрические исследования. Глобальные идентификаторы...
Коллекции ресурсов. Наукометрические исследования. Глобальные идентификаторы...Julia Glavcheva
 
Brandanalytics1 120920095519-phpapp02
Brandanalytics1 120920095519-phpapp02Brandanalytics1 120920095519-phpapp02
Brandanalytics1 120920095519-phpapp02Fedor Kamshilin
 
Написание новостей
Написание новостейНаписание новостей
Написание новостейkopiraiting
 
Апдейты, Дмитрий Севальнев (ПиксельПлюс)
Апдейты, Дмитрий Севальнев (ПиксельПлюс)Апдейты, Дмитрий Севальнев (ПиксельПлюс)
Апдейты, Дмитрий Севальнев (ПиксельПлюс)Евгений Летов
 
Андрей Купавский «Ретвит-каскады: предсказываем популярность контента в социа...
Андрей Купавский «Ретвит-каскады: предсказываем популярность контента в социа...Андрей Купавский «Ретвит-каскады: предсказываем популярность контента в социа...
Андрей Купавский «Ретвит-каскады: предсказываем популярность контента в социа...Yandex
 
модуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетемодуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетеOlena Bashun
 
модуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетемодуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетеLibrary Franko
 
модуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетемодуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетеLibrary Franko
 

Similaire à как работают яндекс.новости (20)

как работают яндекс.новости2
как работают яндекс.новости2как работают яндекс.новости2
как работают яндекс.новости2
 
Yandex News 11 2009
Yandex News 11 2009Yandex News 11 2009
Yandex News 11 2009
 
Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...
Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...
Инструментарий интернет-журналиста и полезные ресурсы. Коммуникационные платф...
 
Масс Старт Минск. Презентация проекта 3click, for OfficeArt.by
Масс Старт Минск. Презентация проекта 3click, for OfficeArt.byМасс Старт Минск. Презентация проекта 3click, for OfficeArt.by
Масс Старт Минск. Презентация проекта 3click, for OfficeArt.by
 
3clika
3clika3clika
3clika
 
Glavcheva about metrics_20_02_2014
Glavcheva about metrics_20_02_2014Glavcheva about metrics_20_02_2014
Glavcheva about metrics_20_02_2014
 
Brands.i look v5-n6
Brands.i look v5-n6Brands.i look v5-n6
Brands.i look v5-n6
 
Принципы работы поисковых систем
Принципы работы поисковых системПринципы работы поисковых систем
Принципы работы поисковых систем
 
О чем писать в социальных сетях и блоге? — MarkEd
О чем писать в социальных сетях и блоге?  — MarkEdО чем писать в социальных сетях и блоге?  — MarkEd
О чем писать в социальных сетях и блоге? — MarkEd
 
Facebook insights
Facebook insightsFacebook insights
Facebook insights
 
Коллекции ресурсов. Наукометрические исследования. Глобальные идентификаторы...
Коллекции ресурсов. Наукометрические исследования. Глобальные идентификаторы...Коллекции ресурсов. Наукометрические исследования. Глобальные идентификаторы...
Коллекции ресурсов. Наукометрические исследования. Глобальные идентификаторы...
 
Brands.i look iteco
Brands.i look itecoBrands.i look iteco
Brands.i look iteco
 
Brandanalytics1 120920095519-phpapp02
Brandanalytics1 120920095519-phpapp02Brandanalytics1 120920095519-phpapp02
Brandanalytics1 120920095519-phpapp02
 
Brands.i look v5-n4
Brands.i look v5-n4Brands.i look v5-n4
Brands.i look v5-n4
 
Написание новостей
Написание новостейНаписание новостей
Написание новостей
 
Апдейты, Дмитрий Севальнев (ПиксельПлюс)
Апдейты, Дмитрий Севальнев (ПиксельПлюс)Апдейты, Дмитрий Севальнев (ПиксельПлюс)
Апдейты, Дмитрий Севальнев (ПиксельПлюс)
 
Андрей Купавский «Ретвит-каскады: предсказываем популярность контента в социа...
Андрей Купавский «Ретвит-каскады: предсказываем популярность контента в социа...Андрей Купавский «Ретвит-каскады: предсказываем популярность контента в социа...
Андрей Купавский «Ретвит-каскады: предсказываем популярность контента в социа...
 
модуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетемодуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернете
 
модуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетемодуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернете
 
модуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетемодуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернете
 

Plus de ГО "Інститут розвитку регіональної преси"

Моніторинг інформаційної відкритості офіційних веб-сайтів центральних органів...
Моніторинг інформаційної відкритості офіційних веб-сайтів центральних органів...Моніторинг інформаційної відкритості офіційних веб-сайтів центральних органів...
Моніторинг інформаційної відкритості офіційних веб-сайтів центральних органів...ГО "Інститут розвитку регіональної преси"
 
Презентація проекту “Громадський моніторинг доступу до інформації про власність”
Презентація проекту “Громадський моніторинг доступу до інформації про власність”Презентація проекту “Громадський моніторинг доступу до інформації про власність”
Презентація проекту “Громадський моніторинг доступу до інформації про власність”ГО "Інститут розвитку регіональної преси"
 
Результати моніторингу інформаційної відкритості офіційних веб сайтів органів...
Результати моніторингу інформаційної відкритості офіційних веб сайтів органів...Результати моніторингу інформаційної відкритості офіційних веб сайтів органів...
Результати моніторингу інформаційної відкритості офіційних веб сайтів органів...ГО "Інститут розвитку регіональної преси"
 
«Відкритість української влади. Результати моніторингу веб-сайтів центральних...
«Відкритість української влади. Результати моніторингу веб-сайтів центральних...«Відкритість української влади. Результати моніторингу веб-сайтів центральних...
«Відкритість української влади. Результати моніторингу веб-сайтів центральних...ГО "Інститут розвитку регіональної преси"
 

Plus de ГО "Інститут розвитку регіональної преси" (20)

Следите за деньгами (Пол Раду)
Следите за деньгами (Пол Раду)Следите за деньгами (Пол Раду)
Следите за деньгами (Пол Раду)
 
Моніторинг інформаційної відкритості офіційних веб-сайтів центральних органів...
Моніторинг інформаційної відкритості офіційних веб-сайтів центральних органів...Моніторинг інформаційної відкритості офіційних веб-сайтів центральних органів...
Моніторинг інформаційної відкритості офіційних веб-сайтів центральних органів...
 
«Медиаменеджмент». Пособие для руководителей СМИ от Ирины Халлинг
«Медиаменеджмент». Пособие для руководителей СМИ от Ирины Халлинг«Медиаменеджмент». Пособие для руководителей СМИ от Ирины Халлинг
«Медиаменеджмент». Пособие для руководителей СМИ от Ирины Халлинг
 
Презентація проекту “Громадський моніторинг доступу до інформації про власність”
Презентація проекту “Громадський моніторинг доступу до інформації про власність”Презентація проекту “Громадський моніторинг доступу до інформації про власність”
Презентація проекту “Громадський моніторинг доступу до інформації про власність”
 
Результати моніторингу інформаційної відкритості офіційних веб сайтів органів...
Результати моніторингу інформаційної відкритості офіційних веб сайтів органів...Результати моніторингу інформаційної відкритості офіційних веб сайтів органів...
Результати моніторингу інформаційної відкритості офіційних веб сайтів органів...
 
Фото- та відеозйомка у роботі журналіста. Частина 1
Фото- та відеозйомка у роботі журналіста. Частина 1 Фото- та відеозйомка у роботі журналіста. Частина 1
Фото- та відеозйомка у роботі журналіста. Частина 1
 
Яка система фінансового контролю працює станом на сьогодні
Яка система фінансового контролю працює станом на сьогодніЯка система фінансового контролю працює станом на сьогодні
Яка система фінансового контролю працює станом на сьогодні
 
Закон Украиїни "Про національне антикорупційне бюро"
Закон Украиїни "Про національне антикорупційне бюро"Закон Украиїни "Про національне антикорупційне бюро"
Закон Украиїни "Про національне антикорупційне бюро"
 
Новели антикорупційного законодавства. Частина 2
Новели антикорупційного законодавства. Частина 2Новели антикорупційного законодавства. Частина 2
Новели антикорупційного законодавства. Частина 2
 
Новели антикорупційного законодавства. Частина 1
Новели антикорупційного законодавства. Частина 1Новели антикорупційного законодавства. Частина 1
Новели антикорупційного законодавства. Частина 1
 
Презентація діяльності ГО "Інститут розвитку регіональної преси"
Презентація діяльності ГО "Інститут розвитку регіональної преси"Презентація діяльності ГО "Інститут розвитку регіональної преси"
Презентація діяльності ГО "Інститут розвитку регіональної преси"
 
«Відкритість української влади. Результати моніторингу веб-сайтів центральних...
«Відкритість української влади. Результати моніторингу веб-сайтів центральних...«Відкритість української влади. Результати моніторингу веб-сайтів центральних...
«Відкритість української влади. Результати моніторингу веб-сайтів центральних...
 
Фінансовий звіт ГО "Інститутрозвитку регіональної преси" за 2014 рік
Фінансовий звіт ГО "Інститутрозвитку регіональної преси" за 2014 рікФінансовий звіт ГО "Інститутрозвитку регіональної преси" за 2014 рік
Фінансовий звіт ГО "Інститутрозвитку регіональної преси" за 2014 рік
 
Tentative program ir conference
Tentative program ir conference Tentative program ir conference
Tentative program ir conference
 
СУДОВА ПРАКТИКА ЮРИСТІВ ІНСТИТУТУ РОЗВИТКУ РЕГІОНАЛЬНОЇ ПРЕСИ У СПРАВАХ ПРО...
СУДОВА ПРАКТИКА ЮРИСТІВ ІНСТИТУТУ РОЗВИТКУ  РЕГІОНАЛЬНОЇ ПРЕСИ  У СПРАВАХ ПРО...СУДОВА ПРАКТИКА ЮРИСТІВ ІНСТИТУТУ РОЗВИТКУ  РЕГІОНАЛЬНОЇ ПРЕСИ  У СПРАВАХ ПРО...
СУДОВА ПРАКТИКА ЮРИСТІВ ІНСТИТУТУ РОЗВИТКУ РЕГІОНАЛЬНОЇ ПРЕСИ У СПРАВАХ ПРО...
 
Стан розслідувальної журналістики в Україні у 2012 році
Стан розслідувальної журналістики в Україні у 2012 роціСтан розслідувальної журналістики в Україні у 2012 році
Стан розслідувальної журналістики в Україні у 2012 році
 
Posibnyk vybory 2012
Posibnyk vybory 2012Posibnyk vybory 2012
Posibnyk vybory 2012
 
Обмеження для журналістів та змі під час виборчої кампанії 2012
Обмеження для журналістів та змі під час виборчої кампанії 2012Обмеження для журналістів та змі під час виборчої кампанії 2012
Обмеження для журналістів та змі під час виборчої кампанії 2012
 
Зразок скарги до прокуратури на бездіяльність посадової особи
Зразок скарги до прокуратури на бездіяльність посадової особи Зразок скарги до прокуратури на бездіяльність посадової особи
Зразок скарги до прокуратури на бездіяльність посадової особи
 
Олег Хоменок: Открытые источники информации украина
Олег Хоменок: Открытые источники информации украинаОлег Хоменок: Открытые источники информации украина
Олег Хоменок: Открытые источники информации украина
 

как работают яндекс.новости

  • 1. Как работают Яндекс.Новости Лев Гершензон, Татьяна Исаева
  • 2. Задачи Яндекс.Новостей Миссия Яндекса – отвечать на заданные и незаданные вопросы пользователей Яндекс.Новости: • На главной странице Яндекса удовлетворяют потребность пользователей в актуальной информации Незаданный вопрос: «Что сейчас происходит?» • В Поиске отвечают на явно сформулированные вопросы пользователей Заданные вопросы: «глава «Нафтогаза», «Агафангел Измаильский», «Олесь Довгий» 2
  • 3. Принципы Яндекс.Новостей • Полностью автоматический сервис • Партнерский сервис • Единые требования для всех партнеров • Зеркало русскоязычной медиа-среды Цели: отразить новостную картину дня и дать ссылки на источники, содержащие наиболее полную информацию о событиях 3 3
  • 4. Модель сервиса • Обеспечивают быструю трансляцию контента Издания (40 тыс. сообщений в сутки) • Получают читателей (4 млн переходов в сутки) • Узнают новости на Яндексе (1-5 млн человек в сутки) Читатели • Читают подробности у источников (2 млн человек в сутки) • Задают вопросы о новостях (500 тыс. запросов в сутки) 4
  • 5. News.yandex.ua • Обеспечивают быструю трансляцию контента Издания (8 тыс. сообщений в сутки) • Получают читателей ( 500 тыс. переходов в сутки) • Узнают новости на Яндексе (1,2 млн человек в сутки) Читатели • Читают подробности у источников (150 тыс. человек в сутки) • Задают вопросы о новостях ( 10 тыс. запросов в сутки) 5
  • 6. Интересы участников • Все хотят трафика • Первоисточники хотят приоритетного размещения и Издания подавления рерайтеров • Оптимизаторы хотят прозрачных правил • Хотят быстро узнавать, не Читатели случилось ли чего • Если вдруг случилось, получить ссылку на статью от знакомого источника • Получить ссылку на первоисточник 6
  • 7. Интересы Яндекс.Новостей • Расширение аудитории, повышение ее лояльности – качественный сервис • Привлечение новых поставщиков интересной информации и сохранение существующих – выгодная для партнеров модель сотрудничества 7
  • 8. Релевантный новостной ответ Алгоритм, формирующий ответ на новостные запросы пользователей, ориентируется на следующие свойства сообщений: – Первоисточник – Оперативность – Цитируемость – Информативность Соответственно, источники, у которых доминируют такие сообщения, предлагаются пользователям в первую очередь. 8
  • 9. Новостной контент • Соответствие формату (не подходят для трансляции реклама, пресс-релизы компаний, блоги, тв-программа, гороскопы...) • Технические требования (доступность сайта, отдельные адреса для каждого сообщения, индексируются сообщения только на русском языке...) • Требования законодательства (защита прав на интеллектуальную собственность; противодействие терроризму; защита чести, достоинства, репутации…) 9
  • 10. Наиболее часто встречающиеся проблемы « • Наше сообщение не попало в сюжет • От помещения сообщения в экспортный файл до появления его в Яндекс.Новостях проходит слишком много времени • В Яндекс.Новости попала перепечатка нашей заметки • Мы изменили текст сообщения на своем сайте. Внесите эти изменения в вашу базу данных » 10
  • 11. Что такое «дубликат» Дубликаты – документы, сильно совпадающие с оригинальным сообщением. В Яндекс.Новостях дубликаты автоматически определяются до формирования сюжета, не представлены в сюжетах и не участвуют в поиске по сервису. Из каждой группы дубликатов остается по одному сообщению («мастеру»), которое может быть представлено на страницах сюжета и в результатах поиска. «Мастер» определяется: – по времени публикации сообщения на сайте; – по сравнительному анализу текстов; – по цитированию источника (учитываются гиперссылки, текстовые упоминания). 11
  • 12. Специальный инструмент для партнѐров Предназначен для поиска похожих новостных сообщений (дубликатов, заимствований, цитат и т.п.) Используются те же алгоритмы, что и в массовом сервисе news.yandex.ru, что позволяет увидеть все ошибки алгоритма в разметке дубликатов Находит связи сообщения по заголовку или фрагменту текста 12
  • 14. Информация от партнеров За достоверность информации отвечают наши партнѐры. Если информация на сайте изменена, необходимо протранслировать в Яндекс.Новости актуальный вариант. Это касается любой части сообщения: ссылки <link>, заголовка <title>, текста <yandex:full-text>, времени публикации <pubDate>, etc. 14
  • 15. Основные продукты Яндекс.Новостей 1. Страница сюжета 2. Новостной блок на главной странице Яндекса 3. Главная страница Новостей, страницы рубрик 4. Поиск по новостям (новостные результаты в поиске Яндекса) 5. Новости в основной выдаче Яндекса 15
  • 16. 1. Сюжет. Основные задачи Представление разных точек зрения на одно событие Отображение основных актуальных фактов сюжета Отражение развития событий Предоставление аналитических материалов о событии 16
  • 17. Схема создания сюжета Создание поискового запроса из ключевых слов документа, построение матрицы близости документов Аннотирование сюжета: выбор заголовка и фрагментов сообщений, содержащих основные факты сюжета Выбор основных заголовков сюжета Выбор статей и интервью 17
  • 19. Выбор заголовка сюжета • Соответствие региону пользователя • Лексическая и фактологическая «ядерность» • Актуальность фактов • Информативность и читаемость Цель: первый по времени заголовок, наиболее полно отражающий актуальную фактическую сторону сюжета, не содержащий нехарактерных для сюжета слов и фактов. 19
  • 20. Создание аннотации сюжета (дайджеста) Из всех сообщений сюжета автоматически выделяются наиболее значимые объекты, имена людей, названия организаций, географические объекты, даты и числа. Они, наряду с ключевыми словами сюжета и новостными запросами, определяют выбор текстов для аннотации. Цель: показать предложения из сообщений, содержащие основные факты события 20
  • 23. Выбор основных заголовков сюжета Цитирование источника Дата публикации Вес источника в сюжете Цель: Должны быть представлены первоисточник(и), наиболее цитируемые источники и заголовки, отражающие актуальное состояние сюжета 23
  • 24. Выбор заголовков для первой страницы. Цитируемость в сюжете 24
  • 25. Определение рубрики и географии сюжета • Тематическая рубрика –Специализация изданий –Рубрикация от источника –Лексические запросы • География –Выделение обозначений географических объектов из сообщений сюжета –Автоматическое определение релевантных для сюжета географических объектов –Карта населенного пункта, адреса Цель: получить все новости рубрики и региона 25
  • 26. Рубрикация Сюжет на странице новостей региона 26 26
  • 28. 2. Выбор главных новостных сюжетов Цель: отобрать самые освещаемые в СМИ, общезначимые, актуальные и вызывающие интерес пользователей события. 28
  • 29. Определение веса сюжета Интерес Вес отдельного Динамика пользователей сообщения сюжета и медийность • Время создания • Плотность потока сообщений •Количество • Вес источника • Динамика новостных кликабельности запросов • Соответствие новости на главной к Яндексу тематики сюжета странице • Записи в блогах специализации • Время жизни в • Место новости агентства топе на сайтах партнѐров 29
  • 31. Вес источника Цитируемость учитывает, насколько часто ссылаются на источник другие новостные ресурсы Оперативность учитывает, насколько часто источник быстро реагирует на события Вес источников пересчитывается каждую неделю. 31
  • 32. Топ-10 самых цитируемых агентств (в алфавитном порядке) «Ведомости» «Интерфакс» «ИТАР-ТАСС» «Коммерсант» «Комсомольская правда» Lenta.ru «Первый канал» РБК РИА «Новости» «Российская газета» По данным еженедельно обновляемого отчѐта, формируемого роботом Яндекс.Новостей 32
  • 33. Топ-10 самых цитируемых агентств (ua) (в алфавитном порядке) Интерфакс-Украина ICTV КоммерсантЪ (Украина) Корреспондент.Net ЛIГАБiзнесIнформ RBC.ua Сегодня УНИАН Украинская правда Football.ua Все ссылки на украинские источники + ссылки украинских источников в сюжетах про Украину 33
  • 34. Украинский выпуск Показывается по умолчанию пользователям из Украины Отдельный расчет веса источника для украинского выпуска Ранжирование и аннотация сюжетов: основывается на украинских весах источников Выбор заголовков сюжетов: приоритет ― украинским источникам Цель: представление новостной картины дня по версии русскоязычных СМИ Украины 34
  • 35. 3. Главная страница Яндекс.Новостей Цель: дать более развернутый и структурированный ответ на вопрос «что происходит». Главное в разных срезах (разные рубрики, жанры, ньюсмейкеры, …) 35
  • 39. 4. Поиск по Яндекс.Новостям • Выдача с группировкой по сюжетам • Возможности расширенного поиска • Фильтры по жанрам • Поиск по - пресс-портретам - цитатам - архивным сюжетам - БД СМИ 39
  • 40. 5. Новости в поиске по Яндексу логика срабатывания, ранжирование и заголовки из украинского выпуска 40
  • 41. Как правильно жить с нами • Не оптимизировать контент под Яндекс.Новости • Следить за представлением своих материалов в агрегаторе • Стараться конвертировать трафик в лояльную аудиторию 41
  • 42. Что делать с агрегаторским трафиком? • Монетизировать сразу –Завесить баннерами страницу с новостью • Растить читательскую аудиторию –Для старых пользователей – не разочаровать; –Для новых – заинтересовать: картина дня, новостной контекст, дополнительные материалы Для посетителей с агрегаторов входная точка на новостной сайт не главная страница, а страница с текстом сообщения 42
  • 43. Новостные виджеты на Яндексе • Пользовательский виджет на главной странице портала – альтернативная точка входа на новостной сайт • Если пользователь выбрал материал сайта в агрегаторе, надо предложить ему установить виджет 43
  • 44. Робот и человек в Яндекс.Новостях Человек Робот 1. Принимает 1. Скачивает и индексирует новостные решение о сообщения сотрудничестве 2. Определяет и исключает из поиска по 2. Удаляет ссылку на Яндекс.Новостям дубли сообщение из базы данных 3. Определяет жанр сообщения Яндекс.Новостей в случае, если текст 4. Выделяет ключевые слова и факты сообщения 5. Объединяет сообщения в сюжет изменѐн или отсутствует на 6. Определяет рубрику сайте источника 7. Ранжирует сюжеты 44
  • 45. Спасибо за внимание! Вопросы? Лев Гершензон, Татьяна Исаева info@news.yandex.ru 45