Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

Визуализация данных на географических картах в Tableau (базовый уровень)

6 187 vues

Publié le

Лекция и тренинг по базовым навыкам визуализации данных на географических картах в системе Tableau. Рассматриваются способы визуализации данных на картах, виды геоданных, геокодирование. Базовый тренинг посвящен созданию тематических карт в Tableau. Рассмотрены возможности геокодирования объектов на территории РФ, а также подключение с дополнительными источниками тайловых карт (Google, OpenStreet Map, Stamen, Apple...)

Материал разработан для курса "Информационные технологии в менеджменте" для факультета логистики НИУ ВШЭ, 2014 год

Publié dans : Données & analyses

Визуализация данных на географических картах в Tableau (базовый уровень)

  1. 1. Визуализация данных на географических картах Тематические карты в Tableau v0.3 Заходякин Глеб postlogist@gmail.com Факультет логистики НИУ ВШЭ
  2. 2. План занятия • Способы визуализации данных на картах • Виды геоданных • Геокодирование • Построение тематических карт в Tableau – Картограммы – Карты со значками – Картодиаграммы • Расширение возможностей Tableau – Геокодирование объектов на территории РФ – Подключение дополнительных источников карт 2
  3. 3. Файлы данных • Файлы данных для выполнения тренинга можно загрузить по ссылке: https://yadi.sk/d/aDo7AnGUdVXvk 3
  4. 4. Тематическая карта • Визуализация данных на географической карте повышает их наглядность • Тематическая карта - карта, отражающая какой-нибудь один сюжет (тему, объект, явление, отрасль) или сочетание сюжетов 4
  5. 5. Визуализация с помощью значков • Изображение точек интересов (POI, points of interest) значками – наиболее простой способ визуализации. Применим для данных, которые привязаны к некоторой точке, либо для которых не важна точность отображения области 5
  6. 6. Картодиаграммы • Картодиаграммы – это сочетание диаграмм с географической картой. Применимы, если можно пренебречь размером области, для которой отображаются показатели • Популярные способы изображения: – с помощью символов, размер которых пропорционален показываемой величине (proportional symbol map) – с помощью круговых диаграмм (pie chart map) 6
  7. 7. Картограммы • Картограмма (choropleth) – карта, на которой цветом, насыщенностью или штриховкой показывается интенсивность какого-либо показателя для различных областей • Областями обычно являются объекты административно-территориального деления (страны, районы, города) 7
  8. 8. Виды геопространственных данных • Карты строятся из элементов: – точки (point) – линии (polyline) – полигоны (polygon) 8
  9. 9. Визуализация: точки 9
  10. 10. Визуализация: линии 10
  11. 11. Визуализация: полигоны 11
  12. 12. Картографическая проекция • Картографическая проекция – математически определенный способ отображения поверхности Земли на плоскость • В любой проекции существуют искажения нескольких видов: длин, углов, площадей, форм • На мелкомасштабных картах, используемых для визуализации, искажения особенно заметны, поэтому в зависимости от задачи стараются выбрать проекцию с нужными свойствами 12 Проекция Меркатора
  13. 13. Тайлы • Карты, используемые как подложка для визуализаций, хранятся в растровом формате • Для ускорения загрузки изображение карты разбивается на отдельные элементы – тайлы (tiles), которые загружаются по необходимости • Для каждого масштаба карты (zoom level) используется свой набор тайлов • Картографические сервисы могут предлагать разные наборы тайлов, отражающие тематику карты 13
  14. 14. Геокодирование • Геокодирование (geocoding) – определение географических координат для объектов (POI, адреса, почтовые индексы) • Для геокодирования используются базы данных географических объектов (локальные или веб-службы) 14
  15. 15. Геокодирование в Tableau • Полям набора данных можно назначить географическую роль (Geographic Role) – например: широта, долгота, страна, город, почтовый индекс • Значения полей, имеющих географическую роль, автоматически геокодируются с использованием встроенной базы данных • При добавлении на визуализацию полей с географическими ролями автоматически выбирается тип визуализации - карта 15
  16. 16. Повторяющиеся названия • Названия городов могут повторяться, поэтому необходимо уточнять, к какому именно региону относится название 16
  17. 17. Уточнение названий • Для уточнения принадлежности географических названий необходимо добавить на визуализацию дополнительные поля, имеющие географическую роль (например, страну, регион…) 17
  18. 18. Иерархия географических ролей • В Tableau встроены несколько иерархий географических ролей: – Country (Name) – Country (Name), State/Province – Country (Name), State/Province, City – Country (Name), State/Province, County – Country (Name), ZIP Code/Postcode – Country (Name), Area Code • Можно дополнять и расширять существующие иерархии, либо добавлять собственные • Для объектов, имеющих площадь (страна, штат/регион), в базе данных Tableau помимо точечных координат хранятся также и полигоны 18
  19. 19. КАРТОГРАММЫ И КАРТОДИАГАММЫ Построение тематических карт в Tableau 19
  20. 20. Файл данных (newlab) • Создайте новую рабочую книгу Tableau • Создайте новое подключение к файлу данных Access newlab.mdb • Добавьте подключение к таблице ВсеЗаказы (эта таблица формируется на основе заранее созданного в Access запроса) • Для ускорения обработки, а также обеспечения возможности использования расширенных возможностей Tableau для агрегирования данных, выберите режим подключения с извлечением данных (Extract) • Перейдите к рабочему листу (Go to Worksheet). Программа предложит сохранить извлеченный набор данных – выберите тот же каталог, в котором находятся файл данных и рабочая книга 20
  21. 21. Назначение географических ролей • Tableau может автоматически определять географическую роль поля на основе его названия. Однако это работает только если название поля приводится на английском языке (City, Country, …) • В остальных случаях роль нужно назначить вручную с помощью контекстного меню поля • Выберите географическую роль Country/Region для измерения СтранаКлиента • Выберите роль City для измерения ГородКлиента 21
  22. 22. Картограмма оборота по странам • Двойным щелчком по измерению СтранаКлиента добавьте его на визуализацию • Поле СтранаКлиента автоматически добавилось в область деталей, а полученные в результате геокодирования координаты – в область строк и столбцов • Переключите тип графических элементов (Marks) с Automatic на Filled Map • Добавьте факт Выручка в область цвета (Color) • Переименуйте рабочий лист: “Картограмма оборота по странам” 22
  23. 23. Картодиаграмма оборота по городам • Создайте новый лист: “Картодиаграмма оборота по городам” • Двойным щелчком добавьте на визуализацию сначала поле СтранаКлиента, а затем – поле ГородКлиента • Несмотря на уточнение, 17 городов не удалось геокодировать • Щелкните по надписи “17 unknows” в нижнем правом углу и выберите: “Edit Locations” • В столбце Matching Location для не геокодированных городов выводится: Ambiguous (несколько вариантов) или Unrecognized (значение не найдено в базе) • Для дублирующихся названий требуется уточнить местоположение, указав дополнительные поля из географической иерархии (в данном случае – штат). Но такие поля в этом наборе данных отсутствуют. Также можно ввести координаты непосредственно • Для нераспознанных названий можно выбрать подходящее название из списка в поле Matching Location. Для ускорения поиска, можно набирать начало названия в поле Matching Location 23
  24. 24. Картодиаграмма оборота по городам • Добавьте факт Выручка в область размера (Size) • Для факта КодЗаказа выберите в контекстном меню агрегирующую функцию по умолчанию – Count Distinct (число уникальных значений). Мы хотим посчитать, сколько заказов сделал каждый клиент, а в наборе данных содержатся строки заказов. Поэтому коды заказов дублируются и нужно учитывать только уникальные значения • Добавьте факт КодЗаказа в область цвета (Color) • Карту можно двигать с нажатой клавишей Shift, и масштабировать по Ctrl+колесо мыши, либо кнопками управления. Вернуться к исходному положению можно нажав на кнопку с булавкой в окне карты 24
  25. 25. Картодиаграмма оборота по городам • Создайте копию рабочего листа с оборотом по городам (команда Duplicate Sheet в контекстном меню ярлыка рабочего листа) и назовите ее: Оборот по категориям и городам • Измените тип графических элементов (Marks) на Pie • В области цвета (Color) замените поле на Категория • Поместите поле Выручка (из окна данных) в область доли сектора (Angle) • Увеличьте размер графических элементов • Выберите на карте масштаб, удобный для просмотра продаж в Европе 25
  26. 26. Совмещение картограммы и картодиаграммы • Сделайте копию листа, который мы только что закончили, и назовите ее Совмещенная картограмма • Продублируйте (Ctrl-перетаскивание) поле Latitude (generated) в области строк (Rows) Примечание: нужно использовать именно активное поле Latitude (generated) в области Rows, а не перетаскивать его из окна данных еще раз • В окне визуализации должно появиться две карты, расположенных друг под другом • Обратите внимание, что на панели графических элементов (Marks) теперь стало три раздела – All (все панели) и еще два раздела – для верхней и нижней панели • Щелкните по заголовку раздела для первой панели чтобы развернуть его 26
  27. 27. Совмещение картограммы и картодиаграммы • Уберите поле ГородКлиента из области деталей (Detail) • Измените тип графического элемента на Filled Map • Поместите поле КодЗаказа в область цвета (Color) • После этого выберите в контекстном меню второго поля с широтой в области строк (Rows) пункт: Dual Axis • Результат показан на следующем слайде 27
  28. 28. Совмещение картограммы и картодиаграммы 28
  29. 29. ГЕОКОДИРОВАНИЕ ОБЪЕКТОВ НА ТЕРРИТОРИИ РФ Расширение возможностей Tableau 29
  30. 30. Встроенная база данных для геокодирования • Встроенная база для геокодирования в Tableau содержит данные о российских названиях, однако все они указаны в транслитерации • Это означает, что при визуализации геоданных на территории РФ, требуется, чтобы в наборе данных были указаны именно эти варианты названий • Таблицы геокодирования, фрагменты которых приведены выше, можно соединять с другими наборами данных, если задать соответствие названий на русском языке и транслите, либо соотвествие кодов • Есть и другие способы решения проблемы геокодирования, которые будут рассмотрены позднее 30 Фрагмент списка Российских регионов и городов - russian_names.xlsx
  31. 31. Файл данных • Создайте новую рабочую книгу Tableau: russian_names.twbx • Создайте подключение к файлу Excel: russian_names.xlsx (лист Cities) • Задайте для поля Name географическую роль: City, а для поля Region – роль State/Province • Перейдите к рабочему листу (Go to Worksheet) 31
  32. 32. Расположение городов • Постройте карту расположения известных Tableau российских городов, для этого: – добавьте поле Region в детали (Detail), а поле Name – в область метки (Label) – измените цвет маркера на красный и установите прозрачность (Transparency) 50% – уменьшите размер маркера • В правом нижнем углу выводится предупреждение о ненайденных объектах, постарайтесь решить (уменьшить) эту проблему 32
  33. 33. Совмещенная картограмма • Постройте на новом листе совмещенную картограмму: маркерами покажите расположение городов, а заливка региона должна отражать число уникальных кодов городов в этом регионе • Чтобы посчитать число уникальных кодов, сделайте поле ID фактом и измените агрегирующую функцию на Count Distinct 33
  34. 34. ИСПОЛЬЗОВАНИЕ СЕРВИСА ПАКЕТНОГО ГЕОКОДИРОВАНИЯ Расширение возможностей Tableau 34
  35. 35. Файл данных • Откройте в Excel файл данных hse_campus.xlsx • Этот файл содержит список адресов общежитий, учебных и административных зданий, принадлежащих ВШЭ (с сайта http://www.hse.ru/buildinghse) • Tableau не содержит базы данных для геокодирования отдельных адресов, поэтому нам придется воспользоваться услугами стороннего ресурса 35
  36. 36. Сервис пакетного геокодирования • Откройте в браузере страницу: http://www.findlatitudeandlongitude.com/batch-geocode/ • Скопируйте содержимое столбца Address (без заголовка) из Excel и вставьте этот список адресов в форму Input • На панели Batch Geocode Output Fields установите флажок address out, чтобы выводился адрес, распознанный службой геокодирования. Это не обязательно, но поможет проверить, правильно ли обработан адрес • Обратите внимание, что разделители элементов адреса – запятые, а для формата координат выбраны градусы широты и долготы • Нажмите на кнопку geocode и подождите, пока завершится процесс Должно обработаться 49 адресов 36
  37. 37. Добавление координат • Сохраните вывод (Output) в текстовый файл (через блокнот) и импортируйте его в Excel (команда Из Текста в разделе Данные на ленте). Желательно при импорте настроить формат десятичных разделителей, указав точку • Добавьте координаты в файл hse_campus.xlsx • Если вы не меняли настройки десятичного разделителя при импорте, то все координаты импортировались как текст. В этом случае выделите столбцы с координатами и выполните массовую замену точек на запятые, иначе координаты не будут распознаны Tableau как числа • Сохраните файл как hse_campus_geocoded.xlsx 37
  38. 38. Добавление источников карт • Распакуйте содержимое архива mapsources.zip в папку Мои документыMy Tableau RepositoryMapsources • В этом архиве содержатся описания дополнительных источников карт для подложки 38
  39. 39. Визуализация размещения зданий университета • Создайте новую книгу Tableau – hse_campus.twbx • Перетащите файл hse_campus_geocoded.xlsx в окно Tableau • Переименуйте лист в hse_buildings • Постройте визуализацию размещения зданий Вышки (цвет обозначает тип здания) • В меню Map>Background Maps выберите Google Satellite 39

×