SlideShare une entreprise Scribd logo
1  sur  39
От тестирования до промышленной
эксплуатации.
Опыт Центра решений ФОРС
Андрей Тамбовский
Директор по технологиям
FORS Solution Center
с 2011 г.
Обучение
Тестирование
Внедрение
Сопровождение
Задачи Центра
! Демонстрационный центр
" Презентации продуктов и технологий
" Демозал аппаратных средств
! Проведение технических тренингов для Партнеров и
Заказчиков
! Площадка для PoC/PoV, конкурентных тестирований
! Проработка решений архитектуры Oracle-on-Oracle
! Тестирование и оптимизация решений ISV на стеке
аппаратных средств Oracle, включая тесты
! Exadata Optimized ! Exalogic Optimized
! Database Appliance Optimized ! Big Data Optimized
FORS Solution Center
Аппаратные средства
Oracle Engineered System
! Exadata Database Machine: X2-2; X3-2; X4-2; X5-2
! Exalogic Elastic Cloud Machine
! Exalytics In-memory Analytics Machine
! Database Appliance X4-2, X5-2
! Big Data Appliance X5-2
Стандартное оборудование
! Серверы SPARC T5-2
! Серверы SPARC M10-1
! Серверы x86
! Системы хранения данных ZFS и Pillar
! Ленточная библиотека SL150
Oracle Exadata – почему?
! Стратегическая концепция Oracle Engineered Systems
! Революционная оптимизация производительности
! Широкая база пользователей с собственными разработками
! Широкая база российских независимых разработчиков (ISV)
6
ORACLE Engineered Systems
! Вместе:
! Спроектированные
! Протестированные
! Сертифицированные
! Поставляемые
! Развертываемые
! Модернизируемые
! Управляемые
! Поддерживаемые
Тесты на Exadata – важный результат
! 50+ проектов за 50- месяцев
! Развертывание стенда
! Миграция с non-Oracle HW и/или SW
! Оптимизация настроек СУБД/кода приложения
Общие результаты
9
Этапы Внедрения
Март-май 2011 выбор оборудования
Май 2011 года заключение контрактов
Июль 2011 года поставка комплексов
Август 2011 года пусконаладка
01 сентября 2011
запуск комплексов Exadata в промышленную
эксплуатацию
BIG DATA
Appliance
Big Data Appliance X5-2
! Готовый Hadoop или Oracle NoSQL DB кластер
! Совместно тестируется разработчиками Oracle
и Cloudera
! Оптимизирован для высочайшей
производительности
! Единое окно техподдержки по всей системе,
включая ПО Cloudera
! До 1728TB в одной стойке
–Возможны также конфигурации 1/3 и 2/3 стойки
Big Data Appliance X5-2 (FY16)
Sun Oracle X5-2L Servers. На каждом:
! 2 * 18 Core Intel Xeon E5 Processors
! 128 GB Memory
! 96TB Disk space
! 40G Infiniband
Программное обеспечение: Cloudera Enterprise 5 (Data Hub Edition с поддержкой):
! Cloudera’s Distribution including Apache Hadoop (CDH)
! Cloudera Impala
! Cloudera Search
! Apache HBase and Apache Accumulo
! Apache Spark
! Apache Kafka
! Cloudera Manager with support for:
! Cloudera Navigator
! Cloudera Back-up and Disaster Recovery (BDR)
* Oracle Big Data SQL is separately licensed
Почему сейчас
• Несколько лет исследований – понимание технологической ниши
технологий Big Data
• Перевод решений из НИР в эксплуатацию
• Понимание Value – расширение задач на технологиях Big Data
• Появление решений от партнеров
13
Что вам НЕ придется делать с Big Data Appliance (1/2)
• Подбирать и оптимизировать компоненты – сервера, диски,
количество дисков, процессоры, сети, память и т.п.
• Заключать отдельный договор о поддержке с Cloudera
• Собирать кластер
• Настраивать сетевые коммутаторы
• Инсталлировать операционную систему на каждом узле и
• Отслеживать и устанавливать оптимальные версии драйверов и
прошивок для каждого компонента
• Настраивать операционную систему для оптимальной
производительности (у нас же очень много данных!)
• Настраивать Java
Что вам НЕ придется делать с Big Data Appliance (2/2)
• Инсталлировать дополнительное ПО от Cloudera
• Тестировать работоспособность и производительность каждого
узла кластера
• Заниматься самостоятельно трудоемкой процедурой
многуровнего апгрейда и патчирования BIOS, OS, Java, Hadoop и
т.п.
• И просто следить за тем, что нужно что-то проапгрейдить
• Изучать как это все сделать без остановки и прерывания работы
пользователей
• Заниматься дизайном перебалансировки кластера при его
расширении
• И т.д. и т.п. – всего 51 задача
Фактор 1: сокращение сроков внедрения
16
Срок получения
50 миллионов
пользователей
Сокращение сроков внедрения
17
При сокращающемся окне возможностей
18
19
OBDA- проверенное, эффективное решение
Фактор 2: Промышленная система для
непромышленных данных
! Единое ПО для управления Big Data
! Техническая поддержка системы как программно-аппаратного
комплекса
! Развитие аппаратных средств
! Развитие программного стека
! Построение отказоустойчивой архитектуры
! Защита данных
! Стандартизация платформы для промышленных контуров и контуров
тестирования и разработки
20
21
Защита данных (OracleAuditVaultandDatabaseFirewallforHadoopAuditing)
22
Накопление потока данных Организация данных Аналитика, discovery
Фактор 3: Использование референсной
архитектуры
При создании Oracle IM Ref Architecture учитывается:
• Мультивендорный ландшафт заказчиков
• Хранилища данных и аналитика постоянно эволюционируют
• Существование разных типов данных (структурированные,
неструктурированные) и подходов к их обработке
• Необходимость не только обработки исторических данных, но и
существование задач реагирования в режиме близком к реальному
времени (Fast Data)
• Необходимость хранения исходных данных
• Необходимость создания «песочниц» для
экспериментов
Фактор 4: Дополнительные возможности, доступные
только для ORACLE ES
!Oracle Big Data Connectors – “15TB per hour
between Big Data Appliance and Exadata”
– Oracle SQL Connector for Hadoop
– Oracle Loader for Hadoop
– Oracle XQuery for Hadoop
– Oracle R Advanced Analytics for Hadoop
– Oracle Data Integrator
!Oracle Big Data SQL (for Hadoop)
!Oracle Big Data SQL ( for NoSQL Database)
!Enterprise Metadata Management
!Oracle Big Data Spatial and Graph
!Big Data Discovery
24
Разные подходы – разные преимущества
25
0
1
2
3
4
5
Мощь инструментов
Встроенный функционал
ACID транизакции
Безопасность
Разнообразие форматов
данных
Разреженные данные
Простота ETL
Стоимость хранения
Простота загрузки
Взаимодействие с другими
системами
Hadoop
RDBMS
• У Hadoop свои плюсы
• У СУБД свои
0
1
2
3
4
5
Мощь инструментов
Встроенный функционал
ACID транизакции
Безопасность
Разнообразие форматов
данных
Разреженные данные
Простота ETL
Стоимость хранения
Простота загрузки
Взаимодействие с другими
системами
Hadoop
RDBMS
Цель
Есть ли возможность объединить два мира?
26
Как это сделать?
И как это использовать?
SOURCES
РЕЗЕРВУАР ДАННЫХ ХРАНИЛИЩЕ ДАННЫХ
Oracle Database
Oracle Industry
Models
Oracle Advanced
Analytics
Oracle Spatial & Graph
Big Data Appliance
Apache
Flume
Oracle
GoldenGate
Oracle Event
Processing
Cloudera Hadoop
Oracle Big Data SQL
Oracle NoSQL
Oracle R Advanced
Analytics for Hadoop
Oracle R Distribution
Oracle Database
In-Memory, Multi-tenant
Oracle Industry Models
Oracle Advanced
Analytics
Oracle Spatial & Graph
Exadata
Oracle
GoldenGate
Oracle Event
Processing
Oracle Data
Integrator
Oracle Big Data
Connectors
Oracle Data
Integrator/
GoldenGate
БИЗНЕС АНАЛИТИКА
Oracle Big Data Management System
Данные хранятся во многих местах
Транзакции
RelationalHadoop
Логи
NoSQL
Профили клиентов
SQL
Oracle Big Data SQL
Новая технология для обращения к данным в Hadoop из Oracle Database
Запросык Oracle,
Hadoop и NoSQL
Oracle SQL
Oracle
NoSQLDB
HDFS
DataNode
Oracle
NoSQLDB
HDFS
DataNode
OracleDatabase
StorageServer
OracleDatabase
StorageServer
•Для пользователя не важно, где лежат данные – в
Oracle или в Hadoop
•Использование данных в Hadoop любыми BI
инструментами
•Все возможности языка SQL Oracle
•Использование наработок Exadata
•Интеграция Big Data Appliance и Exadata
Как работает Oracle Big Data SQL
Oracle Database 12c
SQL
Предобработка запроса
на ячейках Exadata
Небольшой объем данных
возвращается быстро
Hadoop
& NoSQL
Предобработка и
фильтрация
данных на узлах Hadoop
SQL
небольшой
объем
данных
Oracle NoSQL Database
Распределенная, масштабируемая key-value база данных
• Простая модель данных
• Пара Key-value с подходом major+sub-key
• Операции read/insert/update/delete
• Поддержка ACID и BASE транзакций
• Масштабируемость
• Динамическое партиционирование и перераспределение
• Оптимизированный доступ к данным
• Высокая доступность
• Одна или более реплик
• Катастрофоустойчивость засчет разнесения реплик
• Устойчивость к отказу мастера
• Нет одной точки отказа
• Прозрачная балансировка нагрузки
• Чтение с мастера или реплики
• Драйвер знает о сетевой топологии и временах задержки
Storage Nodes
Data Center A
Storage Nodes
Data Center B
NoSQLDB Driver
Application
NoSQLDB Driver
Application
Для каких задач может использоваться Oracle NoSQL
Database?
• Построение быстрых многопетабайтных распределенных
масштабируемых файловых хранилищ
– С возможностью обработки данных в кластере
• Построение систем, которые очень быстро накапливают огромное
количество данных из многих источников
– Десятки миллионов записей в секунду
– Датчики, результаты испытаний, эксперименты
• Интеграция с системами обработки событий
– Накопление и обработка информации о событиях
• Интернет-проекты с многими тысячами пользователей
– Для обеспечения мгновенного доступа к профилям пользователя, продукта,
информации о рекламной компании и т.д.
Storage Nodes
Data Center A
Storage Nodes
Data Center B
NoSQLDB Driver
Application
NoSQLDB Driver
Application
Enterprise Metadata Management
ETL
BI
Dashboards
App
ETL
ETL
Как считаются
продажи?
Что произойдет, если
я поменяю эту
таблицу?
Какие отчеты
используют данные
с этого сервера? Sys Admin
Руководитель
Разрабочик BI
Из какой системы
пришли
данные?
Пользователь
Какой отчет
использует эти
данные?
CDC
Hadoop
Data Lake
Data Steward
Можно ли
доверять
источнику?
ETL
разрабочтик
Я хочу провести
эксперимент. Какие
данные у меня есть в
наличии?
Data Scientist
GG
34
Oracle Big Data Discovery
Визуализация данных Hadoop
find explore transform discover share
Фактор 5: решения ISV
Тестированы, оптимизированы и
сертифицированы по программам Oracle
Ready и Oracle Optimized
35
Exadata Optimized
«…Тест проводился на специально подготовленной среде с более чем 60
миллионами активных сделок. Необходимо было рассчитать как все
прикладные витрины (кредитный, депозитный портфель, портфель
ценных бумаг, реестр срочных сделок и ПФИ), так и большое количество
специализированных витрин данных
Всего менее чем за 1,5 часа было рассчитано 105 витрин данных.
За аналогичный временной отрезок на стандартных процессорных
мощностях происходит расчет по 300 тысячам договоров.
…можно говорить о более чем 200-кратном росте производительности»
ISV Банковский сектор
Партнер с решением Big Data Appliance Optimized
37
Контакты:
http://www.partner.fors.ru
http://www.exastack.ru
129626, Россия, Москва,
Графский переулок, 14, корп. 2
Тел./Факс: +7 (495) 913-3-913
38
FORS Solution Center
Information Management Reference Architecture
Уровеньдоступакданным
Бизнес
аналитика
Информаци-
онные
сервисы
Простота и скорость
загрузки данных
Стоимость запроса к
данным
Уровень производительного
доступа
Фундаментальный слой
данных (3N форма)
Хранилище первичной информации
Data
Science
Первичная информация хранится
без всяких изменений
Данные очищены, организованы в
некоторую структуру, но абстрагированы
от бизнес процессов
Данные организованы в соответствии с
требованиями бизнес процессов, для достижения
максимальной производительности
Исследование данных Среда разработки
Исследование данных,
выявление новых
закономерностей
Разработка
взаимодействия всех
слоев приложения
Источники данных
Мультиструктурные
источники
Контент
Docs Web & Social Media
SMS
Структурированные
Данные
(из реляционных источников)
Мастер данные
Планирование и
бюджетирование

Contenu connexe

Tendances

Roman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketingRoman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketingCleverDATA
 
CleverDATA_Oracle Cloud BI Day 2015
CleverDATA_Oracle Cloud BI Day 2015CleverDATA_Oracle Cloud BI Day 2015
CleverDATA_Oracle Cloud BI Day 2015CleverDATA
 
Splunk - универсальная платформа для работы с любыми данными
Splunk - универсальная платформа для работы с любыми даннымиSplunk - универсальная платформа для работы с любыми данными
Splunk - универсальная платформа для работы с любыми даннымиCleverDATA
 
2 sap v1_do_как big_data меняет бизнес
2 sap v1_do_как big_data меняет бизнес2 sap v1_do_как big_data меняет бизнес
2 sap v1_do_как big_data меняет бизнесantishmanti
 
4 sas and big data short
4 sas and big data short4 sas and big data short
4 sas and big data shortantishmanti
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данныхYuri Yashkin
 
OSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovOSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovIlya Gershanov
 
Big data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризисаBig data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризисаГлеб Кащеев
 
Data-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииData-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииAlexander Barakov
 
Business Intelligence. Современный взгляд
Business Intelligence. Современный взглядBusiness Intelligence. Современный взгляд
Business Intelligence. Современный взглядAndrey Korshikov
 
Big Data: Как принести пользу Бизнесу
Big Data: Как принести пользу БизнесуBig Data: Как принести пользу Бизнесу
Big Data: Как принести пользу БизнесуDen Reymer
 
1 алексей натекин глубокая социальная аналиктика маленький большой брат
1 алексей натекин глубокая социальная аналиктика маленький большой брат1 алексей натекин глубокая социальная аналиктика маленький большой брат
1 алексей натекин глубокая социальная аналиктика маленький большой братantishmanti
 
OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015Ilya Gershanov
 
Больше DMP, хороших и разных
Больше DMP, хороших и разныхБольше DMP, хороших и разных
Больше DMP, хороших и разныхHybridRussia
 
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьBig Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьTechart Marketing Group
 
Открытая сессия по виртуализации данных
Открытая сессия по виртуализации данныхОткрытая сессия по виртуализации данных
Открытая сессия по виртуализации данныхDenodo
 
Применение Big Data в маркетинге
Применение Big Data в маркетингеПрименение Big Data в маркетинге
Применение Big Data в маркетингеEvgeniy Pavlovskiy
 
Что такое Big Data ?
Что такое Big Data ?Что такое Big Data ?
Что такое Big Data ?Mikhail Alekseev
 
MESImeetup_DenReymer_presentation
MESImeetup_DenReymer_presentationMESImeetup_DenReymer_presentation
MESImeetup_DenReymer_presentationCleverDATA
 

Tendances (20)

Roman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketingRoman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketing
 
CleverDATA_Oracle Cloud BI Day 2015
CleverDATA_Oracle Cloud BI Day 2015CleverDATA_Oracle Cloud BI Day 2015
CleverDATA_Oracle Cloud BI Day 2015
 
Splunk - универсальная платформа для работы с любыми данными
Splunk - универсальная платформа для работы с любыми даннымиSplunk - универсальная платформа для работы с любыми данными
Splunk - универсальная платформа для работы с любыми данными
 
2 sap v1_do_как big_data меняет бизнес
2 sap v1_do_как big_data меняет бизнес2 sap v1_do_как big_data меняет бизнес
2 sap v1_do_как big_data меняет бизнес
 
3 ibm bdw2015
3 ibm bdw20153 ibm bdw2015
3 ibm bdw2015
 
4 sas and big data short
4 sas and big data short4 sas and big data short
4 sas and big data short
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данных
 
OSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovOSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya Gershanov
 
Big data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризисаBig data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризиса
 
Data-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииData-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной Компании
 
Business Intelligence. Современный взгляд
Business Intelligence. Современный взглядBusiness Intelligence. Современный взгляд
Business Intelligence. Современный взгляд
 
Big Data: Как принести пользу Бизнесу
Big Data: Как принести пользу БизнесуBig Data: Как принести пользу Бизнесу
Big Data: Как принести пользу Бизнесу
 
1 алексей натекин глубокая социальная аналиктика маленький большой брат
1 алексей натекин глубокая социальная аналиктика маленький большой брат1 алексей натекин глубокая социальная аналиктика маленький большой брат
1 алексей натекин глубокая социальная аналиктика маленький большой брат
 
OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015
 
Больше DMP, хороших и разных
Больше DMP, хороших и разныхБольше DMP, хороших и разных
Больше DMP, хороших и разных
 
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьBig Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
 
Открытая сессия по виртуализации данных
Открытая сессия по виртуализации данныхОткрытая сессия по виртуализации данных
Открытая сессия по виртуализации данных
 
Применение Big Data в маркетинге
Применение Big Data в маркетингеПрименение Big Data в маркетинге
Применение Big Data в маркетинге
 
Что такое Big Data ?
Что такое Big Data ?Что такое Big Data ?
Что такое Big Data ?
 
MESImeetup_DenReymer_presentation
MESImeetup_DenReymer_presentationMESImeetup_DenReymer_presentation
MESImeetup_DenReymer_presentation
 

En vedette

Hadoop on OpenStack
Hadoop on OpenStackHadoop on OpenStack
Hadoop on OpenStackYandex
 
О.В.Сухорослов "MapReduce"
О.В.Сухорослов "MapReduce"О.В.Сухорослов "MapReduce"
О.В.Сухорослов "MapReduce"Yandex
 
Hadoop presentation
Hadoop presentationHadoop presentation
Hadoop presentationVlad Orlov
 
Facebooks Petabyte Scale Data Warehouse using Hive and Hadoop
Facebooks Petabyte Scale Data Warehouse using Hive and HadoopFacebooks Petabyte Scale Data Warehouse using Hive and Hadoop
Facebooks Petabyte Scale Data Warehouse using Hive and Hadooproyans
 
Pig, Making Hadoop Easy
Pig, Making Hadoop EasyPig, Making Hadoop Easy
Pig, Making Hadoop EasyNick Dimiduk
 
introduction to data processing using Hadoop and Pig
introduction to data processing using Hadoop and Pigintroduction to data processing using Hadoop and Pig
introduction to data processing using Hadoop and PigRicardo Varela
 
Practical Problem Solving with Apache Hadoop & Pig
Practical Problem Solving with Apache Hadoop & PigPractical Problem Solving with Apache Hadoop & Pig
Practical Problem Solving with Apache Hadoop & PigMilind Bhandarkar
 
HIVE: Data Warehousing & Analytics on Hadoop
HIVE: Data Warehousing & Analytics on HadoopHIVE: Data Warehousing & Analytics on Hadoop
HIVE: Data Warehousing & Analytics on HadoopZheng Shao
 
Hive Quick Start Tutorial
Hive Quick Start TutorialHive Quick Start Tutorial
Hive Quick Start TutorialCarl Steinbach
 
Integration of Hive and HBase
Integration of Hive and HBaseIntegration of Hive and HBase
Integration of Hive and HBaseHortonworks
 
Hadoop, Pig, and Twitter (NoSQL East 2009)
Hadoop, Pig, and Twitter (NoSQL East 2009)Hadoop, Pig, and Twitter (NoSQL East 2009)
Hadoop, Pig, and Twitter (NoSQL East 2009)Kevin Weil
 
Introduction To Map Reduce
Introduction To Map ReduceIntroduction To Map Reduce
Introduction To Map Reducerantav
 
Big Data Analytics with Hadoop
Big Data Analytics with HadoopBig Data Analytics with Hadoop
Big Data Analytics with HadoopPhilippe Julio
 

En vedette (14)

Hadoop on OpenStack
Hadoop on OpenStackHadoop on OpenStack
Hadoop on OpenStack
 
О.В.Сухорослов "MapReduce"
О.В.Сухорослов "MapReduce"О.В.Сухорослов "MapReduce"
О.В.Сухорослов "MapReduce"
 
Hadoop presentation
Hadoop presentationHadoop presentation
Hadoop presentation
 
Facebooks Petabyte Scale Data Warehouse using Hive and Hadoop
Facebooks Petabyte Scale Data Warehouse using Hive and HadoopFacebooks Petabyte Scale Data Warehouse using Hive and Hadoop
Facebooks Petabyte Scale Data Warehouse using Hive and Hadoop
 
Pig, Making Hadoop Easy
Pig, Making Hadoop EasyPig, Making Hadoop Easy
Pig, Making Hadoop Easy
 
introduction to data processing using Hadoop and Pig
introduction to data processing using Hadoop and Pigintroduction to data processing using Hadoop and Pig
introduction to data processing using Hadoop and Pig
 
Practical Problem Solving with Apache Hadoop & Pig
Practical Problem Solving with Apache Hadoop & PigPractical Problem Solving with Apache Hadoop & Pig
Practical Problem Solving with Apache Hadoop & Pig
 
HIVE: Data Warehousing & Analytics on Hadoop
HIVE: Data Warehousing & Analytics on HadoopHIVE: Data Warehousing & Analytics on Hadoop
HIVE: Data Warehousing & Analytics on Hadoop
 
Hive Quick Start Tutorial
Hive Quick Start TutorialHive Quick Start Tutorial
Hive Quick Start Tutorial
 
Integration of Hive and HBase
Integration of Hive and HBaseIntegration of Hive and HBase
Integration of Hive and HBase
 
Hadoop, Pig, and Twitter (NoSQL East 2009)
Hadoop, Pig, and Twitter (NoSQL East 2009)Hadoop, Pig, and Twitter (NoSQL East 2009)
Hadoop, Pig, and Twitter (NoSQL East 2009)
 
Introduction To Map Reduce
Introduction To Map ReduceIntroduction To Map Reduce
Introduction To Map Reduce
 
Big data and Hadoop
Big data and HadoopBig data and Hadoop
Big data and Hadoop
 
Big Data Analytics with Hadoop
Big Data Analytics with HadoopBig Data Analytics with Hadoop
Big Data Analytics with Hadoop
 

Similaire à Fors и big data appliance

Новости и анонсы Oracle Open World 2014
Новости и анонсы Oracle Open World 2014Новости и анонсы Oracle Open World 2014
Новости и анонсы Oracle Open World 2014Andrey Akulov
 
Oracle Big Data proposition
Oracle Big Data propositionOracle Big Data proposition
Oracle Big Data propositionAndrey Akulov
 
Решения Oracle для Big Data
Решения Oracle для Big DataРешения Oracle для Big Data
Решения Oracle для Big DataAndrey Akulov
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi octantishmanti
 
Обзор интегрированных систем Oracle
Обзор интегрированных систем OracleОбзор интегрированных систем Oracle
Обзор интегрированных систем OracleAndrey Akulov
 
Проверено и работает. Инструменты Oracle для разработки веб приложений
Проверено и работает. Инструменты Oracle для разработки веб приложенийПроверено и работает. Инструменты Oracle для разработки веб приложений
Проверено и работает. Инструменты Oracle для разработки веб приложенийMedia Gorod
 
Технологии и продукты Oracle для обработки и анализа Больших Данных
Технологии и продукты Oracle для обработки и анализа Больших ДанныхТехнологии и продукты Oracle для обработки и анализа Больших Данных
Технологии и продукты Oracle для обработки и анализа Больших ДанныхAndrey Akulov
 
Database as a Service
Database as a ServiceDatabase as a Service
Database as a ServiceAndrey Akulov
 
Создание географически-распределенных датацентров на базе инженерных систем
Создание географически-распределенных датацентров на базе инженерных системСоздание географически-распределенных датацентров на базе инженерных систем
Создание географически-распределенных датацентров на базе инженерных системAndrey Akulov
 
Новости и анонсы конференции Oracle Open World 2013
Новости и анонсы конференции Oracle Open World 2013Новости и анонсы конференции Oracle Open World 2013
Новости и анонсы конференции Oracle Open World 2013Andrey Akulov
 
Oracle. Моторин Иларион. "Современные и перспективные системы на базе процесс...
Oracle. Моторин Иларион. "Современные и перспективные системы на базе процесс...Oracle. Моторин Иларион. "Современные и перспективные системы на базе процесс...
Oracle. Моторин Иларион. "Современные и перспективные системы на базе процесс...Expolink
 
Oracle Big Data. Обзор технологий
Oracle Big Data. Обзор технологийOracle Big Data. Обзор технологий
Oracle Big Data. Обзор технологийAndrey Akulov
 
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреСХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреDEPO Computers
 
Модернизация хранилища данных для использования передовой аналитики
Модернизация хранилища данных для использования передовой аналитикиМодернизация хранилища данных для использования передовой аналитики
Модернизация хранилища данных для использования передовой аналитикиElizaveta Alekseeva
 
Модернизация хранилища данных для использования передовой аналитики
Модернизация хранилища данных для использования передовой аналитикиМодернизация хранилища данных для использования передовой аналитики
Модернизация хранилища данных для использования передовой аналитикиYuri Yashkin
 
Сергей Мелехов, Менеджер по развитию бизнеса вычислительных систем Oracle Вос...
Сергей Мелехов, Менеджер по развитию бизнеса вычислительных систем Oracle Вос...Сергей Мелехов, Менеджер по развитию бизнеса вычислительных систем Oracle Вос...
Сергей Мелехов, Менеджер по развитию бизнеса вычислительных систем Oracle Вос...Банковское обозрение
 
Предоставление баз данных в виде сервиса (DBaaS)
Предоставление баз данных в виде сервиса (DBaaS)Предоставление баз данных в виде сервиса (DBaaS)
Предоставление баз данных в виде сервиса (DBaaS)Andrey Akulov
 
AZadonsky Exalogic
AZadonsky ExalogicAZadonsky Exalogic
AZadonsky ExalogicVasily Demin
 

Similaire à Fors и big data appliance (20)

Новости и анонсы Oracle Open World 2014
Новости и анонсы Oracle Open World 2014Новости и анонсы Oracle Open World 2014
Новости и анонсы Oracle Open World 2014
 
Oracle Big Data proposition
Oracle Big Data propositionOracle Big Data proposition
Oracle Big Data proposition
 
Решения Oracle для Big Data
Решения Oracle для Big DataРешения Oracle для Big Data
Решения Oracle для Big Data
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi oct
 
Обзор интегрированных систем Oracle
Обзор интегрированных систем OracleОбзор интегрированных систем Oracle
Обзор интегрированных систем Oracle
 
Проверено и работает. Инструменты Oracle для разработки веб приложений
Проверено и работает. Инструменты Oracle для разработки веб приложенийПроверено и работает. Инструменты Oracle для разработки веб приложений
Проверено и работает. Инструменты Oracle для разработки веб приложений
 
Presentation1
Presentation1Presentation1
Presentation1
 
Технологии и продукты Oracle для обработки и анализа Больших Данных
Технологии и продукты Oracle для обработки и анализа Больших ДанныхТехнологии и продукты Oracle для обработки и анализа Больших Данных
Технологии и продукты Oracle для обработки и анализа Больших Данных
 
Database as a Service
Database as a ServiceDatabase as a Service
Database as a Service
 
Создание географически-распределенных датацентров на базе инженерных систем
Создание географически-распределенных датацентров на базе инженерных системСоздание географически-распределенных датацентров на базе инженерных систем
Создание географически-распределенных датацентров на базе инженерных систем
 
Новости и анонсы конференции Oracle Open World 2013
Новости и анонсы конференции Oracle Open World 2013Новости и анонсы конференции Oracle Open World 2013
Новости и анонсы конференции Oracle Open World 2013
 
Oracle. Моторин Иларион. "Современные и перспективные системы на базе процесс...
Oracle. Моторин Иларион. "Современные и перспективные системы на базе процесс...Oracle. Моторин Иларион. "Современные и перспективные системы на базе процесс...
Oracle. Моторин Иларион. "Современные и перспективные системы на базе процесс...
 
Oracle Big Data. Обзор технологий
Oracle Big Data. Обзор технологийOracle Big Data. Обзор технологий
Oracle Big Data. Обзор технологий
 
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреСХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
 
Модернизация хранилища данных для использования передовой аналитики
Модернизация хранилища данных для использования передовой аналитикиМодернизация хранилища данных для использования передовой аналитики
Модернизация хранилища данных для использования передовой аналитики
 
Модернизация хранилища данных для использования передовой аналитики
Модернизация хранилища данных для использования передовой аналитикиМодернизация хранилища данных для использования передовой аналитики
Модернизация хранилища данных для использования передовой аналитики
 
Сергей Мелехов, Менеджер по развитию бизнеса вычислительных систем Oracle Вос...
Сергей Мелехов, Менеджер по развитию бизнеса вычислительных систем Oracle Вос...Сергей Мелехов, Менеджер по развитию бизнеса вычислительных систем Oracle Вос...
Сергей Мелехов, Менеджер по развитию бизнеса вычислительных систем Oracle Вос...
 
Предоставление баз данных в виде сервиса (DBaaS)
Предоставление баз данных в виде сервиса (DBaaS)Предоставление баз данных в виде сервиса (DBaaS)
Предоставление баз данных в виде сервиса (DBaaS)
 
AZadonsky Exalogic
AZadonsky ExalogicAZadonsky Exalogic
AZadonsky Exalogic
 
Big data
Big dataBig data
Big data
 

Plus de CleverDATA

CRM onboarding - оффлайн данные для онлайн рекламы
CRM onboarding - оффлайн данные для онлайн рекламы CRM onboarding - оффлайн данные для онлайн рекламы
CRM onboarding - оффлайн данные для онлайн рекламы CleverDATA
 
Jpoint 2017 - как это было (обзор конференции)
Jpoint 2017 - как это было (обзор конференции)Jpoint 2017 - как это было (обзор конференции)
Jpoint 2017 - как это было (обзор конференции)CleverDATA
 
Data exchange как ключевой элемент экосистемы обмена данными
Data exchange как ключевой элемент экосистемы обмена даннымиData exchange как ключевой элемент экосистемы обмена данными
Data exchange как ключевой элемент экосистемы обмена даннымиCleverDATA
 
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...CleverDATA
 
CleverDATA _HybridConf16_Public
CleverDATA _HybridConf16_PublicCleverDATA _HybridConf16_Public
CleverDATA _HybridConf16_PublicCleverDATA
 
Splunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service IntelligenceSplunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service IntelligenceCleverDATA
 
CleverDATA_Afanasev_DigitalEconomy
CleverDATA_Afanasev_DigitalEconomyCleverDATA_Afanasev_DigitalEconomy
CleverDATA_Afanasev_DigitalEconomyCleverDATA
 
Customers segmentation_responce prediction
Customers segmentation_responce predictionCustomers segmentation_responce prediction
Customers segmentation_responce predictionCleverDATA
 
HR_Scoring_CleverDATA
HR_Scoring_CleverDATAHR_Scoring_CleverDATA
HR_Scoring_CleverDATACleverDATA
 
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_Hadoop
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_HadoopCleverDATA for Hadoop_Meetup_22052015_Spark_vs_Hadoop
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_HadoopCleverDATA
 
CleverDATA_Spark_audience_segmentation_in_online_ad
CleverDATA_Spark_audience_segmentation_in_online_adCleverDATA_Spark_audience_segmentation_in_online_ad
CleverDATA_Spark_audience_segmentation_in_online_adCleverDATA
 
Julia Tuzin teradata omnichannel_interactions
Julia Tuzin teradata omnichannel_interactionsJulia Tuzin teradata omnichannel_interactions
Julia Tuzin teradata omnichannel_interactionsCleverDATA
 
Karel jabornik teradata real-time-interaction_mngmt
Karel jabornik teradata real-time-interaction_mngmtKarel jabornik teradata real-time-interaction_mngmt
Karel jabornik teradata real-time-interaction_mngmtCleverDATA
 
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015CleverDATA
 
CleverCLUB-26.03.15-K.Obukhov
CleverCLUB-26.03.15-K.ObukhovCleverCLUB-26.03.15-K.Obukhov
CleverCLUB-26.03.15-K.ObukhovCleverDATA
 
CleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.KanevskyCleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.KanevskyCleverDATA
 
Predictive models for Operational analytics
Predictive models for Operational analyticsPredictive models for Operational analytics
Predictive models for Operational analyticsCleverDATA
 
Digital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platformDigital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platformCleverDATA
 
10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis 10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis CleverDATA
 
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...CleverDATA
 

Plus de CleverDATA (20)

CRM onboarding - оффлайн данные для онлайн рекламы
CRM onboarding - оффлайн данные для онлайн рекламы CRM onboarding - оффлайн данные для онлайн рекламы
CRM onboarding - оффлайн данные для онлайн рекламы
 
Jpoint 2017 - как это было (обзор конференции)
Jpoint 2017 - как это было (обзор конференции)Jpoint 2017 - как это было (обзор конференции)
Jpoint 2017 - как это было (обзор конференции)
 
Data exchange как ключевой элемент экосистемы обмена данными
Data exchange как ключевой элемент экосистемы обмена даннымиData exchange как ключевой элемент экосистемы обмена данными
Data exchange как ключевой элемент экосистемы обмена данными
 
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...
 
CleverDATA _HybridConf16_Public
CleverDATA _HybridConf16_PublicCleverDATA _HybridConf16_Public
CleverDATA _HybridConf16_Public
 
Splunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service IntelligenceSplunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service Intelligence
 
CleverDATA_Afanasev_DigitalEconomy
CleverDATA_Afanasev_DigitalEconomyCleverDATA_Afanasev_DigitalEconomy
CleverDATA_Afanasev_DigitalEconomy
 
Customers segmentation_responce prediction
Customers segmentation_responce predictionCustomers segmentation_responce prediction
Customers segmentation_responce prediction
 
HR_Scoring_CleverDATA
HR_Scoring_CleverDATAHR_Scoring_CleverDATA
HR_Scoring_CleverDATA
 
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_Hadoop
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_HadoopCleverDATA for Hadoop_Meetup_22052015_Spark_vs_Hadoop
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_Hadoop
 
CleverDATA_Spark_audience_segmentation_in_online_ad
CleverDATA_Spark_audience_segmentation_in_online_adCleverDATA_Spark_audience_segmentation_in_online_ad
CleverDATA_Spark_audience_segmentation_in_online_ad
 
Julia Tuzin teradata omnichannel_interactions
Julia Tuzin teradata omnichannel_interactionsJulia Tuzin teradata omnichannel_interactions
Julia Tuzin teradata omnichannel_interactions
 
Karel jabornik teradata real-time-interaction_mngmt
Karel jabornik teradata real-time-interaction_mngmtKarel jabornik teradata real-time-interaction_mngmt
Karel jabornik teradata real-time-interaction_mngmt
 
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
 
CleverCLUB-26.03.15-K.Obukhov
CleverCLUB-26.03.15-K.ObukhovCleverCLUB-26.03.15-K.Obukhov
CleverCLUB-26.03.15-K.Obukhov
 
CleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.KanevskyCleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.Kanevsky
 
Predictive models for Operational analytics
Predictive models for Operational analyticsPredictive models for Operational analytics
Predictive models for Operational analytics
 
Digital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platformDigital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platform
 
10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis 10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis
 
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
 

Fors и big data appliance

  • 1.
  • 2. От тестирования до промышленной эксплуатации. Опыт Центра решений ФОРС Андрей Тамбовский Директор по технологиям
  • 3. FORS Solution Center с 2011 г. Обучение Тестирование Внедрение Сопровождение
  • 4. Задачи Центра ! Демонстрационный центр " Презентации продуктов и технологий " Демозал аппаратных средств ! Проведение технических тренингов для Партнеров и Заказчиков ! Площадка для PoC/PoV, конкурентных тестирований ! Проработка решений архитектуры Oracle-on-Oracle ! Тестирование и оптимизация решений ISV на стеке аппаратных средств Oracle, включая тесты ! Exadata Optimized ! Exalogic Optimized ! Database Appliance Optimized ! Big Data Optimized
  • 5. FORS Solution Center Аппаратные средства Oracle Engineered System ! Exadata Database Machine: X2-2; X3-2; X4-2; X5-2 ! Exalogic Elastic Cloud Machine ! Exalytics In-memory Analytics Machine ! Database Appliance X4-2, X5-2 ! Big Data Appliance X5-2 Стандартное оборудование ! Серверы SPARC T5-2 ! Серверы SPARC M10-1 ! Серверы x86 ! Системы хранения данных ZFS и Pillar ! Ленточная библиотека SL150
  • 6. Oracle Exadata – почему? ! Стратегическая концепция Oracle Engineered Systems ! Революционная оптимизация производительности ! Широкая база пользователей с собственными разработками ! Широкая база российских независимых разработчиков (ISV) 6
  • 7. ORACLE Engineered Systems ! Вместе: ! Спроектированные ! Протестированные ! Сертифицированные ! Поставляемые ! Развертываемые ! Модернизируемые ! Управляемые ! Поддерживаемые
  • 8. Тесты на Exadata – важный результат ! 50+ проектов за 50- месяцев ! Развертывание стенда ! Миграция с non-Oracle HW и/или SW ! Оптимизация настроек СУБД/кода приложения Общие результаты
  • 9. 9 Этапы Внедрения Март-май 2011 выбор оборудования Май 2011 года заключение контрактов Июль 2011 года поставка комплексов Август 2011 года пусконаладка 01 сентября 2011 запуск комплексов Exadata в промышленную эксплуатацию
  • 11. Big Data Appliance X5-2 ! Готовый Hadoop или Oracle NoSQL DB кластер ! Совместно тестируется разработчиками Oracle и Cloudera ! Оптимизирован для высочайшей производительности ! Единое окно техподдержки по всей системе, включая ПО Cloudera ! До 1728TB в одной стойке –Возможны также конфигурации 1/3 и 2/3 стойки
  • 12. Big Data Appliance X5-2 (FY16) Sun Oracle X5-2L Servers. На каждом: ! 2 * 18 Core Intel Xeon E5 Processors ! 128 GB Memory ! 96TB Disk space ! 40G Infiniband Программное обеспечение: Cloudera Enterprise 5 (Data Hub Edition с поддержкой): ! Cloudera’s Distribution including Apache Hadoop (CDH) ! Cloudera Impala ! Cloudera Search ! Apache HBase and Apache Accumulo ! Apache Spark ! Apache Kafka ! Cloudera Manager with support for: ! Cloudera Navigator ! Cloudera Back-up and Disaster Recovery (BDR) * Oracle Big Data SQL is separately licensed
  • 13. Почему сейчас • Несколько лет исследований – понимание технологической ниши технологий Big Data • Перевод решений из НИР в эксплуатацию • Понимание Value – расширение задач на технологиях Big Data • Появление решений от партнеров 13
  • 14. Что вам НЕ придется делать с Big Data Appliance (1/2) • Подбирать и оптимизировать компоненты – сервера, диски, количество дисков, процессоры, сети, память и т.п. • Заключать отдельный договор о поддержке с Cloudera • Собирать кластер • Настраивать сетевые коммутаторы • Инсталлировать операционную систему на каждом узле и • Отслеживать и устанавливать оптимальные версии драйверов и прошивок для каждого компонента • Настраивать операционную систему для оптимальной производительности (у нас же очень много данных!) • Настраивать Java
  • 15. Что вам НЕ придется делать с Big Data Appliance (2/2) • Инсталлировать дополнительное ПО от Cloudera • Тестировать работоспособность и производительность каждого узла кластера • Заниматься самостоятельно трудоемкой процедурой многуровнего апгрейда и патчирования BIOS, OS, Java, Hadoop и т.п. • И просто следить за тем, что нужно что-то проапгрейдить • Изучать как это все сделать без остановки и прерывания работы пользователей • Заниматься дизайном перебалансировки кластера при его расширении • И т.д. и т.п. – всего 51 задача
  • 16. Фактор 1: сокращение сроков внедрения 16 Срок получения 50 миллионов пользователей
  • 17. Сокращение сроков внедрения 17 При сокращающемся окне возможностей
  • 18. 18
  • 20. Фактор 2: Промышленная система для непромышленных данных ! Единое ПО для управления Big Data ! Техническая поддержка системы как программно-аппаратного комплекса ! Развитие аппаратных средств ! Развитие программного стека ! Построение отказоустойчивой архитектуры ! Защита данных ! Стандартизация платформы для промышленных контуров и контуров тестирования и разработки 20
  • 22. 22 Накопление потока данных Организация данных Аналитика, discovery Фактор 3: Использование референсной архитектуры
  • 23. При создании Oracle IM Ref Architecture учитывается: • Мультивендорный ландшафт заказчиков • Хранилища данных и аналитика постоянно эволюционируют • Существование разных типов данных (структурированные, неструктурированные) и подходов к их обработке • Необходимость не только обработки исторических данных, но и существование задач реагирования в режиме близком к реальному времени (Fast Data) • Необходимость хранения исходных данных • Необходимость создания «песочниц» для экспериментов
  • 24. Фактор 4: Дополнительные возможности, доступные только для ORACLE ES !Oracle Big Data Connectors – “15TB per hour between Big Data Appliance and Exadata” – Oracle SQL Connector for Hadoop – Oracle Loader for Hadoop – Oracle XQuery for Hadoop – Oracle R Advanced Analytics for Hadoop – Oracle Data Integrator !Oracle Big Data SQL (for Hadoop) !Oracle Big Data SQL ( for NoSQL Database) !Enterprise Metadata Management !Oracle Big Data Spatial and Graph !Big Data Discovery 24
  • 25. Разные подходы – разные преимущества 25 0 1 2 3 4 5 Мощь инструментов Встроенный функционал ACID транизакции Безопасность Разнообразие форматов данных Разреженные данные Простота ETL Стоимость хранения Простота загрузки Взаимодействие с другими системами Hadoop RDBMS • У Hadoop свои плюсы • У СУБД свои
  • 26. 0 1 2 3 4 5 Мощь инструментов Встроенный функционал ACID транизакции Безопасность Разнообразие форматов данных Разреженные данные Простота ETL Стоимость хранения Простота загрузки Взаимодействие с другими системами Hadoop RDBMS Цель Есть ли возможность объединить два мира? 26 Как это сделать? И как это использовать?
  • 27. SOURCES РЕЗЕРВУАР ДАННЫХ ХРАНИЛИЩЕ ДАННЫХ Oracle Database Oracle Industry Models Oracle Advanced Analytics Oracle Spatial & Graph Big Data Appliance Apache Flume Oracle GoldenGate Oracle Event Processing Cloudera Hadoop Oracle Big Data SQL Oracle NoSQL Oracle R Advanced Analytics for Hadoop Oracle R Distribution Oracle Database In-Memory, Multi-tenant Oracle Industry Models Oracle Advanced Analytics Oracle Spatial & Graph Exadata Oracle GoldenGate Oracle Event Processing Oracle Data Integrator Oracle Big Data Connectors Oracle Data Integrator/ GoldenGate БИЗНЕС АНАЛИТИКА Oracle Big Data Management System
  • 28. Данные хранятся во многих местах Транзакции RelationalHadoop Логи NoSQL Профили клиентов SQL
  • 29. Oracle Big Data SQL Новая технология для обращения к данным в Hadoop из Oracle Database Запросык Oracle, Hadoop и NoSQL Oracle SQL Oracle NoSQLDB HDFS DataNode Oracle NoSQLDB HDFS DataNode OracleDatabase StorageServer OracleDatabase StorageServer •Для пользователя не важно, где лежат данные – в Oracle или в Hadoop •Использование данных в Hadoop любыми BI инструментами •Все возможности языка SQL Oracle •Использование наработок Exadata •Интеграция Big Data Appliance и Exadata
  • 30. Как работает Oracle Big Data SQL Oracle Database 12c SQL Предобработка запроса на ячейках Exadata Небольшой объем данных возвращается быстро Hadoop & NoSQL Предобработка и фильтрация данных на узлах Hadoop SQL небольшой объем данных
  • 31. Oracle NoSQL Database Распределенная, масштабируемая key-value база данных • Простая модель данных • Пара Key-value с подходом major+sub-key • Операции read/insert/update/delete • Поддержка ACID и BASE транзакций • Масштабируемость • Динамическое партиционирование и перераспределение • Оптимизированный доступ к данным • Высокая доступность • Одна или более реплик • Катастрофоустойчивость засчет разнесения реплик • Устойчивость к отказу мастера • Нет одной точки отказа • Прозрачная балансировка нагрузки • Чтение с мастера или реплики • Драйвер знает о сетевой топологии и временах задержки Storage Nodes Data Center A Storage Nodes Data Center B NoSQLDB Driver Application NoSQLDB Driver Application
  • 32. Для каких задач может использоваться Oracle NoSQL Database? • Построение быстрых многопетабайтных распределенных масштабируемых файловых хранилищ – С возможностью обработки данных в кластере • Построение систем, которые очень быстро накапливают огромное количество данных из многих источников – Десятки миллионов записей в секунду – Датчики, результаты испытаний, эксперименты • Интеграция с системами обработки событий – Накопление и обработка информации о событиях • Интернет-проекты с многими тысячами пользователей – Для обеспечения мгновенного доступа к профилям пользователя, продукта, информации о рекламной компании и т.д. Storage Nodes Data Center A Storage Nodes Data Center B NoSQLDB Driver Application NoSQLDB Driver Application
  • 33. Enterprise Metadata Management ETL BI Dashboards App ETL ETL Как считаются продажи? Что произойдет, если я поменяю эту таблицу? Какие отчеты используют данные с этого сервера? Sys Admin Руководитель Разрабочик BI Из какой системы пришли данные? Пользователь Какой отчет использует эти данные? CDC Hadoop Data Lake Data Steward Можно ли доверять источнику? ETL разрабочтик Я хочу провести эксперимент. Какие данные у меня есть в наличии? Data Scientist GG
  • 34. 34 Oracle Big Data Discovery Визуализация данных Hadoop find explore transform discover share
  • 35. Фактор 5: решения ISV Тестированы, оптимизированы и сертифицированы по программам Oracle Ready и Oracle Optimized 35
  • 36. Exadata Optimized «…Тест проводился на специально подготовленной среде с более чем 60 миллионами активных сделок. Необходимо было рассчитать как все прикладные витрины (кредитный, депозитный портфель, портфель ценных бумаг, реестр срочных сделок и ПФИ), так и большое количество специализированных витрин данных Всего менее чем за 1,5 часа было рассчитано 105 витрин данных. За аналогичный временной отрезок на стандартных процессорных мощностях происходит расчет по 300 тысячам договоров. …можно говорить о более чем 200-кратном росте производительности» ISV Банковский сектор
  • 37. Партнер с решением Big Data Appliance Optimized 37
  • 38. Контакты: http://www.partner.fors.ru http://www.exastack.ru 129626, Россия, Москва, Графский переулок, 14, корп. 2 Тел./Факс: +7 (495) 913-3-913 38 FORS Solution Center
  • 39. Information Management Reference Architecture Уровеньдоступакданным Бизнес аналитика Информаци- онные сервисы Простота и скорость загрузки данных Стоимость запроса к данным Уровень производительного доступа Фундаментальный слой данных (3N форма) Хранилище первичной информации Data Science Первичная информация хранится без всяких изменений Данные очищены, организованы в некоторую структуру, но абстрагированы от бизнес процессов Данные организованы в соответствии с требованиями бизнес процессов, для достижения максимальной производительности Исследование данных Среда разработки Исследование данных, выявление новых закономерностей Разработка взаимодействия всех слоев приложения Источники данных Мультиструктурные источники Контент Docs Web & Social Media SMS Структурированные Данные (из реляционных источников) Мастер данные Планирование и бюджетирование