SlideShare une entreprise Scribd logo
1  sur  42
Télécharger pour lire hors ligne
1 © NEC Corporation 2018
Data Platform for Hadoop のご紹介
2018年9月21日
AIプラットフォーム事業部 SDP-G
最新Hadoopによって開かれる
New Digital World!
もう遅いなんて言わせない!Hadoopで高速アドホック分析
世界初!Hadoop上で動作するベクトルプロセッサで高速分析
2018年10月16日
日本電気株式会社 井上 康博 y-inoue@ab.jp.nec.com
家志 門太 mon-yashi@yk.jp.nec.com
長谷部 賀洋 y-hasebe@ah.jp.nec.com
2 © NEC Corporation 2018
CIO・IT部門長ほかIT関係者のデジタル化に関する現状認識
74%の企業がデジタル化がビジネスに
破壊的影響をもたらすと考え、さらに
90%は欧米よりデジタル化が遅れてい
ると考えている *1
67%の企業が、レガシーシステムがデ
ジタル化の進展への対応の足かせになっ
ていると感じている *1
50%の企業が法規制が、デジタルビジ
ネスやデジタル化への対応推進の障害に
なっていると感じている *1
*1 「デジタル化の進展に対する意識調査」日本システムユーザー協会、野村総合研究所 システムコンサルティング事業本部、2017.5.18
74%
26%
67%
33%
50%50%
の影響拡大
3 © NEC Corporation 2018
New Data World! とは
共有可能な開かれたデータ
組織の壁 組織の壁 組織の壁 組織の壁
データの管理
データの活用
部門1 部門2 部門3
外部2外部1
セキュリティ
&
ガバナンス
アクセシビリティ
データで繋がり、共創
新たなインサイト発見!
4 © NEC Corporation 2018
データを最大限に活用するための要素
情報
データ
分析
攻撃
経営判断支援、顧客インサイト
の創出、リソースの効率化
防御
規制遵守、不正の検出・
抑制、データ漏洩の防止
複数の正確な
派生情報
唯一の正確な
情報源
わからないことを知り判断
(インサイト)
データを情報に変換
データを整備・管理
入手
できる
使える
守られ
ている
速く 正確に 簡単に
目的の設定 成果の検証
技術 & プロセス・ルール
デ
ー
タ
管
理
者
経営層
LOB
IT部門
5 © NEC Corporation 2018
データ活用サイクルと求められる「次世代データプラットフォーム」の機能
目的
の設定
成果の
チェック
データを活用の実行
次世代データプラットフォーム
ビッグデータ分析
分析設計
アルゴリズム
選択
データ
選択
プログラミング
分析実行
データ準
備
「使える」
データ
データ管理
ポリシー定義 活用・実行
データ
カタログ登録
収集 蓄積 処理
構造・非構造化
データ対応
ビッグデータの
高速検索
必要データへの
アクセスしやすさ
アクセスコント
ロール、来歴管理
新しい技術対応
PBクラスへの
スケールアウト
用途に適した形式
のデータ提供
外部システムとの
オープンな接続性
データの
リアルタイム処理
マルチ分析対応
6 © NEC Corporation 2018
次世代データプラットフォーム 構成機能マップ
次世代データプラットフォーム with Hadoop
自社 グループ会社 社外
AIエンジン
BA/BI 顧客360° 不正検知 コンプライアンス対応リスクマネジメント
データ
ソース
データ
活用
業務で更新・蓄積されているデータ(構造化)
顧客 販売 経理 購買 生産 開発 サポート
データ
管理・流通
常に流れているデータ(非構造化)
WEB
ログ
機械・設備
データ
外部情報
データ照合 照合結果
収集(リアル・バッチ)
蓄積
検索 データ整形・品質確保 データフロー
データカタログ
セキュリティ・ガバナンス
(アクセス制御・来歴管理)
マルチサイト
データ連携
データ要求 データ提供
データ分析DevOps環境
クラウド オンプレ
DWH
7 © NEC Corporation 2018
次世代データプラットフォーム with Hadoop
「HDF + HDP 」+ 「Tableau」で
ビッグデータ高速アドホック分析による
新たなインサイトを発見!
8 © NEC Corporation 2018
Tableau
HDF+HDP+Tableauで実現する次世代データプラットフォーム
 Tableauはローカルの独自DBへデータを作成すること
でパフォーマンスを実現。
 ビッグデータでの場合、ローカルに抽出することが出
来ずパフォーマンス上で問題あり。
HDF+HDP
によるモダン化
簡単に分析し、
ビジュアライズ可能
PC,モバイル 様々な
ツールで共有可能
+
HDF
構造・非構造データの簡単取り込み
HDP3.0(Hive+Druid)
ビッグデータへの直接接続+高速検索
9 © NEC Corporation 2018
NYタクシー
データ
53GB
3.4億レコード
デモの内容
支払方法と
その支払総額
ビッグデータの
高速検索
シナリオ1
 ボリュームデータ
からのインサイト
 Druidによる高速化
用途に適した形
式のデータ提供
シナリオ2
時刻・曜日ごと
乗客数(のべ数)
 Dimensionの事前
追加による高速化
構造・非構造化
データ対応
シナリオ3
天候(JSON)の
輸送距離への影響
 非構造を加えたイン
サイトの獲得
 事前のJOIN実行に
よる高速化
10 © NEC Corporation 2018
ビッグデータ高速アドホック分析 リファレンスアーキテクチャー(評価済)
ビッグデータ高速アドホック分析モデル
HDFS
Multitenant Processing - YARN
構造化データ
ERP/CRM
非構造化データ
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
11 © NEC Corporation 2018
デモの環境
▌評価環境(効果を確認するための最少環境)
マスターノード
・Ambari
・HDP Master
・HDP Client
ワーカーノード
・HDP Slave
・HDP Client
Tableau
ワーカーノード
・HDP Slave
・HDP Client
インストール済みサービス
• HDFS
• YARN + MapReduce2
• Tez
• Hive
• Pig
• Zookeeper
• Ambari Metrics
• Druid
• Superset
ワーカーノード
・HDP Slave
・HDP Client
• OS: Windows 2012 R2 for Tableau Server
• OS : Redhat Linux 7.5 for HDP cluster
• HDP 3.0.0
• Memory: 32GB RAM
• CPU:8 Core
• DISK 100GB
12 © NEC Corporation 2018
シナリオ1: 支払方法とその支払総額
Druidを活用し高速化
 “Live”接続でも快適なレスポンス
支払方法(“Payment Mode”)とその支払総額
Hive LLAP
(Druid未使用)
39秒
高速化の工夫
Druidの活用
Hive LLAP
(Druid使用)
16秒
2.4倍
高速化
13 © NEC Corporation 2018
シナリオ2: 時刻・曜日の乗客数(のべ数)の傾向
Druidのテーブルにカラムを追加し高速化
Timestamp型から曜日に変換
(負荷の高い処理)
Timestamp型から時間に変換
時間、曜日ごとに集計
Hive LLAP
(Druid使用)
258秒
高速化の工夫
時刻、曜日の
カラムを追加
Hive LLAP
(Druid使用)
14秒
17倍
高速化
14 © NEC Corporation 2018
シナリオ3: 天候データ(JSON形式)と乗客動向比較
異なるデータ形式の組み合わせ
乗客数データ
Hive LLAP
(Druid使用)
天候データ
Hive(JSON)
乗客数乗客数
乗客数乗客数
乗客数乗客数
乗客数乗客数
積雪量
積雪量
積雪量
積雪量
大雪(20cm位の積雪)の日
は乗客数が減る!?
15 © NEC Corporation 2018
シナリオ3: 天候データ(JSON形式)と乗客動向比較
 事前にJOINして、Druidに書き込高速化
Hive LLAP
(Druid使用)
72秒
高速化の工夫
事前にテーブル
をJOIN
Hive LLAP
(Druid使用)
24秒
3倍
高速化
16 © NEC Corporation 2018
参考:スタースキーマベンチマークの実行結果
OLAP CUBE
へ変換
SSB クエリ実行
Fact
table
Dimension
table
Dimension
table
Dimension
table
Dimension
table
正規化されたスタースキーマ型のテーブル
Hive LLAP
(Druid未使用)
Hive LLAP
(Druid使用)
OLAP cube
クエリー実行時間を98%削減
(Hortonworksとの共同検証結果)
SSB クエリ実行
Hive LLAP(Druid未使用) Hive LLAP(Druid使用)
17 © NEC Corporation 2018
Druid Tips
(1)Dimensionでないカラムを用いて集計しない
変換するなどして新たに生成した項目に基づいて集計する場合は、テーブルを
作成する時点でその項目をDimensionとして追加しておくこと(※シナリオ2)
(2)JOINを行ってからデータを格納
JOINが苦手なので(可能であれば)JOINが必要そうなテーブルは事前に
テーブルをJOINしてからDruidにデータを格納する。(※シナリオ3)
 DruidはOLAP用のCubeを構成し、Dimensionに対する集計処理を高速化する
システムであり、適切な使い方をすることでパフォーマンスの向上が可能
※Dimensionとはテーブルのカラムのうち、分析軸として選択するもの
18 © NEC Corporation 2018
まとめ
データのサイズと種別の悩みから解放された
高速アドホック分析で新たなインサイトを発見!
(組織の枠を超えたデータの活用)
 Live接続でHadoopのサーバリ
ソースを使用する!
リソースの制約からビッグデータ
を対象とした分析が困難
 LLAP + Druidで高速レスポンス!
• 事前にDimensionを適正に設定
• 事前に必要なテーブルをJOIN
Live接続時に快適な応答が得ら
れない
(アドホック分析は厳しい)
これまで 最新Hadoopの活用
Tableau
HDP
(Hadoop)
19 © NEC Corporation 2018
NECとHortonworksが検証済みの
次世代データプラットフォーム
20 © NEC Corporation 2018
Data Platform for Hadoop
※HDF : Hortonworks DataFlow , HDP : Hortonworks Data Platform
ビッグデータ活用基盤
プロフェッショナル
サービス
データ収集 データ処理・蓄積 データ分析
HDP※HDF※ 分析ツール
アドホック分析
セルフサービスBI
データ集約
リアルタイム
データ取り込み
分散
コンピューティング
分散
ストレージ
Red Hat Enterprise Linux
データガバナンス・セキュリティ
分析エンジン
データのインテグレーション・分析
設計サービス
構築サービス
拡張/アップグレード
セ
キ
ュ
リ
テ
ィ
&
ガ
バ
ナ
ン
ス
リ
ア
ル
タ
イ
ム
分
析
デ
ー
タ
見
え
る
化
デ
ー
タ
マ
イ
グ
レ
ー
シ
ョ
ン
デ
ー
タ
イ
ン
テ
グ
レ
ー
シ
ョ
ン
基盤ライフサイクルの維持
検証済みソフトウェア&ハードウェア
業務
システム
Web 等
21 © NEC Corporation 2018
10月15日にHortonworks x NECが共同プレスリリースを発表
ビッグデータ向け高速分析プラットフォームを共同開発
SX-Aurora TSUBASAのYARNへの対応
Hortonworks NEC
2018年10月15日共同プレスリリース
•Apache Hadoop/Spark上で
「SX-Aurora TSUBASA」のリソースが利用可能となる
•NECのAIミドルウェア「Flovedis」と「Data Platform
for Hadoop」を組み合わせたソリューションの提供
共同発表内容
22 © NEC Corporation 2018
NECのHadoop/Sparkデジタルプラットフォームの特長
DX時代の
最適なデータ分析
プラットフォームの
短期導入と
その環境の維持
事前評価済みの
システムとサービス
分析要件に基づく
最適なデータ
インテグレーション
とプリパレーション
最新テクノロジーを活用した
検証済みリファレンスモデル
に基づくサービス
コンプライアンス*
を遵守する
データアクセス制御
とデータガバナンス
最新ニーズに対応した
導入経験に基づくサービス
*GDPRなど
Hortonworks認証済み「システム」
最新技術の検証とPB基盤の導入運用に基づく「サービス」
23 © NEC Corporation 2018
Centre of Excellence for Analytics Platform & Solutions
日本とインドをコアに
COEチーム Hadoopプロフェッショナルが
お客様のデジタル化実現をグローバルにサポート
2017年6月 インドにグローバルビッグデータ分析事業のコアとしてCOEを設立
Analytics &
Consulting
Presales
Technical
Research & POC
Design &
Development
System
Integration
Implementation
Support
Singapore
Philippines
France
India
Japan
24 © NEC Corporation 2018
NEC Hadoop/Spark情報
『Data Platform for Hadoop』で検索
https://jpn.nec.com/slpf/product/dph/index.html
Hadoop/Spark体験
オリジナル・チュートリアル
(WEBにて登録必要)
Hadoop/Spark
活用方法の紹介
DX実現に向けたデータ活用
冊子
(WEBにて登録必要)
Hadoopが簡単にわかる
• サンプルデータ
• スクリプト
• マニュアル付き
• 事例付
DXの取り組み方がわかる
25 © NEC Corporation 2018
世界初!Hadoop上で動作するベクトルプロセッサで高速分析!
カード型ベクトルエンジン「SX-Aurora TSUBASA」
 新開発ベクトルプロセッサ(8コア)
 PCIe規格準拠
 GPGPUと異なる実行モデル、Fortran/C/C++の標準環境
 演算性能:2.45TF(倍精度),4.91TF(単精度)
 メモリ帯域 1.22TB/s(世界一)
 メモリ容量 48GB
26 © NEC Corporation 2018
SX-Aurora TSUBASAのYARN対応の狙い
 Data Platform for Hadoopの大量データの収集・蓄積能力とSX-Aurora
TSUBASAの高性能データ分析能力により、真のAI/BD処理基盤が完成する
 Hadoop上でSX-Aurora TSUBASAのリソース管理が一元的に可能
 タスクやアプリケーションの実行の最適化が全体で可能となる
データ
処理・蓄積
Data Platform for Hadoop
Mllib
Frovedis
SX-Aurora TSUBASA
+
データ分析
データ
収集
YARN
同じYARNの
配下で管理
スーパーコンピューターをNECの技術
で1枚のカードにダウンサイジング
SX-ACE(HPC)
27 © NEC Corporation 2018
 レコメンデーション
 過去の購買履歴や思考/行動の似た人から顧客の好みを推測し、製
品やサービスの紹介を行う
 売上実績だけでなく、レコメンデーション情報も活用した需要予測
で物流・在庫管理を最適化
 損害保険/生命保険
 事故や病気を起こしやすい人の傾向を見つけアドバイスを行う
 人が事故現場に赴き損害を判定していたのを、事故画像を解析し自
動で損害度合いを判定する
 医療・ヘルスケア
 罹患率の高い生活習慣や行動パターンを見つけ、予防医療を行う
 患者の症状と過去に蓄積した症例や論文を比較・解析し医師の判断
を助ける
AI/Bigdata分析の価値
 これからのデータ分析は膨大なデータを活用し更なる未知の法則の発見や
予測の精度向上を行うことで、ビジネスの差別化に繋げていくことが重要
想定ユースケース
非構造データ
構造データ
画像・映像 音声
SNSログ/センサ
売上データ 顧客情報
28 © NEC Corporation 2018
AI/Bigdata分析における課題と解決策
 より大きな価値を求め、データサイエンティストの負担が増えていく
→ データ処理/分析の高速化により、学習・探索の待ち時間を減らす
次世代データ分析基盤
Data Platform for
Hadoop
SX-Aurora
TSUBASA
+
収集
大量データを処理
大量データを分析
蓄積
処理
分析
分析の繰り返し処理やデータ探索
(マイニング)の高性能化を実現する
プラットフォームを提供する
様々なデータの組み合わせの
中から未知の規則性を見つける
様々なデータやパラメーターを
試し、最適な学習結果を得る
十分な予測精度
未知の知見
29 © NEC Corporation 2018
ユースケース例:レコメンデーション
▌概要・背景(小売:商品レコメンデーション)
 ECサイトなどにおいて、行動履歴や購入情報などをもとに顧客の趣味趣向
に合わせた商品をレコメンデーション表示
 レコメンデーションからの購入率が高く、精度の高さが売上に大きく影響
▌課題
 レコメンデーションの精度を高める為により多くの情報を学習させたい
 学習に時間がかかり、完了したときには鮮度が古くなってしまう
▌解決策
 スパコン技術を活用した高速処理によりXeonサーバ上での計算と比較して
40倍以上の高速化を実現
▌期待される効果
 短期間で学習が完了するため、より鮮度の高い情報をもとにレコメンデー
ション
 より多くの情報を学習出来、レコメンデーション精度が向上
試作機での評価:
Xeon (Gold 6126) 1ソケット 対 ベクトルエンジン1基
[*] ロジスティック回帰はCriteoが公開しているデータの1/4を用
い(6GB)。
K-meansと特異値分解は英文Wikipedia全文(10GB)。いずれもI/O
時間を含まない
Spark互換ミドルウェア
“Frovedis”
31 © NEC Corporation 2018
SX-Aurora TSUBASAの適応領域と応用例
統計型機械学習はメモリバンド幅の広いSX-Aurora TSUBASAが得意とする分野
ピーク演算性能
汎用CPU
ロジスティック回帰
クラスタリング
AI(機械学習)
ベクトル
翻訳 (LSTM)
汎用 (MLP)
特異値分解
GPU
Web広告最適化
与信審査
需要予測
商品レコメンド
人材マッチング
文章分類
不正取引検知
マルウェア検知
コールセンター
オペレータ支援
犯罪予測
自動運転
画像認識 (CNN)
音声認識 (RNN)
深層学習
(Deep Learning)
統計型
機械学習
メ
モ
リ
バ
ン
ド
幅
32 © NEC Corporation 2018
Sparkの機械学習を高速化するミドルウェア:Frovedis
 Spark/Pythonからベクトルを意識せず利用可能なミドルウェア
 SX-Aurora TSUBASAのメモリ性能を生かし、統計型機械学習を高速化
▌ベクトル化済みの機械学習/行列演算機能を用意(Spark Mllib,前処理機能)
 SX-Aurora TSUBASAの性能を、直ぐにフル活用できる
 機械学習ライブラリ (Spark MLlib)
• 行列演算ライブラリ(疎行列中心)、回帰、ロジスティック回帰、線形SVM、ALS、K-means、
特異値分解などを用意、逐次拡張中
 Data Frame (前処理機能)
• 前処理に用いる表操作を提供:select, filter, sort, join, group by/aggregate
ベクトル
エンジン
x86
プロセッサ
Spark
Python
Server
RPC
33 © NEC Corporation 2018
Frovedis
▌Frovedis: Sparkと互換性を持つNECが開発したミドルウェア
 Sparkのオリジナルのソースコードを3行変えるだけで実行可能
 NECでOSS化しており、下記のリンク先で公開中
https://github.com/frovedis
Original Spark program: logistic regression
…
import org.apache.spark.mllib.classification.LogisticRegressionWithSGD
…
val model = LogisticRegressionWithSGD.train(data)
…
…
import com.nec.frovedis.mllib.classificaiton.LogisticRegressionWithSGD
…
FrovedisServer.initialize(...)
val model = LogisticRegressionWithSGD.train(data)
FrovedisServer.shut_down()
…
Change to call NEC middleware implementation
Change import
Start/Stop
server
Same API
(no change)
※ FRamework Of VEctorized and DIStributed data analytics
34 © NEC Corporation 2018
Frovedis + SX-Aurora TSUBASAの性能
▌x86上のSparkと機械学習にかかる実行時間を比較:
試作機での評価:Xeon (Gold 6126) 1ソケット 対 ベクトルエンジン1基
ミドルウェアの効率の良さと、ベクトル型コンピュータを用いた高速化により、40倍以上の高速化を確認
113倍
43倍
57倍
[*] ロジスティック回帰はCriteoが公開しているデータの1/4を用いた(6GB)。
K-meansと特異値分解は英文Wikipedia全文(10GB)。いずれもI/O時間を含まない
SX-Aurora TSUBASA製品概要
36 © NEC Corporation 2018
NECのベクトルコンピューターの歴史
NECはベクトルコンピューターの“SXシリーズ”
を継続的に市場に投入性能
1990 2000 2010
SX-2
SX-3
SX-6
SX-8
SX-9
SX-4
SX-5
SX-ACE
Earth Simulator
SX-7
Earth Simulator
2
Earth Simulator
3
Vector Engine
(PCI card)
高性能だが…
• 大きい
• 高価である
35年間に培ってきたベクタテクノロ
ジを1枚のPCIeカードに集積
Change!
37 © NEC Corporation 2018
SX-Aurora TSUBASAの特長
(従来のスパコン)
ラック
スーパーコンピューターを
NECの技術でダウンサイジング
超高性能
使いやすさ
フレキシブル
ベクトル技術で大量データの一括処理を実現
し、Xeon比10倍以上の性能を実現
専門知識不要で、コンパイルして実行する
だけで高い性能を享受可能
C/C++/Fortranで開発可能
お客様ニーズに従い、サーバ/エンジン
構成選択可能、C/P最適化、適応市場拡大
タワー
38 © NEC Corporation 2018
① 超高性能:世界最速ベクトルプロセッサ
世界最速コア
307GFlops(DP)
614GFlops(SP)
世界最速のデータアクセス性能
1.2TB/s
テクノロジー
世界初HBM2 x6実装
ベクトルプロセッサ
2017年10月現在、NEC調べ
2017年10月現在、NEC調べ
キャッシュ 16MB
コア コア コア コア
コア コア コア コア
1.2TB/s
39 © NEC Corporation 2018
② 使いやすさ:実行環境
コンパイラ
自動ベクトル化機能 自動並列化機能
Fortran: F2003, F2008(制限あり)
C: C11
C++: C++14
OpenMP: OpenMP4.5
MPI: MPI3.1
$ vi sample.c
$ ncc sample.c
$ ./a.out
x86
プログラム環境
アプリケーション実行環境
40 © NEC Corporation 2018
③ フレキシブル:様々な用途を想定した幅広いラインアップ
 ベクトルエンジンの超高性能を、組込み用途から大規模データセンタ対応
まで幅広く提供し、利用範囲を拡大
データセンタモデル
データセンタ、計算センタでの巨大処理
例:大規模AI・ビッグデータ、
大規模シミュレーションなど
オンサイトモデル
製造業などのシミュレーション、AI・ビッグ
データ利用
例:大規模需要予測、
製造シミュレーションなど
エッジモデル&組込みソリューション
AI・ビッグデータ・システム組込み用途
例:製品検査、医療画像処理、需要予測、
レーダ解析など
データセンタモデル(水冷)
オンサイトモデル
エッジモデル
1VE搭載
2VE搭載 4VE搭載 8VE搭載
64VE搭載
組込みソリューション
ユーザ様専用システム SX-Aurora TSUBASA
標準価格:1億2千万~
標準価格:270万~
標準価格:170万~
41 © NEC Corporation 2018
contact@dph.jp.nec.com
ご要望、ご質問がございましたら
コチラからお問い合わせ願います。
New Digital World - NEC

Contenu connexe

Tendances

[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...Insight Technology, Inc.
 
Red Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM sessionRed Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM sessionShinichiro Arai
 
HDInsight & CosmosDB - Global IoT · Big data processing infrastructure
HDInsight & CosmosDB - Global IoT · Big data processing infrastructureHDInsight & CosmosDB - Global IoT · Big data processing infrastructure
HDInsight & CosmosDB - Global IoT · Big data processing infrastructureDataWorks Summit
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Insight Technology, Inc.
 
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]Insight Technology, Inc.
 
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...Insight Technology, Inc.
 
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 Insight Technology, Inc.
 
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...NTT DATA Technology & Innovation
 
難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?Insight Technology, Inc.
 
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Mineaki Motohashi
 
Multi-Cloud Integration with Data Virtualization (Japanese)
Multi-Cloud Integration with Data Virtualization (Japanese)Multi-Cloud Integration with Data Virtualization (Japanese)
Multi-Cloud Integration with Data Virtualization (Japanese)Denodo
 
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...Insight Technology, Inc.
 
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Hortonworks Japan
 
Hadoop Summit 2016 San Jose レポート
Hadoop Summit 2016  San Jose レポートHadoop Summit 2016  San Jose レポート
Hadoop Summit 2016 San Jose レポートKimihiko Kitase
 
Accelerate Migration to the Cloud using Data Virtualization
Accelerate Migration to the Cloud using Data VirtualizationAccelerate Migration to the Cloud using Data Virtualization
Accelerate Migration to the Cloud using Data VirtualizationDenodo
 
[db tech showcase Tokyo 2018] #dbts2018 #C13 『IoT からクラウドで活用される Hybrid Data を高...
[db tech showcase Tokyo 2018] #dbts2018 #C13 『IoT からクラウドで活用される Hybrid Data を高...[db tech showcase Tokyo 2018] #dbts2018 #C13 『IoT からクラウドで活用される Hybrid Data を高...
[db tech showcase Tokyo 2018] #dbts2018 #C13 『IoT からクラウドで活用される Hybrid Data を高...Insight Technology, Inc.
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナーmtanaka0111
 
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...オラクルエンジニア通信
 

Tendances (20)

[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
 
Red Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM sessionRed Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM session
 
HDInsight & CosmosDB - Global IoT · Big data processing infrastructure
HDInsight & CosmosDB - Global IoT · Big data processing infrastructureHDInsight & CosmosDB - Global IoT · Big data processing infrastructure
HDInsight & CosmosDB - Global IoT · Big data processing infrastructure
 
Case study of DevOps for Hadoop in Recruit.
Case study of DevOps for Hadoop in Recruit.Case study of DevOps for Hadoop in Recruit.
Case study of DevOps for Hadoop in Recruit.
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
 
The real world use of Big Data to change business
The real world use of Big Data to change businessThe real world use of Big Data to change business
The real world use of Big Data to change business
 
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
 
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
 
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
 
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
 
難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?
 
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
 
Multi-Cloud Integration with Data Virtualization (Japanese)
Multi-Cloud Integration with Data Virtualization (Japanese)Multi-Cloud Integration with Data Virtualization (Japanese)
Multi-Cloud Integration with Data Virtualization (Japanese)
 
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
 
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
 
Hadoop Summit 2016 San Jose レポート
Hadoop Summit 2016  San Jose レポートHadoop Summit 2016  San Jose レポート
Hadoop Summit 2016 San Jose レポート
 
Accelerate Migration to the Cloud using Data Virtualization
Accelerate Migration to the Cloud using Data VirtualizationAccelerate Migration to the Cloud using Data Virtualization
Accelerate Migration to the Cloud using Data Virtualization
 
[db tech showcase Tokyo 2018] #dbts2018 #C13 『IoT からクラウドで活用される Hybrid Data を高...
[db tech showcase Tokyo 2018] #dbts2018 #C13 『IoT からクラウドで活用される Hybrid Data を高...[db tech showcase Tokyo 2018] #dbts2018 #C13 『IoT からクラウドで活用される Hybrid Data を高...
[db tech showcase Tokyo 2018] #dbts2018 #C13 『IoT からクラウドで活用される Hybrid Data を高...
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナー
 
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
 

Similaire à New Digital World - NEC

[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data PlatformNaoki (Neo) SATO
 
Expectations and reality of hybrid cloud
Expectations and reality of hybrid cloudExpectations and reality of hybrid cloud
Expectations and reality of hybrid cloudNaoki Yonezu
 
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~Developers Summit
 
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)Ryusuke Ashiya
 
Wagby で100+ のクラウドデータに連携するアプリを開発(CData JDBC Drivers)
Wagby で100+ のクラウドデータに連携するアプリを開発(CData JDBC Drivers)Wagby で100+ のクラウドデータに連携するアプリを開発(CData JDBC Drivers)
Wagby で100+ のクラウドデータに連携するアプリを開発(CData JDBC Drivers)CData Software Japan
 
データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供Denodo
 
Datrium high performance_virtual_infra_community
Datrium high performance_virtual_infra_communityDatrium high performance_virtual_infra_community
Datrium high performance_virtual_infra_communitydatriumjapan
 
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みリクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みRecruit Technologies
 
要求開発アライアンス 9月定例会議
要求開発アライアンス 9月定例会議要求開発アライアンス 9月定例会議
要求開発アライアンス 9月定例会議Atsushi Takayasu
 
JPC2018[A4]Reimagine your business ~Microsoft Cloud/AI でビジネスを再構築
JPC2018[A4]Reimagine your business ~Microsoft Cloud/AI でビジネスを再構築JPC2018[A4]Reimagine your business ~Microsoft Cloud/AI でビジネスを再構築
JPC2018[A4]Reimagine your business ~Microsoft Cloud/AI でビジネスを再構築MPN Japan
 
IOT and Lean Manifacturing
IOT and Lean ManifacturingIOT and Lean Manifacturing
IOT and Lean ManifacturingOsaka University
 
【Japan Partner Conference 2019】Microsoft Azure と AI で加速するデジタル改革
【Japan Partner Conference 2019】Microsoft Azure と AI で加速するデジタル改革【Japan Partner Conference 2019】Microsoft Azure と AI で加速するデジタル改革
【Japan Partner Conference 2019】Microsoft Azure と AI で加速するデジタル改革日本マイクロソフト株式会社
 
リクルート式Hadoopの使い方
リクルート式Hadoopの使い方リクルート式Hadoopの使い方
リクルート式Hadoopの使い方Recruit Technologies
 
Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力NTT DATA OSS Professional Services
 
BigQueryを活用したPrivate DMPを作って使ってるお話
BigQueryを活用したPrivate DMPを作って使ってるお話BigQueryを活用したPrivate DMPを作って使ってるお話
BigQueryを活用したPrivate DMPを作って使ってるお話Masato Kawada
 
Node-REDのノード開発容易化ツール Node generator
Node-REDのノード開発容易化ツールNode generatorNode-REDのノード開発容易化ツールNode generator
Node-REDのノード開発容易化ツール Node generatorBMXUG
 
Cedec2015 ゲームサーバー基盤の新しい選択肢
Cedec2015 ゲームサーバー基盤の新しい選択肢Cedec2015 ゲームサーバー基盤の新しい選択肢
Cedec2015 ゲームサーバー基盤の新しい選択肢Maho Takara
 
Part 5: "製品の変革" を支える基盤サービス (製造リファレンス・アーキテクチャ勉強会)
Part 5: "製品の変革" を支える基盤サービス (製造リファレンス・アーキテクチャ勉強会)Part 5: "製品の変革" を支える基盤サービス (製造リファレンス・アーキテクチャ勉強会)
Part 5: "製品の変革" を支える基盤サービス (製造リファレンス・アーキテクチャ勉強会)Takeshi Fukuhara
 

Similaire à New Digital World - NEC (20)

[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
 
Expectations and reality of hybrid cloud
Expectations and reality of hybrid cloudExpectations and reality of hybrid cloud
Expectations and reality of hybrid cloud
 
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
 
ビッグデータ活用とサーバー基盤
ビッグデータ活用とサーバー基盤ビッグデータ活用とサーバー基盤
ビッグデータ活用とサーバー基盤
 
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
 
Wagby で100+ のクラウドデータに連携するアプリを開発(CData JDBC Drivers)
Wagby で100+ のクラウドデータに連携するアプリを開発(CData JDBC Drivers)Wagby で100+ のクラウドデータに連携するアプリを開発(CData JDBC Drivers)
Wagby で100+ のクラウドデータに連携するアプリを開発(CData JDBC Drivers)
 
データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供
 
Datrium high performance_virtual_infra_community
Datrium high performance_virtual_infra_communityDatrium high performance_virtual_infra_community
Datrium high performance_virtual_infra_community
 
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みリクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
 
要求開発アライアンス 9月定例会議
要求開発アライアンス 9月定例会議要求開発アライアンス 9月定例会議
要求開発アライアンス 9月定例会議
 
JPC2018[A4]Reimagine your business ~Microsoft Cloud/AI でビジネスを再構築
JPC2018[A4]Reimagine your business ~Microsoft Cloud/AI でビジネスを再構築JPC2018[A4]Reimagine your business ~Microsoft Cloud/AI でビジネスを再構築
JPC2018[A4]Reimagine your business ~Microsoft Cloud/AI でビジネスを再構築
 
IOT and Lean Manifacturing
IOT and Lean ManifacturingIOT and Lean Manifacturing
IOT and Lean Manifacturing
 
【Japan Partner Conference 2019】Microsoft Azure と AI で加速するデジタル改革
【Japan Partner Conference 2019】Microsoft Azure と AI で加速するデジタル改革【Japan Partner Conference 2019】Microsoft Azure と AI で加速するデジタル改革
【Japan Partner Conference 2019】Microsoft Azure と AI で加速するデジタル改革
 
リクルート式Hadoopの使い方
リクルート式Hadoopの使い方リクルート式Hadoopの使い方
リクルート式Hadoopの使い方
 
Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力
 
BigQueryを活用したPrivate DMPを作って使ってるお話
BigQueryを活用したPrivate DMPを作って使ってるお話BigQueryを活用したPrivate DMPを作って使ってるお話
BigQueryを活用したPrivate DMPを作って使ってるお話
 
Node-REDのノード開発容易化ツール Node generator
Node-REDのノード開発容易化ツールNode generatorNode-REDのノード開発容易化ツールNode generator
Node-REDのノード開発容易化ツール Node generator
 
Cedec2015 ゲームサーバー基盤の新しい選択肢
Cedec2015 ゲームサーバー基盤の新しい選択肢Cedec2015 ゲームサーバー基盤の新しい選択肢
Cedec2015 ゲームサーバー基盤の新しい選択肢
 
Part 5: "製品の変革" を支える基盤サービス (製造リファレンス・アーキテクチャ勉強会)
Part 5: "製品の変革" を支える基盤サービス (製造リファレンス・アーキテクチャ勉強会)Part 5: "製品の変革" を支える基盤サービス (製造リファレンス・アーキテクチャ勉強会)
Part 5: "製品の変革" を支える基盤サービス (製造リファレンス・アーキテクチャ勉強会)
 
CData Drivers for PCA 概要
CData Drivers for PCA 概要CData Drivers for PCA 概要
CData Drivers for PCA 概要
 

Plus de DataWorks Summit

Floating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache RatisFloating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache RatisDataWorks Summit
 
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFiTracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFiDataWorks Summit
 
HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...DataWorks Summit
 
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...DataWorks Summit
 
Managing the Dewey Decimal System
Managing the Dewey Decimal SystemManaging the Dewey Decimal System
Managing the Dewey Decimal SystemDataWorks Summit
 
Practical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist ExamplePractical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist ExampleDataWorks Summit
 
HBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at UberHBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at UberDataWorks Summit
 
Scaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and PhoenixScaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and PhoenixDataWorks Summit
 
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFiBuilding the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFiDataWorks Summit
 
Supporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability ImprovementsSupporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability ImprovementsDataWorks Summit
 
Security Framework for Multitenant Architecture
Security Framework for Multitenant ArchitectureSecurity Framework for Multitenant Architecture
Security Framework for Multitenant ArchitectureDataWorks Summit
 
Presto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything EnginePresto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything EngineDataWorks Summit
 
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...DataWorks Summit
 
Extending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google CloudExtending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google CloudDataWorks Summit
 
Event-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFiEvent-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFiDataWorks Summit
 
Securing Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache RangerSecuring Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache RangerDataWorks Summit
 
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...DataWorks Summit
 
Computer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near YouComputer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near YouDataWorks Summit
 
Big Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache SparkBig Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache SparkDataWorks Summit
 

Plus de DataWorks Summit (20)

Data Science Crash Course
Data Science Crash CourseData Science Crash Course
Data Science Crash Course
 
Floating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache RatisFloating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache Ratis
 
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFiTracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
 
HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...
 
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
 
Managing the Dewey Decimal System
Managing the Dewey Decimal SystemManaging the Dewey Decimal System
Managing the Dewey Decimal System
 
Practical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist ExamplePractical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist Example
 
HBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at UberHBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at Uber
 
Scaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and PhoenixScaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and Phoenix
 
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFiBuilding the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFi
 
Supporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability ImprovementsSupporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability Improvements
 
Security Framework for Multitenant Architecture
Security Framework for Multitenant ArchitectureSecurity Framework for Multitenant Architecture
Security Framework for Multitenant Architecture
 
Presto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything EnginePresto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything Engine
 
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
 
Extending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google CloudExtending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google Cloud
 
Event-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFiEvent-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFi
 
Securing Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache RangerSecuring Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache Ranger
 
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
 
Computer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near YouComputer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near You
 
Big Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache SparkBig Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
 

Dernier

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 

Dernier (10)

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 

New Digital World - NEC

  • 1. 1 © NEC Corporation 2018 Data Platform for Hadoop のご紹介 2018年9月21日 AIプラットフォーム事業部 SDP-G 最新Hadoopによって開かれる New Digital World! もう遅いなんて言わせない!Hadoopで高速アドホック分析 世界初!Hadoop上で動作するベクトルプロセッサで高速分析 2018年10月16日 日本電気株式会社 井上 康博 y-inoue@ab.jp.nec.com 家志 門太 mon-yashi@yk.jp.nec.com 長谷部 賀洋 y-hasebe@ah.jp.nec.com
  • 2. 2 © NEC Corporation 2018 CIO・IT部門長ほかIT関係者のデジタル化に関する現状認識 74%の企業がデジタル化がビジネスに 破壊的影響をもたらすと考え、さらに 90%は欧米よりデジタル化が遅れてい ると考えている *1 67%の企業が、レガシーシステムがデ ジタル化の進展への対応の足かせになっ ていると感じている *1 50%の企業が法規制が、デジタルビジ ネスやデジタル化への対応推進の障害に なっていると感じている *1 *1 「デジタル化の進展に対する意識調査」日本システムユーザー協会、野村総合研究所 システムコンサルティング事業本部、2017.5.18 74% 26% 67% 33% 50%50% の影響拡大
  • 3. 3 © NEC Corporation 2018 New Data World! とは 共有可能な開かれたデータ 組織の壁 組織の壁 組織の壁 組織の壁 データの管理 データの活用 部門1 部門2 部門3 外部2外部1 セキュリティ & ガバナンス アクセシビリティ データで繋がり、共創 新たなインサイト発見!
  • 4. 4 © NEC Corporation 2018 データを最大限に活用するための要素 情報 データ 分析 攻撃 経営判断支援、顧客インサイト の創出、リソースの効率化 防御 規制遵守、不正の検出・ 抑制、データ漏洩の防止 複数の正確な 派生情報 唯一の正確な 情報源 わからないことを知り判断 (インサイト) データを情報に変換 データを整備・管理 入手 できる 使える 守られ ている 速く 正確に 簡単に 目的の設定 成果の検証 技術 & プロセス・ルール デ ー タ 管 理 者 経営層 LOB IT部門
  • 5. 5 © NEC Corporation 2018 データ活用サイクルと求められる「次世代データプラットフォーム」の機能 目的 の設定 成果の チェック データを活用の実行 次世代データプラットフォーム ビッグデータ分析 分析設計 アルゴリズム 選択 データ 選択 プログラミング 分析実行 データ準 備 「使える」 データ データ管理 ポリシー定義 活用・実行 データ カタログ登録 収集 蓄積 処理 構造・非構造化 データ対応 ビッグデータの 高速検索 必要データへの アクセスしやすさ アクセスコント ロール、来歴管理 新しい技術対応 PBクラスへの スケールアウト 用途に適した形式 のデータ提供 外部システムとの オープンな接続性 データの リアルタイム処理 マルチ分析対応
  • 6. 6 © NEC Corporation 2018 次世代データプラットフォーム 構成機能マップ 次世代データプラットフォーム with Hadoop 自社 グループ会社 社外 AIエンジン BA/BI 顧客360° 不正検知 コンプライアンス対応リスクマネジメント データ ソース データ 活用 業務で更新・蓄積されているデータ(構造化) 顧客 販売 経理 購買 生産 開発 サポート データ 管理・流通 常に流れているデータ(非構造化) WEB ログ 機械・設備 データ 外部情報 データ照合 照合結果 収集(リアル・バッチ) 蓄積 検索 データ整形・品質確保 データフロー データカタログ セキュリティ・ガバナンス (アクセス制御・来歴管理) マルチサイト データ連携 データ要求 データ提供 データ分析DevOps環境 クラウド オンプレ DWH
  • 7. 7 © NEC Corporation 2018 次世代データプラットフォーム with Hadoop 「HDF + HDP 」+ 「Tableau」で ビッグデータ高速アドホック分析による 新たなインサイトを発見!
  • 8. 8 © NEC Corporation 2018 Tableau HDF+HDP+Tableauで実現する次世代データプラットフォーム  Tableauはローカルの独自DBへデータを作成すること でパフォーマンスを実現。  ビッグデータでの場合、ローカルに抽出することが出 来ずパフォーマンス上で問題あり。 HDF+HDP によるモダン化 簡単に分析し、 ビジュアライズ可能 PC,モバイル 様々な ツールで共有可能 + HDF 構造・非構造データの簡単取り込み HDP3.0(Hive+Druid) ビッグデータへの直接接続+高速検索
  • 9. 9 © NEC Corporation 2018 NYタクシー データ 53GB 3.4億レコード デモの内容 支払方法と その支払総額 ビッグデータの 高速検索 シナリオ1  ボリュームデータ からのインサイト  Druidによる高速化 用途に適した形 式のデータ提供 シナリオ2 時刻・曜日ごと 乗客数(のべ数)  Dimensionの事前 追加による高速化 構造・非構造化 データ対応 シナリオ3 天候(JSON)の 輸送距離への影響  非構造を加えたイン サイトの獲得  事前のJOIN実行に よる高速化
  • 10. 10 © NEC Corporation 2018 ビッグデータ高速アドホック分析 リファレンスアーキテクチャー(評価済) ビッグデータ高速アドホック分析モデル HDFS Multitenant Processing - YARN 構造化データ ERP/CRM 非構造化データ … … … … … … … … … … … … … … … … … … … …
  • 11. 11 © NEC Corporation 2018 デモの環境 ▌評価環境(効果を確認するための最少環境) マスターノード ・Ambari ・HDP Master ・HDP Client ワーカーノード ・HDP Slave ・HDP Client Tableau ワーカーノード ・HDP Slave ・HDP Client インストール済みサービス • HDFS • YARN + MapReduce2 • Tez • Hive • Pig • Zookeeper • Ambari Metrics • Druid • Superset ワーカーノード ・HDP Slave ・HDP Client • OS: Windows 2012 R2 for Tableau Server • OS : Redhat Linux 7.5 for HDP cluster • HDP 3.0.0 • Memory: 32GB RAM • CPU:8 Core • DISK 100GB
  • 12. 12 © NEC Corporation 2018 シナリオ1: 支払方法とその支払総額 Druidを活用し高速化  “Live”接続でも快適なレスポンス 支払方法(“Payment Mode”)とその支払総額 Hive LLAP (Druid未使用) 39秒 高速化の工夫 Druidの活用 Hive LLAP (Druid使用) 16秒 2.4倍 高速化
  • 13. 13 © NEC Corporation 2018 シナリオ2: 時刻・曜日の乗客数(のべ数)の傾向 Druidのテーブルにカラムを追加し高速化 Timestamp型から曜日に変換 (負荷の高い処理) Timestamp型から時間に変換 時間、曜日ごとに集計 Hive LLAP (Druid使用) 258秒 高速化の工夫 時刻、曜日の カラムを追加 Hive LLAP (Druid使用) 14秒 17倍 高速化
  • 14. 14 © NEC Corporation 2018 シナリオ3: 天候データ(JSON形式)と乗客動向比較 異なるデータ形式の組み合わせ 乗客数データ Hive LLAP (Druid使用) 天候データ Hive(JSON) 乗客数乗客数 乗客数乗客数 乗客数乗客数 乗客数乗客数 積雪量 積雪量 積雪量 積雪量 大雪(20cm位の積雪)の日 は乗客数が減る!?
  • 15. 15 © NEC Corporation 2018 シナリオ3: 天候データ(JSON形式)と乗客動向比較  事前にJOINして、Druidに書き込高速化 Hive LLAP (Druid使用) 72秒 高速化の工夫 事前にテーブル をJOIN Hive LLAP (Druid使用) 24秒 3倍 高速化
  • 16. 16 © NEC Corporation 2018 参考:スタースキーマベンチマークの実行結果 OLAP CUBE へ変換 SSB クエリ実行 Fact table Dimension table Dimension table Dimension table Dimension table 正規化されたスタースキーマ型のテーブル Hive LLAP (Druid未使用) Hive LLAP (Druid使用) OLAP cube クエリー実行時間を98%削減 (Hortonworksとの共同検証結果) SSB クエリ実行 Hive LLAP(Druid未使用) Hive LLAP(Druid使用)
  • 17. 17 © NEC Corporation 2018 Druid Tips (1)Dimensionでないカラムを用いて集計しない 変換するなどして新たに生成した項目に基づいて集計する場合は、テーブルを 作成する時点でその項目をDimensionとして追加しておくこと(※シナリオ2) (2)JOINを行ってからデータを格納 JOINが苦手なので(可能であれば)JOINが必要そうなテーブルは事前に テーブルをJOINしてからDruidにデータを格納する。(※シナリオ3)  DruidはOLAP用のCubeを構成し、Dimensionに対する集計処理を高速化する システムであり、適切な使い方をすることでパフォーマンスの向上が可能 ※Dimensionとはテーブルのカラムのうち、分析軸として選択するもの
  • 18. 18 © NEC Corporation 2018 まとめ データのサイズと種別の悩みから解放された 高速アドホック分析で新たなインサイトを発見! (組織の枠を超えたデータの活用)  Live接続でHadoopのサーバリ ソースを使用する! リソースの制約からビッグデータ を対象とした分析が困難  LLAP + Druidで高速レスポンス! • 事前にDimensionを適正に設定 • 事前に必要なテーブルをJOIN Live接続時に快適な応答が得ら れない (アドホック分析は厳しい) これまで 最新Hadoopの活用 Tableau HDP (Hadoop)
  • 19. 19 © NEC Corporation 2018 NECとHortonworksが検証済みの 次世代データプラットフォーム
  • 20. 20 © NEC Corporation 2018 Data Platform for Hadoop ※HDF : Hortonworks DataFlow , HDP : Hortonworks Data Platform ビッグデータ活用基盤 プロフェッショナル サービス データ収集 データ処理・蓄積 データ分析 HDP※HDF※ 分析ツール アドホック分析 セルフサービスBI データ集約 リアルタイム データ取り込み 分散 コンピューティング 分散 ストレージ Red Hat Enterprise Linux データガバナンス・セキュリティ 分析エンジン データのインテグレーション・分析 設計サービス 構築サービス 拡張/アップグレード セ キ ュ リ テ ィ & ガ バ ナ ン ス リ ア ル タ イ ム 分 析 デ ー タ 見 え る 化 デ ー タ マ イ グ レ ー シ ョ ン デ ー タ イ ン テ グ レ ー シ ョ ン 基盤ライフサイクルの維持 検証済みソフトウェア&ハードウェア 業務 システム Web 等
  • 21. 21 © NEC Corporation 2018 10月15日にHortonworks x NECが共同プレスリリースを発表 ビッグデータ向け高速分析プラットフォームを共同開発 SX-Aurora TSUBASAのYARNへの対応 Hortonworks NEC 2018年10月15日共同プレスリリース •Apache Hadoop/Spark上で 「SX-Aurora TSUBASA」のリソースが利用可能となる •NECのAIミドルウェア「Flovedis」と「Data Platform for Hadoop」を組み合わせたソリューションの提供 共同発表内容
  • 22. 22 © NEC Corporation 2018 NECのHadoop/Sparkデジタルプラットフォームの特長 DX時代の 最適なデータ分析 プラットフォームの 短期導入と その環境の維持 事前評価済みの システムとサービス 分析要件に基づく 最適なデータ インテグレーション とプリパレーション 最新テクノロジーを活用した 検証済みリファレンスモデル に基づくサービス コンプライアンス* を遵守する データアクセス制御 とデータガバナンス 最新ニーズに対応した 導入経験に基づくサービス *GDPRなど Hortonworks認証済み「システム」 最新技術の検証とPB基盤の導入運用に基づく「サービス」
  • 23. 23 © NEC Corporation 2018 Centre of Excellence for Analytics Platform & Solutions 日本とインドをコアに COEチーム Hadoopプロフェッショナルが お客様のデジタル化実現をグローバルにサポート 2017年6月 インドにグローバルビッグデータ分析事業のコアとしてCOEを設立 Analytics & Consulting Presales Technical Research & POC Design & Development System Integration Implementation Support Singapore Philippines France India Japan
  • 24. 24 © NEC Corporation 2018 NEC Hadoop/Spark情報 『Data Platform for Hadoop』で検索 https://jpn.nec.com/slpf/product/dph/index.html Hadoop/Spark体験 オリジナル・チュートリアル (WEBにて登録必要) Hadoop/Spark 活用方法の紹介 DX実現に向けたデータ活用 冊子 (WEBにて登録必要) Hadoopが簡単にわかる • サンプルデータ • スクリプト • マニュアル付き • 事例付 DXの取り組み方がわかる
  • 25. 25 © NEC Corporation 2018 世界初!Hadoop上で動作するベクトルプロセッサで高速分析! カード型ベクトルエンジン「SX-Aurora TSUBASA」  新開発ベクトルプロセッサ(8コア)  PCIe規格準拠  GPGPUと異なる実行モデル、Fortran/C/C++の標準環境  演算性能:2.45TF(倍精度),4.91TF(単精度)  メモリ帯域 1.22TB/s(世界一)  メモリ容量 48GB
  • 26. 26 © NEC Corporation 2018 SX-Aurora TSUBASAのYARN対応の狙い  Data Platform for Hadoopの大量データの収集・蓄積能力とSX-Aurora TSUBASAの高性能データ分析能力により、真のAI/BD処理基盤が完成する  Hadoop上でSX-Aurora TSUBASAのリソース管理が一元的に可能  タスクやアプリケーションの実行の最適化が全体で可能となる データ 処理・蓄積 Data Platform for Hadoop Mllib Frovedis SX-Aurora TSUBASA + データ分析 データ 収集 YARN 同じYARNの 配下で管理 スーパーコンピューターをNECの技術 で1枚のカードにダウンサイジング SX-ACE(HPC)
  • 27. 27 © NEC Corporation 2018  レコメンデーション  過去の購買履歴や思考/行動の似た人から顧客の好みを推測し、製 品やサービスの紹介を行う  売上実績だけでなく、レコメンデーション情報も活用した需要予測 で物流・在庫管理を最適化  損害保険/生命保険  事故や病気を起こしやすい人の傾向を見つけアドバイスを行う  人が事故現場に赴き損害を判定していたのを、事故画像を解析し自 動で損害度合いを判定する  医療・ヘルスケア  罹患率の高い生活習慣や行動パターンを見つけ、予防医療を行う  患者の症状と過去に蓄積した症例や論文を比較・解析し医師の判断 を助ける AI/Bigdata分析の価値  これからのデータ分析は膨大なデータを活用し更なる未知の法則の発見や 予測の精度向上を行うことで、ビジネスの差別化に繋げていくことが重要 想定ユースケース 非構造データ 構造データ 画像・映像 音声 SNSログ/センサ 売上データ 顧客情報
  • 28. 28 © NEC Corporation 2018 AI/Bigdata分析における課題と解決策  より大きな価値を求め、データサイエンティストの負担が増えていく → データ処理/分析の高速化により、学習・探索の待ち時間を減らす 次世代データ分析基盤 Data Platform for Hadoop SX-Aurora TSUBASA + 収集 大量データを処理 大量データを分析 蓄積 処理 分析 分析の繰り返し処理やデータ探索 (マイニング)の高性能化を実現する プラットフォームを提供する 様々なデータの組み合わせの 中から未知の規則性を見つける 様々なデータやパラメーターを 試し、最適な学習結果を得る 十分な予測精度 未知の知見
  • 29. 29 © NEC Corporation 2018 ユースケース例:レコメンデーション ▌概要・背景(小売:商品レコメンデーション)  ECサイトなどにおいて、行動履歴や購入情報などをもとに顧客の趣味趣向 に合わせた商品をレコメンデーション表示  レコメンデーションからの購入率が高く、精度の高さが売上に大きく影響 ▌課題  レコメンデーションの精度を高める為により多くの情報を学習させたい  学習に時間がかかり、完了したときには鮮度が古くなってしまう ▌解決策  スパコン技術を活用した高速処理によりXeonサーバ上での計算と比較して 40倍以上の高速化を実現 ▌期待される効果  短期間で学習が完了するため、より鮮度の高い情報をもとにレコメンデー ション  より多くの情報を学習出来、レコメンデーション精度が向上 試作機での評価: Xeon (Gold 6126) 1ソケット 対 ベクトルエンジン1基 [*] ロジスティック回帰はCriteoが公開しているデータの1/4を用 い(6GB)。 K-meansと特異値分解は英文Wikipedia全文(10GB)。いずれもI/O 時間を含まない
  • 31. 31 © NEC Corporation 2018 SX-Aurora TSUBASAの適応領域と応用例 統計型機械学習はメモリバンド幅の広いSX-Aurora TSUBASAが得意とする分野 ピーク演算性能 汎用CPU ロジスティック回帰 クラスタリング AI(機械学習) ベクトル 翻訳 (LSTM) 汎用 (MLP) 特異値分解 GPU Web広告最適化 与信審査 需要予測 商品レコメンド 人材マッチング 文章分類 不正取引検知 マルウェア検知 コールセンター オペレータ支援 犯罪予測 自動運転 画像認識 (CNN) 音声認識 (RNN) 深層学習 (Deep Learning) 統計型 機械学習 メ モ リ バ ン ド 幅
  • 32. 32 © NEC Corporation 2018 Sparkの機械学習を高速化するミドルウェア:Frovedis  Spark/Pythonからベクトルを意識せず利用可能なミドルウェア  SX-Aurora TSUBASAのメモリ性能を生かし、統計型機械学習を高速化 ▌ベクトル化済みの機械学習/行列演算機能を用意(Spark Mllib,前処理機能)  SX-Aurora TSUBASAの性能を、直ぐにフル活用できる  機械学習ライブラリ (Spark MLlib) • 行列演算ライブラリ(疎行列中心)、回帰、ロジスティック回帰、線形SVM、ALS、K-means、 特異値分解などを用意、逐次拡張中  Data Frame (前処理機能) • 前処理に用いる表操作を提供:select, filter, sort, join, group by/aggregate ベクトル エンジン x86 プロセッサ Spark Python Server RPC
  • 33. 33 © NEC Corporation 2018 Frovedis ▌Frovedis: Sparkと互換性を持つNECが開発したミドルウェア  Sparkのオリジナルのソースコードを3行変えるだけで実行可能  NECでOSS化しており、下記のリンク先で公開中 https://github.com/frovedis Original Spark program: logistic regression … import org.apache.spark.mllib.classification.LogisticRegressionWithSGD … val model = LogisticRegressionWithSGD.train(data) … … import com.nec.frovedis.mllib.classificaiton.LogisticRegressionWithSGD … FrovedisServer.initialize(...) val model = LogisticRegressionWithSGD.train(data) FrovedisServer.shut_down() … Change to call NEC middleware implementation Change import Start/Stop server Same API (no change) ※ FRamework Of VEctorized and DIStributed data analytics
  • 34. 34 © NEC Corporation 2018 Frovedis + SX-Aurora TSUBASAの性能 ▌x86上のSparkと機械学習にかかる実行時間を比較: 試作機での評価:Xeon (Gold 6126) 1ソケット 対 ベクトルエンジン1基 ミドルウェアの効率の良さと、ベクトル型コンピュータを用いた高速化により、40倍以上の高速化を確認 113倍 43倍 57倍 [*] ロジスティック回帰はCriteoが公開しているデータの1/4を用いた(6GB)。 K-meansと特異値分解は英文Wikipedia全文(10GB)。いずれもI/O時間を含まない
  • 36. 36 © NEC Corporation 2018 NECのベクトルコンピューターの歴史 NECはベクトルコンピューターの“SXシリーズ” を継続的に市場に投入性能 1990 2000 2010 SX-2 SX-3 SX-6 SX-8 SX-9 SX-4 SX-5 SX-ACE Earth Simulator SX-7 Earth Simulator 2 Earth Simulator 3 Vector Engine (PCI card) 高性能だが… • 大きい • 高価である 35年間に培ってきたベクタテクノロ ジを1枚のPCIeカードに集積 Change!
  • 37. 37 © NEC Corporation 2018 SX-Aurora TSUBASAの特長 (従来のスパコン) ラック スーパーコンピューターを NECの技術でダウンサイジング 超高性能 使いやすさ フレキシブル ベクトル技術で大量データの一括処理を実現 し、Xeon比10倍以上の性能を実現 専門知識不要で、コンパイルして実行する だけで高い性能を享受可能 C/C++/Fortranで開発可能 お客様ニーズに従い、サーバ/エンジン 構成選択可能、C/P最適化、適応市場拡大 タワー
  • 38. 38 © NEC Corporation 2018 ① 超高性能:世界最速ベクトルプロセッサ 世界最速コア 307GFlops(DP) 614GFlops(SP) 世界最速のデータアクセス性能 1.2TB/s テクノロジー 世界初HBM2 x6実装 ベクトルプロセッサ 2017年10月現在、NEC調べ 2017年10月現在、NEC調べ キャッシュ 16MB コア コア コア コア コア コア コア コア 1.2TB/s
  • 39. 39 © NEC Corporation 2018 ② 使いやすさ:実行環境 コンパイラ 自動ベクトル化機能 自動並列化機能 Fortran: F2003, F2008(制限あり) C: C11 C++: C++14 OpenMP: OpenMP4.5 MPI: MPI3.1 $ vi sample.c $ ncc sample.c $ ./a.out x86 プログラム環境 アプリケーション実行環境
  • 40. 40 © NEC Corporation 2018 ③ フレキシブル:様々な用途を想定した幅広いラインアップ  ベクトルエンジンの超高性能を、組込み用途から大規模データセンタ対応 まで幅広く提供し、利用範囲を拡大 データセンタモデル データセンタ、計算センタでの巨大処理 例:大規模AI・ビッグデータ、 大規模シミュレーションなど オンサイトモデル 製造業などのシミュレーション、AI・ビッグ データ利用 例:大規模需要予測、 製造シミュレーションなど エッジモデル&組込みソリューション AI・ビッグデータ・システム組込み用途 例:製品検査、医療画像処理、需要予測、 レーダ解析など データセンタモデル(水冷) オンサイトモデル エッジモデル 1VE搭載 2VE搭載 4VE搭載 8VE搭載 64VE搭載 組込みソリューション ユーザ様専用システム SX-Aurora TSUBASA 標準価格:1億2千万~ 標準価格:270万~ 標準価格:170万~
  • 41. 41 © NEC Corporation 2018 contact@dph.jp.nec.com ご要望、ご質問がございましたら コチラからお問い合わせ願います。