SlideShare une entreprise Scribd logo
1  sur  51
Bigdata Architecture for Azure
概論
1. Big Data Architecture 概論
1. はじめに
2. データレイク
3. 分散処理技術
4. ワークロード分離(PaaS指向、CQRS)
5. 分析におけるセマンティック層
6. ラムダアーキテクチャ
7. データストアの選択・使い分け
8. Azure ソリューション
アジェンダ
Big Data Architecture 概論
はじめに
4
データを取扱うシステムの分類と一般的特徴
基幹系システム
特徴
(≒考慮事項)
情報系システム
少
Volume
データ量 大
単
Variety
システム内で扱うデータ形式 複
短
Velocity
発生から消費まで 長
多
Concurrency
同時アクセス 少
小
Cost
費用 大
ERP CRM
MES
DataLakeDWH
いわゆるビッグデータの3V
従来の情報基盤におけるデータ処理の課題
データ収集 データ加工 データ蓄積 データ分析データソース
ETL DWH
ダッシュボード
レポート
リレーショナル
データベース
ニーズ:
業務システムがサイロ化しているため、
分析のために業務データを集約した DWH
が
必要であった
現状認識や課題:
• リレーショナル データベース (DWH/DM) を中核とした情報基
盤
• 増大するデータや新たなデータ形式の扱いに、処理能力が対応
できない
• 新たなデータ分析のニーズに適応できない
新たな情報基盤の考え方
- Big Data Reference Architecture
データ収集 データ加工データ蓄積 データ活用データソース
ダッシュボード
レポート
ML/DL
リレーショナル
データベース
ファイル
半構造化・非構造
化データ
メッセージ
ストリームデータ
Batch Layer
(Cold Path)
Service
Layer
リアルタイム
アプリケーション
Speed Layer
(Hot Path)
ニーズ:
業務データのみでなく、センサーデータ
や画像など様々な形式のデータを扱え、
かつリアルタイムなデータ処理も可能な
基盤が必要となる
方針:ラムダ アーキテクチャ等の ビッグデータアーキ
テクチャ ※
• データの処理頻度やデータサイズに応じた処理形式にデータフ
ローを分ける
• データ形式に応じたデータストアを活用する (構造化データ:
リレーショナル、
半構造化、非構造化データ:NoSQL、 Document Db 等)
• データソースのデータはそのままの蓄積し、必要な時に加工し
て利用する
参考URL: http://lambda-architecture.net/ https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/
アーキテクチャ検討の出発点
データソース
リレーショナル
データベース
データ加
工
データ蓄
積
データ収
集
従来の分析システムにおける論理コンポーネント
データ分
析
データレイク
多種形式(Variety)への対応
9
データレイクの考え方
これまでの分析 ← → これからの分析
• ユーザによる活用 (分
析) シナリオを想定し、
そこからデータ蓄積
先の
スキーマを設計
• 業務システムからは、
そのシナリオ実現の
ためにETLで「デー
タ」抽出
• 想定に含まれなかっ
た「データ」の周辺
データは埋没
Schema-on-Write
• 将来のあらゆる分
析要件に対応する
ために、すべての
データを、
可能な限りネイ
ティブフォーマッ
トのまま蓄積
• 利用時にはじめて
スキーマ・データ
構造を定義し、
Read を実施
Schema-on-Read
abe, 95, 46, 85, 85
itoh, 89, 72, 46, 76,
34
ueda, 95, 13, 57, 63,
87
emoto, 50, 68, 38,
85, 98
otsuka, 13, 16, 67,
100, 7
katase, 42, 61, 90,
11, 33
{"name" : "cat",
"count" : 105}
{"name" : "dog",
"count" : 81}
{"name" : "rabbit",
"count" : 2030}
{"name" : "turtle",
"count" : 1550}
{"name" : "tiger",
"count" : 300}
{"name" : "lion",
"count" : 533}
{"name" : "whale",
"count" : 2934}
xxx.xxx.xxx.xxx - -
[27/Jan/2018:14:20:17
+0000] "GET
/item/giftcards/3720
HTTP/1.1" 200 70 "-"
"Mozilla/5.0
(Windows NT 6.1;
WOW64; rv:10.0.1)
Gecko/20100101
Firefox/10.0.1"
ネイティブフォーマットを、そのまま蓄積
SELECT ~~~ FROM ~~~
WHERE ~~~ ORDER BY ~~~;
利用時にデータ構造を定義
10
ストレージ総保有コスト
の低下
ETLからELTへのトレンド変遷
これまでの分析(ETL) ← → これからの分析(ELT)
• さまざまなソースからデータを収集し、ビジネス
ルールに従ってデータを変換し、宛先データ スト
アに読み込むために使用
• フィルター処理、並べ替え、集計、データ結合、
データ クレンジング、重複除去、
データ検証など
• ネイティブフォーマットのデータを、そのまま
蓄積し、独立した変換エンジンを使用する代わ
りに、データ ストア側(もしくは近辺)の処理
機能で変換
11
データ蓄
積
(DataLake)
アーキテクチャの再検討
データソース
リレーショナル
データベース
多種形式(Variety)への対応
ファイル
メッセージ
ETLからELTへ
様々な形式のデータソースをData Lakeで蓄積
データ加
工
データ連
携
データ分
析
分散処理テクノロジー
大規模データ(Volume)への対応
13
ビッグデータ処理技術のトレンド変遷
• データ量の増大
• 非構造データへの対応
• 求められる処理能力
Hadoop 分散処理フレームワークの利用
クラスタ管理の煩雑さ
繰り返し処理時の非効率性
高速インタラクティブ処理への要望(機械学習)
• インメモリ高速分散処理基盤
• Hadoopの不得意な部分に改善を加え、
ビッグデータに対するバッチ処理/リ
アルタイム処理/インタラクティブ分
析(繰り返し処理)を高速実現
14
15
Disk
現代のDWHのアーキテクチャ
• OLTP処理向けの従来のDBMS製品でのスタン
ダード
• ディスク、メモリが複数のCPUに共有される
→CPU性能の頭打ちなどの背景から、ビッグデータ
に対する大量処理要件を満たすことができなく
なった
CPU CPU CPU
Shared Memory
Worker Node
CPU
Memory
Disk
・・・
Disk
Worker Node
CPU
Memory
Control Node
ABC XYZ
・・・
ABC…XYZ
SMP (対称型マルチプロセッシング ) MPP (超並列処理)
• ビッグデータに対応するDWH製品でのスタンダー
ド
• ディスク、メモリは各ノードで独立(Shared
Nothing)
• データは分配され、それぞれのノードで並列に処
理される
• Control Nodeがクエリの分配、整合性をチェック
Shared Disk型の構造 Shared Nothing型の構造
ビッグデータへの対応
列指向ストレージ
• OLTPシステム向けの従来のストレージシステム
• データ(ブロック)は1レコードを構成する複数列
が格納される
• 集計クエリでは特定のカラム集計値もすべてのカラ
ムをリードする必要がある
• DWHなど分析システム向けのストレージシステム
• データ(ブロック)は複数行にまたがって一つの列
が格納される
• 分析クエリでは通常少数の列しか利用しないため、
必要なスキャンのみを実施可能
行指向ストレージ 列指向ストレージ
参考:https://www.slideshare.net/nttdata-tech/bigdata-storage-layer-software-nttdata
対象列 対象列対象列 対象列
• 一般に圧縮効率はユニークなデータが少ないほど高効率となる
• 列指向ストレージでは列ごとのデータ形式となるため、同じ値
が頻出することが多く(カーディナリティが低い)、データ圧
縮の効果が高い
列指向ストレージによる圧縮の効率化
ID ユーザ名 都市 性別
1 AAA Tokyo 男
2 BBB Osaka 女
3 CCC Nagoya 男
同一のデータが頻出
列のデータ型毎に最適な圧縮技法を利用可能
ワークロード分離(PaaS指向、CQRS)
18
PaaS指向による独立スケーリングと適切なテクノロジー導入
19
オンプレミス クラウド
(PaaS)
• 汎用性を重視した製品選定
• 部分的な需要の増加に対して全
体を拡張する
• コンポーネントの要求に合わせたサービス選
択・細分化
• 需要増加したコンポーネントを部分的に拡張
• 新機能の導入≒サービスの追加
→特にデータ基盤では処理と提供のワークロー
ドを切り分けることで性能が改善するケースが
書き込みクエリ、読み取りクエリが混在
書き込み処理→Hadoop,Spark
読み取り処理→SQL クエリ
分離
データストアにおける、UpdateとReadの操作を分離する手法
CQRS(コマンド クエリ責務分離 )パターン
• 更新スキーマと読み取りスキーマが異なる
→Select、SUMしたい情報≠更新すべき列
• 混在ワークロードの影響
→パフォーマンス、データ競合
従来のCRUD対応システム CQRSパターン
• 最適なスキーマ
→更新用スキーマ、読み取り用スキーマ
• アクセス制御の分離
→Viewとベーステーブルに個別の権限実装
データストアにおける、UpdateとReadの操作を分離する手法
CQRS(コマンド クエリ責務分離 )パターン
• 更新スキーマと読み取りスキーマが異なる
→Select、SUMしたい情報≠更新すべき列
• 混在ワークロードの影響
→パフォーマンス、データ競合
従来のCRUD対応システム CQRSパターン
• 最適なスキーマ
→更新用スキーマ、読み取り用スキーマ
• アクセス制御の分離
→ストアごとに個別の権限実装
• 個別のストアの独立スケーリング
→PaaSの利用により簡易に実現
• 適材適所原則から異種のテクノロジー利用可能
→書き込みストアにNoSQL,読み取りストアに
RDBなど
分離
分析におけるセマンティック層
22
23
可視化・分析に際して
BIシステムはDWHだけで成立するわけではなく、実際にDWH上の
データを可視化・分析するためには、本来様々な前提知識・機能作
成が必要
???
• DWHに対するSQL作成
• 難解な物理名の判別
• データ同士のリレーション構造
• アクセス制御
24
BIシステム内での役割分離
一般的にBIシステムでは可視化の際、業務ユーザーとDWHをつなぐ
「セマンティック層」(=データマート)を提供している
Reporting
Semantic Layer
Data Warehouse
Data Sources
ビジネスユーザーの分析を支援するためのセ
マンティックモデルの役割
• ビジネスロジック
• リレーション構造のモデリング
• 行レベルでのデータアクセス制御
• データ取得先に対するクエリの作成・
発行
• 物理名から分析用の名称の変換
• 多言語対応
…etc.
一般にBIツールがカバーする範囲
BIセマンティックモデル
※DWH上のViewで構成される場合も多い
データ統合
クエリ結果取得
OLAP分析操作
25
セマンティックモデルの利点
1. ビジネスユーザの利便性向上
• 複雑な物理名ではなく、ビジネスニーズのための命名
SalesResultProfit -> Profit
2. 共通モデルを利用することによる結果の保証
• 同一ビジネスロジック、同一リレーション
• 作業者によって計算結果が異なるなどの問題を防ぐ
3. セキュリティポリシー対応
• データの分離
• ユーザアクセス制御
• 同レポートをユーザごとに見せる範囲を変えたい、など
26
補足:セマンティック層の実装方式
方式
DWHで保持 BIサーバ BIツールに内包
RDB上のMaterialized Viewなどで結合
済みの表を作成
リレーションシップ、メジャーを定義したOLAPモデルを作成
特徴
• 最もコストの高い結合操作をあら
かじめ計算しておく
• 性能はDWHに完全依存する
• DWH開発者による開発
• 専用サーバにデータをキャッシュ
しておく
• 製品により差分更新、グローバル
な負荷分散など機能が多い
• モデル開発者による開発
• BIツール内の専用領域にデータを
キャッシュしておく
• BIサーバと比較すると負荷分散な
どが苦手なケースあり
• ビジネスユーザ側で作成している
ことが多い
大規模データ(Volume)への対応
アーキテクチャの再検討
参考URL: https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/
データソース
リレーショナル
データベース
ファイル
メッセージ
並列分散
処理
分析データ
ストア
(書込/読取)
データ収
集
BI レポート
(集計分析)
(機械学習)
・
セルフサー
ビス
BI
データ蓄積
(Data Lake)
分散処理と
PaaS指向による独立したスケーリング
ラムダアーキテクチャ
高頻度データへの対応(Velocity)
28
29
ビッグデータ処理基盤における2種類の処理
蓄積 処理 提供連携
ビッグデータアーキテクチャを検討する上で、データフローはホットパスとコールドパスの2つに大別
できます。Bigdata分析ではそれぞれのパスの分析を両立させる必要があります
Big Data基盤における一般的なアーキテクチャ
• スピードレイヤ(速報データ)とバッチレイヤ(蓄積データ)により、リアルタイム分析と時系列分析を両立
• バッチレイヤで生データを保持し(DataLake)、ビジネスロジック変更後の再計算が可能
ラムダアーキテクチャ
https://docs.microsoft.com/ja-jp/azure/architecture/data-guide/big-data/#lambda-architecture
データソース
Hot Path
Cold Path
ストリー
ム処理
参考URL: https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/
データソース
リレーショナル
データベース
ファイル
メッセージ
データ蓄積
Data Lake
バッチ処
理
(並列分散
処理基盤)
分析データ
ストア
(書/読)
BI レポート
(集計分析)
(機械学習)
・
セルフサー
ビス
BI
データ
収集
リアルタイ
ム
インジェス
ト
リアルタイ
ム
ダッシュ
ボード
(異常検知)
分析データ
ストア
(書/読)
2種類のパスにコンポーネントを分割・最適化
データストアの選択・使い分け
32
ストリー
ム処理
参考URL: https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/
データソース
リレーショナル
データベース
ファイル
メッセージ
データ蓄積
Data Lake
バッチ処
理
(並列分散
処理基盤)
分析データ
ストア
(書/読)
BI レポート
(集計分析)
(機械学習)
・
セルフサー
ビス
BI
データ
収集
リアルタイ
ム
インジェス
ト
リアルタイ
ム
ダッシュ
ボード
(異常検知)
分析データ
ストア
(書/読)
34
データストアの使い分け
利用者の要件に合わせた提供方法
• 提供頻度、形式の考慮
• どのような鮮度のデータを提供すべきか、利用したいBIツール、アプリケーションに適した形式はなに
かを検討することが重要
• ワークロード分離
• データストア使い分けによる、個別での性能最適化
アプリケーション
ML/DL
BI
35
データストアの使い分け
Cold Pathにおける負荷分散
• セマンティック層の有効利用
• キャッシュ
• 複数の分析ユーザは類似のデータを必要とすることが多いため、事前キャッシュが有効
• 分離スケール
• DWHとは個別に、読み取りに特化したスケールアウト、スケールアップ対応が可能
キャッシュ済みデータ
による高速応答
キャッシュ外データに
は直接クエリ
データソース
キャッシュ
キャッシュ済みモデル
…
セマンティック層可視化
スケールアウト
36
データストアの使い分け
HotPathにおける負荷分散
• ランダムWriteとランダムRead
• 大規模データの定期的な一括書き込みを実行するDWHに対して、リアルタイム分析では小規模なデー
タ書き込みが高頻度で発生する。
NoSQLはスケールアウト(負荷分散)に優れ、RDBはBI用途などの複雑な結合クエリに強いためCQRS
の具体例として下記のような構成が考えられる。(ただし、トレードオフとしてNoSQL-RDB間の同期
処理)
アプリケーション
アプリケーション
アプリケーション
レポート
複数ノードで
負荷分散
レポート用のスキーマに
定型化、結合クエリ対応
ストリー
ム処理
参考URL: https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/
データソース
リレーショナル
データベース
ファイル
メッセージ
Data Lake
バッチ処
理
(並列分散
処理基盤)
分析データ
ストア
(書/読)
BI レポート
(集計分析)
(機械学習)
・
セルフサー
ビス
BI
データ
収集
リアルタイ
ム
インジェス
ト
リアルタイ
ム
ダッシュ
ボード
(異常検知)
分析データ
ストア
(書/読)
データカタログ
オーケストレーション
役割 Azure AWS(参考) その他(参考)
データレイク
オーケストレー
ション
データ収集 -
バッチ処理
分析データスト
ア(コールドパ
ス)
Azure Databricks
Data Factory
Azure
Analysis Services
Azure
Synapse Analytics
SQL Pool
Amazon Redshift
AWS Glue
Databricks (3rd Party)HDInsight Amazon EMR
Storage Accounts Amazon Simple Storage Service (S3)
役割 Azure AWS(参考) その他(参考)
リアルタイム
インジェスト
ストリーム処理
分析データスト
ア(ホットパ
ス)
ストリーム処理
+分析データス
トア(ホットパ
ス)
+可視化
- -
Azure IoT Hub Event Hubs
Azure DatabricksAzure Stream Analytics
Azure Cosmos DB Azure SQL Database
Time Series Insights
AWS IoT
Amazon Kinesis
Amazon Kinesis
Amazon DynamoDB Amazon RDS
役割 Azure AWS(参考) その他(参考)
データカタログ
可視化
セルフサービス
BI
機械学習
DevOps
クエリエンジン
Data Catalog
Power BI
Machine Learning
Azure Dev Ops
https://docs.microsoft.com/ja-jp/azure/architecture/aws-professional/services
Amazon SageMaker
Amazon QuickSight
AWS Glue
Azure
Synapse Analytics(SQL On-demand)
Amazon Athena
CodeCommit CodeDeploy
CodePipelineCodeBuild
41
Azure Solution
Modern Data Warehouse
“データウェアハウスにすべての
データを集約したい”
Advanced Analytics
“ロスト危機にある顧客を
特定したい”
Realtime Analytics
“リアルタイムで端末機器から
インサイトを得たい”
42
Modern Data Warehouse
Data Factory Data Lake Storage
Analysis Services
or
Databricks
Synapse
Analytics
Power BI
Services
そのまま コピー
Or
Spark ETL(GUI)
Spark ETL生データの保存
大量クライアントの
負荷分散
Power BI
Dataset
43
Advanced Analytics
Databricks
Power BI
Services
実験、学習、スコアリング
Machine Learning
Data Factory
Synapse
Analytics
Data Lake Storage
Container
Service
モデルデプロイ
Application
Power BI
Dataset
Analysis Services
or
44
Advanced Analytics
Databricks
Power BI
Services
実験、学習、スコアリング
Machine Learning
Data Factory
Synapse
Analytics
Data Lake Storage
Container
Service
モデルデプロイ
Application
Analysis Services
or
Power BI
Dataset
45
Realtime Analytics
Data Factory
Databricks
Power BI
Services
Cosmos DBStream Analytics Realtime
Application
Synapse
Analytics
Event Hubs
リアルタイムにデータ連携
Event , Telemetry
IoT hub
データレイクへの蓄積
世界規模の分散即時集計書き込み
リアルタイム情報可視化
長期的・大規模データの分析Data Lake Storage
Power BI
Dataset
Analysis Services
or
46
Realtime Analytics
Data Factory
Databricks
Power BI
Services
Cosmos DBStream Analytics Realtime
Application
Synapse
Analytics
Event Hubs
リアルタイムにデータ連携
Event , Telemetry
IoT hub
データレイクへの蓄積
世界規模の分散即時集計書き込み
リアルタイム情報可視化
長期的・大規模データの分析Data Lake Storage
Power BI
Dataset
Analysis Services
or
データが到着す
ると、ほぼリア
ルタイムでその
データを分析
毎時または毎日
バッチ処理を実
行し、大量デー
タを分析
役割 Azure AWS(参考) その他(参考)
データレイク
オーケストレー
ション
データ収集 -
バッチ処理
分析データスト
ア(コールドパ
ス) Azure
Analysis Services
Azure
Synapse Analytics
Amazon Redshift
AWS Glue
Databricks (3rd Party)Amazon EMR
Storage Accounts Amazon Simple Storage Service (S3)
48
Azure Synapse Analytics MDW
Azure Synapse Analytics
Synapse Pipeline
SQL Pool
Spark PoolData Lake Storage
そのまま コピー or
Spark ETL(GUI)
On-Demand クエリ
Spark ETL
Overview Data Develop MonitorOrchestrate Manage
Synapse Studio
統合管理 Power BI
Dataset
Analysis Services
or
49
Azure Synapse Analytics ML
Azure Synapse Analytics
Synapse Pipeline
SQL Pool
Spark PoolData Lake Storage
そのまま コピー or
Spark ETL(GUI)
On-Demand クエリ
Spark ETL
Overview Data Develop MonitorOrchestrate Manage
Synapse Studio
統合管理
Machine Learning
実験、学習、スコアリング
Container
Service
モデルデプロイ
Application
Power BI
Dataset
Analysis Services
or
50
Azure Synapse Analytics Lambda
Cosmos DBEvent Hubs
リアルタイム情報可視化
リアルタイムにデータ連携 世界規模の分散
Azure Synapse Analytics
Synapse Pipeline
Event , Telemetry
Application
SQL Pool
Spark PoolData Lake Storage
そのまま コピー or
Spark ETL(GUI)
On-Demand クエリ
Spark ETL
Overview Data Develop MonitorOrchestrate Manage
Synapse Studio
統合管理
データレイクへの蓄積
即時集計書き込み
長期的・大規模データの分析
IoT hub
Stream Analytics
Power BI
Dataset
Analysis Services
or
51
Azure Synapse Analytics Lambda
Cosmos DBEvent Hubs
リアルタイム情報可視化
リアルタイムにデータ連携 世界規模の分散
Azure Synapse Analytics
Synapse Pipeline
Event , Telemetry
Application
SQL Pool
Spark PoolData Lake Storage
そのまま コピー or
Spark ETL(GUI)
On-Demand クエリ
Spark ETL
Overview Data Develop MonitorOrchestrate Manage
Synapse Studio
統合管理
データレイクへの蓄積
即時集計書き込み
長期的・大規模データの分析
IoT hub
Stream Analytics
Power BI
Dataset
Analysis Services
or

Contenu connexe

Tendances

Synapse lakedatabase
Synapse lakedatabaseSynapse lakedatabase
Synapse lakedatabaseRyoma Nagata
 
データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門Satoru Ishikawa
 
20191001 AWS Black Belt Online Seminar AWS Lake Formation
20191001 AWS Black Belt Online Seminar AWS Lake Formation 20191001 AWS Black Belt Online Seminar AWS Lake Formation
20191001 AWS Black Belt Online Seminar AWS Lake Formation Amazon Web Services Japan
 
一歩先行く Azure Computing シリーズ(全3回) 第2回 Azure VM どれを選ぶの? Azure VM 集中講座
一歩先行く Azure Computing シリーズ(全3回) 第2回 Azure VM どれを選ぶの? Azure VM 集中講座一歩先行く Azure Computing シリーズ(全3回) 第2回 Azure VM どれを選ぶの? Azure VM 集中講座
一歩先行く Azure Computing シリーズ(全3回) 第2回 Azure VM どれを選ぶの? Azure VM 集中講座Minoru Naito
 
今こそ知りたい!Microsoft Azureの基礎
今こそ知りたい!Microsoft Azureの基礎今こそ知りたい!Microsoft Azureの基礎
今こそ知りたい!Microsoft Azureの基礎Trainocate Japan, Ltd.
 
ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)NTT DATA Technology & Innovation
 
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQLAmazon Web Services Japan
 
Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門Keisuke Fujikawa
 
DeNA の AWS アカウント管理とセキュリティ監査自動化
DeNA の AWS アカウント管理とセキュリティ監査自動化DeNA の AWS アカウント管理とセキュリティ監査自動化
DeNA の AWS アカウント管理とセキュリティ監査自動化DeNA
 
日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント
日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント
日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイントAmazon Web Services Japan
 
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版) データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版) Satoshi Nagayasu
 
Amazon S3を中心とするデータ分析のベストプラクティス
Amazon S3を中心とするデータ分析のベストプラクティスAmazon S3を中心とするデータ分析のベストプラクティス
Amazon S3を中心とするデータ分析のベストプラクティスAmazon Web Services Japan
 
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(後編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(後編)【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(後編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(後編)日本マイクロソフト株式会社
 
PostgreSQL 15の新機能を徹底解説
PostgreSQL 15の新機能を徹底解説PostgreSQL 15の新機能を徹底解説
PostgreSQL 15の新機能を徹底解説Masahiko Sawada
 

Tendances (20)

Synapse lakedatabase
Synapse lakedatabaseSynapse lakedatabase
Synapse lakedatabase
 
データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門
 
20191001 AWS Black Belt Online Seminar AWS Lake Formation
20191001 AWS Black Belt Online Seminar AWS Lake Formation 20191001 AWS Black Belt Online Seminar AWS Lake Formation
20191001 AWS Black Belt Online Seminar AWS Lake Formation
 
一歩先行く Azure Computing シリーズ(全3回) 第2回 Azure VM どれを選ぶの? Azure VM 集中講座
一歩先行く Azure Computing シリーズ(全3回) 第2回 Azure VM どれを選ぶの? Azure VM 集中講座一歩先行く Azure Computing シリーズ(全3回) 第2回 Azure VM どれを選ぶの? Azure VM 集中講座
一歩先行く Azure Computing シリーズ(全3回) 第2回 Azure VM どれを選ぶの? Azure VM 集中講座
 
今こそ知りたい!Microsoft Azureの基礎
今こそ知りたい!Microsoft Azureの基礎今こそ知りたい!Microsoft Azureの基礎
今こそ知りたい!Microsoft Azureの基礎
 
AWS Black Belt Techシリーズ AWS IAM
AWS Black Belt Techシリーズ  AWS IAMAWS Black Belt Techシリーズ  AWS IAM
AWS Black Belt Techシリーズ AWS IAM
 
ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
 
Black Belt Online Seminar AWS Amazon S3
Black Belt Online Seminar AWS Amazon S3Black Belt Online Seminar AWS Amazon S3
Black Belt Online Seminar AWS Amazon S3
 
Azure Datalake 大全
Azure Datalake 大全Azure Datalake 大全
Azure Datalake 大全
 
AWS Black Belt Techシリーズ Amazon EMR
AWS Black Belt Techシリーズ  Amazon EMRAWS Black Belt Techシリーズ  Amazon EMR
AWS Black Belt Techシリーズ Amazon EMR
 
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
 
Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門
 
DeNA の AWS アカウント管理とセキュリティ監査自動化
DeNA の AWS アカウント管理とセキュリティ監査自動化DeNA の AWS アカウント管理とセキュリティ監査自動化
DeNA の AWS アカウント管理とセキュリティ監査自動化
 
日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント
日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント
日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント
 
Azure Network 概要
Azure Network 概要Azure Network 概要
Azure Network 概要
 
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版) データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
 
AWS BlackBelt AWS上でのDDoS対策
AWS BlackBelt AWS上でのDDoS対策AWS BlackBelt AWS上でのDDoS対策
AWS BlackBelt AWS上でのDDoS対策
 
Amazon S3を中心とするデータ分析のベストプラクティス
Amazon S3を中心とするデータ分析のベストプラクティスAmazon S3を中心とするデータ分析のベストプラクティス
Amazon S3を中心とするデータ分析のベストプラクティス
 
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(後編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(後編)【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(後編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(後編)
 
PostgreSQL 15の新機能を徹底解説
PostgreSQL 15の新機能を徹底解説PostgreSQL 15の新機能を徹底解説
PostgreSQL 15の新機能を徹底解説
 

Similaire à BigData Architecture for Azure

SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能
SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能
SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能Koichiro Sasaki
 
Data Center As A Computer 2章前半
Data Center As A Computer 2章前半Data Center As A Computer 2章前半
Data Center As A Computer 2章前半Akinori YOSHIDA
 
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~griddb
 
99999999 azure iaas_newportal版
99999999 azure iaas_newportal版99999999 azure iaas_newportal版
99999999 azure iaas_newportal版Osamu Takazoe
 
Microsoft Azure build & ignight update summary
Microsoft Azure build & ignight update summary Microsoft Azure build & ignight update summary
Microsoft Azure build & ignight update summary Hirano Kazunori
 
[ウェビナー] Build 2018 アップデート ~ データ プラットフォーム/IoT編 ~
[ウェビナー] Build 2018 アップデート ~ データ プラットフォーム/IoT編 ~[ウェビナー] Build 2018 アップデート ~ データ プラットフォーム/IoT編 ~
[ウェビナー] Build 2018 アップデート ~ データ プラットフォーム/IoT編 ~Naoki (Neo) SATO
 
db tech showcase_2014_A14_Actian Vectorで得られる、BIにおける真のパフォーマンスとは
db tech showcase_2014_A14_Actian Vectorで得られる、BIにおける真のパフォーマンスとはdb tech showcase_2014_A14_Actian Vectorで得られる、BIにおける真のパフォーマンスとは
db tech showcase_2014_A14_Actian Vectorで得られる、BIにおける真のパフォーマンスとはKoji Shinkubo
 
Azure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/SparkAzure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/SparkRyoma Nagata
 
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
クラウドDWHにおける観点とAzure Synapse Analyticsの対応クラウドDWHにおける観点とAzure Synapse Analyticsの対応
クラウドDWHにおける観点とAzure Synapse Analyticsの対応Ryoma Nagata
 
MySQL最新情報
MySQL最新情報MySQL最新情報
MySQL最新情報yoyamasaki
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューションDell TechCenter Japan
 
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装de:code 2017
 
No-Ops で大量データ処理基盤を簡単に実現する
No-Ops で大量データ処理基盤を簡単に実現するNo-Ops で大量データ処理基盤を簡単に実現する
No-Ops で大量データ処理基盤を簡単に実現するKiyoshi Fukuda
 
マイニング探検会#10
マイニング探検会#10マイニング探検会#10
マイニング探検会#10Yoji Kiyota
 

Similaire à BigData Architecture for Azure (20)

SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能
SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能
SQL Server 2008/2008 R2/ 2012(/ 2014) 新機能
 
[Japan Tech summit 2017] DAL 003
[Japan Tech summit 2017] DAL 003[Japan Tech summit 2017] DAL 003
[Japan Tech summit 2017] DAL 003
 
Data Center As A Computer 2章前半
Data Center As A Computer 2章前半Data Center As A Computer 2章前半
Data Center As A Computer 2章前半
 
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
 
99999999 azure iaas_newportal版
99999999 azure iaas_newportal版99999999 azure iaas_newportal版
99999999 azure iaas_newportal版
 
Microsoft Azure build & ignight update summary
Microsoft Azure build & ignight update summary Microsoft Azure build & ignight update summary
Microsoft Azure build & ignight update summary
 
DLLAB Ignite Update Data Platform
DLLAB  Ignite Update Data PlatformDLLAB  Ignite Update Data Platform
DLLAB Ignite Update Data Platform
 
Sql azure入門
Sql azure入門Sql azure入門
Sql azure入門
 
BPStudy20121221
BPStudy20121221BPStudy20121221
BPStudy20121221
 
[ウェビナー] Build 2018 アップデート ~ データ プラットフォーム/IoT編 ~
[ウェビナー] Build 2018 アップデート ~ データ プラットフォーム/IoT編 ~[ウェビナー] Build 2018 アップデート ~ データ プラットフォーム/IoT編 ~
[ウェビナー] Build 2018 アップデート ~ データ プラットフォーム/IoT編 ~
 
db tech showcase_2014_A14_Actian Vectorで得られる、BIにおける真のパフォーマンスとは
db tech showcase_2014_A14_Actian Vectorで得られる、BIにおける真のパフォーマンスとはdb tech showcase_2014_A14_Actian Vectorで得られる、BIにおける真のパフォーマンスとは
db tech showcase_2014_A14_Actian Vectorで得られる、BIにおける真のパフォーマンスとは
 
Azure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/SparkAzure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/Spark
 
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
クラウドDWHにおける観点とAzure Synapse Analyticsの対応クラウドDWHにおける観点とAzure Synapse Analyticsの対応
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
 
MySQL最新情報
MySQL最新情報MySQL最新情報
MySQL最新情報
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
 
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
 
No-Ops で大量データ処理基盤を簡単に実現する
No-Ops で大量データ処理基盤を簡単に実現するNo-Ops で大量データ処理基盤を簡単に実現する
No-Ops で大量データ処理基盤を簡単に実現する
 
No-Ops で大量データ処理基盤
No-Ops で大量データ処理基盤No-Ops で大量データ処理基盤
No-Ops で大量データ処理基盤
 
超高速な機械学習を Oracle Database で実現!
超高速な機械学習を Oracle Database で実現!超高速な機械学習を Oracle Database で実現!
超高速な機械学習を Oracle Database で実現!
 
マイニング探検会#10
マイニング探検会#10マイニング探検会#10
マイニング探検会#10
 

Plus de Ryoma Nagata

Delta Lake with Synapse dataflow
Delta Lake with Synapse dataflowDelta Lake with Synapse dataflow
Delta Lake with Synapse dataflowRyoma Nagata
 
Power Query Online
Power Query OnlinePower Query Online
Power Query OnlineRyoma Nagata
 
Paas_Security_Part1
Paas_Security_Part1Paas_Security_Part1
Paas_Security_Part1Ryoma Nagata
 
Databricks の始め方
Databricks の始め方Databricks の始め方
Databricks の始め方Ryoma Nagata
 
Azure DevOps CICD Azure SQL / Data Factory
Azure DevOps CICD Azure SQL / Data FactoryAzure DevOps CICD Azure SQL / Data Factory
Azure DevOps CICD Azure SQL / Data FactoryRyoma Nagata
 
Ignite update databricks_stream_analytics
Ignite update databricks_stream_analyticsIgnite update databricks_stream_analytics
Ignite update databricks_stream_analyticsRyoma Nagata
 
道徳経営実践講座
道徳経営実践講座道徳経営実践講座
道徳経営実践講座Ryoma Nagata
 
20190517 Spark+AI Summit2019最新レポート
20190517 Spark+AI Summit2019最新レポート20190517 Spark+AI Summit2019最新レポート
20190517 Spark+AI Summit2019最新レポートRyoma Nagata
 

Plus de Ryoma Nagata (9)

Delta Lake with Synapse dataflow
Delta Lake with Synapse dataflowDelta Lake with Synapse dataflow
Delta Lake with Synapse dataflow
 
Power Query Online
Power Query OnlinePower Query Online
Power Query Online
 
Paas_Security_Part1
Paas_Security_Part1Paas_Security_Part1
Paas_Security_Part1
 
Databricks の始め方
Databricks の始め方Databricks の始め方
Databricks の始め方
 
Azure DevOps CICD Azure SQL / Data Factory
Azure DevOps CICD Azure SQL / Data FactoryAzure DevOps CICD Azure SQL / Data Factory
Azure DevOps CICD Azure SQL / Data Factory
 
Ignite update databricks_stream_analytics
Ignite update databricks_stream_analyticsIgnite update databricks_stream_analytics
Ignite update databricks_stream_analytics
 
道徳経営実践講座
道徳経営実践講座道徳経営実践講座
道徳経営実践講座
 
Delta lakesummary
Delta lakesummaryDelta lakesummary
Delta lakesummary
 
20190517 Spark+AI Summit2019最新レポート
20190517 Spark+AI Summit2019最新レポート20190517 Spark+AI Summit2019最新レポート
20190517 Spark+AI Summit2019最新レポート
 

Dernier

[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 

Dernier (9)

[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 

BigData Architecture for Azure