SlideShare une entreprise Scribd logo
1  sur  51
Télécharger pour lire hors ligne
データ分析プラットフォーム 勉強会 #1?
この勉強会では
「RDBプロ」ネタ
(現行主戦場技術のさらなる研鑽)
「データ関連ニューテクノロジ」ネタ
(トランスフォームも視野に得意分野+α)
を基本セットでやりたい
今一番バズってるもの
何かもっと良
いものあれば
差し替え
出典)https://deepmind.com/blog/alphago-zero-learning-scratch/
0
20
40
60
80
100
120
140
160
180
200
0
10
20
30
40
50
60
70
2012/10/28 2013/10/28 2014/10/28 2015/10/28 2016/10/28 2017/10/28
「AI Deep Learning」Trend Search
「NVIDIA Corp」Stock Price
出典)https://trends.google.com/trends/explore?date=today%205-y&q=AI%20Deep%20Learning
出典)https://stooq.com/q/d/?s=nvda.us&c=0&d1=20121027&d2=20171027&i=w
0
5
10
15
20
25
30
2010年
NEC
2011年
Xerox
2012年
University
of Toronto
2013年
Clarifai
2014年
Google
2015年
Microsoft
2016年
MPS
人間
画像識別誤り率(%)
人間の識別能力を超過
社会実装が進む
出典)Large Scale Visual Recognition Challenge (ILSVRC)
出典)https://www.gartner.co.jp/press/html/pr20170823-01.html
RDBプロのその次へ
ビジネス能力
Business problem
solving
データ
サイエンス能力
data science
データ
エンジニアリング能力
data engineering
出典)日本データサイエンティスト協会 http://www.datascientist.or.jp/
背景を踏まえてビジネス
課題を整理・解決する力。
情報処理、人口知能、
統計学等の情報科学の
知恵を理解し、使う力。
データサイエンスを
意味のある形に実装、
運用する力
ビジネス
課題解決
データ
課題解決
基礎能力
プロジェクトプロセス 20
4解決
論理的思考 18
行動規範 12
4
データ
の入手 3
データの
理解・検証 5
意味合いの
抽出・洞察
活動マネジメント 20
事業に実装 8
知財 6
出典)日本データサイエンティスト協会 http://www.datascientist.or.jp/
データ
課題解決
解決技術
非構造化
データ処理
基礎技術 統計数理基礎 16
グラフィカルモデル 3
音声/音楽処理 5
画像・動画処理 8言語処理 13
最適化 10
データ可視化 37
パターン発見 3
性質・関係性把握 14
検定 / 判断 11
シミュレーション
/ データ同化 5
グルーピング 14
データ加工 8
時系列分析 7
機器学習 20
サンプリング 5
予測 17
データの理解・検証 23 意味合いの抽出・洞察 4
分析プロセス 5
出典)日本データサイエンティスト協会 http://www.datascientist.or.jp/
守る技術
実装技術
基礎能力
環境構築 21
データ
共有 14
プログラミング 22
ITセキュリティ 15
出典)日本データサイエンティスト協会 http://www.datascientist.or.jp/
データ
収集 16
データ
蓄積 17
データ
構造 11
データ
加工 13
シニア
データサイエンティスト
出典)日本データサイエンティスト協会 http://www.datascientist.or.jp/
デ
|
タ
サ
イ
エ
ン
テ
ィ
ス
ト
一
般
71 39
90 52
67 38
228 129
148
184
125
457
71
42
38
100
出典)日本データサイエンティスト協会 http://www.datascientist.or.jp/
出典)日本データサイエンティスト協会 http://www.datascientist.or.jp/
守る技術
実装技術
基礎能力
環境構築 21
データ
共有 14
プログラミング 22
ITセキュリティ 15
出典)日本データサイエンティスト協会 http://www.datascientist.or.jp/
データ
収集 16
データ
蓄積 17
データ
構造 11
データ
加工 13
ビジネス能力
Business problem
solving
データ
サイエンス能力
data science
データ
エンジニアリング能力
data engineering
出典)日本データサイエンティスト協会 http://www.datascientist.or.jp/
背景を踏まえてビジネス
課題を整理・解決する力。
情報処理、人口知能、
統計学等の情報科学の
知恵を理解し、使う力。
データサイエンスを
意味のある形に実装、
運用する力
データ分析プラットフォーム
全体像の理解
処理
蓄積
収集 分析
オーケストレーション
/ ユーティリティ
入力 出力
ア
ク
シ
ョ
ン
デ
ー
タ
処理
蓄積
収
集
分
析
オーケスト
レーション
入
力
出
力
出典)総務省 政策白書 27年版 企業等におけるビッグデータの活用状況
46.7% 45.6%
23.8%
6.6% 5.2%
31.2%
0.4%
7.6%
5.7%
14.1%
1.2%
5.2%
2.0% 1.2% 1.3% 1.0% 1.3% 2.2% 3.5% 3.6%
5.7%
顧
客
デ
ー
タ
経
理
デ
ー
タ
業
務
日
誌
デ
ー
タ
POS
デ
ー
タ
e
コ
マ
ー
ス
に
お
け
る
販
売
デ
ー
タ
電
子
メ
ー
ル
CTI
音
声
デ
ー
タ
固
定
電
話
携
帯
電
話
ア
ク
セ
ス
ロ
グ
動
画
・
映
像
視
聴
ロ
グ
Blog
、
SNS
等
記
事
デ
ー
タ
GPS
デ
ー
タ
RFID
デ
ー
タ
セ
ン
サ
ー
デ
ー
タ
交
通
量
・
渋
滞
情
報
デ
ー
タ
気
象
デ
ー
タ
防
犯
・
遠
隔
監
視
カ
メ
ラ
デ
ー
タ
電
子
カ
ル
テ
デ
ー
タ
画
像
診
断
デ
ー
タ
電
子
レ
セ
プ
ト
デ
ー
タ
業務データ 販売記録顧客等とのコミュニケーション 自動取得 自動取得(M2M) 医療
処理収集 分析
オーケストレーション / ユーティリティ
蓄積 Notebook
収集
オーケストレーション/ユーティリティ
蓄積
分析処理
Notebook
収集
オーケストレーション/ユーティリティ
蓄積
分析処理
収集
オーケストレーション/ユーティリティ
蓄積
分析処理収集
オーケストレーション/ユーティリティ
蓄積
分析処理
オーケストレーション
/ ユーティリティ
入力 出力
ア
ク
シ
ョ
ン
デ
ー
タ
処理
蓄積
収集 分析
オーケストレーション
/ ユーティリティ
入力 出力
ア
ク
シ
ョ
ン
デ
ー
タ
処理
蓄積
収集 分析
バッチ
ストリーム アドホック
AA
BI
データベース
ストレージ
関係
処理方式
方向
オーケストレーション
/ ユーティリティ
入力 出力
ア
ク
シ
ョ
ン
デ
ー
タ
処理
蓄積
収集 分析
バッチ
ストリーム アドホック
AA
BI
データベース
ストレージ
方向
関係
処理方式
処理
蓄積
分
析
オーケスト
レーション
入
力
出
力
収
集
ストリーム処理バルク処理
PUSH PULL
P2P Pub/Sub
オーケストレーション
/ ユーティリティ
入力 出力
ア
ク
シ
ョ
ン
デ
ー
タ
蓄積
収集 分析
AA
BI
データベース
ストレージ
関係
処理方式
方向
処理
バッチ
ストリーム アドホック
蓄積
分
析
オーケスト
レーション
入
力
出
力
収
集
処理
オーケストレーション
/ ユーティリティ
入力 出力
ア
ク
シ
ョ
ン
デ
ー
タ
処理
蓄積
収集 分析
バッチ
ストリーム アドホック
AA
BI
データベース
ストレージ
関係
処理方式
方向
分類 BI:Business Intelligence AA:Advanced Analytics
目的 データの理解 データに基づいた意思決定
手法
演繹的分析 帰納的分析
可視化分析
(descriptive)
診断分析
(diagnostic)
予測分析
(predictive)
処方分析
(prescriptive)
何が起こったのか? 何故起こったのか? 何が起こるのか? 何をすべきなのか?
技術 データウェアハウス分析 ビックデータ分析
難易度
価
値
整形・加工したデータを分析し、アクションに必要な
Hindsight(後知恵)、Insight(洞察)、Foresight(先見の明)を得る
オーケストレーション
/ ユーティリティ
入力 出力
ア
ク
シ
ョ
ン
デ
ー
タ
処理収集 分析
バッチ
ストリーム アドホック
AA
BI
関係
処理方式
方向
蓄積
データベース
ストレージ
技術
分類
役割 蓄積
データ
ベース
RDB
(OLTP)
行ストア
オペレーショ
ン
RDB
(DWH/Mart)
列ストア
分析
NoSQL
KVS
オペレーショ
ン
Wide
Column
オペレーショ
ン
Document
オペレーショ
ン
Graph
オペレーショ
ン
ストレージ
Data Lake
(Hadoop)
分散ファイル
システム
分析
処理収
集
分
析
オーケスト
レーション
入
力
出
力蓄積
データ収集機能から入ってくる大量多様データ、
データ処理機能による整形・加工結果を蓄積
スケール
アウト
スケール
アップ
性能特性
拡
張
特
性
まとめ
 今回のゴール
✓ データ分析プラットフォームの構成要素を知り全体像をイメージ
できるようになること
 次回以降のゴール
✓ 構成要素をさらにもう一段掘り下げて製品の選定ができるように
なること
用途
構造
技術
分類
役割 蓄積
データ
ベース
RDB
(OLTP)
行ストア
オペレーショ
ン
RDB
(DWH/Mart)
列ストア
分析
NoSQL
KVS
オペレーショ
ン
Wide
Column
オペレーショ
ン
Document
オペレーショ
ン
Graph
オペレーショ
ン
ストレージ
Data Lake
(Hadoop)
分散ファイル
システム
分析
処理収
集
分
析
オーケスト
レーション
入
力
出
力蓄積
Demo「はじめの一歩」
処理
蓄積
収集入力 分析 出力
オーケストレーション
Windows10
IoTCore
onRaspberryPi3
Azure
IoT Hub
Azure
Data Lake
Store
Azure
Stream
Analytics
Power BI
Service
スマホ
操作
処理
蓄積
収集入力 分析 出力
オーケストレーション
Windows10
IoTCore
onRaspberryPi3
Azure
IoT Hub
Azure
Data Lake
Store
Azure
Stream
Analytics
Power BI
Service
スマホ
操作
Webブラウザ
スマホ用
Power BI
処理
蓄積
収集入力 分析 出力
オーケストレーション
Azure
Data Lake
Store
Power BI
Service
感謝
Microsoft
Forms
Microsoft
Flow
ご参加いただき
ありがとう
ございました!
参加者の皆様に
データを生成して
もらいます!
処理
蓄積
収集入力 分析 出力
オーケストレーション
Azure
Data Lake
Store
Power BI
Service
感謝
Microsoft
Forms
Microsoft
Flow
ご参加いただき
ありがとう
ございました!
参加者の皆様に
データを生成して
もらいます!
http://bit.ly/2tt5qJk
アンケートに回答しデータ分析プラットフォームへ
データを投入してください
Webブラウザ
スマホ用
Power BI
Power BIスキルを磨くには「 Power BI 勉強会」がおすすめ
Demo#2は管理人の清水さん(Microsoft MVP)のネタを拝借 🙏
ご参加いただき
ありがとう
ございました!

Contenu connexe

Tendances

ただいまHadoop勉強中
ただいまHadoop勉強中ただいまHadoop勉強中
ただいまHadoop勉強中
Satoshi Noto
 

Tendances (20)

低価格で高品質な苺をふんだんに使用したGTFS-RTを整備してみた話
低価格で高品質な苺をふんだんに使用したGTFS-RTを整備してみた話低価格で高品質な苺をふんだんに使用したGTFS-RTを整備してみた話
低価格で高品質な苺をふんだんに使用したGTFS-RTを整備してみた話
 
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
 
ChatGPTがもたらす未来予測
ChatGPTがもたらす未来予測ChatGPTがもたらす未来予測
ChatGPTがもたらす未来予測
 
Airflow 2.0 migration ガイド
Airflow 2.0 migration ガイドAirflow 2.0 migration ガイド
Airflow 2.0 migration ガイド
 
データモデリングとアルゴリズムで考える統計と機械学習の違い
データモデリングとアルゴリズムで考える統計と機械学習の違いデータモデリングとアルゴリズムで考える統計と機械学習の違い
データモデリングとアルゴリズムで考える統計と機械学習の違い
 
IoT向けプラットフォーム「SORACOM」とは? 他2本
IoT向けプラットフォーム「SORACOM」とは? 他2本IoT向けプラットフォーム「SORACOM」とは? 他2本
IoT向けプラットフォーム「SORACOM」とは? 他2本
 
エンジニアのキャリアパスを考える 篠宮
エンジニアのキャリアパスを考える 篠宮エンジニアのキャリアパスを考える 篠宮
エンジニアのキャリアパスを考える 篠宮
 
Hadoopの概念と基本的知識
Hadoopの概念と基本的知識Hadoopの概念と基本的知識
Hadoopの概念と基本的知識
 
キムワイプ卓球のルール
キムワイプ卓球のルールキムワイプ卓球のルール
キムワイプ卓球のルール
 
運用してわかったLookerの本質的メリット : Data Engineering Study #8
運用してわかったLookerの本質的メリット : Data Engineering Study #8運用してわかったLookerの本質的メリット : Data Engineering Study #8
運用してわかったLookerの本質的メリット : Data Engineering Study #8
 
ESP32開発環境まとめ
ESP32開発環境まとめESP32開発環境まとめ
ESP32開発環境まとめ
 
屋外向け 8chLoRaWANゲートウェイ DLOS8 日本語マニュアル
屋外向け 8chLoRaWANゲートウェイ  DLOS8 日本語マニュアル屋外向け 8chLoRaWANゲートウェイ  DLOS8 日本語マニュアル
屋外向け 8chLoRaWANゲートウェイ DLOS8 日本語マニュアル
 
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料) 40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
 
Apache Spark の紹介(前半:Sparkのキホン)
Apache Spark の紹介(前半:Sparkのキホン)Apache Spark の紹介(前半:Sparkのキホン)
Apache Spark の紹介(前半:Sparkのキホン)
 
モノタロウを支える Solr による商品検索システム
モノタロウを支える Solr による商品検索システムモノタロウを支える Solr による商品検索システム
モノタロウを支える Solr による商品検索システム
 
Supabase Edge Functions と Netlify Edge Functions を使ってみる – 機能とその比較 –
Supabase Edge Functions と Netlify Edge Functions を使ってみる – 機能とその比較 –Supabase Edge Functions と Netlify Edge Functions を使ってみる – 機能とその比較 –
Supabase Edge Functions と Netlify Edge Functions を使ってみる – 機能とその比較 –
 
ただいまHadoop勉強中
ただいまHadoop勉強中ただいまHadoop勉強中
ただいまHadoop勉強中
 
Amazon RDSを参考にしたとりまチューニング
Amazon RDSを参考にしたとりまチューニングAmazon RDSを参考にしたとりまチューニング
Amazon RDSを参考にしたとりまチューニング
 
全社のデータ活用を一段階上げる取り組み
全社のデータ活用を一段階上げる取り組み全社のデータ活用を一段階上げる取り組み
全社のデータ活用を一段階上げる取り組み
 
Geopaparazzi実習(Geopaparazziハンズオン)
Geopaparazzi実習(Geopaparazziハンズオン)Geopaparazzi実習(Geopaparazziハンズオン)
Geopaparazzi実習(Geopaparazziハンズオン)
 

Similaire à データ分析プラットフォームの歩き方

WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
Recruit Technologies
 

Similaire à データ分析プラットフォームの歩き方 (20)

Iot algyan jhirono 20190111
Iot algyan jhirono 20190111Iot algyan jhirono 20190111
Iot algyan jhirono 20190111
 
DataEngConf NYC’18 セッションサマリー #1
DataEngConf NYC’18 セッションサマリー #1DataEngConf NYC’18 セッションサマリー #1
DataEngConf NYC’18 セッションサマリー #1
 
[Gree] DataEngConf NYC’18 セッションサマリー #1
[Gree] DataEngConf NYC’18 セッションサマリー #1[Gree] DataEngConf NYC’18 セッションサマリー #1
[Gree] DataEngConf NYC’18 セッションサマリー #1
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
 
デジタルトランスフォーメーション時代を生き抜くためのビジネス力 ~ AI、Advanced Analytics の使いどころ ~
デジタルトランスフォーメーション時代を生き抜くためのビジネス力 ~ AI、Advanced Analytics の使いどころ ~デジタルトランスフォーメーション時代を生き抜くためのビジネス力 ~ AI、Advanced Analytics の使いどころ ~
デジタルトランスフォーメーション時代を生き抜くためのビジネス力 ~ AI、Advanced Analytics の使いどころ ~
 
20181206 Jazug DataScience TeamBuilding and DevOps
20181206 Jazug DataScience TeamBuilding and DevOps20181206 Jazug DataScience TeamBuilding and DevOps
20181206 Jazug DataScience TeamBuilding and DevOps
 
リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例
 
佐賀大学 - データ分析と向き合う
佐賀大学 - データ分析と向き合う佐賀大学 - データ分析と向き合う
佐賀大学 - データ分析と向き合う
 
Now and then: next-generation sequencing database to encourage the big data s...
Now and then: next-generation sequencing database to encourage the big data s...Now and then: next-generation sequencing database to encourage the big data s...
Now and then: next-generation sequencing database to encourage the big data s...
 
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展
 
DB TechShowcase Tokyo - Intelligent Data Platform
DB TechShowcase Tokyo - Intelligent Data PlatformDB TechShowcase Tokyo - Intelligent Data Platform
DB TechShowcase Tokyo - Intelligent Data Platform
 
チームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptx
チームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptxチームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptx
チームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptx
 
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年version
 
社内のリース車の利用状況を Power BI で可視化してみた
社内のリース車の利用状況を Power BI で可視化してみた社内のリース車の利用状況を Power BI で可視化してみた
社内のリース車の利用状況を Power BI で可視化してみた
 
Microsoft AI セミナー - Microsoft AI Platform
Microsoft AI セミナー - Microsoft AI PlatformMicrosoft AI セミナー - Microsoft AI Platform
Microsoft AI セミナー - Microsoft AI Platform
 
Example using LattePanda
Example  using LattePandaExample  using LattePanda
Example using LattePanda
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
 
NRI流 検索ソリューション導入時にこれだけはおさえておきたい鉄則
NRI流 検索ソリューション導入時にこれだけはおさえておきたい鉄則NRI流 検索ソリューション導入時にこれだけはおさえておきたい鉄則
NRI流 検索ソリューション導入時にこれだけはおさえておきたい鉄則
 
sitTokyo2022_Dev_05_Kawanabe.pptx
sitTokyo2022_Dev_05_Kawanabe.pptxsitTokyo2022_Dev_05_Kawanabe.pptx
sitTokyo2022_Dev_05_Kawanabe.pptx
 

Plus de Tomoyuki Oota

SQL Server エンジニア のための コンテナ入門(k8s編)
SQL Server エンジニア のための コンテナ入門(k8s編)SQL Server エンジニア のための コンテナ入門(k8s編)
SQL Server エンジニア のための コンテナ入門(k8s編)
Tomoyuki Oota
 

Plus de Tomoyuki Oota (10)

SQL Server エンジニア のための コンテナ入門(k8s編)
SQL Server エンジニア のための コンテナ入門(k8s編)SQL Server エンジニア のための コンテナ入門(k8s編)
SQL Server エンジニア のための コンテナ入門(k8s編)
 
SQL Server コンテナ入門(Kubernetes編)
SQL Server コンテナ入門(Kubernetes編)SQL Server コンテナ入門(Kubernetes編)
SQL Server コンテナ入門(Kubernetes編)
 
SQL Server コンテナ入門(Docker編)
SQL Server コンテナ入門(Docker編)SQL Server コンテナ入門(Docker編)
SQL Server コンテナ入門(Docker編)
 
SQL Server エンジニア のための コンテナ入門
SQL Server エンジニア のための コンテナ入門SQL Server エンジニア のための コンテナ入門
SQL Server エンジニア のための コンテナ入門
 
For Power BI Beginners
For Power BI BeginnersFor Power BI Beginners
For Power BI Beginners
 
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
 
SQL Server 2017 で実現される AIシステムモデル のご紹介
SQL Server 2017 で実現される AIシステムモデル のご紹介SQL Server 2017 で実現される AIシステムモデル のご紹介
SQL Server 2017 で実現される AIシステムモデル のご紹介
 
性能問題を起こしにくい 強いDBシステムの作り方(Ver. 2018.9)
性能問題を起こしにくい 強いDBシステムの作り方(Ver. 2018.9)性能問題を起こしにくい 強いDBシステムの作り方(Ver. 2018.9)
性能問題を起こしにくい 強いDBシステムの作り方(Ver. 2018.9)
 
SQL Server 2017 Machine Learning Services (CLR-H in TOKYO #13)
SQL Server 2017 Machine Learning Services (CLR-H in TOKYO #13)SQL Server 2017 Machine Learning Services (CLR-H in TOKYO #13)
SQL Server 2017 Machine Learning Services (CLR-H in TOKYO #13)
 
Data Scientists Love SQL Server
Data Scientists Love SQL ServerData Scientists Love SQL Server
Data Scientists Love SQL Server
 

データ分析プラットフォームの歩き方