Contenu connexe
Similaire à ユーザに価値を届けるためのデータプラットフォームの考え方 (20)
Plus de Rakuten Group, Inc. (20)
ユーザに価値を届けるためのデータプラットフォームの考え方
- 8. 8
自己紹介
Daigoro (Daisuke Watanabe)
Role : Business Data platform Group, Assistant Manager
Job : Data Platform engineer
Interest Tech : DevOps / BigData / Programming
Favorite topic : Engineer Culture
Placed : Osaka > Paris > Tokyo > Fukuoka
- 14. 14
サイクルの例
• 継続的改善手法
• PDCA
• STPD
• 開発手法等
• アジャイル
• スクラム
• DevOps
• サイクルの基本
• Idea・仮設
• Try
• Feedback
https://note.mu/bangucs/n/nef481150e6c8
- 15. 15
ビジネスと開発のサイクル
• ビジネス → マーケット
• 変化を起こす
• 開発 → ビジネス
• サービスをリリース・改善
• 開発 → ビジネス
• 結果の確認のレポート
• データの加工し、サービス利用
マーケット
ビジネス
開発
サービス
レポート
加工
- 17. 17
ビッグデータとは
• データ : 単一のプロセスやサーバで処理するのが困難な量
• テラバイト以上などが一般的
• 解析・処理 : 莫大なデータへの並列処理
• Hadoop, Sparkなど
• データマイニング : 莫大なデータから新たな価値を見つけること
- 19. 19
できること
• 分散
• データの蓄積
• 分散処理の力
• データ
• 複数のデータソースの加工・分析
• 共有化と再利用
• 2次加工3次加工データの作成と提供
• 価値の発掘
• 非構造データも構造データも処理可能
• データマイニング
• 機械学習
- 20. 20
楽天市場の現在
1億人以上(ログイン会員数) *
3.4兆円 (国内EC流通総額)(2018) ***
264,389,685商品(2019年10月1日現在)
**
48,467店舗(2019年10月1日現在) **
以上
* https://corp.rakuten.co.jp/ 2019/01/21
** https://www.rakuten.co.jp/ 2019/10/05
*** https://corp.rakuten.co.jp/investors/documents/results/2018.html 2019/10/05
- 23. 23
ビジネスと開発のサイクル
• ビジネス → マーケット
• 変化を起こす
• 開発 → ビジネス
• サービスをリリース・改善
• 開発 → ビジネス
• 結果の確認のレポート
• データの加工し、サービス利用
マーケット
ビジネス
開発
サービス
レポート
加工
- 24. 24
レポート
加工
プラットフォームが加わると
• ビジネス → マーケット
• 変化を起こす
• 開発 → ビジネス
• サービスをリリース・改善
• 開発 → ビジネス
• 結果の確認のレポート
• データの加工し、サービス利用
• マーケット → データプラットフォーム
• 結果を収集
• データプラットフォーム → ビジネス
• 結果のデータを分析
• データプラットフォーム → 開発
• データを追加・加工・利用
マーケット
ビジネス
開発
データプラット
フォーム
サービス
- 29. 29
運用するだけでも大変、改善が大変
運用の大変さ
• 常にデータの量も増える(一年で 20PB → 40PB )
• ユーザの増加により要望とデータの複雑化
• 高すぎるサービスレベル
• 分散処理は予期せぬフリーズが起こりやすい
• なぜかデータには意図せぬ事が起きる
改善する恐怖(ビッグデータを扱う基盤は複雑)
• Hiveのversion上げたら”left outer join”が違う結果を返すようになった
• Javaログの出力方式変えたら、データが半分以上壊れた
• On memory処理に変えたら処理時間が20倍になった
- 31. 31
データプラットフォーム ベスト プラクティス
• システムのフローをできるだけシンプルに
• データをアプリだけのためではなく、分析も想定にいれて設計する
• データを捨てない、すべてのデータになにか価値がある
• 認可・認証の管理を怠らない
• データリネージを正しく管理して、データクオリティを守る
• データもクエリもオーナーを明確にしないと、2年後に管理できなくなる
• 共通化を可能な限り進めないと、同じロジックのクエリが大量になる。
• データはいろいろと消えるので、バックアップは大切に。
• 会社の動向を考え、プロアクティブにプラットフォームを進化させる
• プロジェクトベースではなく、プロダクトベースで考える
• DevOpsはプラットフォームの開発に合う