SlideShare une entreprise Scribd logo
1  sur  39
データ分析基盤におけるOpsのためのDev
with event driven + Serverless
白鳥 昇治
ネットビジネス本部
データマネジメントグループ
データプラットフォームチーム
@DevOpsDays Tokyo 2018
2018.04.25
2 今日お話すること
• サーバーレスアーキテクチャでデータ分析基盤
を構築し、運用負荷の低減と機能開発への集中
を行った事例
3 自己紹介
• 白鳥 昇治 / @irotoris
データエンジニア@リクルートライフスタイル
2013.04〜 SIer
• インフラエンジニアとしてプライベートクラウドの開発・運用
• 開発ツールの社内ホスティングサービス開発・運用
2017.07〜 リクルートライフスタイル
• データエンジニアとして社内データ分析基盤/データパイプライン
の開発・運用
興味/関心事
• Docker / Kubernetes / IaC / CD/CI / Serverless
4 リクルートライフスタイルとは
5 データドリブンビジネス
6 データ利活用の3大要素「入力・処理・出力」
入力 出力処理
7 リクルートライフスタイルのデータ分析基盤
HPB HPG
JLN
事業データ
CSV
外部データ
S3
Redshift
Redshift (mirror)
BigQuery
Cloud Storage
アクセスログ
アプリログ Treasure Data
ORACLE
Exadata
8 リクルートライフスタイルのデータ分析基盤
HPB HPG
JLN
事業データ
CSV
外部データ
S3
Redshift
Redshift (mirror)
BigQuery
Cloud Storage
アクセスログ
アプリログ Treasure Data
ORACLE
Exadata
入力 出力処理
9 データ分析基盤で提供したい価値
• データ分析基盤は使ってもらってなんぼ
• たくさん分析してもらって事業成果を上げてもらう
• たくさん分析してもらうには
 基盤を提供し続ける
 パフォーマンスを上げる
 データ品質を上げる
 新しいデータ連携の追加
 データ鮮度を保つ&上げる
10 データ分析基盤チーム
Dev Team
• より効率的なデータ連携・集計の仕組みの開発
• ビッグデータ系の新しい技術・サービスの検証・導入
Ops Team
• 日々のデータ連携・集計バッチのモニタリング・エラー対応
• 新しいデータソース連携や集計バッチの追加対応
• インフラ・ミドルウェアの管理と整備
みんなで
• データをどう効率的・安定的に処理・提供するか考える
• データを使って何かしたい人たちの相談に乗る
• 大規模なエラー対応
11 データ分析基盤チームがやりたいこと
Dev Team
• より効率的なデータ連携・集計の仕組みの開発
• ビッグデータ系の新しい技術・サービスの検証・導入
Ops Team
• 日々のデータ連携・集計バッチのモニタリング・エラー対応
• 新しいデータソース連携や集計バッチの追加対応
• インフラ・ミドルウェアの管理と整備
みんなで
• データをどう効率的・安定的に処理・提供するか考える
• データを使って何かしたい人たちの相談に乗る
• 大規模なエラー対応
価値を増幅させ、素早く届けるための活動
その活動のための時間を創出する
ここから事例の話
13 ある日…
「機械学習基盤つくって。サービス
に組み込むやつ。」
「やりましょう。」
メンバー
結果
14 トリップAIコンシェルジュ
入力 出力処理
問い合わせに対する回答の精度を
高めるための機械学習基盤
フロントエンド
(チャット)
学習結果をAIへ反映
バックエンド
(AI)
15 なにする基盤?
有効な学習データ
分類済み質問データ
学習済みデータ
質問データ
分類不可質問データ
入力 出力処理
Active Learning
最適化/並列処理
Text Clustering
Powered by データサイエンティスト
16
さあつくろう、でもちょっとまって
17 いままでの分析基盤開発・運用を振り返る
• データロード・集計処理・データ転送は、バッチサーバー
(オンプレ)やEC2インスタンス上で行っている
 ジョブのキックはジョブスケジューラ(JP1)を採用
• 問題点
 サーバー、ジョブスケジューラがSPOF
 トラブル発生時の対応が大量に発生
 スケールしない
 1サーバーに複数のランタイムがインストール
 影響範囲がわからない
 OS、ミドルウェアの管理が必要
 定期的なメンテナンスコストが無視できない
つらみ
18 新しい基盤を作る上で考えたこと
サーバーをなくせばいいじゃない。
マネージドサービス使えば急な
データスパイクにも楽にスケール
対応できそう。
19 新しい基盤を作る上で考えたこと
• スケーラビリティ:データ量の増加、スパイクに耐えられるスケー
ラビリティ。
• 可用性:プロダクション環境なのでSPOF(単一障害点)は作りた
くない。エラー時のリトライ処理を組んでおく。
• メンテナンス性:運用コストのかからない設計。機能開発のために
工数を割けるように。
• 堅牢性:セキュアな設計、将来的な機能追加にもすぐ対応できる変
化に強い基盤が必要。
• コスト:基盤のコストだけでなく、運用コストも下げれるように。
ちゃんと考えました。
よろしい、ならばサーバーレスだ
Machine learning pipelines
on-premises
Data load
Machine
learning
on-premises
State control
Cloud trail
Cloud watch
Monitoring
22 よろしい、ならばサーバーレスだ
https://www.slideshare.net/RecruitLifestyle/step-functionsaws-batch-81700778
詳しくはServerlessconfの登壇資料をチェック!
23 この基盤の運用をなるべく減らすためのDev
• event driven + Serverless
 イベント(ファイル連携)発生時のみパイプラインが起動
 AWS Batchによりオンデマンドに実行環境が起動
 バッチはコンテナでまとめる
• 自動リトライ
 各処理ですべてにリトライ処理を実装する
 処理はべき等にしておく
retry×3retry×3retry×3
24 この基盤の運用をなるべく減らすためのDev
• ロギング、モニタリング
 ERRORログ、特定のINFOログはSlackへ通知
 INFOログはバッチの実行状態を把握するため
 基盤のモニタリングはDatadogに集約
 パイプラインの状態可視化:バッチのステータスを
DynamoDB→Elasticsearch+Kibanaで可視化
25 この基盤の運用をなるべく減らすためのDev
• CD/CI、Infrastructure as a Code(IaC)
 基盤構成はすべてTerraform、Ansibleでコード化
 バッチの単体テスト、パイプラインのE2Eテストを自動化
 テストとデプロイはJenkinsパイプラインを構築
Dev
Stg1
Prd
機械学習パイプライン
コンテナの単体テスト
E2Eテスト
デプロイ
26 ServerlessでDevOpsプラクティスがどう変わったか
• Infrastructure as Code
• CD/CI
• ロギング、モニタリング
• 協業/コミュニケーション
27 ServerlessでDevOpsプラクティスがどう変わったか
Infrastructure as a Code
• よかったこと
 コード量:Terraform >> Ansible
 IaCデプロイパイプラインの構築難易度:Terraform >> Ansible
 サーバーのチューニング項目やミドルウェアなどの独自に検
証・設計しなければいけないものが減った。
• 課題
 Terraform職人爆誕→ボトルネック
 教育?or採用?
28 ServerlessでDevOpsプラクティスがどう変わったか
CD/CI
• よかったこと
 バッチはコンテナで動かしているので、デプロイ/ロールバッ
クが簡単に。イメージ差替だけ。
 テストパスすればいつでもデプロイ可能な状態に。
 コンピュートリソースは独立しているので、いろんな変更を並
列テストできる。
• 課題
 Lambda/サーバーレス基盤自体のテスト、特に異常系が難しい
 AWS sam-local(AWSリソースのイベントをローカルで再現できる)
 E2Eのテストだけでは心もとない
 機械学習プログラムが5時間かかる→テストがボトルネック
 データ量によってテストステージを分ける
29 ServerlessでDevOpsプラクティスがどう変わったか
ロギング、モニタリング
• よかったこと
 Lambdaで外形監視を組みやすい(パイプライン自体を変更しな
くても良い)
 マネージドサービスAPI→CloudWatch→Datadogでアラート
• 課題
 ログの出力先が個々のマネージドサービスのコンソール、
CWLに吐かれるのでトレースが難しい
Slackに集約しても逆によくわからなくなる
 パイプラインの全体像がわかりにくくなる
Elasticsearch+Kibanaで状態遷移を可視化してもバッチ数が多
いと限界がある
 必要なエラーイベントだけ補足できればOKかも?
30 ServerlessでDevOpsプラクティスがどう変わったか
協業/コミュニケーション
• よかったこと
 サイエンティストとエンジニアがお互い歩み寄って成果を上げた
31 diff データサイエンティスト データエンジニア
データエンジニアデータサイエンティスト
• モデルの予測精度向上
• 学習速度向上
• Edge版ライブラリ
etc.
• エラーハンドリング
• ワークロード最適化
• オートスケール
• Stable版ライブラリ
etc.
興味・志向・軸
お互いの知識ドメインが異なる
32 歩み寄る
データエンジニアデータサイエンティスト
興味・志向・軸
このライブラリ使いたいです。
メモリ1TBとvCPU64使います。
MongoDBも使っていいですか?
Dockerfile書いてくれれば基盤側でな
んとかします。
ロギングとエラーハンドリングだけお
願いします。
33 コミュニケーション
データエンジニアデータサイエンティスト
34 歩み寄った結果
データエンジニアデータサイエンティスト
「72時間かかってたプログラムを5時
間で終わるようにしました。」
「精度も基準値を大幅にクリアしまし
た。」
「データ量に合わせて動的にリソース
が確保できるようにしました。」
「このエラーでたらアラート出るよう
にしました。」
35 歩み寄った結果
データエンジニアデータサイエンティスト
「すごい!」
「すごい!」
36 運用、どうですか?
• 運用期間:2017/12〜現在
• 自動リトライ処理のお陰で、基盤側のエラーはほぼ自動で解
決している。Datadogを眺めているくらい。
• いつでもすぐバッチのデプロイが可能な状態。
• 余裕が出たのでDevSecOpsにもトライ。
– 新しいこと、やりたいことに取り組めている=いい状態!
機械学習基盤の運用もしつつ、本業のデータ分析基
盤の開発も行えました。
37 まとめ
• 運用を極力減らし、機能開発に集中するためのevent driven +
Serverlessなバッチシステム構成とそのDevOpsプラクティス変化について
紹介しました。
• Serverlessとバッチシステムは相性が良い。
• 次→もっとServerless!
 現状のデータ分析基盤 / データパイプライン / バッチシステム
をサーバーレス構成で順次適用中
 より複雑で並列度の高いバッチシステムをサーバーレスででき
るか?運用減らして価値開発に集中できるか?
38 最後に:リクルートライフスタイルのエンジニア文化
39
THANK YOU!

Contenu connexe

Tendances

[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
de:code 2017
 

Tendances (20)

Azure DevOps CICD Azure SQL / Data Factory
Azure DevOps CICD Azure SQL / Data FactoryAzure DevOps CICD Azure SQL / Data Factory
Azure DevOps CICD Azure SQL / Data Factory
 
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
 
[AC11] サーバー管理よ、サヨウナラ。サーバーレスアーキテクチャの意義と実践
[AC11] サーバー管理よ、サヨウナラ。サーバーレスアーキテクチャの意義と実践[AC11] サーバー管理よ、サヨウナラ。サーバーレスアーキテクチャの意義と実践
[AC11] サーバー管理よ、サヨウナラ。サーバーレスアーキテクチャの意義と実践
 
データから価値を生み続けるには
データから価値を生み続けるにはデータから価値を生み続けるには
データから価値を生み続けるには
 
Data platformdesign
Data platformdesignData platformdesign
Data platformdesign
 
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
データサイエンティストが力を発揮できるアジャイルデータ活用基盤データサイエンティストが力を発揮できるアジャイルデータ活用基盤
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
 
データからビジネス変革をもたらすマイクロソフトの AI とは
データからビジネス変革をもたらすマイクロソフトの AI とはデータからビジネス変革をもたらすマイクロソフトの AI とは
データからビジネス変革をもたらすマイクロソフトの AI とは
 
Delta lakesummary
Delta lakesummaryDelta lakesummary
Delta lakesummary
 
Synapse lakedatabase
Synapse lakedatabaseSynapse lakedatabase
Synapse lakedatabase
 
Ignite update databricks_stream_analytics
Ignite update databricks_stream_analyticsIgnite update databricks_stream_analytics
Ignite update databricks_stream_analytics
 
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
 
BigData Architecture for Azure
BigData Architecture for AzureBigData Architecture for Azure
BigData Architecture for Azure
 
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
 
インフラ観点で運用を考える!Windows 10 VDI on Azure
インフラ観点で運用を考える!Windows 10 VDI on Azure インフラ観点で運用を考える!Windows 10 VDI on Azure
インフラ観点で運用を考える!Windows 10 VDI on Azure
 
PySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL GraphPySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL Graph
 
Power Query Online
Power Query OnlinePower Query Online
Power Query Online
 
おいしいフルマネージドデータベース はじめました
おいしいフルマネージドデータベース はじめましたおいしいフルマネージドデータベース はじめました
おいしいフルマネージドデータベース はじめました
 
基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群
基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群
基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群
 
そのデータ、活かせていますか?
そのデータ、活かせていますか?そのデータ、活かせていますか?
そのデータ、活かせていますか?
 
20200324 ms open-tech-elastic
20200324 ms open-tech-elastic20200324 ms open-tech-elastic
20200324 ms open-tech-elastic
 

Similaire à データ分析基盤におけるOpsのためのDev with event driven + serverless

Similaire à データ分析基盤におけるOpsのためのDev with event driven + serverless (20)

データ分析基盤を支えるエンジニアリング
データ分析基盤を支えるエンジニアリングデータ分析基盤を支えるエンジニアリング
データ分析基盤を支えるエンジニアリング
 
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみたAWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
 
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
 
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
 
BIがクラウドで更なる進化!  データとの連携を強化したデータビジュアライゼーション
BIがクラウドで更なる進化!  データとの連携を強化したデータビジュアライゼーションBIがクラウドで更なる進化!  データとの連携を強化したデータビジュアライゼーション
BIがクラウドで更なる進化!  データとの連携を強化したデータビジュアライゼーション
 
BIがクラウドで更なる進化!データとの連携を強化したデータビジュアライゼーション(Oracle Cloud Days Tokyo 2015)
BIがクラウドで更なる進化!データとの連携を強化したデータビジュアライゼーション(Oracle Cloud Days Tokyo 2015)BIがクラウドで更なる進化!データとの連携を強化したデータビジュアライゼーション(Oracle Cloud Days Tokyo 2015)
BIがクラウドで更なる進化!データとの連携を強化したデータビジュアライゼーション(Oracle Cloud Days Tokyo 2015)
 
データをどこに溜めよう?ローカル?クラウド?どのデータベース?
データをどこに溜めよう?ローカル?クラウド?どのデータベース?データをどこに溜めよう?ローカル?クラウド?どのデータベース?
データをどこに溜めよう?ローカル?クラウド?どのデータベース?
 
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようMicrosoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
 
DataEngConf NYC’18 セッションサマリー #1
DataEngConf NYC’18 セッションサマリー #1DataEngConf NYC’18 セッションサマリー #1
DataEngConf NYC’18 セッションサマリー #1
 
[Gree] DataEngConf NYC’18 セッションサマリー #1
[Gree] DataEngConf NYC’18 セッションサマリー #1[Gree] DataEngConf NYC’18 セッションサマリー #1
[Gree] DataEngConf NYC’18 セッションサマリー #1
 
Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713
 
TREASUREDATAのエコシステムで作るロバストなETLデータ処理基盤の作り方
TREASUREDATAのエコシステムで作るロバストなETLデータ処理基盤の作り方TREASUREDATAのエコシステムで作るロバストなETLデータ処理基盤の作り方
TREASUREDATAのエコシステムで作るロバストなETLデータ処理基盤の作り方
 
Database as code in Devops - DBを10分間で1000個構築するDB仮想化テクノロジーとは?(Ishikawa)
Database as code in Devops - DBを10分間で1000個構築するDB仮想化テクノロジーとは?(Ishikawa)Database as code in Devops - DBを10分間で1000個構築するDB仮想化テクノロジーとは?(Ishikawa)
Database as code in Devops - DBを10分間で1000個構築するDB仮想化テクノロジーとは?(Ishikawa)
 
Data Scientist Workbench - dots0729
Data Scientist Workbench - dots0729Data Scientist Workbench - dots0729
Data Scientist Workbench - dots0729
 
ここが良かったDatadog
ここが良かったDatadogここが良かったDatadog
ここが良かったDatadog
 
祝★AWSスタンダードコンサルティングパートナーに認定されました
祝★AWSスタンダードコンサルティングパートナーに認定されました祝★AWSスタンダードコンサルティングパートナーに認定されました
祝★AWSスタンダードコンサルティングパートナーに認定されました
 
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
 
クラウドを活用した自由自在なデータ分析
クラウドを活用した自由自在なデータ分析クラウドを活用した自由自在なデータ分析
クラウドを活用した自由自在なデータ分析
 
20150905 stream analytics
20150905 stream analytics20150905 stream analytics
20150905 stream analytics
 
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
 

Dernier

Dernier (7)

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 

データ分析基盤におけるOpsのためのDev with event driven + serverless

Notes de l'éditeur

  1. ビジネス、データエンジニアリング、データサイエンスの役割の人が連携しながらビジネスを作り上げている 私がいるのは、データエンジニアリング
  2. ビジネス課題を解決するためのデータを提供しています
  3. 脳みその日次バッチの部分ですよを冒頭に 前述のscalability,availability,maitenability,robustness,costを考えこのような構成にしました。 メインのバッチは2つあります。 まずはETL部分のバッチそして機械学習のバッチです。 それぞれAWS Batchを使用しています。 それらはeven drivenでサーバレスなパイプラインで繋ぎました。
  4. 最後に、弊社の企業文化についてお話しておしまいにしたいと思います。 この画像、弊社の採用ページなんですけど、ボトムアップ文化が非常に強く、 個々人が自分が実現したい世界、解決したいクライアント・カスタマーの課題のために動き、人を巻き込んでいくスタイルです。 圧倒的当事者意識 経営層にもガンガンインプットいれるし、それに答えてくれる。 論理的に正しく、筋が通った提案なら、即実行。 その実現したい世界に対してみんながアドバイス、フィードバックをかけていくれます。 社内ビジネスコンテストもあり、そこから新しいプロダクトも次々出てきています。 そういったマインドやビジネススピードが損なわれないように、DevOpsのプラクティスやスクラム、開発・運用を改善していきます。