SlideShare une entreprise Scribd logo
1  sur  40
Télécharger pour lire hors ligne
AWS SageMaker導入による

機械学習インフラの再構築

Studio Ousia 

島岡 聖世

はじめに

● 自然言語処理を応用したサービスを作っています



● チャットボットサービス QA ENGINE を提供

はじめに

AWSの機械学習サービス SageMaker を導入することで、
QA ENGINE のインフラが改善された話をします。
QA ENGINEのサービス概要
チャットボットのためのテキスト分類APIを提供

① データのアノテーション 
 ② ワンクリックで学習&デプロイ 
 ③ チャットボットと連携 

コントロール

サーバー

クライアント
API

システム構成(SageMaker導入前;レガシー)

機械学習

モジュール

フロントシステム

:通信

:コードの依存関係

コントロール

サーバー

クライアント
API

システム構成(SageMaker導入前;レガシー)

機械学習

モジュール

フロントシステム

タスク処理用のサーバー 



・学習ジョブの起動

・推論インスタンス起動 

・データベース処理

・etc...

:通信

:コードの依存関係

コントロール

サーバー

クライアント
API

システム構成(SageMaker導入前;レガシー)

機械学習

モジュール

フロントシステム

タスク処理用のサーバー 



・学習ジョブの起動

・推論インスタンス起動 

・データベース処理

・etc...

:通信

:コードの依存関係

テキスト分類の

クライアント用API

コントロール

サーバー

クライアント
API

システム構成(SageMaker導入前;レガシー)

機械学習

モジュール

機械学習の

学習や推論の実装

フロントシステム

タスク処理用のサーバー 



・学習ジョブの起動

・推論インスタンス起動 

・データベース処理

・etc...

:通信

:コードの依存関係

テキスト分類の

クライアント用API

レガシーシステムの課題



① 周辺的な処理によるコードの肥大化



② コンポーネント間の依存関係





① 周辺的な処理によるコードの肥大化
ジョブやリソースのマネジメントにたくさんの行数を消費





● 学習



● 推論







● 学習ジョブ起動、状態確認



● 推論インスタンス起動、更新



● モニタリング、スケーリング



● etc...

本質的な処理
周辺的な処理
レガシーシステムの課題 

① 周辺的な処理によるコードの肥大化
ジョブやリソースのマネジメントにたくさんの行数を消費





● 学習



● 推論







● 学習ジョブ起動、状態確認



● 推論インスタンス起動、更新



● モニタリング、スケーリング



● etc...

本質的な処理
周辺的な処理
レガシーシステムの課題 

コードの

肥大化

② コンポーネント間の依存関係
3つのコンポーネントが、同じリポジトリで相互依存

コントロール

サーバー

機械学習

モジュール

クライアント
API

共通モ
ジュール

単一リポジトリ

:コードの依存関係

レガシーシステムの課題 

①コードの肥大化 & ②コンポーネント間の依存関係





機械学習モデルの改良などが困難な状況に

SageMakerで解決できないか?

SageMakerとは

フルマネージド機械学習サービス。学習、性能評価、デプロイ、モニタリングなど機械学
習ワークフロー全体を、APIやコンソールで操作

SageMakerの魅力



① 周辺的な処理を任せられる



② 機械学習モデルをDockerイメージとして作成





① 周辺的な処理を任せられる

機械学習に関連する周辺的な処理は、SageMakerがマネージしてくれる

SageMakerの魅力





● 学習



● 推論







● 学習ジョブ起動、状態確認



● 推論インスタンス起動、更新



● モニタリング、スケーリング



● etc...

本質的な処理
周辺的な処理
SageMaker

① 周辺的な処理を任せられる

機械学習に関連する周辺的な処理は、SageMakerがマネージしてくれる

SageMakerの魅力





● 学習



● 推論







● 学習ジョブ起動、状態確認



● 推論インスタンス起動、更新



● モニタリング、スケーリング



● etc...

本質的な処理
周辺的な処理
② 機械学習モデルをDockerイメージとして作成
● 任意の言語、フレームワークを利用可能

● SageMakerからみれば、モデルは要件を満たすブラックボックス

任意の機械学習モデル 

SageMaker

Dockerイメージ参照 

SageMakerの魅力

SageMakerを導入すれば、機械学習インフラを大きく改善
できるのではないか?

期待と共に、プロジェクトを実施。

Sagemaker導入プロジェクト

2019年

1月
 2月
 3月
 4月
 6月
5月

提案
 実装

本番

デプロイ
入社

プロジェクトによってシステムはどの
ように変わったのか?

レガシーシステム
3つのコンポーネントが、同じリポジトリで相互依存

コントロール

サーバー

機械学習

モジュール

クライアント
API

共通モ
ジュール

単一リポジトリ

:コードの依存関係

新しいシステム

● 各コンポーネントを別々のリポジトリで管理

● コンポーネント間の依存関係は、SageMakerのインターフェースに置き換え

:通信

:Dockerイメージ参照 

リポ ①

コントロール

サーバー

クライアント
API

SageMaker

機械学習

モジュール

リポ ②
 リポ ③

リポ ①

プロジェクト前後の変化

リポ ①
 コントロー
ル

サーバー

クライアン
トAPI

SageMaker

機械学習

モジュール

リポ ②
 リポ ③

リポ ①

コントロール

サーバー

機械学習

モジュール

クライアント
API

共通モ
ジュー
ル

単一

リポジトリ

:通信

:Dockerイメージ参照 

:コードの依存関係

数字でみる変化

 ① コードの量が減った



40%

行数の削減率

② 学習時間が短縮された



70%

学習時間の

平均削減率

 ③ 性能が上がった



4.4%

正解率の

平均上昇幅

① コードの量が減った

独自実装だった周辺的な処理がSageMakerに吸収され、行数が 40% 削減

数字でみる変化

② 学習時間が短縮された

● ハイパーパラメタ探索を行なっている



● SageMakerの機能により効率的な実装が可能に



● クライアント平均で学習時間 70% 短縮

数字でみる変化

③ 精度が上がった

MLエンジニアはシステム全体を気にすることなく、自由なフレームワークを使用可能に。
ゼロから新しいモデルが開発され、正解率は、平均 4.4% 上昇

リポ ①
 コントロー
ル

サーバー

クライアン
トAPI

SageMaker

機械学習

モジュール

リポ ②
 リポ ③

リポ ①

プロダクト

エンジニア
 MLエンジニア

数字でみる変化

数字でみる変化

 ① コードの量が減った



40%

行数の削減率

② 学習時間が短縮された



70%

学習時間の

平均削減率

 ③ 性能が上がった



4.4%

正解率の

平均上昇幅

チームメンバーや顧客からも高評価が続出

チームメンバーや顧客からも高評価が続出

「革命が起きたということになりますね」 ー 弊社エンジニア

チームメンバーや顧客からも高評価が続出

「革命が起きたということになりますね」 ー 弊社エンジニア

「QA ENGINEのシステムアップデート後、回答精度が格段に良くなり回答できる範
囲が拡張できました。ありがとうございます。」ー クライアント様

チームメンバーや顧客からも高評価が続出

「革命が起きたということになりますね」 ー 弊社エンジニア

「QA ENGINEのシステムアップデート後、回答精度が格段に良くなり回答できる範
囲が拡張できました。ありがとうございます。」ー クライアント様

「こちらは正常に完了していますでしょうか。それであればとても嬉しいのです
が...。」ー クライアント様 (学習時間が大幅に短縮されて不審に思われた) 

プロジェクトは大成功!

まとめ

Thanks!

● 周辺的な処理をプラットフォームに任せれば、本質
的な仕事に専念出来るようになる



● コンポーネント同士の依存関係をなくせば、チーム
の共同作業は効率的になる



SageMakerとは

AWSの機械学習のマネージド型サービス。機械学習モデルを構築、トレーニング、デプ
ロイするためのモジュールを提供

構築



● 定番のMLモデルをあ
らかじめ用意



● Dockerでカスタムモ
デルを構築可能

トレーニング



● 学習データはS3に



● コンピューティング資
源を自動管理



● 並列でハイパーパラ
メータ探索

デプロイ



● 学習済みモデルをコ
マンド一つでデプロイ



● モニタリングとオート
スケーリング

② 機械学習モデルをDockerイメージとして作成
● 任意の言語、フレームワークを利用可能

● SageMakerからみれば、モデルは要件を満たすブラックボックス

任意の機械学習モデル 

SageMaker
 要件



● ハイパラ、学習データ、学習後モデルの
ディレクトリのマウント先 



● コンテナ起動時の実行コマンド 



● 標準出力への各種指標の出力フォー
マット



● 推論時のREST APIの仕様 

ECRから参照

SageMakerの魅力

コントロール

サーバー

クライアント
API

レガシーシステム構成

機械学習

モジュール

フロントシステム

:通信

:コードの依存関係

コントロール

サーバー

クライアント
API

新しいシステム構成

フロントシステム

機械学習

モジュール

SageMaker

:通信

:Dockerイメージ参照 


Contenu connexe

Tendances

Tendances (20)

CDN and WAF
CDN and WAFCDN and WAF
CDN and WAF
 
20191106 AWS Black Belt Online Seminar AWS認定にチャレンジしょう – まずはクラウドプラクティショナーから
20191106 AWS Black Belt Online Seminar AWS認定にチャレンジしょう – まずはクラウドプラクティショナーから20191106 AWS Black Belt Online Seminar AWS認定にチャレンジしょう – まずはクラウドプラクティショナーから
20191106 AWS Black Belt Online Seminar AWS認定にチャレンジしょう – まずはクラウドプラクティショナーから
 
AWS Black Belt Online Seminar 2018 動画配信 on AWS
AWS Black Belt Online Seminar 2018 動画配信 on AWSAWS Black Belt Online Seminar 2018 動画配信 on AWS
AWS Black Belt Online Seminar 2018 動画配信 on AWS
 
20211203 AWS Black Belt Online Seminar AWS re:Invent 2021アップデート速報
20211203 AWS Black Belt Online Seminar AWS re:Invent 2021アップデート速報20211203 AWS Black Belt Online Seminar AWS re:Invent 2021アップデート速報
20211203 AWS Black Belt Online Seminar AWS re:Invent 2021アップデート速報
 
Best Practices for Running PostgreSQL on AWS
Best Practices for Running PostgreSQL on AWSBest Practices for Running PostgreSQL on AWS
Best Practices for Running PostgreSQL on AWS
 
20150901 ops jaws_araya_v2
20150901 ops jaws_araya_v220150901 ops jaws_araya_v2
20150901 ops jaws_araya_v2
 
AWS ML Update
AWS ML UpdateAWS ML Update
AWS ML Update
 
[JAWS DAYS] 20180310 Alexa for Business とワークスタイルの未来
[JAWS DAYS] 20180310 Alexa for Business とワークスタイルの未来[JAWS DAYS] 20180310 Alexa for Business とワークスタイルの未来
[JAWS DAYS] 20180310 Alexa for Business とワークスタイルの未来
 
AWSアカウントを解約して1から再構築した話
AWSアカウントを解約して1から再構築した話AWSアカウントを解約して1から再構築した話
AWSアカウントを解約して1から再構築した話
 
20210309 AWS Black Belt Online Seminar AWS Audit Manager
20210309 AWS Black Belt Online Seminar AWS Audit Manager20210309 AWS Black Belt Online Seminar AWS Audit Manager
20210309 AWS Black Belt Online Seminar AWS Audit Manager
 
製造業向けSmart Factoryデモと 関連AWSサービスのご紹介
製造業向けSmart Factoryデモと 関連AWSサービスのご紹介製造業向けSmart Factoryデモと 関連AWSサービスのご紹介
製造業向けSmart Factoryデモと 関連AWSサービスのご紹介
 
Japan Wrap Up re:Invent2018
Japan Wrap Up re:Invent2018Japan Wrap Up re:Invent2018
Japan Wrap Up re:Invent2018
 
20180612 AWS Black Belt Online Seminar AWS で実現するライブ動画配信とリアルタイムチャットのアーキテクチャパターン
20180612 AWS Black Belt Online Seminar AWS で実現するライブ動画配信とリアルタイムチャットのアーキテクチャパターン20180612 AWS Black Belt Online Seminar AWS で実現するライブ動画配信とリアルタイムチャットのアーキテクチャパターン
20180612 AWS Black Belt Online Seminar AWS で実現するライブ動画配信とリアルタイムチャットのアーキテクチャパターン
 
20200811 AWS Black Belt Online Seminar CloudEndure
20200811 AWS Black Belt Online Seminar CloudEndure20200811 AWS Black Belt Online Seminar CloudEndure
20200811 AWS Black Belt Online Seminar CloudEndure
 
Migration to AWS part2
Migration to AWS part2Migration to AWS part2
Migration to AWS part2
 
OpsJAWS 20160128
OpsJAWS 20160128OpsJAWS 20160128
OpsJAWS 20160128
 
202110 AWS Black Belt Online Seminar AWS Site-to-Site VPN
202110 AWS Black Belt Online Seminar AWS Site-to-Site VPN202110 AWS Black Belt Online Seminar AWS Site-to-Site VPN
202110 AWS Black Belt Online Seminar AWS Site-to-Site VPN
 
AWS リモートワークソリューション
AWS リモートワークソリューションAWS リモートワークソリューション
AWS リモートワークソリューション
 
Machine Learning on AWS
Machine Learning on AWS Machine Learning on AWS
Machine Learning on AWS
 
AWS Black Belt Online Seminar コストの観点から見るアカウント管理
AWS Black Belt Online Seminar コストの観点から見るアカウント管理AWS Black Belt Online Seminar コストの観点から見るアカウント管理
AWS Black Belt Online Seminar コストの観点から見るアカウント管理
 

Similaire à AWS SageMaker導入による 機械学習インフラの再構築プロジェクト

AWSを会社で使ってみた
AWSを会社で使ってみたAWSを会社で使ってみた
AWSを会社で使ってみた
Satoshi Ishikawa
 
非公式PaaS勉強会~新宿d社会議室
非公式PaaS勉強会~新宿d社会議室非公式PaaS勉強会~新宿d社会議室
非公式PaaS勉強会~新宿d社会議室
Daisuke Masubuchi
 
クラウド連携のキモは管理用API
クラウド連携のキモは管理用APIクラウド連携のキモは管理用API
クラウド連携のキモは管理用API
Atsushi Nakada
 

Similaire à AWS SageMaker導入による 機械学習インフラの再構築プロジェクト (20)

AWS市場動向と求められる人材、その育成方法について
AWS市場動向と求められる人材、その育成方法についてAWS市場動向と求められる人材、その育成方法について
AWS市場動向と求められる人材、その育成方法について
 
AWSを会社で使ってみた
AWSを会社で使ってみたAWSを会社で使ってみた
AWSを会社で使ってみた
 
Serverless for VUI
Serverless for VUIServerless for VUI
Serverless for VUI
 
DevAx::connect はじめました
DevAx::connect はじめましたDevAx::connect はじめました
DevAx::connect はじめました
 
20190314 aws first_stepv2
20190314 aws first_stepv220190314 aws first_stepv2
20190314 aws first_stepv2
 
非公式PaaS勉強会~新宿d社会議室
非公式PaaS勉強会~新宿d社会議室非公式PaaS勉強会~新宿d社会議室
非公式PaaS勉強会~新宿d社会議室
 
Ajn24
Ajn24Ajn24
Ajn24
 
開発者におくるサーバーレスモニタリング
開発者におくるサーバーレスモニタリング開発者におくるサーバーレスモニタリング
開発者におくるサーバーレスモニタリング
 
[CTO Night & Day 2019] ML services: MLOps #ctonight
[CTO Night & Day 2019] ML services: MLOps #ctonight[CTO Night & Day 2019] ML services: MLOps #ctonight
[CTO Night & Day 2019] ML services: MLOps #ctonight
 
クラウド連携のキモは管理用API
クラウド連携のキモは管理用APIクラウド連携のキモは管理用API
クラウド連携のキモは管理用API
 
Azure Machine Learning アップデートセミナー 20191127
Azure Machine Learning アップデートセミナー 20191127Azure Machine Learning アップデートセミナー 20191127
Azure Machine Learning アップデートセミナー 20191127
 
20211109 JAWS-UG SRE keynotes
20211109 JAWS-UG SRE keynotes20211109 JAWS-UG SRE keynotes
20211109 JAWS-UG SRE keynotes
 
20200728 AWS Black Belt Online Seminar What's New in Serverless
20200728 AWS Black Belt Online Seminar What's New in Serverless20200728 AWS Black Belt Online Seminar What's New in Serverless
20200728 AWS Black Belt Online Seminar What's New in Serverless
 
アマゾンにおけるAWSを用いた社内システム移行事例
アマゾンにおけるAWSを用いた社内システム移行事例アマゾンにおけるAWSを用いた社内システム移行事例
アマゾンにおけるAWSを用いた社内システム移行事例
 
Interoperability of webassembly with javascript
Interoperability of webassembly with javascriptInteroperability of webassembly with javascript
Interoperability of webassembly with javascript
 
Smart Store サーバーレスアーキテクチャ編
Smart Store サーバーレスアーキテクチャ編Smart Store サーバーレスアーキテクチャ編
Smart Store サーバーレスアーキテクチャ編
 
20190514 Smart Store - Azure servlerless architecture
20190514 Smart Store - Azure servlerless architecture20190514 Smart Store - Azure servlerless architecture
20190514 Smart Store - Azure servlerless architecture
 
Swaggerで始めるモデルファーストなAPI開発
Swaggerで始めるモデルファーストなAPI開発Swaggerで始めるモデルファーストなAPI開発
Swaggerで始めるモデルファーストなAPI開発
 
アマゾンクラウドの真価
アマゾンクラウドの真価アマゾンクラウドの真価
アマゾンクラウドの真価
 
aws mackerel twilio_handson_public
aws mackerel twilio_handson_publicaws mackerel twilio_handson_public
aws mackerel twilio_handson_public
 

AWS SageMaker導入による 機械学習インフラの再構築プロジェクト