Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.
1⽇10TB以上の店舗映像を解析する
サービスの仕組みとノウハウ
A-8 17:00〜17:45 #devsumiA
ABEJA Inc. Development Division
⼤⽥黒 紘之
大田黒 紘之 @xecus
ABEJA, Inc.
Development Division
Engineer
2015年新卒入社
• Device Development
• Infrastructure
• Video Analysis A...
https://qiita.com/xecus/items/b7350111024b5fc2d9ae https://tech-blog.abeja.asia/entry/making-flu-warning-iot-device
SORACOM-UG JAWS IoT⽀部
AGENDA
1. 会社・サービス紹介
2. ABEJA Insight for Retailの仕組み
3. サービス拡⼤時に困ったこと
4. ABEJAでの取り組み
5. まとめ
ゆたかな世界を、実装する ― Implement a Fruitful World ―
社名 株式会社ABEJA (ABEJA Inc.)
本社 東京都港区⽩⾦1-17-3 NBFプラチナタワー
代表者 代表取締役社⻑CEO 岡⽥ 陽介
設⽴ ...
2012
ABEJA Platform
取得 蓄積 学習 デプロイ 推論・再学習
ABEJA Platform 利用事例
①不良ポイントマーキング
②不良内容選択
不良ポイントのアノテーション
⾃動検品 異常検知 危険予測 商品仕分け
異常診断 故障予測 需要予測
ABEJA Insight for Retail
Copyright © 2018 ABEJA, Inc. All rights reserved.
Copyright © 2018 ABEJA, Inc. All rights reserved.
(New) リピーター推定機能
顔画像から特徴量(個⼈識別符号)
を抽出し、特徴量がマッチした⼈物
をリピート客と判断(⾃社で研究開発
したアルゴリズムを利⽤)
⇢新規客・リピート客の割合計測が
可能に
※経済産業省から3⽉30⽇にリリー
スさ...
Insight for Retail
導入規模の変化
0
500
1000
1500
2000
2015年 2016年 2017年
100台
(10社50店舗)
800台
(30社200店舗)
1900台
(100社480店舗)
導入デバイス数
導入企業様
サービス提供の仕組み
⾃社開発カメラ
汎⽤ネットワーク
カメラ
POS・IoTデバイス
サービス基盤(国内)
⾃社開発カメラ
汎⽤ネットワーク
カメラ
POS・IoTデバイス
映像録画
システム
ダッシュボード
システム
メール配信
システム
データ変換システム
可視化&配信系
各種運⽤ツール群
映像解析システム
Powered By
Support ...
店舗サイドとサービス基盤サイドの接続 (例)
店舗サイド
カメラカメラカメラ
PoE
Switch
その他IoT
デバイス
ABEJA
Router
ABEJA
ISP
Backend
国内外 数百拠点以上
映像解析
システム
サービス基盤サイ...
映像
FaceDetector
(顔検出)
Feature Extractor
(特徴量抽出器)
ABEJA Platform上のサービス実装
FaceIdentifier
(顔識別器)
ダッシュ
ボード
特徴量データベース
Demographi...
サービス規模
Video Traffic
10TB / Day
Containers
7,000+
サービス拡大時に困ったこと
IoT AI
サービス拡⼤の阻害要因
※もちろん、⼀般的なWebサービスと同様なツラミもある
サービス拡⼤の阻害要因:IoT側
デバイスの故障対応
デバイスの導入設置コスト
デバイスの導⼊設置コスト
・データ供給にはデバイス導⼊作業(設置⼯事等)が必須
・デバイス導⼊作業の例
(1)事前調査・導⼊計画⽴案
(2)電源・ネットワークの確保
(3)デバイスの設置作業・設定作業
※基本的に現地作業が発⽣。専⾨知識必須。
...
デバイス故障との戦い
・デバイス故障は、サービス品質に悪影響を及ぼす
⇢良好な設置条件でも故障は発⽣する
⇢故障にはパターンがあり
・サービス拡⼤時に故障が増える
⇢想定していない環境が増えた結果
⇢現地対応が何度も発⽣
サービス拡⼤の阻害要因...
デバイス故障パターンの種類と例
・故障のパターン例
⇢初期不良
例:FWキッティングミス
⇢群発故障
例:環境要因が多い
⇢寿命による故障
例:SDカード書き換え寿命
  熱によるハード故障
故障率曲線(バスタブ曲線)
デバイス故障要因の例
•電源トラブル
•計画停電 / 絶縁試験 / ブレーカー / 断線 / 電圧不足
•ネットワークトラブル
•ISP帯域制限 / ISP障害 / IP重複 / 特定NW機器の組み合わせ
•無線LANチャンネル干渉 / 断線(...
サービス拡⼤の阻害要因:AI側
多様化するデバイス・アルゴリズムの対応
大量のパラメータ管理
常に変化する実環境への対応
スケールするインフラ確保
多様化するデバイス・アルゴリズムの対応
・サービス拡⼤時に機能拡張ラッシュが発⽣!!
⇢要因:連携するデバイス・アルゴリズムの種類が増えた為
・実際に発⽣した対応例
⇢新デバイスの登場
 特殊環境⽤カメラ / 距離画像⽤カメラ
⇢新アルゴリズム...
常に変化する実環境への対応
・設置環境(店舗内)は常に変化している
⇢弊社ダッシュボードを⾒ながら店舗内の改善活動を実施
・AIの品質を保つ為には環境変化への追従が必要
(1)映像解析のパラメータ調節
(2)デバイスのリモート設定変更
サービス...
AIの品質に悪影響を与える要素
オクルージョン発⽣の例 逆光の例
(七⼣などのイベントが地味に要注意)
⼤量のパラメータ管理
・サービス導⼊と運⽤にはIoT・AIの両サイドのパラメータ管理が必須
・サービス拡⼤時には管理すべきパラメータが⼀気に増加する
⇢クライアント数・カメラ台数が増加する為
サービス拡⼤の阻害要因:AI側
IoTデバイス関連設...
IoTデバイス関連パラメータ例
ネットワーク関連
パラメータ
デバイス関連
パラメーター
IPアドレス
デバイスホスト名
ネットワーク認証情報
SIMカード関連
データ出⼒設定
・圧縮⽅法
・FPS
・ビットレート
設置位置・画⾓・⾼さ
MAC...
AI関連パラメータ例
その他
解析設定関連
顔・⼈物検出⽤パラメータ
データ提供開始⽇時 データ提供終了⽇時
ダッシュボード表⽰名 解析する時間幅
誤検知防⽌⽤パラメータ
リピート判断閾値
DWH認証情報
モデルバージョン
ネットワークモデル
ABEJAでの取り組みご紹介
デバイスの
安定性改善
拡張・スケール可能な
サービス基盤
サービス拡大の取り組み
チームでサービス導入・
運用できる体制構築
Design for Device failure
デバイスの
安定性改善
拡張・スケール可能な
サービス基盤
サービス拡⼤の取り組み
チームでサービス導入・
運用できる体制構築
1. ABEJA Platformの
利⽤
2. Plugableな映像解析
パイプライン
3.品質の⾒える化
4....
取り組み① ABEJA Platformの利⽤
⽬的:サービス展開・拡張に集中する為
IoT運⽤
モデルの管理
推論⽤インフラの調達・運⽤学習⽤インフラの調達・運⽤
AI運⽤
設定の管理
蓄積データの管理 精度確認
IoT x AI活⽤サービスの展開・拡⼤に必要な要素
IoT運⽤ AI運⽤
IoT x AI活⽤サービスの展開・拡⼤に必要な要素
取り組み② Plugableな映像解析パイプラインの構築
⽬的:新種デバイス・アルゴリズムの対応を
柔軟にする
機能拡張の難しい構成
(Monolithicな構成)
デバイス
(カメラ)
解析システム ダッシュボード
Monolithic Core
• 開発環境の構築が⼤変(当時)
• 機能追加によってコアサイズが肥⼤化
• ⼩さな機能追加をする度に時間...
機能拡張のしやすい構成
(Pluggableなコンポーネントの活⽤)
解析システム ダッシュボード
コンポーネント群
録画部 変換部
アルゴリズム
部分
結果
転送部
デバイス
(カメラ)
データの流れ
ダッシュ
ボード
録画部 変換部
アルゴリズム
部
結果
転送部
カメラ
構成例:新カメラ対応が必要な時
ダッシュ
ボード
録画部
(カメラA⽤)
アルゴリズム
部
結果
転送部
カメラ
A
ダッシュ
ボード
アルゴリズム
部
結果
転送部
カメラ
B
変換部
(カメラA⽤)
録画部
(カメラB
変換部
(カメラB⽤)
構成例:新アルゴリズム対応が必要な時
(新サービス登場含む)
ダッシュ
ボード
録画部
アルゴリズム
A
結果
転送部
カメラ
ダッシュ
ボード
アルゴリズム
B
結果
転送部
変換部
カメラ 録画部 変換部
Pluggableなモジュール活⽤のメリット
・いわゆるSeparate of Concern
・機能の拡張性が向上、開発が加速
⇢新カメラデバイス対応
⇢新アルゴリズム対応
・様々なデバイス・アルゴリズムを組み合わせた
サービス提供が可能にな...
デバイスの
安定性改善
拡張・スケール可能な
サービス基盤
サービス拡⼤の取り組み
チームでサービス導入・
運用できる体制構築
1. ABEJA Platformの
利⽤
2. Plugableな映像解析
パイプライン
3.品質の⾒える化
4....
取り組み③ 「品質」の⾒える化
⽬的:デバイス・映像解析の状況を正しく把握し
トラブル対応をする⼟壌を作る
⾒るべき「品質」は・・?
・データ提供に関わる全てのシステム ・⼊出⼒データ(理想)
⇢ デバイス/ネットワーク/映像/映像解析/解析結果/Dashboard/etc..
・デバイスまわりの品質⾒える化も重要
⇢サービス拡⼤時に予期せぬデバイス...
デバイス故障要因の例 (再掲)
•電源トラブル
•計画停電 / 絶縁試験 / ブレーカー / 断線 / 電圧不足
•ネットワークトラブル
•ISP帯域制限 / ISP障害 / IP重複 / 特定NW機器の組み合わせ
•無線LANチャンネル干渉 ...
取得しているデバイス情報
•メトリクス
•デバイスファームウェアの安定性
• CPU / メモリ使⽤率
•店舗側ネットワーク環境の安定性
• デバイスの通信量
• RSSI(無線LAN電波強度)
•店舗電源環境の安定性
• デバイスの起動回数
...
実装例
デバイスA
デバイスB
デバイスC
Devices Aggregator Database Visualizer
デバイスまわりの品質が⾒えると…
・デバイスのトラブル要因切り分けが
円滑になった
⇢エンジニアの対応⼯数が減少
⇢現地に⾏く回数が激減
・トラブルの起きやすい環境が⾒えてくる
⇢定量的な安定性評価
・デバイス・店舗ネットワークへの反映
取り組み④ 徹底的なツール開発
⽬的:IoT・AI活⽤サービスの導⼊・運⽤を
チーム全員でやる体制をつくる
ツールがなかった時代
• サービス導⼊
• デバイス準備・映像解析の設定・アカウント発⾏の各業務が属⼈化
• ⼤規模導⼊に時間がかかる。⼤規模導⼊がストレス
• サービス運⽤
• ⽇々環境が変わる店舗に対して、エンジニアが映像解析設定業務(チュ...
開発した社内ツール達(⼀部)
• サービス導⼊・運⽤⽀援
• デバイス⾃動設定ツール(キッティング、出荷チェック)
• 施⼯⽀援ツール群(在庫管理、施⼯後のシステム連携確認)
• 映像解析管理ツール
• アカウント管理ツール
• デバイス設定管...
映像解析管理ツールのご紹介
• 解析に必要な情報管理
• 映像解析の制御
• デバイス設置後の解析⽴ち上げ
• 設定変更(パラメータチューニン
グ・学習モデル変更)
• 設定状況確認
• 解析破棄
• インフラの⼿動スケール 映像解析ツール(画...
取り組み⑤ 導⼊・運⽤プロセスの継続的改善
⽬的:⾃⾛可能なチームの⼟台をつくる為
(ツール中⼼の導⼊・運⽤体制の仕上げ)
効率的なサービス導⼊・運⽤には
ツール+OneMoreThingが必要
• よいツールがあっても意思決定がノウハウを持っている⼈に集中
• この⼈がボトルネックになる
• 事業拡⼤フェーズに導⼊・運⽤が追いつかなくなる
• ベストプラクティスが...
プロセス構築と⽂化確⽴
ツール・ドキュメント中⼼
の導⼊・運⽤プロセス
プロセス改善をする
⽂化の確⽴
×
ドキュメント例
• 作成したマニュアル(⼀部)
• デバイス準備マニュアル
• デバイス設置マニュアル
• 映像解析設定マニュアル
• デバイス交換マニュアル
• アカウント発⾏マニュアル
• ドキュメントリンク集
ポータルサイトでチーム内の誰...
プロセスを改善する⽂化の確⽴
1.⾮エンジニアを含むDevOps
• 開発と運⽤を分離しない体制
• 運⽤を前提とした開発が可能
2.常により良いプラクティスをチームで追いかけるTRY
• 様々なメンバーにドキュメントだけでプロセスを回してもら...
取り組みのまとめ
デバイスの
安定性改善
拡張・スケール可能な
サービス基盤
チームでサービス導入・
運用できる体制構築
1. ABEJA Platformの
利⽤
2. Plugableな映像解析
パイプライン
3.品質の⾒える化
4.徹底的...
Conclusion
• AI×IoTには、⼀般的なWebサービスと異なるツラミがある
• デバイス故障 / 実環境の変化対応 / …
• AI×IoTを活⽤したサービスの展開・拡⼤には準備が必要
• サービス拡⼤に集中する為にABEJA Pl...
We’re Hiring!
https://www.wantedly.com/companies/abeja
Thank you !!
Developers Summit Summer 2018 - 1日10TB以上の店舗映像を解析するサービスの仕組みとノウハウ
Developers Summit Summer 2018 - 1日10TB以上の店舗映像を解析するサービスの仕組みとノウハウ
Developers Summit Summer 2018 - 1日10TB以上の店舗映像を解析するサービスの仕組みとノウハウ
Developers Summit Summer 2018 - 1日10TB以上の店舗映像を解析するサービスの仕組みとノウハウ
Developers Summit Summer 2018 - 1日10TB以上の店舗映像を解析するサービスの仕組みとノウハウ
Prochain SlideShare
Chargement dans…5
×

Developers Summit Summer 2018 - 1日10TB以上の店舗映像を解析するサービスの仕組みとノウハウ

2 594 vues

Publié le

2018/7/27にDevelopers Summit Summer 2018にて発表させていただいたものです。
※一部、PDF化する時にレイアウトに崩れている場所がございます。

Publié dans : Technologie
  • Identifiez-vous pour voir les commentaires

Developers Summit Summer 2018 - 1日10TB以上の店舗映像を解析するサービスの仕組みとノウハウ

  1. 1. 1⽇10TB以上の店舗映像を解析する サービスの仕組みとノウハウ A-8 17:00〜17:45 #devsumiA ABEJA Inc. Development Division ⼤⽥黒 紘之
  2. 2. 大田黒 紘之 @xecus ABEJA, Inc. Development Division Engineer 2015年新卒入社 • Device Development • Infrastructure • Video Analysis Application • DeepLearning
  3. 3. https://qiita.com/xecus/items/b7350111024b5fc2d9ae https://tech-blog.abeja.asia/entry/making-flu-warning-iot-device
  4. 4. SORACOM-UG JAWS IoT⽀部
  5. 5. AGENDA 1. 会社・サービス紹介 2. ABEJA Insight for Retailの仕組み 3. サービス拡⼤時に困ったこと 4. ABEJAでの取り組み 5. まとめ
  6. 6. ゆたかな世界を、実装する ― Implement a Fruitful World ― 社名 株式会社ABEJA (ABEJA Inc.) 本社 東京都港区⽩⾦1-17-3 NBFプラチナタワー 代表者 代表取締役社⻑CEO 岡⽥ 陽介 設⽴ 2012年9⽉10⽇ Vision イノベーションで世界を変える 出資企業 NVIDIA 三菱UFJキャピタル株式会社 株式会社産業⾰新機構 みずほキャピタル株式会社 伊藤忠商事株式会社 株式会社インスパイア 東芝テック株式会社 ダイキン⼯業株式会社 株式会社セールスフォース・ドットコム 株式会社トプコン 株式会社NTTドコモベンチャーズ 武蔵精密⼯業株式会社 代表取締役社⻑ CEO 兼 CTO 岡⽥ 陽介 取締役 CRO(最⾼研究責任者) 緒⽅ 貴紀 取締役 COO 兼 CFO 外⽊ 直樹 取締役 ファウンダー 富松 圭介
  7. 7. 2012
  8. 8. ABEJA Platform 取得 蓄積 学習 デプロイ 推論・再学習
  9. 9. ABEJA Platform 利用事例
  10. 10. ①不良ポイントマーキング ②不良内容選択 不良ポイントのアノテーション
  11. 11. ⾃動検品 異常検知 危険予測 商品仕分け
  12. 12. 異常診断 故障予測 需要予測
  13. 13. ABEJA Insight for Retail
  14. 14. Copyright © 2018 ABEJA, Inc. All rights reserved.
  15. 15. Copyright © 2018 ABEJA, Inc. All rights reserved.
  16. 16. (New) リピーター推定機能 顔画像から特徴量(個⼈識別符号) を抽出し、特徴量がマッチした⼈物 をリピート客と判断(⾃社で研究開発 したアルゴリズムを利⽤) ⇢新規客・リピート客の割合計測が 可能に ※経済産業省から3⽉30⽇にリリー スされた「カメラ画像利活⽤ガイド ブックver2.0」に準拠
  17. 17. Insight for Retail 導入規模の変化 0 500 1000 1500 2000 2015年 2016年 2017年 100台 (10社50店舗) 800台 (30社200店舗) 1900台 (100社480店舗) 導入デバイス数
  18. 18. 導入企業様
  19. 19. サービス提供の仕組み ⾃社開発カメラ 汎⽤ネットワーク カメラ POS・IoTデバイス サービス基盤(国内)
  20. 20. ⾃社開発カメラ 汎⽤ネットワーク カメラ POS・IoTデバイス 映像録画 システム ダッシュボード システム メール配信 システム データ変換システム 可視化&配信系 各種運⽤ツール群 映像解析システム Powered By Support Members ABEJA Insight For Retail  サービス基盤全体像
  21. 21. 店舗サイドとサービス基盤サイドの接続 (例) 店舗サイド カメラカメラカメラ PoE Switch その他IoT デバイス ABEJA Router ABEJA ISP Backend 国内外 数百拠点以上 映像解析 システム サービス基盤サイド 暗号化 通信 映像録画 システム (⼀部省略)
  22. 22. 映像 FaceDetector (顔検出) Feature Extractor (特徴量抽出器) ABEJA Platform上のサービス実装 FaceIdentifier (顔識別器) ダッシュ ボード 特徴量データベース Demographic Estimator (年齢・性別推定器) 年齢性別・リピーター判定部顔画像・特徴量抽出部 ※解析後の動画は即時破棄 ※ガイドブックに準拠したデータ管理
  23. 23. サービス規模 Video Traffic 10TB / Day Containers 7,000+
  24. 24. サービス拡大時に困ったこと
  25. 25. IoT AI サービス拡⼤の阻害要因 ※もちろん、⼀般的なWebサービスと同様なツラミもある
  26. 26. サービス拡⼤の阻害要因:IoT側 デバイスの故障対応 デバイスの導入設置コスト
  27. 27. デバイスの導⼊設置コスト ・データ供給にはデバイス導⼊作業(設置⼯事等)が必須 ・デバイス導⼊作業の例 (1)事前調査・導⼊計画⽴案 (2)電源・ネットワークの確保 (3)デバイスの設置作業・設定作業 ※基本的に現地作業が発⽣。専⾨知識必須。 サービス拡⼤の阻害要因:IoT側 カメラ設置の様⼦
  28. 28. デバイス故障との戦い ・デバイス故障は、サービス品質に悪影響を及ぼす ⇢良好な設置条件でも故障は発⽣する ⇢故障にはパターンがあり ・サービス拡⼤時に故障が増える ⇢想定していない環境が増えた結果 ⇢現地対応が何度も発⽣ サービス拡⼤の阻害要因:IoT側
  29. 29. デバイス故障パターンの種類と例 ・故障のパターン例 ⇢初期不良 例:FWキッティングミス ⇢群発故障 例:環境要因が多い ⇢寿命による故障 例:SDカード書き換え寿命   熱によるハード故障 故障率曲線(バスタブ曲線)
  30. 30. デバイス故障要因の例 •電源トラブル •計画停電 / 絶縁試験 / ブレーカー / 断線 / 電圧不足 •ネットワークトラブル •ISP帯域制限 / ISP障害 / IP重複 / 特定NW機器の組み合わせ •無線LANチャンネル干渉 / 断線(人為的) •ネットワーク帯域不足 •物理的破損 •ファームウェア不良
  31. 31. サービス拡⼤の阻害要因:AI側 多様化するデバイス・アルゴリズムの対応 大量のパラメータ管理 常に変化する実環境への対応 スケールするインフラ確保
  32. 32. 多様化するデバイス・アルゴリズムの対応 ・サービス拡⼤時に機能拡張ラッシュが発⽣!! ⇢要因:連携するデバイス・アルゴリズムの種類が増えた為 ・実際に発⽣した対応例 ⇢新デバイスの登場  特殊環境⽤カメラ / 距離画像⽤カメラ ⇢新アルゴリズムの登場 ⇢新サービスの登場 サービス拡⼤の阻害要因:AI側
  33. 33. 常に変化する実環境への対応 ・設置環境(店舗内)は常に変化している ⇢弊社ダッシュボードを⾒ながら店舗内の改善活動を実施 ・AIの品質を保つ為には環境変化への追従が必要 (1)映像解析のパラメータ調節 (2)デバイスのリモート設定変更 サービス拡⼤の阻害要因:AI側
  34. 34. AIの品質に悪影響を与える要素 オクルージョン発⽣の例 逆光の例 (七⼣などのイベントが地味に要注意)
  35. 35. ⼤量のパラメータ管理 ・サービス導⼊と運⽤にはIoT・AIの両サイドのパラメータ管理が必須 ・サービス拡⼤時には管理すべきパラメータが⼀気に増加する ⇢クライアント数・カメラ台数が増加する為 サービス拡⼤の阻害要因:AI側 IoTデバイス関連設定 (カメラ関連設定) AI関連設定 (映像解析設定)
  36. 36. IoTデバイス関連パラメータ例 ネットワーク関連 パラメータ デバイス関連 パラメーター IPアドレス デバイスホスト名 ネットワーク認証情報 SIMカード関連 データ出⼒設定 ・圧縮⽅法 ・FPS ・ビットレート 設置位置・画⾓・⾼さ MACアドレス DDNS デバイス認証情報 ファームウェアバージョン NW機器 F/Wバージョン
  37. 37. AI関連パラメータ例 その他 解析設定関連 顔・⼈物検出⽤パラメータ データ提供開始⽇時 データ提供終了⽇時 ダッシュボード表⽰名 解析する時間幅 誤検知防⽌⽤パラメータ リピート判断閾値 DWH認証情報 モデルバージョン ネットワークモデル
  38. 38. ABEJAでの取り組みご紹介
  39. 39. デバイスの 安定性改善 拡張・スケール可能な サービス基盤 サービス拡大の取り組み チームでサービス導入・ 運用できる体制構築
  40. 40. Design for Device failure
  41. 41. デバイスの 安定性改善 拡張・スケール可能な サービス基盤 サービス拡⼤の取り組み チームでサービス導入・ 運用できる体制構築 1. ABEJA Platformの 利⽤ 2. Plugableな映像解析 パイプライン 3.品質の⾒える化 4.徹底的なツール開発 5.導⼊・運⽤プロセス の整備 ※ある程度は実施※
  42. 42. 取り組み① ABEJA Platformの利⽤ ⽬的:サービス展開・拡張に集中する為
  43. 43. IoT運⽤ モデルの管理 推論⽤インフラの調達・運⽤学習⽤インフラの調達・運⽤ AI運⽤ 設定の管理 蓄積データの管理 精度確認 IoT x AI活⽤サービスの展開・拡⼤に必要な要素
  44. 44. IoT運⽤ AI運⽤ IoT x AI活⽤サービスの展開・拡⼤に必要な要素
  45. 45. 取り組み② Plugableな映像解析パイプラインの構築 ⽬的:新種デバイス・アルゴリズムの対応を 柔軟にする
  46. 46. 機能拡張の難しい構成 (Monolithicな構成) デバイス (カメラ) 解析システム ダッシュボード Monolithic Core • 開発環境の構築が⼤変(当時) • 機能追加によってコアサイズが肥⼤化 • ⼩さな機能追加をする度に時間のかかるCI • 依存関係が複雑に⼊り乱れる
  47. 47. 機能拡張のしやすい構成 (Pluggableなコンポーネントの活⽤) 解析システム ダッシュボード コンポーネント群 録画部 変換部 アルゴリズム 部分 結果 転送部 デバイス (カメラ)
  48. 48. データの流れ ダッシュ ボード 録画部 変換部 アルゴリズム 部 結果 転送部 カメラ
  49. 49. 構成例:新カメラ対応が必要な時 ダッシュ ボード 録画部 (カメラA⽤) アルゴリズム 部 結果 転送部 カメラ A ダッシュ ボード アルゴリズム 部 結果 転送部 カメラ B 変換部 (カメラA⽤) 録画部 (カメラB 変換部 (カメラB⽤)
  50. 50. 構成例:新アルゴリズム対応が必要な時 (新サービス登場含む) ダッシュ ボード 録画部 アルゴリズム A 結果 転送部 カメラ ダッシュ ボード アルゴリズム B 結果 転送部 変換部 カメラ 録画部 変換部
  51. 51. Pluggableなモジュール活⽤のメリット ・いわゆるSeparate of Concern ・機能の拡張性が向上、開発が加速 ⇢新カメラデバイス対応 ⇢新アルゴリズム対応 ・様々なデバイス・アルゴリズムを組み合わせた サービス提供が可能になった 社内研究 チーム 録画 変換 アルゴ リズム 転送 開発チームA 開発チームB 機能改良 アルゴリズム改良
  52. 52. デバイスの 安定性改善 拡張・スケール可能な サービス基盤 サービス拡⼤の取り組み チームでサービス導入・ 運用できる体制構築 1. ABEJA Platformの 利⽤ 2. Plugableな映像解析 パイプライン 3.品質の⾒える化 4.徹底的なツール開発 5.導⼊・運⽤プロセス の整備 ※ある程度は実施※
  53. 53. 取り組み③ 「品質」の⾒える化 ⽬的:デバイス・映像解析の状況を正しく把握し トラブル対応をする⼟壌を作る
  54. 54. ⾒るべき「品質」は・・? ・データ提供に関わる全てのシステム ・⼊出⼒データ(理想) ⇢ デバイス/ネットワーク/映像/映像解析/解析結果/Dashboard/etc.. ・デバイスまわりの品質⾒える化も重要 ⇢サービス拡⼤時に予期せぬデバイストラブルが頻発する! ・そしてデバイストラブルの対応は⾮常に⾟い… ⇢度重なる現地対応 ⇢複合的な要因が多く、原因究明が⼤変
  55. 55. デバイス故障要因の例 (再掲) •電源トラブル •計画停電 / 絶縁試験 / ブレーカー / 断線 / 電圧不足 •ネットワークトラブル •ISP帯域制限 / ISP障害 / IP重複 / 特定NW機器の組み合わせ •無線LANチャンネル干渉 / 断線(人為的) •物理的破損 •ファームウェア不良
  56. 56. 取得しているデバイス情報 •メトリクス •デバイスファームウェアの安定性 • CPU / メモリ使⽤率 •店舗側ネットワーク環境の安定性 • デバイスの通信量 • RSSI(無線LAN電波強度) •店舗電源環境の安定性 • デバイスの起動回数 •ログ •デバイス上ロジックの安定性 • 正常系イベントログ(正常 系) •原因究明⽤の情報 • エラーレポート • システム・ネットワークのイ ベントログ
  57. 57. 実装例 デバイスA デバイスB デバイスC Devices Aggregator Database Visualizer
  58. 58. デバイスまわりの品質が⾒えると… ・デバイスのトラブル要因切り分けが 円滑になった ⇢エンジニアの対応⼯数が減少 ⇢現地に⾏く回数が激減 ・トラブルの起きやすい環境が⾒えてくる ⇢定量的な安定性評価 ・デバイス・店舗ネットワークへの反映
  59. 59. 取り組み④ 徹底的なツール開発 ⽬的:IoT・AI活⽤サービスの導⼊・運⽤を チーム全員でやる体制をつくる
  60. 60. ツールがなかった時代 • サービス導⼊ • デバイス準備・映像解析の設定・アカウント発⾏の各業務が属⼈化 • ⼤規模導⼊に時間がかかる。⼤規模導⼊がストレス • サービス運⽤ • ⽇々環境が変わる店舗に対して、エンジニアが映像解析設定業務(チュー ニング・学習モデルのアップデート)に追われる • 故障したデバイス対応・解析再設定が割り込む
  61. 61. 開発した社内ツール達(⼀部) • サービス導⼊・運⽤⽀援 • デバイス⾃動設定ツール(キッティング、出荷チェック) • 施⼯⽀援ツール群(在庫管理、施⼯後のシステム連携確認) • 映像解析管理ツール • アカウント管理ツール • デバイス設定管理ツール
  62. 62. 映像解析管理ツールのご紹介 • 解析に必要な情報管理 • 映像解析の制御 • デバイス設置後の解析⽴ち上げ • 設定変更(パラメータチューニン グ・学習モデル変更) • 設定状況確認 • 解析破棄 • インフラの⼿動スケール 映像解析ツール(画⾯イメージ)
  63. 63. 取り組み⑤ 導⼊・運⽤プロセスの継続的改善 ⽬的:⾃⾛可能なチームの⼟台をつくる為 (ツール中⼼の導⼊・運⽤体制の仕上げ)
  64. 64. 効率的なサービス導⼊・運⽤には ツール+OneMoreThingが必要 • よいツールがあっても意思決定がノウハウを持っている⼈に集中 • この⼈がボトルネックになる • 事業拡⼤フェーズに導⼊・運⽤が追いつかなくなる • ベストプラクティスが追求できない • ツール/ドキュメントが陳腐化する
  65. 65. プロセス構築と⽂化確⽴ ツール・ドキュメント中⼼ の導⼊・運⽤プロセス プロセス改善をする ⽂化の確⽴ ×
  66. 66. ドキュメント例 • 作成したマニュアル(⼀部) • デバイス準備マニュアル • デバイス設置マニュアル • 映像解析設定マニュアル • デバイス交換マニュアル • アカウント発⾏マニュアル • ドキュメントリンク集 ポータルサイトでチーム内の誰もが参照可能
  67. 67. プロセスを改善する⽂化の確⽴ 1.⾮エンジニアを含むDevOps • 開発と運⽤を分離しない体制 • 運⽤を前提とした開発が可能 2.常により良いプラクティスをチームで追いかけるTRY • 様々なメンバーにドキュメントだけでプロセスを回してもらう • 良いプラクティスを⾒つけたらプロセス改良&ドキュメント更新
  68. 68. 取り組みのまとめ デバイスの 安定性改善 拡張・スケール可能な サービス基盤 チームでサービス導入・ 運用できる体制構築 1. ABEJA Platformの 利⽤ 2. Plugableな映像解析 パイプライン 3.品質の⾒える化 4.徹底的なツール開発 5.導⼊・運⽤プロセス の整備
  69. 69. Conclusion • AI×IoTには、⼀般的なWebサービスと異なるツラミがある • デバイス故障 / 実環境の変化対応 / … • AI×IoTを活⽤したサービスの展開・拡⼤には準備が必要 • サービス拡⼤に集中する為にABEJA Platformを利⽤ • 新しいデバイス・アルゴリズムに対して柔軟な機能拡張ができるアーキテクチャ • デバイスを含めたシステム・データの品質を⾒る仕組み • 導⼊・運⽤を円滑に進めるためのツール・体制・⽂化づくり
  70. 70. We’re Hiring! https://www.wantedly.com/companies/abeja
  71. 71. Thank you !!

×