SlideShare une entreprise Scribd logo
1  sur  12
Mobility Technologies Co., Ltd.
郭 卓然
モバイル向けEdgeTPUの紹介
Mobility Technologies Co., Ltd.
2
はじめに
● これから話す内容
○ TPUとは
○ Edge TPUとは
○ Edge TPUを用いてエッジモデルの推論評価
Mobility Technologies Co., Ltd.
3
TPUとは
- TPU(Tensor Processing Unit)は、AI処理を高速化するためにGoogleが開発したプロセッサで、主にクラウドサービ
ス側での使用を想定したものでした。
Google TPU v2
https://blog.inten.to/hardware-for-deep-learning-part-4-
asic-96a542fe6a81
Google TPUの特徴:
● 巨大なオンチップRAMを備えている。メモリのアクセス時間を減らします。
● 8ビット 量子化(8 bit quantization)。32ビットのfloating-pointの計算の代わりに8ビット
のinteger 計算が実行される。ある程度の精度を犠牲に、効率を改善します。
● Systolic arrayというアーキテクチャを使用します。
● 「積和演算」などの特定の操作用に配線されている。ディープラーニングによく適用
できます。
● 良い冷却システムがあり、リソースコストを節約できます。
Mobility Technologies Co., Ltd.
4
TPU vs GPU
Nvidia Tesla Volta 100のGPUと比べてTPU v2の性能は明らかに高いとは言えない
がコストを減らすことは明らかです。
https://www.hpcwire.com/2018/04/30/riseml-benchmarks-google-tpuv2-
against-nvidia-v100-gpu/
https://qiita.com/nishiha/items/32276cc77b27383c825f
Mobility Technologies Co., Ltd.
5
EdgeTPUとは
- Edge TPUはエッジ端末用に開発されたデバイスで、8ビットの演算のみをサポートしています。高速に機械学習ラ
イブラリ(TensorFlow Lite)を実行させることができ、たとえば高解像度の動画上でフレームごとに複数のAIモデルを
30フレーム/秒で同時に実行させることができます。
今も様々なデバイスがリリースされています。
Edge teamのchallenge weekでDev Boardを購入して、自社Modelの推
論評価を担当しました。
https://coral.ai/docs/dev-board/get-started/#flash-the-board
Mobility Technologies Co., Ltd.
6
EdgeTPUの使い方
● Edge TPUのデバイスとTensorFlow liteが緊密的に繋がります。
● TensorFlow Liteのおかげで、モバイル、組み込み、IoTデバイスで
TensorFlowモデルを変換して実行できるようになります。
https://blog.tensorflow.org/2018/03/using-
tensorflow-lite-on-android.html
Mobility Technologies Co., Ltd.
7
EdgeTPUの使い方
★ Edge TPUに向けて、TensorFlowモデルの導入フロ
ーは以下のようになる:
https://coral.ai/docs/edgetpu/models-intro/#compatibility-overview
Mobility Technologies Co., Ltd.
8
EdgeTPUの使い方
1. Dev BoardとUSB Acceleratorで推論速度が変わっていないことからCPU自体のスペックにはほとんど
影響しないということがこの表からわかります。
2. また同じハードでモデル同士を比較するとDesktop CPUにおけるInception v4からMobile Net V1は16
倍速くなっているといえますが、Dev Boardの場合だと45倍速くなっていると計算できます。
https://cdn-images-
1.medium.com/max/1024/1*pCYQHA_PmF2_awq2c
oMJvg.png)
Mobility Technologies Co., Ltd.
9
EdgeTPUの使い方
demo:PyCoralAPIを使用してモデルを実行します。
https://coral.ai/docs/edgetpu/tflite-
python/#overview
Mobility Technologies Co., Ltd.
10
EdgeTPUを用いてエッジModel推論評価
エッジのonnxモデルからEdgeTPUモデルまで二つの変換方法試しました:
1. onnx → tf → TFlite→edge_tpu.tflite:
converter = tf.lite.TFLiteConverter.from_saved_model(pb_model_save_path)
1. onnx → keras→ TFlite→edge_tpu.tflite:
converter = tf.lite.TFLiteConverter.from_keras_model(keras_model)
⭐️edge_tpuでうまく動くために、モデルはTFliteにコンパイルする場合量子化が必
要
Mobility Technologies Co., Ltd.
11
EdgeTPUを用いてエッジ推論評価ベンチマーク
自社Edge製品に搭載されているDSP、GPU、およびDevBoardのEdgeTPUのランタイムを用いて自
社モデルの推論速度のベンチマークを行いました。
● model1とmodel2:edge_tpuの推
論速度はgpuとdspより明らかに速
いと分かります。
● model3:edge_tpuの推論速度は
gpuとの比較ではほぼ同等(か少
し遅い)になっていますが、それ
はmodel3のアーキテクチャがgpu
Runtimeに最適化されていること
が1つの要因としてありそうです。
Mobility Technologies Co., Ltd.
12
まとめと感想
■ CPUとGPUと違ってTPUは特にディープラーニングのために設計された。巨
大オンチップ RAM を備えているし、Systolic arrayのようなアーキテクチャ
も使用されます。
■ EdgeTPUのcomplierと仕様など複雑ではなく、Python APIとC++ API両方も
使えます。
■ 一部のエッジモデルに対してある程度高速化できる傾向が見られます。

Contenu connexe

Tendances

Tendances (20)

機械学習モデルのサービングとは?
機械学習モデルのサービングとは?機械学習モデルのサービングとは?
機械学習モデルのサービングとは?
 
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
 
研究効率化Tips Ver.2
研究効率化Tips Ver.2研究効率化Tips Ver.2
研究効率化Tips Ver.2
 
【DL輪読会】Segment Anything
【DL輪読会】Segment Anything【DL輪読会】Segment Anything
【DL輪読会】Segment Anything
 
最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情
 
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
 
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
 
【DL輪読会】ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders
【DL輪読会】ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders【DL輪読会】ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders
【DL輪読会】ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders
 
画像キャプションの自動生成
画像キャプションの自動生成画像キャプションの自動生成
画像キャプションの自動生成
 
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
 
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
 
簡単な算数でできる文章校正
簡単な算数でできる文章校正簡単な算数でできる文章校正
簡単な算数でできる文章校正
 
[DL輪読会]1次近似系MAMLとその理論的背景
[DL輪読会]1次近似系MAMLとその理論的背景[DL輪読会]1次近似系MAMLとその理論的背景
[DL輪読会]1次近似系MAMLとその理論的背景
 
テスト文字列に「うんこ」と入れるな
テスト文字列に「うんこ」と入れるなテスト文字列に「うんこ」と入れるな
テスト文字列に「うんこ」と入れるな
 
文献紹介:VideoCLIP: Contrastive Pre-training for Zero-shot Video-Text Understanding
文献紹介:VideoCLIP: Contrastive Pre-training for Zero-shot Video-Text Understanding文献紹介:VideoCLIP: Contrastive Pre-training for Zero-shot Video-Text Understanding
文献紹介:VideoCLIP: Contrastive Pre-training for Zero-shot Video-Text Understanding
 
【メタサーベイ】Video Transformer
 【メタサーベイ】Video Transformer 【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
 
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
 
[DL輪読会]画像を使ったSim2Realの現況
[DL輪読会]画像を使ったSim2Realの現況[DL輪読会]画像を使ったSim2Realの現況
[DL輪読会]画像を使ったSim2Realの現況
 
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
 

Similaire à モバイル向けEdgeTPUの紹介

2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
智啓 出川
 
C22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by Taichi Umeda
C22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by  Taichi UmedaC22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by  Taichi Umeda
C22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by Taichi Umeda
Insight Technology, Inc.
 
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
智啓 出川
 
2015年度GPGPU実践プログラミング 第1回 GPGPUの歴史と応用例
2015年度GPGPU実践プログラミング 第1回 GPGPUの歴史と応用例2015年度GPGPU実践プログラミング 第1回 GPGPUの歴史と応用例
2015年度GPGPU実践プログラミング 第1回 GPGPUの歴史と応用例
智啓 出川
 
X dev 20121106
X dev 20121106X dev 20121106
X dev 20121106
Ken Azuma
 

Similaire à モバイル向けEdgeTPUの紹介 (20)

2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
 
【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介
【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介
【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介
 
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
 
C22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by Taichi Umeda
C22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by  Taichi UmedaC22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by  Taichi Umeda
C22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by Taichi Umeda
 
ヘネシー&パターソン7.4
ヘネシー&パターソン7.4ヘネシー&パターソン7.4
ヘネシー&パターソン7.4
 
【CEDEC2018】一歩先のUnityでのパフォーマンス/メモリ計測、デバッグ術
【CEDEC2018】一歩先のUnityでのパフォーマンス/メモリ計測、デバッグ術【CEDEC2018】一歩先のUnityでのパフォーマンス/メモリ計測、デバッグ術
【CEDEC2018】一歩先のUnityでのパフォーマンス/メモリ計測、デバッグ術
 
201110 01 Polytech Center 1
201110 01 Polytech Center 1201110 01 Polytech Center 1
201110 01 Polytech Center 1
 
1.コース概要
1.コース概要1.コース概要
1.コース概要
 
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...
 
WeDX Flow Hands-on
WeDX Flow Hands-onWeDX Flow Hands-on
WeDX Flow Hands-on
 
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
 
2015年度GPGPU実践プログラミング 第1回 GPGPUの歴史と応用例
2015年度GPGPU実践プログラミング 第1回 GPGPUの歴史と応用例2015年度GPGPU実践プログラミング 第1回 GPGPUの歴史と応用例
2015年度GPGPU実践プログラミング 第1回 GPGPUの歴史と応用例
 
【XPagesDy】A-2_コムチュア_20131106_公開用
【XPagesDy】A-2_コムチュア_20131106_公開用【XPagesDy】A-2_コムチュア_20131106_公開用
【XPagesDy】A-2_コムチュア_20131106_公開用
 
そう、UE4ならね。あなたのモバイルゲームをより快適にする沢山の冴えたやり方について Part 2 <Texture Streaming, メモリプロ...
  そう、UE4ならね。あなたのモバイルゲームをより快適にする沢山の冴えたやり方について Part 2 <Texture Streaming, メモリプロ...  そう、UE4ならね。あなたのモバイルゲームをより快適にする沢山の冴えたやり方について Part 2 <Texture Streaming, メモリプロ...
そう、UE4ならね。あなたのモバイルゲームをより快適にする沢山の冴えたやり方について Part 2 <Texture Streaming, メモリプロ...
 
openstack_neutron-dvr_os5thaniv_20150713
openstack_neutron-dvr_os5thaniv_20150713openstack_neutron-dvr_os5thaniv_20150713
openstack_neutron-dvr_os5thaniv_20150713
 
Developer's Summit 夏 EnterpriseTED 資料
Developer's Summit 夏 EnterpriseTED 資料Developer's Summit 夏 EnterpriseTED 資料
Developer's Summit 夏 EnterpriseTED 資料
 
AWSとGPUインスタンスのご紹介
AWSとGPUインスタンスのご紹介AWSとGPUインスタンスのご紹介
AWSとGPUインスタンスのご紹介
 
【OSC2013 .Enterprise】監視とジョブを併せ持つ唯一のオープンソースソフトウェア「Hinemos」
【OSC2013 .Enterprise】監視とジョブを併せ持つ唯一のオープンソースソフトウェア「Hinemos」【OSC2013 .Enterprise】監視とジョブを併せ持つ唯一のオープンソースソフトウェア「Hinemos」
【OSC2013 .Enterprise】監視とジョブを併せ持つ唯一のオープンソースソフトウェア「Hinemos」
 
X dev 20121106
X dev 20121106X dev 20121106
X dev 20121106
 
【関東GPGPU勉強会#4】GTX 1080でComputer Vision アルゴリズムを色々動かしてみる
【関東GPGPU勉強会#4】GTX 1080でComputer Visionアルゴリズムを色々動かしてみる【関東GPGPU勉強会#4】GTX 1080でComputer Visionアルゴリズムを色々動かしてみる
【関東GPGPU勉強会#4】GTX 1080でComputer Vision アルゴリズムを色々動かしてみる
 

Dernier

Dernier (12)

Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 

モバイル向けEdgeTPUの紹介

  • 1. Mobility Technologies Co., Ltd. 郭 卓然 モバイル向けEdgeTPUの紹介
  • 2. Mobility Technologies Co., Ltd. 2 はじめに ● これから話す内容 ○ TPUとは ○ Edge TPUとは ○ Edge TPUを用いてエッジモデルの推論評価
  • 3. Mobility Technologies Co., Ltd. 3 TPUとは - TPU(Tensor Processing Unit)は、AI処理を高速化するためにGoogleが開発したプロセッサで、主にクラウドサービ ス側での使用を想定したものでした。 Google TPU v2 https://blog.inten.to/hardware-for-deep-learning-part-4- asic-96a542fe6a81 Google TPUの特徴: ● 巨大なオンチップRAMを備えている。メモリのアクセス時間を減らします。 ● 8ビット 量子化(8 bit quantization)。32ビットのfloating-pointの計算の代わりに8ビット のinteger 計算が実行される。ある程度の精度を犠牲に、効率を改善します。 ● Systolic arrayというアーキテクチャを使用します。 ● 「積和演算」などの特定の操作用に配線されている。ディープラーニングによく適用 できます。 ● 良い冷却システムがあり、リソースコストを節約できます。
  • 4. Mobility Technologies Co., Ltd. 4 TPU vs GPU Nvidia Tesla Volta 100のGPUと比べてTPU v2の性能は明らかに高いとは言えない がコストを減らすことは明らかです。 https://www.hpcwire.com/2018/04/30/riseml-benchmarks-google-tpuv2- against-nvidia-v100-gpu/ https://qiita.com/nishiha/items/32276cc77b27383c825f
  • 5. Mobility Technologies Co., Ltd. 5 EdgeTPUとは - Edge TPUはエッジ端末用に開発されたデバイスで、8ビットの演算のみをサポートしています。高速に機械学習ラ イブラリ(TensorFlow Lite)を実行させることができ、たとえば高解像度の動画上でフレームごとに複数のAIモデルを 30フレーム/秒で同時に実行させることができます。 今も様々なデバイスがリリースされています。 Edge teamのchallenge weekでDev Boardを購入して、自社Modelの推 論評価を担当しました。 https://coral.ai/docs/dev-board/get-started/#flash-the-board
  • 6. Mobility Technologies Co., Ltd. 6 EdgeTPUの使い方 ● Edge TPUのデバイスとTensorFlow liteが緊密的に繋がります。 ● TensorFlow Liteのおかげで、モバイル、組み込み、IoTデバイスで TensorFlowモデルを変換して実行できるようになります。 https://blog.tensorflow.org/2018/03/using- tensorflow-lite-on-android.html
  • 7. Mobility Technologies Co., Ltd. 7 EdgeTPUの使い方 ★ Edge TPUに向けて、TensorFlowモデルの導入フロ ーは以下のようになる: https://coral.ai/docs/edgetpu/models-intro/#compatibility-overview
  • 8. Mobility Technologies Co., Ltd. 8 EdgeTPUの使い方 1. Dev BoardとUSB Acceleratorで推論速度が変わっていないことからCPU自体のスペックにはほとんど 影響しないということがこの表からわかります。 2. また同じハードでモデル同士を比較するとDesktop CPUにおけるInception v4からMobile Net V1は16 倍速くなっているといえますが、Dev Boardの場合だと45倍速くなっていると計算できます。 https://cdn-images- 1.medium.com/max/1024/1*pCYQHA_PmF2_awq2c oMJvg.png)
  • 9. Mobility Technologies Co., Ltd. 9 EdgeTPUの使い方 demo:PyCoralAPIを使用してモデルを実行します。 https://coral.ai/docs/edgetpu/tflite- python/#overview
  • 10. Mobility Technologies Co., Ltd. 10 EdgeTPUを用いてエッジModel推論評価 エッジのonnxモデルからEdgeTPUモデルまで二つの変換方法試しました: 1. onnx → tf → TFlite→edge_tpu.tflite: converter = tf.lite.TFLiteConverter.from_saved_model(pb_model_save_path) 1. onnx → keras→ TFlite→edge_tpu.tflite: converter = tf.lite.TFLiteConverter.from_keras_model(keras_model) ⭐️edge_tpuでうまく動くために、モデルはTFliteにコンパイルする場合量子化が必 要
  • 11. Mobility Technologies Co., Ltd. 11 EdgeTPUを用いてエッジ推論評価ベンチマーク 自社Edge製品に搭載されているDSP、GPU、およびDevBoardのEdgeTPUのランタイムを用いて自 社モデルの推論速度のベンチマークを行いました。 ● model1とmodel2:edge_tpuの推 論速度はgpuとdspより明らかに速 いと分かります。 ● model3:edge_tpuの推論速度は gpuとの比較ではほぼ同等(か少 し遅い)になっていますが、それ はmodel3のアーキテクチャがgpu Runtimeに最適化されていること が1つの要因としてありそうです。
  • 12. Mobility Technologies Co., Ltd. 12 まとめと感想 ■ CPUとGPUと違ってTPUは特にディープラーニングのために設計された。巨 大オンチップ RAM を備えているし、Systolic arrayのようなアーキテクチャ も使用されます。 ■ EdgeTPUのcomplierと仕様など複雑ではなく、Python APIとC++ API両方も 使えます。 ■ 一部のエッジモデルに対してある程度高速化できる傾向が見られます。