SlideShare une entreprise Scribd logo
1  sur  20
Télécharger pour lire hors ligne
PyData.Okinawa #29 LT
2017/09/23(土)
15:00:00 晴
アイパー隊長
自己紹介
沖縄県うるま市の平安座島に住んでいます
ちゅらデータ株式会社(メイン言語Python)
会社できました!
オフィスも契約(冷房無い(´;ω;`)ウッ…
数学勉強中
祭りがあります!
話すこと
vs Google Vision API
vs Google Vision API
Google Vision APIとは?
使い方
精度向上との戦い(どんなして精度あげるの?
Google Vision APIとは?
Google Cloud Platformで用意されているAPIのひ
とつ
機能が色々ある(ラベル検出、ロゴ検出、顔検
出、OCR...etc)
でもお高いんでしょう...?
1 ~ 1000 ユニット/月-> 無料!!
1,001~500万ユニット/月-> (リクエスト数/
1,000) × $3.50
今回触ったのはtext detection (OCR)
使い方.1
api_url = 'Vision API URL'
access_key = 'Access key'
img = open('画像ファイルパス', 'rb').read()
content = base64.b64encode(img).decode('utf8')
url = '%s?key=%s' % , (api_url, access_key))
res = json.dumps({
'requests': [{
'image': {
'content': content
},
'features': [{
'type': 'TEXT_DETECTION',
'maxResults': 2
}]
}]
})
res = requests.post(url, res)
return res.json()
使い方.2
リクエストする画像はbase64に変換するか、
Google Cloud Storageへアップしてそのurlを渡す
features を複数指定することも可能
OCRと同時に顔検出することもできる
maxResults というパラメータは謎
検出数が多くなるらしいが変更してもそんなか
わらん(気がする
画像のサイズとかは? -> ベストプラクティス
返ってくるデータは検出位置とテキスト
[左上(x, y), 右上(x, y), 右下(x, y), 左下(x, y)]
使い方.3
精度向上との戦い.1
はじめのころ-> これはすごい!!
実際開発に組み込むと-> 文字を認識してくれない
ケースがでてきた...
どうすべ?(´・ω・`)
色々試してみた
グレースケール
精度上がらない(´・ω・`)
二値化
ちょっとだけあがった!
幾何学変換+ グレースケール
さがった(´・ω・`)
幾何学変換+ 二値化
あがった!(`・ω・´)
幾何学変換+ 二値化-> 平滑化
(´・ω・`)?
超必殺技必要なとこだけ投げる
(‫^ﻭ‬o^)‫ﻭ‬ イケルイケル!!
/(^o^)\
まとめ
Google Vision APIでOCRするときは
検出文字は黒、他は白(二値化)
paddingを除去する(幾何学変換)
必要な箇所以外は削除する(スライス)
この3つで結構精度あがるはず!! 参考まで
今日使ったコード->
https://github.com/Aipakazuma/play-gcp-vision-
api
終わり
(宣伝: ちゅらデータはエンジニアを"絶賛"募集しています!!)

Contenu connexe

Tendances

かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0SakaiAtsushi
 
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現 [SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現 Iwamoto Naoya
 
Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理SIGDance
 
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋Yahoo!デベロッパーネットワーク
 
青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会Takehito Tanabe
 
スマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかったスマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかったHiro H.
 

Tendances (7)

かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0
 
養成読本と私
養成読本と私養成読本と私
養成読本と私
 
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現 [SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
 
Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理
 
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
 
青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会
 
スマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかったスマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかった
 

Similaire à vs Google Vision API

Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化Terui Masashi
 
AWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポAWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポかの たん
 
AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析Mitsuhiro Yamashita
 
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略NVIDIA Japan
 
第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わるDIVE INTO CODE Corp.
 
[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。Toru Enomoto
 
PredictionIOのPython対応計画
PredictionIOのPython対応計画PredictionIOのPython対応計画
PredictionIOのPython対応計画Shinsuke Sugaya
 
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ 2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ Koichiro Oki
 
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。tak9029
 
クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介kintone papers
 
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だったIoTビジネス共創ラボ
 
Einsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみようEinsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみようSalesforce Developers Japan
 
AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜Naoki Fujiwara
 
20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerapps20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerappsひかり 影中
 
おふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathonおふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathonYuuki Toriba
 
kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話安隆 沖
 
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030Ayako Omori
 

Similaire à vs Google Vision API (20)

Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化
 
AWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポAWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポ
 
AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析
 
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略
 
第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる
 
[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。
 
PredictionIOのPython対応計画
PredictionIOのPython対応計画PredictionIOのPython対応計画
PredictionIOのPython対応計画
 
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ 2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
 
Why python
Why pythonWhy python
Why python
 
Why python
Why pythonWhy python
Why python
 
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。
 
Azureで動いている機械学習のいろいろについて
Azureで動いている機械学習のいろいろについてAzureで動いている機械学習のいろいろについて
Azureで動いている機械学習のいろいろについて
 
クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介
 
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
 
Einsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみようEinsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみよう
 
AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜
 
20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerapps20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerapps
 
おふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathonおふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathon
 
kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話
 
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030
 

Dernier

SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 

Dernier (10)

SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 

vs Google Vision API