SlideShare une entreprise Scribd logo
1  sur  20
Télécharger pour lire hors ligne
PyData.Okinawa #29 LT
2017/09/23(土)
15:00:00 晴
アイパー隊長
自己紹介
沖縄県うるま市の平安座島に住んでいます
ちゅらデータ株式会社(メイン言語Python)
会社できました!
オフィスも契約(冷房無い(´;ω;`)ウッ…
数学勉強中
祭りがあります!
話すこと
vs Google Vision API
vs Google Vision API
Google Vision APIとは?
使い方
精度向上との戦い(どんなして精度あげるの?
Google Vision APIとは?
Google Cloud Platformで用意されているAPIのひ
とつ
機能が色々ある(ラベル検出、ロゴ検出、顔検
出、OCR...etc)
でもお高いんでしょう...?
1 ~ 1000 ユニット/月-> 無料!!
1,001~500万ユニット/月-> (リクエスト数/
1,000) × $3.50
今回触ったのはtext detection (OCR)
使い方.1
api_url = 'Vision API URL'
access_key = 'Access key'
img = open('画像ファイルパス', 'rb').read()
content = base64.b64encode(img).decode('utf8')
url = '%s?key=%s' % , (api_url, access_key))
res = json.dumps({
'requests': [{
'image': {
'content': content
},
'features': [{
'type': 'TEXT_DETECTION',
'maxResults': 2
}]
}]
})
res = requests.post(url, res)
return res.json()
使い方.2
リクエストする画像はbase64に変換するか、
Google Cloud Storageへアップしてそのurlを渡す
features を複数指定することも可能
OCRと同時に顔検出することもできる
maxResults というパラメータは謎
検出数が多くなるらしいが変更してもそんなか
わらん(気がする
画像のサイズとかは? -> ベストプラクティス
返ってくるデータは検出位置とテキスト
[左上(x, y), 右上(x, y), 右下(x, y), 左下(x, y)]
使い方.3
精度向上との戦い.1
はじめのころ-> これはすごい!!
実際開発に組み込むと-> 文字を認識してくれない
ケースがでてきた...
どうすべ?(´・ω・`)
色々試してみた
グレースケール
精度上がらない(´・ω・`)
二値化
ちょっとだけあがった!
幾何学変換+ グレースケール
さがった(´・ω・`)
幾何学変換+ 二値化
あがった!(`・ω・´)
幾何学変換+ 二値化-> 平滑化
(´・ω・`)?
超必殺技必要なとこだけ投げる
(‫^ﻭ‬o^)‫ﻭ‬ イケルイケル!!
/(^o^)\
まとめ
Google Vision APIでOCRするときは
検出文字は黒、他は白(二値化)
paddingを除去する(幾何学変換)
必要な箇所以外は削除する(スライス)
この3つで結構精度あがるはず!! 参考まで
今日使ったコード->
https://github.com/Aipakazuma/play-gcp-vision-
api
終わり
(宣伝: ちゅらデータはエンジニアを"絶賛"募集しています!!)

Contenu connexe

Tendances

Tendances (7)

かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0
 
養成読本と私
養成読本と私養成読本と私
養成読本と私
 
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現 [SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
 
Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理
 
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
 
青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会
 
スマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかったスマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかった
 

Similaire à vs Google Vision API

Similaire à vs Google Vision API (20)

Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化
 
AWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポAWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポ
 
AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析
 
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略
 
第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる
 
[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。
 
PredictionIOのPython対応計画
PredictionIOのPython対応計画PredictionIOのPython対応計画
PredictionIOのPython対応計画
 
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ 2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
 
Why python
Why pythonWhy python
Why python
 
Why python
Why pythonWhy python
Why python
 
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。
 
Azureで動いている機械学習のいろいろについて
Azureで動いている機械学習のいろいろについてAzureで動いている機械学習のいろいろについて
Azureで動いている機械学習のいろいろについて
 
クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介
 
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
 
Einsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみようEinsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみよう
 
AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜
 
20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerapps20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerapps
 
おふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathonおふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathon
 
kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話
 
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030
 

Dernier

Dernier (7)

Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 

vs Google Vision API