Soumettre la recherche
Mettre en ligne
vs Google Vision API
•
0 j'aime
•
368 vues
隊長 アイパー
Suivre
PyData.Okinawa #29 LT
Lire moins
Lire la suite
Technologie
Signaler
Partager
Signaler
Partager
1 sur 20
Télécharger maintenant
Télécharger pour lire hors ligne
Recommandé
18 minitus発表資料
18 minitus発表資料
Keiichirou Miyamoto
Fluentd勉強会 (導入編 TreasureData活用)
Fluentd勉強会 (導入編 TreasureData活用)
takeuchi-tk
hpフィルター
hpフィルター
chjava
MBSハッカソン協賛品_ハンズラボ20170211
MBSハッカソン協賛品_ハンズラボ20170211
由佳 青木
Unagipy pysuruga202010
Unagipy pysuruga202010
hide ogawa
エンジニア転向を目指すデザイナーがNuxt.jsでアプリを開発した話
エンジニア転向を目指すデザイナーがNuxt.jsでアプリを開発した話
Kota Hashihama
ヤマムギVol.5 BIファーストステップre:dash
ヤマムギVol.5 BIファーストステップre:dash
Mitsuhiro Yamashita
Rustで3D graphics programming
Rustで3D graphics programming
KiyotomoHiroyasu
Recommandé
18 minitus発表資料
18 minitus発表資料
Keiichirou Miyamoto
Fluentd勉強会 (導入編 TreasureData活用)
Fluentd勉強会 (導入編 TreasureData活用)
takeuchi-tk
hpフィルター
hpフィルター
chjava
MBSハッカソン協賛品_ハンズラボ20170211
MBSハッカソン協賛品_ハンズラボ20170211
由佳 青木
Unagipy pysuruga202010
Unagipy pysuruga202010
hide ogawa
エンジニア転向を目指すデザイナーがNuxt.jsでアプリを開発した話
エンジニア転向を目指すデザイナーがNuxt.jsでアプリを開発した話
Kota Hashihama
ヤマムギVol.5 BIファーストステップre:dash
ヤマムギVol.5 BIファーストステップre:dash
Mitsuhiro Yamashita
Rustで3D graphics programming
Rustで3D graphics programming
KiyotomoHiroyasu
かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0
SakaiAtsushi
養成読本と私
養成読本と私
Kimikazu Kato
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
Iwamoto Naoya
Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理
SIGDance
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
Yahoo!デベロッパーネットワーク
青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会
Takehito Tanabe
スマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかった
Hiro H.
Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化
Terui Masashi
AWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポ
かの たん
AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析
Mitsuhiro Yamashita
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略
NVIDIA Japan
第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる
DIVE INTO CODE Corp.
[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。
Toru Enomoto
PredictionIOのPython対応計画
PredictionIOのPython対応計画
Shinsuke Sugaya
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
Koichiro Oki
Why python
Why python
TeppeiAkada1
Why python
Why python
TeppeiAkada1
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。
tak9029
Azureで動いている機械学習のいろいろについて
Azureで動いている機械学習のいろいろについて
エンジニア勉強会 エスキュービズム
クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介
kintone papers
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
IoTビジネス共創ラボ
Einsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみよう
Salesforce Developers Japan
Contenu connexe
Tendances
かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0
SakaiAtsushi
養成読本と私
養成読本と私
Kimikazu Kato
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
Iwamoto Naoya
Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理
SIGDance
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
Yahoo!デベロッパーネットワーク
青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会
Takehito Tanabe
スマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかった
Hiro H.
Tendances
(7)
かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0
養成読本と私
養成読本と私
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会
スマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかった
Similaire à vs Google Vision API
Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化
Terui Masashi
AWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポ
かの たん
AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析
Mitsuhiro Yamashita
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略
NVIDIA Japan
第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる
DIVE INTO CODE Corp.
[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。
Toru Enomoto
PredictionIOのPython対応計画
PredictionIOのPython対応計画
Shinsuke Sugaya
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
Koichiro Oki
Why python
Why python
TeppeiAkada1
Why python
Why python
TeppeiAkada1
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。
tak9029
Azureで動いている機械学習のいろいろについて
Azureで動いている機械学習のいろいろについて
エンジニア勉強会 エスキュービズム
クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介
kintone papers
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
IoTビジネス共創ラボ
Einsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみよう
Salesforce Developers Japan
AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜
Naoki Fujiwara
20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerapps
ひかり 影中
おふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathon
Yuuki Toriba
kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話
安隆 沖
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030
Ayako Omori
Similaire à vs Google Vision API
(20)
Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化
AWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポ
AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略
第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる
[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。
PredictionIOのPython対応計画
PredictionIOのPython対応計画
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
Why python
Why python
Why python
Why python
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。
Azureで動いている機械学習のいろいろについて
Azureで動いている機械学習のいろいろについて
クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
Einsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみよう
AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜
20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerapps
おふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathon
kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030
Dernier
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
Ryo Sasaki
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Toru Tamaki
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
danielhu54
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
Toru Tamaki
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
taisei2219
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
sugiuralab
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Yuma Ohgami
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Toru Tamaki
Dernier
(10)
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
vs Google Vision API
1.
PyData.Okinawa #29 LT 2017/09/23(土) 15:00:00
晴 アイパー隊長
2.
自己紹介 沖縄県うるま市の平安座島に住んでいます ちゅらデータ株式会社(メイン言語Python) 会社できました! オフィスも契約(冷房無い(´;ω;`)ウッ… 数学勉強中
3.
祭りがあります!
4.
話すこと
5.
vs Google Vision
API
6.
vs Google Vision
API Google Vision APIとは? 使い方 精度向上との戦い(どんなして精度あげるの?
7.
Google Vision APIとは? Google
Cloud Platformで用意されているAPIのひ とつ 機能が色々ある(ラベル検出、ロゴ検出、顔検 出、OCR...etc) でもお高いんでしょう...? 1 ~ 1000 ユニット/月-> 無料!! 1,001~500万ユニット/月-> (リクエスト数/ 1,000) × $3.50 今回触ったのはtext detection (OCR)
8.
使い方.1 api_url = 'Vision
API URL' access_key = 'Access key' img = open('画像ファイルパス', 'rb').read() content = base64.b64encode(img).decode('utf8') url = '%s?key=%s' % , (api_url, access_key)) res = json.dumps({ 'requests': [{ 'image': { 'content': content }, 'features': [{ 'type': 'TEXT_DETECTION', 'maxResults': 2 }] }] }) res = requests.post(url, res) return res.json()
9.
使い方.2 リクエストする画像はbase64に変換するか、 Google Cloud Storageへアップしてそのurlを渡す features
を複数指定することも可能 OCRと同時に顔検出することもできる maxResults というパラメータは謎 検出数が多くなるらしいが変更してもそんなか わらん(気がする 画像のサイズとかは? -> ベストプラクティス 返ってくるデータは検出位置とテキスト [左上(x, y), 右上(x, y), 右下(x, y), 左下(x, y)]
10.
使い方.3
11.
精度向上との戦い.1 はじめのころ-> これはすごい!! 実際開発に組み込むと-> 文字を認識してくれない ケースがでてきた... どうすべ?(´・ω・`) 色々試してみた
12.
グレースケール 精度上がらない(´・ω・`)
13.
二値化 ちょっとだけあがった!
14.
幾何学変換+ グレースケール さがった(´・ω・`)
15.
幾何学変換+ 二値化 あがった!(`・ω・´)
16.
幾何学変換+ 二値化-> 平滑化 (´・ω・`)?
17.
超必殺技必要なとこだけ投げる (^ﻭo^)ﻭ イケルイケル!!
18.
/(^o^)\
19.
まとめ Google Vision APIでOCRするときは 検出文字は黒、他は白(二値化) paddingを除去する(幾何学変換) 必要な箇所以外は削除する(スライス) この3つで結構精度あがるはず!!
参考まで 今日使ったコード-> https://github.com/Aipakazuma/play-gcp-vision- api
20.
終わり (宣伝: ちゅらデータはエンジニアを"絶賛"募集しています!!)
Télécharger maintenant