Contenu connexe Similaire à ビッグデータ・AI 活用最前線:「Data Augmentation (データ拡張)」という新しい常識 (20) ビッグデータ・AI 活用最前線:「Data Augmentation (データ拡張)」という新しい常識3. 3
• 企業情報化協会 AI&ロボティクス委員長
• 日本データベース学会理事
• APEC(アジア太平洋経済協力)データ・アナリ
ティクス人材育成プロジェクトアドバイザー
• 楽天株式会社 執行役員
森 正弥
https://note.mu/masayamori
• 先端技術の動向の情報発信を行い、産業横断的な公職にも携わる
• 楽天では、開発組織のグローバル化、研究開発の統括を行い、AI
を用いた新サービスも創出
Profile
7. 7
AI / Deep Learning の成果
⚫ 画像認識 (Rakutenラクマでの活用、楽天ドローンでの活用)
⚫ 顔認識 (各グループ会社での活用、楽天Pay の顔認識ペイメント)
⚫ 機械翻訳 (Video配信ビジネスでの7言語の字幕翻訳。世界レベルの精度)
⚫ 商品データの自動生成
⚫ 顧客ニーズの抽出及び商品デザイン
⚫ 株価予測・マーケット予測
⚫ 潜在顧客ターゲティング (Rakuten Airis)
⚫ 広告バナーの自動生成、商品解説文の自動生成 (Creative AI)
• Deep Learning による具体的なビジネスソリューションを創出
12. 12
Next Paradigm is coming.
Deep
learning
Small
Dataset
Big Dataset
Great AI
Deep
learning
So so AI
Other
Dataset
2nd Deep
Learning
Another so so AI
Connect
&
Loop
Learning
Super
AI
Interactive Loop
16. 16
具体的な手法:画像データ
• 水平・垂直に画像をシフトする
• 水平方向・垂直方向に画像を反転させる
• 回転させる (回転角度はランダムのケースもある)
• 明度を変える
• ズームインする、ズームアウトする
• 画像の一部をくり抜く、削除する
• 背景色を変える
• 背景を置き換える
• Mixup、CutMix
• 冒頭で紹介したハッカソンでも参加者は
みなデータ拡張を駆使
• Mixup, CutMix 以外はラベルの変更不要
• 例えば、ドローンやUGV (無人配送車)
の学習では、道路の画像に、対象物のCG
物体や人物を配置したデータでも十分な
成果がでてくる
18. 18
背景としての インターネット、スマートフォンの普及
• C2C、B2C 領域においてはスマホが広く普及
• 言語データ: 様々なユーザーが入力した文章データは
不完全な文や構造化されていない文、またフレーズの誤
用や記述ミス等も含まれる。
• 画像データ: SNSの画像共有とあいまって多くはスマ
ホで撮影。色々な距離や角度、照明の強弱、反射、映り
込み、陰影、何かによって一部覆われていることも。
• 実際のデータは様々な撹乱があり、それらに対応し、ロバストネスさを高めていくこ
とも非常に重要。
19. 19
Waymo もData Augmentation を駆使し、自動運転を実現
https://note.com/masayamori/n/n7f21db4e5e49
• Deep Neural Net を複数用いたアーキテクチャ
としており、入力データの拡張だけでなく、
内部データも拡張させていく方法で、ロバス
トな自動運転を実現している。
22. 22
NVIDIA による Imaginary Celebrities
https://research.nvidia.com/sites/default/files/pubs/2017-
10_Progressive-Growing-of/karras2018iclr-paper.pdf
23. 23
新しいトレンド: Creative Economy, Creative AI
⚫ World Economic Forum でも注目されるトレンド
⚫ 特定の技術やソリューションではなく、活用(アプリケーション)
⚫ Non-iterative かつ Expert Knowledge を要する経済的価値創出を実現する
✓ PFNのオンライン線画自動着色サービス PaintsChainer
✓ Magical PunchLine、 AI をクリエイティブディレクターに迎える
✓ 電通によるAI コピーライター AICO
✓ 佐藤・松崎研によるAIによるSF小説「人狼知能能力測定テスト」
✓ 日経のAI記者「決算サマリー」
(LINK)
(LINK)
(LINK)
(LINK)
(LINK)
24. 24
Draw by AI
AttnGAN by Microsoft: AI can create a picture from caption
Text-to-Image convertor http://www.itmedia.co.jp/news/articles/1801/19/news054.html
“A bird with a yellow
body, with black
feathers and has a
short beak.”
• 画像から画像を作るのではないところがポイント。
• 例えば応用することで、設計図から製品の画像を作り出し、実際の製品と比較す
ることで設計図どおりに作られているのかの確認等にも使える。
25. 25
Creative AI 事例
[LuBan System, Alibaba]
Background Shapes Colors Layout Product
Alibaba used automated banner design system at 11.11
出典: (Alibaba社 発表資料より)http://www.uisdc.com/alibaba-luban-ai-banner
26. 26
Creative AI: 商品説明の自動生成
Dan Jurafsky 教授との研究を通し、
究極のパーソナライズサービスの実現へ一歩
商品とセールス・嗜好の関係を踏
まえ、PC/モバイル/スピーカーそれ
ぞれに最適な商品説明を生成
s://news.stanford.edu/2017/09/29/predicting-sales-online-products-advertising-language/
30. 30
• Data Augmentation (データ拡張)という手法
• Back Translation、GAN という新テクノロジー
• Creative AI という新トレンドにもつながっている
• 単にデータを集める・貯める、をこえた
データをどう拡張して活用していくかという視点が
AI 活用においては大事
まとめ
https://note.mu/masayamori