SlideShare une entreprise Scribd logo
1  sur  15
Télécharger pour lire hors ligne
© 2014 NTT DOCOMO, INC. All rights reserved.
モデレータ: 栄藤 @mickbean
ハッシュタグ #MIRU2014
https://sites.google.com/site/miru2014okayama/online-question-form
特別チュートリアル
「パターン認識とメディア理解のフロンティア」
1
© 2014 NTT DOCOMO, INC. All rights reserved.
2
15:15-16:00
【ゲスト講演】
「自然言語処理の現在と画像処理」徳永拓之(PFI)
16:00-16:45
【ゲスト講演】
「音楽理解技術の魅力」後藤真孝(産総研)
(休憩)
17:00-17:45
【ゲスト講演】「E-Commerceにおける機械学習・パターン認識・画像解析技術の活用
の実際」森正弥(楽天技術研究所)
17:45-18:15
【パネルディスカッション】
「画像以外もこんなに面白い。」
© 2014 NTT DOCOMO, INC. All rights reserved.
ハッシュタグ #MIRU2014
https://sites.google.com/site/miru2014okayama/online-question-form
画像以外も面白い.広い視野を->学生の皆さんへ
境界分野を新たな研究フロンティアへ
3
モデレータ: 栄藤 @mickbean
© 2013 NTT DOCOMO, INC. All rights reserved.
1985 私の経験:隣の芝はまぶしい
• 画像符号化の仕事を始めた時,画像の符号化レートにデジタル処理が追いつか
ず,できたのは適応サブサンプリングくらい.同僚の殆どはアナログ人間.
• 隣の音声処理グループ: 離散コサイン変換,FFTでの波形整形,窓関数,サ
ブバンド符号化(ウェーブレット)くらいはやっていた..
• 音声認識で使われる言語モデル(生成モデル)を用いた制約解法も早かった.
モデルベースのノイズリダクションもそう
!
• 他分野で先行して利用され,画像分野で花開いたものに以下がある.(井尻)
boosting, random forests, graph cut, level set, MRF, structured learning (CRF),
4
© 2013 NTT DOCOMO, INC. All rights reserved.
2007 私の経験:画像やっててよかった.
• ドコモでデータマイニング,NLPの開発に従事
しゃべってコンシェルで多用している技術はSVM,CRF.
• 企業の技術経営者としてデータ処理分野には以下の見解.
1.パターン認識,機械学習に関する知識を教えるのは時間がかか
る→大学で教育されていると助かる。基礎は重要.音声系・NLP系の学
生は少ない.MIRU系の学生は多く,人材源としては最高.現実の問題を
モデル化して解くという訓練を受けている.
2.特徴抽出:ドメインに関する前処理。センスが要る。
ビックデータのマイニングでもクレンジングでのセンスがかなり必要。
5
© 2014 NTT DOCOMO, INC. All rights reserved.
1. 画像特有の本質的な技術は何であって、
2. 音声・自然言語等他のメディア認識・理解と基本
を共有する汎用的な技術?
6
Thanks to
仙田さん,田中さん,井尻さん
黄瀬先生,嶋田先生,大山先生
© 2014 NTT DOCOMO, INC. All rights reserved.
7
1. メディアに固有な技術
信号入力から特徴抽出まで.セグメンテーション,
初期視覚,センシング
2. 汎用な技術
 それ以降、信号を記号に置き換えるまで。
技術の手法自体が、対象メディアに依存しなくなり
つつある.
© 2014 NTT DOCOMO, INC. All rights reserved.
結局,何が言いたい?
• 画像理解は良い教育の場である.どうして? →
ドメイン固有技術と汎用技術の切り分けを意識すれば,汎用
技術部分をいろんなメディアに適用できる.
• ドメイン固有を馬鹿にする事なかれ.各ドメインの攻め方は
似ていると思う:現実の事象をモデル化する方法論を腕に仕
込む. (←このマインドセットは大事.以下の3人のプレゼンに関連する)
• 画像に限定しないメディア理解の統合を考えてみよう.
• 特徴抽出を含めた一般的な認識技術を目指そう
8
© 2014 NTT DOCOMO, INC. All rights reserved.
9
1.画像特有の本質的な技術
信号処理の観点:
・二次元もしくは三次元の空間的に相関を持つ信号の処理。時間を含めた四次元方向に、相関を持っても良い。
 ・デノイジング、フィルタ等は、相関構造を直接利用。
 ・特徴抽出は、時空間の相関構造を抽出する手段(エッジ・領域など)
 ・パノラマ等は相関をベースに合成処理
  ・レーダ信号処理等における合成開口処理に類似だが、合成開口自体が画像処理と考えても良い。
・複数のセンサ利用した際には、幾何的情報を持った信号の処理
 ・相関構造抽出+幾何情報抽出(ステレオなど)
センシングの観点:
・基本的には電磁波のセンシング:
 ・波長が特有(狭義には可視光領域)、この波長帯に特有の回折、屈折、反射現象を持つ。
 ・多くの場合、3チャンネルの二次元信号を一組として利用
 ・可視光領域の波長の信号(光線)の、方位、時間、波長変化、偏光等に関するセンシング、モデリングつまり、opticsや、computer graphicsなど
2.音声・自然言語等他のメディア認識・理解と基本を共有する汎用的な技術
・数理モデリング(IsingModel, Graphical Model, State Space Model, GMM,... )
・最適化(非線形最適化(Newton, GaussNewton, etc)LevelSet, GraphCut,
L0/1最適化(ADMM, etc)、最短経路探索(DP, Dijkstra, A*, etc))
・機械学習(SVM, RVM, Boosting, RandomForests, DeepXXX, XXX-learning,Clustering, ...)
・確率、統計(MRF, CRF, ...)
・信号処理(種々のフィルタ(FIT, IIT, Kalman, Particle, ... ), DCT, FFT,Wavelet, ... )
・センシング原理(Time of Flight, ... )
技術分類(井尻さん)
© 2014 NTT DOCOMO, INC. All rights reserved.
10
画像特有
2D/3D object detection and recognition 3D shape recovery Biological image and signal analysis Biologically motivated
vision Coding,compression and super-resolution Cognitive and embodied vision Computational photography Content based
image retrieval and data mining Display Hardware Early vision Face recognitionFacial expression recognition
Fingerprint recognition Forensic biometrics and its applications Gait recognition Gesture and Behavior Analysis Graphics 
Recognition Illumination and reflectance modeling Image and video analysis and understanding Image based modeling
Image guidance and robot guidance of interventions Industrial image analysis Inpainting and Superimposing Iris
recognition Low-level vision Medical image and signal analysis  Mixed and Augmented Reality Modeling, simulation
andvisualization Motion, tracking and video analysis Occlusion and shadow detection Physics-based vision
Reconstruction and camera motion estimation Representation and analysis in pixel/voxel images Scene understanding
Segmentation, features and descriptors Shape modeling and encoding Signal, image and video processing Stereo and
multiple view geometry Texture and color analysis Vision for graphics Vision for robotics
!
メディア共通・横断
Active and ensemble learning Affective computing Artificial neural networks Biometric systems and applications
Classification and clustering Computer-aided detection and diagnosis Deep learning Dimensionality reduction and
manifold learning Character and Text Recognition Document Understanding Enhancement, restoration and filtering
Handwriting Recognition Human body motion and gesture based interaction Human Computer Interaction
Machine learning and data mining Model selection Multi-biometrics Multimedia analysis, indexing and retrieval Other
applications Other Biometric applications Perceptual organizationPerformance Evaluation Semi-supervised learning and 
spectral methods Statistical, syntactic and structural pattern recognition Support vector machines and kernel methods
Symbolic learning Transfer learning
他メディア特有
Audio and acoustic processing and analysis Automatic speech and speaker recognition Pattern Recognition for Art,
Cultural Heritage and Entertainment Pattern Recognition for Bioinformatics Pattern Recognition for Search, Retrieval and
Visualization Pattern Recognition for Surveillance and SecuritySecurity issues Sensor array & multichannel signal processing
Signal Processing for Astronomy Soft biometrics Speaker recognition Speech and natural language based interaction
Spoken language processing
ICPR2014 Keywordsの分類(大山先生)
© 2014 NTT DOCOMO, INC. All rights reserved.
徳永さんのプレゼン
• word2vec でできるようになったという
king - man + woman -> queen     画像でもできるかな・・
• Paragraph Vector面白そう.
• Zero-Shot Learning by Convex Combination of Semantic Embeddings (Norouzi et al., 2014)の話は,
実は凄い狙い.言語側ではtiger, lion, liger(tigerとlionの子)というデータがある.普通に分類を行
い、 P(tiger) = 0.5, P(lion) = 0.5 という確率値を得る. tigerとlionの分散表現をその割合で混ぜ合わせ
る.得られた分散表現で最近傍探索を行い、ligerが得られたら…嬉しい.ただし. ligerは学習データ
に入っていないものとする.
• 統計的機械翻訳のコーパスに画像と説明文を使う.→最初はICCV10の cs.cmu.edu/~afarhadi/pape…
で、その後 EMNLP11 dl.acm.org/citation.cfm?i… や牛久くんのACMMM11があり。
• 一般物体認識は記号接地(Symbol Grounding)問題の特殊な場合.(気づいてもらいたい,栄藤)
• Deep NNはほとんど2層以下.画像や音声とは問題の性質が違う.
11
© 2014 NTT DOCOMO, INC. All rights reserved.
後藤さんのプレゼン
• 音楽認識はなぜ面白いか.「複数の音が相互に関係し合いながら時間的な構造を形成して内
容を伝える信号」の理解.
• 画像のオクルージョンは、音声だとマスキング効果に例えられるような気がするんだけど、
人間の知覚とは違う音声認識や音楽理解では関係ないんだろうか…
• 混合音と単音を「同じ音階」と認知するのって、考えてみると意味不明ですね。色彩もおなじ
ですが。音源分離も考えると、余計分からなくなります、
• オーケストラを聞いて各楽器のパートに分解できる人はオーケストラを編曲もできるだけの知
識がある。機械学習で数種類の楽器を分離できるだけで、素人の能力はすでに超えてるね
• 音源分離とBSSは同じ問題と考えて良いのかな?音楽特有の技術もありそうですが。。
• songleは作曲の教育にも使えそうですね。
• 音楽に対する自動コメント.映像と自然言語の融合分野?
• アイマスMADについ苦笑して反応してしまった。負けた気がする。
12
© 2014 NTT DOCOMO, INC. All rights reserved.
森さんのプレゼン
• 楽天スーパーDB, TERADATA
• Amazonの売り上げの30%はリコメンデーションから生み出されている.楽天も同じ感覚か.
• 氷川きよしのCD売り上げは出来る.AKB48はプロモーションが非定常的なので無理.
• 日本はロングテール:じゃばらは食べられないが,じゃばらドリンクは売れた.
• 何も高度な技術を適用していない。何(データ・ログ)を対象とするか。どう適用するか。データ・
ログ収集・基礎集計の戦略。変数に入れるためのデータの加工の仕方。データ・ログの標準化・統
一化。あるいはそもそもの仮説の立て方。それらこそが重要。(激しく同意)
• 「機械学習」の知識に加え、大量データ処理の技術、分散プログラミングの技術もあわせて必要。
• 代表画像の表示はGoogleへのSEO対策として良い.
• ディープラーニングはディープな画像に使っている.
• アマゾン,ファイアフォンの『ファイアフライ』機能についてどう思いますか?
13
© 2014 NTT DOCOMO, INC. All rights reserved.
質問1:
• 自然言語,音声・楽音理解,画像理解の融合分野で
面白そうな研究テーマはあるでしょうか?あるとす
ればどのようなアプローチがありますか?
14
© 2014 NTT DOCOMO, INC. All rights reserved.
質問2:
• 画像理解の研究コミュニティが他分野に期待するこ
と,v.v.
15

Contenu connexe

En vedette

Start with why?: how innovators combine ideas to explore new business models
Start with why?:  how innovators combine ideas to explore new business modelsStart with why?:  how innovators combine ideas to explore new business models
Start with why?: how innovators combine ideas to explore new business modelsOsaka University
 
モバイル&クラウドにおけるイノベーションへの挑戦と実践
モバイル&クラウドにおけるイノベーションへの挑戦と実践モバイル&クラウドにおけるイノベーションへの挑戦と実践
モバイル&クラウドにおけるイノベーションへの挑戦と実践Osaka University
 
大企業におけるイノベーションはどうやって起こす?@立命館大学
大企業におけるイノベーションはどうやって起こす?@立命館大学大企業におけるイノベーションはどうやって起こす?@立命館大学
大企業におけるイノベーションはどうやって起こす?@立命館大学Osaka University
 
How changing mobile and media technologies is changing the way we create inno...
How changing mobile and media technologies is changing the way we create inno...How changing mobile and media technologies is changing the way we create inno...
How changing mobile and media technologies is changing the way we create inno...Osaka University
 
Software is eating the world
Software is eating the worldSoftware is eating the world
Software is eating the worldOsaka University
 
ダイバーシティーを生かすためには。
ダイバーシティーを生かすためには。ダイバーシティーを生かすためには。
ダイバーシティーを生かすためには。Osaka University
 
デザイン思考の人材育成
デザイン思考の人材育成デザイン思考の人材育成
デザイン思考の人材育成Osaka University
 
Introduction of Mirai Translate, Inc.
Introduction of Mirai Translate, Inc.Introduction of Mirai Translate, Inc.
Introduction of Mirai Translate, Inc.Osaka University
 
How Changing Mobile Technology Is Changing The Way We Create Economy.
How Changing Mobile Technology Is Changing The Way We Create Economy. How Changing Mobile Technology Is Changing The Way We Create Economy.
How Changing Mobile Technology Is Changing The Way We Create Economy. Osaka University
 
IOT and Lean Manifacturing
IOT and Lean ManifacturingIOT and Lean Manifacturing
IOT and Lean ManifacturingOsaka University
 
DOCOMO Innovations' investment tactics
DOCOMO Innovations' investment tacticsDOCOMO Innovations' investment tactics
DOCOMO Innovations' investment tacticsOsaka University
 
Innovation, how to make it
Innovation, how to make itInnovation, how to make it
Innovation, how to make itOsaka University
 
Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)
Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)
Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)Osaka University
 
Introduction of Mirai Translate, Inc.
Introduction of Mirai Translate, Inc. Introduction of Mirai Translate, Inc.
Introduction of Mirai Translate, Inc. Osaka University
 
ビッグデータによる社会イノベーションの実現(公開版)
 ビッグデータによる社会イノベーションの実現(公開版) ビッグデータによる社会イノベーションの実現(公開版)
ビッグデータによる社会イノベーションの実現(公開版)Osaka University
 
CVCにおけるイノベーションの挑戦 第1版
CVCにおけるイノベーションの挑戦 第1版CVCにおけるイノベーションの挑戦 第1版
CVCにおけるイノベーションの挑戦 第1版Osaka University
 
Cloud Technologies and AI in IoT Era
Cloud Technologies  and AI in IoT EraCloud Technologies  and AI in IoT Era
Cloud Technologies and AI in IoT EraOsaka University
 

En vedette (20)

Start with why?: how innovators combine ideas to explore new business models
Start with why?:  how innovators combine ideas to explore new business modelsStart with why?:  how innovators combine ideas to explore new business models
Start with why?: how innovators combine ideas to explore new business models
 
モバイル&クラウドにおけるイノベーションへの挑戦と実践
モバイル&クラウドにおけるイノベーションへの挑戦と実践モバイル&クラウドにおけるイノベーションへの挑戦と実践
モバイル&クラウドにおけるイノベーションへの挑戦と実践
 
Engines of Innovations
Engines of InnovationsEngines of Innovations
Engines of Innovations
 
Cloud, why not?
Cloud, why not?Cloud, why not?
Cloud, why not?
 
大企業におけるイノベーションはどうやって起こす?@立命館大学
大企業におけるイノベーションはどうやって起こす?@立命館大学大企業におけるイノベーションはどうやって起こす?@立命館大学
大企業におけるイノベーションはどうやって起こす?@立命館大学
 
How changing mobile and media technologies is changing the way we create inno...
How changing mobile and media technologies is changing the way we create inno...How changing mobile and media technologies is changing the way we create inno...
How changing mobile and media technologies is changing the way we create inno...
 
Software is eating the world
Software is eating the worldSoftware is eating the world
Software is eating the world
 
ダイバーシティーを生かすためには。
ダイバーシティーを生かすためには。ダイバーシティーを生かすためには。
ダイバーシティーを生かすためには。
 
デザイン思考の人材育成
デザイン思考の人材育成デザイン思考の人材育成
デザイン思考の人材育成
 
Introduction of Mirai Translate, Inc.
Introduction of Mirai Translate, Inc.Introduction of Mirai Translate, Inc.
Introduction of Mirai Translate, Inc.
 
How Changing Mobile Technology Is Changing The Way We Create Economy.
How Changing Mobile Technology Is Changing The Way We Create Economy. How Changing Mobile Technology Is Changing The Way We Create Economy.
How Changing Mobile Technology Is Changing The Way We Create Economy.
 
みらい翻訳紹介2015
みらい翻訳紹介2015みらい翻訳紹介2015
みらい翻訳紹介2015
 
IOT and Lean Manifacturing
IOT and Lean ManifacturingIOT and Lean Manifacturing
IOT and Lean Manifacturing
 
DOCOMO Innovations' investment tactics
DOCOMO Innovations' investment tacticsDOCOMO Innovations' investment tactics
DOCOMO Innovations' investment tactics
 
Innovation, how to make it
Innovation, how to make itInnovation, how to make it
Innovation, how to make it
 
Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)
Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)
Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)
 
Introduction of Mirai Translate, Inc.
Introduction of Mirai Translate, Inc. Introduction of Mirai Translate, Inc.
Introduction of Mirai Translate, Inc.
 
ビッグデータによる社会イノベーションの実現(公開版)
 ビッグデータによる社会イノベーションの実現(公開版) ビッグデータによる社会イノベーションの実現(公開版)
ビッグデータによる社会イノベーションの実現(公開版)
 
CVCにおけるイノベーションの挑戦 第1版
CVCにおけるイノベーションの挑戦 第1版CVCにおけるイノベーションの挑戦 第1版
CVCにおけるイノベーションの挑戦 第1版
 
Cloud Technologies and AI in IoT Era
Cloud Technologies  and AI in IoT EraCloud Technologies  and AI in IoT Era
Cloud Technologies and AI in IoT Era
 

Similaire à 特別チュートリアル「パターン認識とメディア理解のフロンティア」 ディスカッションペーパー

学会・研究会の情報保障におけるソーシャルネットワークの役割
学会・研究会の情報保障におけるソーシャルネットワークの役割学会・研究会の情報保障におけるソーシャルネットワークの役割
学会・研究会の情報保障におけるソーシャルネットワークの役割Takuya Nishimoto
 
ビッグデータ:ハイプカーブの先に見えるもの2013(etoh)
ビッグデータ:ハイプカーブの先に見えるもの2013(etoh)ビッグデータ:ハイプカーブの先に見えるもの2013(etoh)
ビッグデータ:ハイプカーブの先に見えるもの2013(etoh)Osaka University
 
音声認識どこまでできる?
音声認識どこまでできる?音声認識どこまでできる?
音声認識どこまでできる?高見 知英
 
리츠메이칸대학 정보이공학부 소개 (정보 시스템 글로벌 코스 입시 소개)
리츠메이칸대학 정보이공학부 소개 (정보 시스템 글로벌 코스 입시 소개)리츠메이칸대학 정보이공학부 소개 (정보 시스템 글로벌 코스 입시 소개)
리츠메이칸대학 정보이공학부 소개 (정보 시스템 글로벌 코스 입시 소개)Joo-Ho Lee
 
Japan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラムJapan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラムKomei Sugiura
 
デブサミ2014 オフィシャルコミュニティ募集要項
デブサミ2014 オフィシャルコミュニティ募集要項デブサミ2014 オフィシャルコミュニティ募集要項
デブサミ2014 オフィシャルコミュニティ募集要項Developers Summit
 
ビックデータとシリコンバレースタートアップ事情
ビックデータとシリコンバレースタートアップ事情ビックデータとシリコンバレースタートアップ事情
ビックデータとシリコンバレースタートアップ事情Osaka University
 
エンジニアライフ 市場価値 20140322
エンジニアライフ 市場価値 20140322エンジニアライフ 市場価値 20140322
エンジニアライフ 市場価値 20140322Mamoru Sato
 
≪インテル x ブロケード 特別対談≫ 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~
≪インテル x ブロケード 特別対談≫ 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~ ≪インテル x ブロケード 特別対談≫ 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~
≪インテル x ブロケード 特別対談≫ 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~ Brocade
 
20160907rsj16ロボット聴覚OS
20160907rsj16ロボット聴覚OS20160907rsj16ロボット聴覚OS
20160907rsj16ロボット聴覚OSKomei Sugiura
 
Saleshub uxro survice document ver1.1
Saleshub uxro survice document ver1.1Saleshub uxro survice document ver1.1
Saleshub uxro survice document ver1.1hirotakashimazaki
 
Lab introduction 2014
Lab introduction 2014Lab introduction 2014
Lab introduction 2014nlab_utokyo
 
2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)
2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)
2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)ayumi kizuka
 
2020.5.28開催 朝の15分でわかるAIニュース解説 「AIがコロナ危機を予測」 #3 関連書籍の紹介
2020.5.28開催 朝の15分でわかるAIニュース解説 「AIがコロナ危機を予測」 #3 関連書籍の紹介2020.5.28開催 朝の15分でわかるAIニュース解説 「AIがコロナ危機を予測」 #3 関連書籍の紹介
2020.5.28開催 朝の15分でわかるAIニュース解説 「AIがコロナ危機を予測」 #3 関連書籍の紹介Hiroki Katayama
 
ブロックチェーンと仮想通貨 -- 新しいビジネスに挑戦
ブロックチェーンと仮想通貨 -- 新しいビジネスに挑戦ブロックチェーンと仮想通貨 -- 新しいビジネスに挑戦
ブロックチェーンと仮想通貨 -- 新しいビジネスに挑戦Yuto Takei
 
受動的なメディア接触のススメ Ad tech
受動的なメディア接触のススメ Ad tech受動的なメディア接触のススメ Ad tech
受動的なメディア接触のススメ Ad techIkko Yoshiba
 
情報システム・ユーザビリティの評価改善手法
情報システム・ユーザビリティの評価改善手法情報システム・ユーザビリティの評価改善手法
情報システム・ユーザビリティの評価改善手法Jun Iio
 
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究Deep Learning Lab(ディープラーニング・ラボ)
 
日本語における自然言語解析とその応用 〜COTOHA VA & API〜
日本語における自然言語解析とその応用 〜COTOHA VA & API〜日本語における自然言語解析とその応用 〜COTOHA VA & API〜
日本語における自然言語解析とその応用 〜COTOHA VA & API〜ネクストスケープ
 

Similaire à 特別チュートリアル「パターン認識とメディア理解のフロンティア」 ディスカッションペーパー (20)

学会・研究会の情報保障におけるソーシャルネットワークの役割
学会・研究会の情報保障におけるソーシャルネットワークの役割学会・研究会の情報保障におけるソーシャルネットワークの役割
学会・研究会の情報保障におけるソーシャルネットワークの役割
 
ビッグデータ:ハイプカーブの先に見えるもの2013(etoh)
ビッグデータ:ハイプカーブの先に見えるもの2013(etoh)ビッグデータ:ハイプカーブの先に見えるもの2013(etoh)
ビッグデータ:ハイプカーブの先に見えるもの2013(etoh)
 
音声認識どこまでできる?
音声認識どこまでできる?音声認識どこまでできる?
音声認識どこまでできる?
 
리츠메이칸대학 정보이공학부 소개 (정보 시스템 글로벌 코스 입시 소개)
리츠메이칸대학 정보이공학부 소개 (정보 시스템 글로벌 코스 입시 소개)리츠메이칸대학 정보이공학부 소개 (정보 시스템 글로벌 코스 입시 소개)
리츠메이칸대학 정보이공학부 소개 (정보 시스템 글로벌 코스 입시 소개)
 
自然言語処理紹介(就職編)
自然言語処理紹介(就職編)自然言語処理紹介(就職編)
自然言語処理紹介(就職編)
 
Japan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラムJapan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラム
 
デブサミ2014 オフィシャルコミュニティ募集要項
デブサミ2014 オフィシャルコミュニティ募集要項デブサミ2014 オフィシャルコミュニティ募集要項
デブサミ2014 オフィシャルコミュニティ募集要項
 
ビックデータとシリコンバレースタートアップ事情
ビックデータとシリコンバレースタートアップ事情ビックデータとシリコンバレースタートアップ事情
ビックデータとシリコンバレースタートアップ事情
 
エンジニアライフ 市場価値 20140322
エンジニアライフ 市場価値 20140322エンジニアライフ 市場価値 20140322
エンジニアライフ 市場価値 20140322
 
≪インテル x ブロケード 特別対談≫ 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~
≪インテル x ブロケード 特別対談≫ 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~ ≪インテル x ブロケード 特別対談≫ 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~
≪インテル x ブロケード 特別対談≫ 2020年。どうなる?車とデータセンタの関係 ~SDxの、その先へ~
 
20160907rsj16ロボット聴覚OS
20160907rsj16ロボット聴覚OS20160907rsj16ロボット聴覚OS
20160907rsj16ロボット聴覚OS
 
Saleshub uxro survice document ver1.1
Saleshub uxro survice document ver1.1Saleshub uxro survice document ver1.1
Saleshub uxro survice document ver1.1
 
Lab introduction 2014
Lab introduction 2014Lab introduction 2014
Lab introduction 2014
 
2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)
2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)
2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)
 
2020.5.28開催 朝の15分でわかるAIニュース解説 「AIがコロナ危機を予測」 #3 関連書籍の紹介
2020.5.28開催 朝の15分でわかるAIニュース解説 「AIがコロナ危機を予測」 #3 関連書籍の紹介2020.5.28開催 朝の15分でわかるAIニュース解説 「AIがコロナ危機を予測」 #3 関連書籍の紹介
2020.5.28開催 朝の15分でわかるAIニュース解説 「AIがコロナ危機を予測」 #3 関連書籍の紹介
 
ブロックチェーンと仮想通貨 -- 新しいビジネスに挑戦
ブロックチェーンと仮想通貨 -- 新しいビジネスに挑戦ブロックチェーンと仮想通貨 -- 新しいビジネスに挑戦
ブロックチェーンと仮想通貨 -- 新しいビジネスに挑戦
 
受動的なメディア接触のススメ Ad tech
受動的なメディア接触のススメ Ad tech受動的なメディア接触のススメ Ad tech
受動的なメディア接触のススメ Ad tech
 
情報システム・ユーザビリティの評価改善手法
情報システム・ユーザビリティの評価改善手法情報システム・ユーザビリティの評価改善手法
情報システム・ユーザビリティの評価改善手法
 
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
 
日本語における自然言語解析とその応用 〜COTOHA VA & API〜
日本語における自然言語解析とその応用 〜COTOHA VA & API〜日本語における自然言語解析とその応用 〜COTOHA VA & API〜
日本語における自然言語解析とその応用 〜COTOHA VA & API〜
 

Plus de Osaka University

Generative AI: Redefining Creativity and Transforming Corporate Landscape
Generative AI: Redefining Creativity and Transforming Corporate LandscapeGenerative AI: Redefining Creativity and Transforming Corporate Landscape
Generative AI: Redefining Creativity and Transforming Corporate LandscapeOsaka University
 
自然言語処理の発展がもたらす未来(電気通信協会調査会での講演)
自然言語処理の発展がもたらす未来(電気通信協会調査会での講演)自然言語処理の発展がもたらす未来(電気通信協会調査会での講演)
自然言語処理の発展がもたらす未来(電気通信協会調査会での講演)Osaka University
 
立教大学MBA:AIの最先端技術によるこれからの価値創造
立教大学MBA:AIの最先端技術によるこれからの価値創造立教大学MBA:AIの最先端技術によるこれからの価値創造
立教大学MBA:AIの最先端技術によるこれからの価値創造Osaka University
 
龍野高校創立125周年記念講演:2030年までにやっておくべき3つのこと
龍野高校創立125周年記念講演:2030年までにやっておくべき3つのこと龍野高校創立125周年記念講演:2030年までにやっておくべき3つのこと
龍野高校創立125周年記念講演:2030年までにやっておくべき3つのことOsaka University
 
デジタル資本主義と スマートリスクの取り方
デジタル資本主義とスマートリスクの取り方デジタル資本主義とスマートリスクの取り方
デジタル資本主義と スマートリスクの取り方Osaka University
 
DX 組織デザインパターン
DX 組織デザインパターンDX 組織デザインパターン
DX 組織デザインパターンOsaka University
 
To be or not to be an academic, big enterprise, startup job that is the qu...
  To be or not to be an academic, big enterprise, startup job  that is the qu...  To be or not to be an academic, big enterprise, startup job  that is the qu...
To be or not to be an academic, big enterprise, startup job that is the qu...Osaka University
 
身の丈にあった社会問題解決
身の丈にあった社会問題解決身の丈にあった社会問題解決
身の丈にあった社会問題解決Osaka University
 
AI系ディープテックスタートアップ の経営環境
AI系ディープテックスタートアップの経営環境AI系ディープテックスタートアップの経営環境
AI系ディープテックスタートアップ の経営環境Osaka University
 
AI_IoTを活用する企業のあり方
AI_IoTを活用する企業のあり方AI_IoTを活用する企業のあり方
AI_IoTを活用する企業のあり方Osaka University
 
AI とデジタル変革
AI とデジタル変革AI とデジタル変革
AI とデジタル変革Osaka University
 
デジタル変革とソフトウェア化する産業:これからの20年に君たちが知っておくべきこと
デジタル変革とソフトウェア化する産業:これからの20年に君たちが知っておくべきことデジタル変革とソフトウェア化する産業:これからの20年に君たちが知っておくべきこと
デジタル変革とソフトウェア化する産業:これからの20年に君たちが知っておくべきことOsaka University
 
デジタルが切り開く未来ビジネス
デジタルが切り開く未来ビジネスデジタルが切り開く未来ビジネス
デジタルが切り開く未来ビジネスOsaka University
 
鉄腕アトムはできるか?
鉄腕アトムはできるか?鉄腕アトムはできるか?
鉄腕アトムはできるか?Osaka University
 
経営視点から考察するデジタル戦略 ~クラウドがもたらすビジネスインパクト~
経営視点から考察するデジタル戦略 ~クラウドがもたらすビジネスインパクト~経営視点から考察するデジタル戦略 ~クラウドがもたらすビジネスインパクト~
経営視点から考察するデジタル戦略 ~クラウドがもたらすビジネスインパクト~Osaka University
 
Move out from your comfort zone!
Move out from your comfort zone!Move out from your comfort zone!
Move out from your comfort zone!Osaka University
 
クラウドの進化とメディア理解の発展
クラウドの進化とメディア理解の発展クラウドの進化とメディア理解の発展
クラウドの進化とメディア理解の発展Osaka University
 

Plus de Osaka University (20)

CREST AIの振り返り
CREST AIの振り返りCREST AIの振り返り
CREST AIの振り返り
 
Generative AI: Redefining Creativity and Transforming Corporate Landscape
Generative AI: Redefining Creativity and Transforming Corporate LandscapeGenerative AI: Redefining Creativity and Transforming Corporate Landscape
Generative AI: Redefining Creativity and Transforming Corporate Landscape
 
自然言語処理の発展がもたらす未来(電気通信協会調査会での講演)
自然言語処理の発展がもたらす未来(電気通信協会調査会での講演)自然言語処理の発展がもたらす未来(電気通信協会調査会での講演)
自然言語処理の発展がもたらす未来(電気通信協会調査会での講演)
 
立教大学MBA:AIの最先端技術によるこれからの価値創造
立教大学MBA:AIの最先端技術によるこれからの価値創造立教大学MBA:AIの最先端技術によるこれからの価値創造
立教大学MBA:AIの最先端技術によるこれからの価値創造
 
龍野高校創立125周年記念講演:2030年までにやっておくべき3つのこと
龍野高校創立125周年記念講演:2030年までにやっておくべき3つのこと龍野高校創立125周年記念講演:2030年までにやっておくべき3つのこと
龍野高校創立125周年記念講演:2030年までにやっておくべき3つのこと
 
デジタル資本主義と スマートリスクの取り方
デジタル資本主義とスマートリスクの取り方デジタル資本主義とスマートリスクの取り方
デジタル資本主義と スマートリスクの取り方
 
DX 組織デザインパターン
DX 組織デザインパターンDX 組織デザインパターン
DX 組織デザインパターン
 
To be or not to be an academic, big enterprise, startup job that is the qu...
  To be or not to be an academic, big enterprise, startup job  that is the qu...  To be or not to be an academic, big enterprise, startup job  that is the qu...
To be or not to be an academic, big enterprise, startup job that is the qu...
 
DX と社会問題解決
DX と社会問題解決DX と社会問題解決
DX と社会問題解決
 
身の丈にあった社会問題解決
身の丈にあった社会問題解決身の丈にあった社会問題解決
身の丈にあった社会問題解決
 
AI系ディープテックスタートアップ の経営環境
AI系ディープテックスタートアップの経営環境AI系ディープテックスタートアップの経営環境
AI系ディープテックスタートアップ の経営環境
 
AI_IoTを活用する企業のあり方
AI_IoTを活用する企業のあり方AI_IoTを活用する企業のあり方
AI_IoTを活用する企業のあり方
 
AI とデジタル変革
AI とデジタル変革AI とデジタル変革
AI とデジタル変革
 
デジタル変革とソフトウェア化する産業:これからの20年に君たちが知っておくべきこと
デジタル変革とソフトウェア化する産業:これからの20年に君たちが知っておくべきことデジタル変革とソフトウェア化する産業:これからの20年に君たちが知っておくべきこと
デジタル変革とソフトウェア化する産業:これからの20年に君たちが知っておくべきこと
 
デジタルが切り開く未来ビジネス
デジタルが切り開く未来ビジネスデジタルが切り開く未来ビジネス
デジタルが切り開く未来ビジネス
 
デジタル戦略とAWS
デジタル戦略とAWSデジタル戦略とAWS
デジタル戦略とAWS
 
鉄腕アトムはできるか?
鉄腕アトムはできるか?鉄腕アトムはできるか?
鉄腕アトムはできるか?
 
経営視点から考察するデジタル戦略 ~クラウドがもたらすビジネスインパクト~
経営視点から考察するデジタル戦略 ~クラウドがもたらすビジネスインパクト~経営視点から考察するデジタル戦略 ~クラウドがもたらすビジネスインパクト~
経営視点から考察するデジタル戦略 ~クラウドがもたらすビジネスインパクト~
 
Move out from your comfort zone!
Move out from your comfort zone!Move out from your comfort zone!
Move out from your comfort zone!
 
クラウドの進化とメディア理解の発展
クラウドの進化とメディア理解の発展クラウドの進化とメディア理解の発展
クラウドの進化とメディア理解の発展
 

Dernier

【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 

Dernier (9)

【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 

特別チュートリアル「パターン認識とメディア理解のフロンティア」 ディスカッションペーパー

  • 1. © 2014 NTT DOCOMO, INC. All rights reserved. モデレータ: 栄藤 @mickbean ハッシュタグ #MIRU2014 https://sites.google.com/site/miru2014okayama/online-question-form 特別チュートリアル 「パターン認識とメディア理解のフロンティア」 1
  • 2. © 2014 NTT DOCOMO, INC. All rights reserved. 2 15:15-16:00 【ゲスト講演】 「自然言語処理の現在と画像処理」徳永拓之(PFI) 16:00-16:45 【ゲスト講演】 「音楽理解技術の魅力」後藤真孝(産総研) (休憩) 17:00-17:45 【ゲスト講演】「E-Commerceにおける機械学習・パターン認識・画像解析技術の活用 の実際」森正弥(楽天技術研究所) 17:45-18:15 【パネルディスカッション】 「画像以外もこんなに面白い。」
  • 3. © 2014 NTT DOCOMO, INC. All rights reserved. ハッシュタグ #MIRU2014 https://sites.google.com/site/miru2014okayama/online-question-form 画像以外も面白い.広い視野を->学生の皆さんへ 境界分野を新たな研究フロンティアへ 3 モデレータ: 栄藤 @mickbean
  • 4. © 2013 NTT DOCOMO, INC. All rights reserved. 1985 私の経験:隣の芝はまぶしい • 画像符号化の仕事を始めた時,画像の符号化レートにデジタル処理が追いつか ず,できたのは適応サブサンプリングくらい.同僚の殆どはアナログ人間. • 隣の音声処理グループ: 離散コサイン変換,FFTでの波形整形,窓関数,サ ブバンド符号化(ウェーブレット)くらいはやっていた.. • 音声認識で使われる言語モデル(生成モデル)を用いた制約解法も早かった. モデルベースのノイズリダクションもそう ! • 他分野で先行して利用され,画像分野で花開いたものに以下がある.(井尻) boosting, random forests, graph cut, level set, MRF, structured learning (CRF), 4
  • 5. © 2013 NTT DOCOMO, INC. All rights reserved. 2007 私の経験:画像やっててよかった. • ドコモでデータマイニング,NLPの開発に従事 しゃべってコンシェルで多用している技術はSVM,CRF. • 企業の技術経営者としてデータ処理分野には以下の見解. 1.パターン認識,機械学習に関する知識を教えるのは時間がかか る→大学で教育されていると助かる。基礎は重要.音声系・NLP系の学 生は少ない.MIRU系の学生は多く,人材源としては最高.現実の問題を モデル化して解くという訓練を受けている. 2.特徴抽出:ドメインに関する前処理。センスが要る。 ビックデータのマイニングでもクレンジングでのセンスがかなり必要。 5
  • 6. © 2014 NTT DOCOMO, INC. All rights reserved. 1. 画像特有の本質的な技術は何であって、 2. 音声・自然言語等他のメディア認識・理解と基本 を共有する汎用的な技術? 6 Thanks to 仙田さん,田中さん,井尻さん 黄瀬先生,嶋田先生,大山先生
  • 7. © 2014 NTT DOCOMO, INC. All rights reserved. 7 1. メディアに固有な技術 信号入力から特徴抽出まで.セグメンテーション, 初期視覚,センシング 2. 汎用な技術  それ以降、信号を記号に置き換えるまで。 技術の手法自体が、対象メディアに依存しなくなり つつある.
  • 8. © 2014 NTT DOCOMO, INC. All rights reserved. 結局,何が言いたい? • 画像理解は良い教育の場である.どうして? → ドメイン固有技術と汎用技術の切り分けを意識すれば,汎用 技術部分をいろんなメディアに適用できる. • ドメイン固有を馬鹿にする事なかれ.各ドメインの攻め方は 似ていると思う:現実の事象をモデル化する方法論を腕に仕 込む. (←このマインドセットは大事.以下の3人のプレゼンに関連する) • 画像に限定しないメディア理解の統合を考えてみよう. • 特徴抽出を含めた一般的な認識技術を目指そう 8
  • 9. © 2014 NTT DOCOMO, INC. All rights reserved. 9 1.画像特有の本質的な技術 信号処理の観点: ・二次元もしくは三次元の空間的に相関を持つ信号の処理。時間を含めた四次元方向に、相関を持っても良い。  ・デノイジング、フィルタ等は、相関構造を直接利用。  ・特徴抽出は、時空間の相関構造を抽出する手段(エッジ・領域など)  ・パノラマ等は相関をベースに合成処理   ・レーダ信号処理等における合成開口処理に類似だが、合成開口自体が画像処理と考えても良い。 ・複数のセンサ利用した際には、幾何的情報を持った信号の処理  ・相関構造抽出+幾何情報抽出(ステレオなど) センシングの観点: ・基本的には電磁波のセンシング:  ・波長が特有(狭義には可視光領域)、この波長帯に特有の回折、屈折、反射現象を持つ。  ・多くの場合、3チャンネルの二次元信号を一組として利用  ・可視光領域の波長の信号(光線)の、方位、時間、波長変化、偏光等に関するセンシング、モデリングつまり、opticsや、computer graphicsなど 2.音声・自然言語等他のメディア認識・理解と基本を共有する汎用的な技術 ・数理モデリング(IsingModel, Graphical Model, State Space Model, GMM,... ) ・最適化(非線形最適化(Newton, GaussNewton, etc)LevelSet, GraphCut, L0/1最適化(ADMM, etc)、最短経路探索(DP, Dijkstra, A*, etc)) ・機械学習(SVM, RVM, Boosting, RandomForests, DeepXXX, XXX-learning,Clustering, ...) ・確率、統計(MRF, CRF, ...) ・信号処理(種々のフィルタ(FIT, IIT, Kalman, Particle, ... ), DCT, FFT,Wavelet, ... ) ・センシング原理(Time of Flight, ... ) 技術分類(井尻さん)
  • 10. © 2014 NTT DOCOMO, INC. All rights reserved. 10 画像特有 2D/3D object detection and recognition 3D shape recovery Biological image and signal analysis Biologically motivated vision Coding,compression and super-resolution Cognitive and embodied vision Computational photography Content based image retrieval and data mining Display Hardware Early vision Face recognitionFacial expression recognition Fingerprint recognition Forensic biometrics and its applications Gait recognition Gesture and Behavior Analysis Graphics  Recognition Illumination and reflectance modeling Image and video analysis and understanding Image based modeling Image guidance and robot guidance of interventions Industrial image analysis Inpainting and Superimposing Iris recognition Low-level vision Medical image and signal analysis  Mixed and Augmented Reality Modeling, simulation andvisualization Motion, tracking and video analysis Occlusion and shadow detection Physics-based vision Reconstruction and camera motion estimation Representation and analysis in pixel/voxel images Scene understanding Segmentation, features and descriptors Shape modeling and encoding Signal, image and video processing Stereo and multiple view geometry Texture and color analysis Vision for graphics Vision for robotics ! メディア共通・横断 Active and ensemble learning Affective computing Artificial neural networks Biometric systems and applications Classification and clustering Computer-aided detection and diagnosis Deep learning Dimensionality reduction and manifold learning Character and Text Recognition Document Understanding Enhancement, restoration and filtering Handwriting Recognition Human body motion and gesture based interaction Human Computer Interaction Machine learning and data mining Model selection Multi-biometrics Multimedia analysis, indexing and retrieval Other applications Other Biometric applications Perceptual organizationPerformance Evaluation Semi-supervised learning and  spectral methods Statistical, syntactic and structural pattern recognition Support vector machines and kernel methods Symbolic learning Transfer learning 他メディア特有 Audio and acoustic processing and analysis Automatic speech and speaker recognition Pattern Recognition for Art, Cultural Heritage and Entertainment Pattern Recognition for Bioinformatics Pattern Recognition for Search, Retrieval and Visualization Pattern Recognition for Surveillance and SecuritySecurity issues Sensor array & multichannel signal processing Signal Processing for Astronomy Soft biometrics Speaker recognition Speech and natural language based interaction Spoken language processing ICPR2014 Keywordsの分類(大山先生)
  • 11. © 2014 NTT DOCOMO, INC. All rights reserved. 徳永さんのプレゼン • word2vec でできるようになったという king - man + woman -> queen     画像でもできるかな・・ • Paragraph Vector面白そう. • Zero-Shot Learning by Convex Combination of Semantic Embeddings (Norouzi et al., 2014)の話は, 実は凄い狙い.言語側ではtiger, lion, liger(tigerとlionの子)というデータがある.普通に分類を行 い、 P(tiger) = 0.5, P(lion) = 0.5 という確率値を得る. tigerとlionの分散表現をその割合で混ぜ合わせ る.得られた分散表現で最近傍探索を行い、ligerが得られたら…嬉しい.ただし. ligerは学習データ に入っていないものとする. • 統計的機械翻訳のコーパスに画像と説明文を使う.→最初はICCV10の cs.cmu.edu/~afarhadi/pape… で、その後 EMNLP11 dl.acm.org/citation.cfm?i… や牛久くんのACMMM11があり。 • 一般物体認識は記号接地(Symbol Grounding)問題の特殊な場合.(気づいてもらいたい,栄藤) • Deep NNはほとんど2層以下.画像や音声とは問題の性質が違う. 11
  • 12. © 2014 NTT DOCOMO, INC. All rights reserved. 後藤さんのプレゼン • 音楽認識はなぜ面白いか.「複数の音が相互に関係し合いながら時間的な構造を形成して内 容を伝える信号」の理解. • 画像のオクルージョンは、音声だとマスキング効果に例えられるような気がするんだけど、 人間の知覚とは違う音声認識や音楽理解では関係ないんだろうか… • 混合音と単音を「同じ音階」と認知するのって、考えてみると意味不明ですね。色彩もおなじ ですが。音源分離も考えると、余計分からなくなります、 • オーケストラを聞いて各楽器のパートに分解できる人はオーケストラを編曲もできるだけの知 識がある。機械学習で数種類の楽器を分離できるだけで、素人の能力はすでに超えてるね • 音源分離とBSSは同じ問題と考えて良いのかな?音楽特有の技術もありそうですが。。 • songleは作曲の教育にも使えそうですね。 • 音楽に対する自動コメント.映像と自然言語の融合分野? • アイマスMADについ苦笑して反応してしまった。負けた気がする。 12
  • 13. © 2014 NTT DOCOMO, INC. All rights reserved. 森さんのプレゼン • 楽天スーパーDB, TERADATA • Amazonの売り上げの30%はリコメンデーションから生み出されている.楽天も同じ感覚か. • 氷川きよしのCD売り上げは出来る.AKB48はプロモーションが非定常的なので無理. • 日本はロングテール:じゃばらは食べられないが,じゃばらドリンクは売れた. • 何も高度な技術を適用していない。何(データ・ログ)を対象とするか。どう適用するか。データ・ ログ収集・基礎集計の戦略。変数に入れるためのデータの加工の仕方。データ・ログの標準化・統 一化。あるいはそもそもの仮説の立て方。それらこそが重要。(激しく同意) • 「機械学習」の知識に加え、大量データ処理の技術、分散プログラミングの技術もあわせて必要。 • 代表画像の表示はGoogleへのSEO対策として良い. • ディープラーニングはディープな画像に使っている. • アマゾン,ファイアフォンの『ファイアフライ』機能についてどう思いますか? 13
  • 14. © 2014 NTT DOCOMO, INC. All rights reserved. 質問1: • 自然言語,音声・楽音理解,画像理解の融合分野で 面白そうな研究テーマはあるでしょうか?あるとす ればどのようなアプローチがありますか? 14
  • 15. © 2014 NTT DOCOMO, INC. All rights reserved. 質問2: • 画像理解の研究コミュニティが他分野に期待するこ と,v.v. 15