SlideShare une entreprise Scribd logo
1  sur  89
8. 人工知能とコンピュータビジョン
(人工知能)
URL: https://www.kkaneko.jp/ai/mi/index.html
1
金子邦彦
アウトライン
1. コンピュータビジョン
2. 画像を扱うための畳み込み
3. 畳み込み、プーリング、畳み込み
ニューラルネットワーク
4. 畳み込みニューラルネットワーク
の演習
5. 物体検出
6. 顔情報処理
7. 姿勢推定
8. 演習 2
8-1 コンピュータビジョン
3
コンピュータビジョン
• コンピュータが「視覚」を持つ
• 実世界の様子を理解し活用する(何があり,何が発生し,
何が起きそうかを予測するなど)
4
物体検出
インスタンス・セグメンテーション
セマンティック・セグメンテーション
画像理解の主な種類
① 画像分類
「何があるか」を理解
② 物体検出
場所と大きさも理解
③ セグメンテーション
画素単位で領域を理解
5
person
bicycle
person
bicycle
画像分類での教師あり学習
6
画像
分類結果
(正解)
mammal
placental
carnivore
canine
dog など
文献 J. Deng, W. Dong, R. Socher, L. -J. Li, Kai Li and Li Fei-Fei, "ImageNet: A large-scale hierarchical image database," 2009 IEEE
Conference on Computer Vision and Pattern Recognition, 2009, pp. 248-255, doi: 10.1109/CVPR.2009.5206848.
人工知能
訓練データ
person
bicycle
画像分類
ディープニューラルネットワーク
• ディープニューラルネットワークは,
層が深い(層の数が多い)ニューラルネットワーク
7
層の数が少ない(浅い) 層の数が多い(深い)
画像分類の精度の向上
• ディープラーニングの進展
• 画像分類は,場合によっては,AI
が人間と同等の精度 とも考えら
るように
画像分類の誤り率 (top 5 error)
人間: 5.1 %
PReLU による画像分類: 4.9 %
(2015年発表)
8
ImageNet データセット
の画像分類の結果
文献: Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun,
Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification
arXiv:1502.01852, 2015.
コンピュータビジョンまとめ
• コンピュータビジョン:コンピュータが実世界の様子
を理解し活用する
• 画像理解の主な種類:
• 画像分類:「何があるか」を理解
• 物体検出:場所と大きさも理解
• セグメンテーション:画素単位で領域を理解
• 教師あり学習を用いるのが主流
• ディープニューラルネットワーク(DNN):層が多い
ニューラルネットワークで、画像分類の精度向上に貢
献。
• 進歩により、2015年の時点で、AIの画像分類は人間と
同等の精度(誤り率:人間5.1%、AI4.9%)を達成可
能。
9
8-2 画像を扱うための
畳み込み
10
画像の畳み込みの応用例
• 人工知能以外でも,ぼかし,エッジ抽出などさま
ざまな処理で,畳み込みを使用できる
11
畳み込みによる
ぼかし
畳み込みによる
エッジ抽出
畳み込み
12
畳み込みは,あるデータを移動しながら,カーネルと
重ね合わせる.重ね合わせの結果は1つの値になる.
移動
カーネルと同じ長さに切り出し
重ね合わせ
(掛け算と合計)
データ
カーネル
畳み込みの例
13
0 1 0 1 0 0 1 1 1 0
0
1 0 1
0×1 1×0 0×1
この部分を切り出す
重ね合わせの結果: 0×1 + 1×0 + 0×1 = 0
データ
カーネル
畳み込みの例
14
0
1 0 1
0×1 1×0 0×1
1 0 1
1×1 0×0 1×1
1 0 1
0×1 1×0 0×1
2 0
0 1 0 1 0 0 1 1 1 0
1 0 1
1×1 0×0 0×1
1 0 1
0×1 0×0 0×1
1 0 1
0×1 1×0 1×1
1 0 1
1×1 1×0 1×1
1 0 1
1×1 1×0 0×1
1 1 1 2 1
移動
畳み込み
15
1 0 1
畳み込みは,「特定のパターンに強く反応する」と考える
こともできる
0 2 0 1 1 1 2 1
0 1 0 1 0 0 1 1 1 0
畳み込み結果
畳み込み結果が大きくなる部分
データ
カーネル
画像の畳み込み
16
出典: https://serokell.io/blog/introduction-to-convolutional-neural-networks
元画像(5×5マス)
カーネル(3×3マス)
画像での畳み込み
17
元画像(5×5マス)
畳み込み
0×1 1×0 1×1
0×1 1×1 1×1
0×0 1×0 1×1
切り出し(3×3マス)
カーネル
(3×3マス)
合計: 4 (これが畳み込み結果)
カーネルと同じサイズ
で切り出す
切り出した部分とカーネルの
掛け算の合計
画像での畳み込み
18
元画像(5×5マス)
畳み込み結果
切り出し(3×3マス)
カーネル
(3×3マス)
畳み込み結果
切り出し領域を横にずらす
4 3
0×1 1×0 1×1
0×1 1×1 1×1
0×0 1×0 1×1
合計: 4
1×1 1×0 0×1
1×1 1×1 0×1
1×0 1×0 0×1
合計: 3
画像での畳み込み
19
元画像(5×5マス)
畳み込み結果
4 3 5
4 3 5
4 3 5
切り出し(3×3マス)
カーネル
(3×3マス)
切り出し領域を縦横にずらす
画像全体について
畳み込み
画像の畳み込みを行う Python プログラムの例
20
https://colab.research.google.com/drive/1pcdD-I5-2VbLizKb3egJIQWXn8tBfOuK?usp=sharing
畳み込みまとめ
畳み込み: データに対し移動しながらカーネルと重ね合わ
せ、その結果を1つの値にまとめる。
• 特定のパターンに強く反応する性質を持つ。
• コンピュータビジョンに欠かせない技術
• 人工知能以外でも使用可能。例えば、画像のぼかしやエッ
ジ抽出などに活用。
21
8-3. 畳み込み、プーリング、畳み
込みニューラルネットワーク
22
全結合層
• 全結合層のユニットは,前の層のすべてのユニッ
トと結合している
23
前の層 全結合層
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
(他の結合は
書いていない)
畳み込み層
• 畳み込み層は,畳み込みを行う
• 結合の重みが,畳み込みのカーネルになる
• 前の層の,一部分のユニットとのみ結合
24
前の層 畳み込み層
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
0×1 + 1×0 + 0×1 = 0
畳み込みのカーネルのサ
イズが 2×2 のとき:
前の層の 4つのユニット
とのみ結合
プーリング
• プーリングにより,画像サイズが小さくなる
• Max pooling (マックス・プーリング)は,最大
値を利用するプーリング
25
出典: https://github.com/jeffheaton/t81_558_deep_learning/blob/084023876b6cf09c931b452584dbd44c56314a03/t81_558_class_06_2_cnn.ipynb
・4, 8, 7, 1 の最大値は 4
・「4, 8, 7, 1」の 4マス
から,最大値の 8 を選ぶ.
すると,サイズは ¼ にな
る
畳み込みニューラルネットワーク(CNN)
さまざまなバリエーション
26
畳み込みニューラルネットワークは,畳み込み
層と,プーリング層を交互に繰り返すディープ
ニューラルネットワーク
畳
み
込
み
層
• 畳み込み層 ・・・ 畳み込みによるパターンの識別
• プーリング層 ・・・ 画像の小移動に対して,出力が不
変になる
畳
み
込
み
層
畳
み
込
み
層
畳
み
込
み
層
畳
み
込
み
層
プ
ー
リ
ン
グ
層
プ
ー
リ
ン
グ
層
プ
ー
リ
ン
グ
層
プ
ー
リ
ン
グ
層
プ
ー
リ
ン
グ
層
畳み込みニューラルネットワークの特徴
全結合層のみの場合と比べて.
• ユニット間の結合を局所に限定
• 結合の数を,大幅に削減
• 結合の数が減り,過学習の問題を緩和
27
畳み込みニューラルネットワーク(CNN)の用途
画像分類,物体検出,セグメンテーションなどで高
い性能・機能を発揮する場合がある
28
画像分類
物体検出
セグメン
テーション
演習
【トピックス】
• 畳み込みニューラルネット
ワーク
• CNN Explainer
• 畳み込み層
• プーリング層
29
CNN Explainer
• CNN Explainer ジョージア工科大学 Polo Club
• 畳み込み層などの仕組みをビジュアルに学ぶこと
ができるサイト
Webブラウザで次の URL を開く
https://poloclub.github.io/cnn-explainer/
30
① 画面の確認
このニューラルネットワークは,画像分類を行う
31
画像を選ぶ
元画像の
赤青緑の成分
ニューラルネットワーク 画像の分類結果.
ここでは espresso
② ニューラルネットワークの構成
畳み込み層とプーリング層を含む
32
全結合層
conv relu conv relu max_pool conv relu conv relu max_pool
畳み込み層 畳み込み層 プーリング層 畳み込み層 畳み込み層 プーリング層
conv は畳み込み層で,max_pool はプーリング層
全結合層 全結合層 全結合層
③ 左上の画像をクリック
→ 畳み込みの様子をアニメーションで確認できる
(この画像は,各層での処理結果である.画像1個
がニューロン1つというわけではない)
33
④ 出てきた画像をクリック
→ 畳み込みの詳細をアニメーションで確認できる
34
⑤ 畳み込みの様子がアニメーションで表示される
35
その他の層についてもビジュアルに表示できる
(いろいろ試すことは,各自の自主的な自習とす
る)
畳み込みニューラルネットワークまとめ
• 全結合層:前の層の全てのユニットと結合
• 畳み込み層:前の層の一部のユニットと結合し、
畳み込みを行う
• プーリング:画像サイズを小さくする。マックス
プーリングは最大値を利用。
• 畳み込みニューラルネットワーク:畳み込み層と
プーリング層を含むニューラルネットワーク。
• ユニット間の結合を局所に限定し、結合の数を大幅に
削減して過学習を緩和する。
• 画像分類、物体検出、セグメンテーションなどで高性
能を発揮。
36
8-4. 畳み込みニューラルネット
ワークの演習
37
次のページを使用
• 畳み込みニューラルネットワークを用いた画像分
類
• 学習と検証を行うプログラム
• 学習曲線をプロット
https://colab.research.google.com/drive/18IPPkY96
Oc6jkYD2su4cFgWcoYAskLo_?usp=sharing
38
畳み込み層を含むニューラルネットワー
クの例
39
入力データ 出力データ
ユニット
10 個
softmax
ユニット間
の結合 最終層
ユニット
128 個
relu
畳
み
込
み
層
畳
み
込
み
層
プ
ー
リ
ン
グ
層
ニューラルネットワーク作成のプログラム例
40
import tensorflow as tf
m = tf.keras.models.Sequential([
tf.keras.layers.Conv2D(32, kernel_size=(3, 3),
activation='relu',
input_shape=(28, 28, 1)),
tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
tf.keras.layers.Dropout(0.25),
tf.keras.layers.Flatten(),
tf.keras.layers.Dense(units=128, activation='relu'),
tf.keras.layers.Dropout(0.5),
tf.keras.layers.Dense(units=10, activation='softmax')
])
←畳み込み層
←畳み込み層
←プーリング層
←全結合層
←全結合層
https://colab.research.google.com/drive/18IPPkY96Oc6jkYD2su4cFgWcoYAskLo_?usp
=sharing
学習のための準備
• ニューラルネットワークの作成
• 訓練データ (学習用)
• 検証データ (検証用)
41
60000枚の画像と正解
10000枚の画像と正解
抜粋
抜粋
学習の繰り返しを行うプログラム例
42
訓練データの指定
検証データの指定
学習の繰り返し回数は 10
学習の繰り返しを行うプログラム例
43
訓練データの指定
検証データの指定
学習の繰り返し回数は 10
学習の繰り返しを行うプログラムと実行結果
44
同じ訓練データを用いた学習を10回繰り返し.
学習の繰り返しごとに,
訓練データや検証データ
での精度や損失
の変化を確認
そのとき,検証データで検証
プログラム
実行結果
画像分類の精度は 0.99
45
MIT Introduction to Deep Learning | 6.S191,
https://www.youtube.com/watch?v=5tvmMX8r_OM
の「Why Deep Learning」のページ
うまく設計されたニューラルネットワークは,「データ
からのパターンの抽出」を行っているという考え方も
ニューラルネットワークが扱うさまざまなレベルのパターン
演習
【トピックス】
• 畳み込みニューラルネット
ワーク
• 学習
• 学習曲線
46
次のページを使用
https://colab.research.google.com/drive/18IPPkY96
Oc6jkYD2su4cFgWcoYAskLo_?usp=sharing
47
8-5 物体検出
48
49
物体検出
物体検出の仕組み
50
taxi 種類
画像全体の中で,
物体がありそうな
場所を特定
場所と大きさ
を表すバウンディングボックス
畳み込み,
プーリング,
全結合
場所の特定 画像分類
51
52
8-6 顔情報処理
53
顔検出
• 用途:顔の数のカウント,顔情報処理の最初の処
理
54
顔ランドマーク (facial landmark))
• 目,鼻,口,眉毛,あごなどがランドマークになる
• 位置合わせ,表情分析,人物特定の手がかり
55
顔のコード化
• 顔のコードは,複数の数値(ふつう100以上)の組み合
わせ
• 顔画像から,顔ランドマークを求め,顔のコードを得る
• さまざまな用途:顔識別(本人の特定),顔認識,年齢の
推定,性別の推定,表情の推定,顔の3次元再構成など
56
顔検出,
顔ランドマーク
数値化
表情の推定
57
• ここでは,7種の表情 Angry, Disgust, Fear, Happy,
Neutral, Sad, Surprised のそれぞれの確率を推定
• https://github.com/ezgiakcora/Facial-Expression-Keras
で公開されている成果物
年齢の推定,性別の推定
58
人物特定の例
59
younes
顔写真からの3次元再構成
3DFFA 法(2022年発表)
• 元画像から,3次元の顔を生成(3次元再構成)
• 顔検出,顔ランドマーク(顔の目印となるポイント)の検
出ののち,ランドマークに顔の3次元モデルをあてはめる
60
元画像 顔ランドマーク 3次元再構成
Face aging
元の顔画像から,さまざまな年齢の顔画像を生成
61
Ali Elmahmudi, H. Ugail,
A framework for facial age progression and regression using exemplar face templates, 2020.
顔情報処理のバリエーション
• 顔検出
• 顔のアラインメント
• 顔ランドマーク検出
• 顔のコード化
• 顔検証
• 顔識別(本人の特定)や顔認識
• 年齢の推定,性別の推定,表情の推定
• さまざまな応用
群衆のカウント,マスク有り顔に関する処理,
顔の3次元再構成など
62
キーポイントの抽出と,表情の読み取りを
行うオンラインサービス
元画像
63
画像分類の結果
URL:https://cloud.google.com/vision/docs/drag-and-drop
• 顔識別(本人の特定)を行い,鍵代わりに使用
64
65
過去,写真の中の顔が誰であるかを,自動で
特定, SNS のタグ付けが行われてきた
この機能を廃止するというニュースも (2021年)
便利さより ⇒ プライバシー,人権が重要に
66
職場での行動把握
・「顔」が本人の特定の手掛かり
・適切な監視により,安全が高まるという
考え方も(プライバシ,人権の尊重は前提)
群衆のカウント
• 群衆のカウント(画像内の人数を数える)
• 監視等に役立つ.
67
元画像 FIDTM 法による群衆のカウント
FIDTM 法(2021年発表)は,
それ以前の手法よりも,さまざま
な大きさの顔を精度よく検出
できるとされている
マスク有りの顔,マスク無しの顔検出
Chandrika Deb の顔マスク検出法では,次を同時に実行
• 顔検出
• マスク有りの顔とマスク無しの顔の画像分類
68
マスク有りの顔検出 マスク無しの顔検出
訓練データ:顔のデータセット(マス
ク有り: 2165 枚,マスク無し 1930 枚)
顔情報処理の用途
• 顔による本人確認
• 集団行動解析,人流解析,人数推定
• その他
表情の推定,年齢判定,3次元再構成,
顔のセグメンテーション,顔画像の生成 など
69
顔情報処理まとめ
顔情報処理は次の要素から成り立つ
• 顔検出: 顔の数をカウントし、顔情報処理の初期ステップ
を行う。
• 顔ランドマーク: 目、鼻、口などの特定のポイントを使用
して、位置調整(アラインメント)や表情分析、人物特定
を行う。
• 顔のコード化: 顔画像からランドマークを抽出し、これを
もとに顔を数値で表現。これは顔識別、顔認識、年齢・性
別・表情の推定、顔の3次元再構成などに利用される。
• 3次元再構成: 元の画像から3次元の顔を生成する。
これらの技術はさまざまな応用が可能ですが、プライバシー
や人権の観点から慎重な使用が求められます。
70
8-7 姿勢推定
71
姿勢推定
• AI の進展により,画像からの姿勢推定ができるよ
うになってきた
72
ランドマークとボーン
ランドマークの位置情報
は3次元(縦,横,奥行き)
人体の姿勢推定
73
撮影
人工知能で処理
姿勢推定の結果
マーカーレス:画像,ビデオから姿勢推定を行う.
特別な機材は使わない
人体の姿勢推定の例
74
(OpenPose を使用)
75
(Detectron2 の DensePose を使用)
人体の姿勢推定の例
76
ビデオの例
77
人体の姿勢推定の例(動画)
78
ビデオから,人物のポーズの読み取り
79
姿勢推定の用途①
80
• 状況把握,行動予測
姿勢推定の用途②
81
• 行動検知
姿勢推定の用途③
82
• 危険の察知,救援・救護
姿勢推定の用途④
83
• 監視,防犯
姿勢推定の用途⑤
84
• トレーニング,フィットネス,エクササイズ
姿勢推定の用途⑥
• アバター(バーチャル・キャラクタ)の操作
85
アバター(バーチャル・キャラクタ)
姿勢推定の用途⑦
• 集団行動の観察,分析,監視
86
Qi Dang, Jianqin Yin, Bin Wang, Wenqing Zheng,
Deep Learning Based 2D Human Pose Estimation: A SurveyDeep Learning Based 2D Human Pose Estimation: A Survey,
Tsinghua Science and TechnologyTsinghua Science and Technology,
Volume 24 Issue 6 Article 5, 2019.
姿勢推定の用途⑧
• 姿勢推定の結果を用いて,画像から人物を切り出
す
87
姿勢推定まとめ
• 姿勢推定:AIを用いて画像やビデオから人体の姿勢を
把握する技術。
• 特別な機材を使わずに姿勢推定が可能。
• ランドマークと呼ばれる特定の位置情報を元に、3次
元(縦、横、奥行き)での姿勢を推定する。
• 姿勢推定は多様な用途で利用され、以下が含まれる:
• 状況把握や行動予測
• 行動検知
• 危険の察知や救援・救護
• 監視や防犯
• フィットネスやエクササイズのトレーニング
• アバター操作
• 集団行動の観察や分析
88
全体まとめ
• コンピュータビジョン:コンピュータが実世界の情報を理
解・活用する技術。
• 画像理解:画像分類(何があるか)、物体検出(場所と大きさ)、
セグメンテーション(画素単位の領域理解)など。
• ディープニューラルネットワーク:画像分類等の精度向上
に貢献。
• 畳み込み:データとカーネルを重ね合わせ、1つの値にま
とめる技術。コンピュータビジョンで重要。
• 顔情報処理:顔検出、顔ランドマーク、顔のコード化、3D
再構成から成る。プライバシーや人権の観点から注意が必
要。
• 姿勢推定:AIを用いて画像から人体の姿勢を把握する技術。
状況把握、行動予測、行動検知、危険察知等に利用。
89

Contenu connexe

Similaire à mi-8. 人工知能とコンピュータビジョン

Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~nlab_utokyo
 
ae-5. 物体検出,セグメンテーション
ae-5. 物体検出,セグメンテーションae-5. 物体検出,セグメンテーション
ae-5. 物体検出,セグメンテーションkunihikokaneko1
 
Convolutional Neural Network @ CV勉強会関東
Convolutional Neural Network @ CV勉強会関東Convolutional Neural Network @ CV勉強会関東
Convolutional Neural Network @ CV勉強会関東Hokuto Kagaya
 
ae-4. ディープラーニングでの物体認識,画像分類
ae-4. ディープラーニングでの物体認識,画像分類ae-4. ディープラーニングでの物体認識,画像分類
ae-4. ディープラーニングでの物体認識,画像分類kunihikokaneko1
 
20150803.山口大学講演
20150803.山口大学講演20150803.山口大学講演
20150803.山口大学講演Hayaru SHOUNO
 
20160601画像電子学会
20160601画像電子学会20160601画像電子学会
20160601画像電子学会nlab_utokyo
 
SAS Viyaのディープラーニングを用いた物体検出
SAS Viyaのディープラーニングを用いた物体検出SAS Viyaのディープラーニングを用いた物体検出
SAS Viyaのディープラーニングを用いた物体検出SAS Institute Japan
 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 Preferred Networks
 
[論文紹介] Convolutional Neural Network(CNN)による超解像
[論文紹介] Convolutional Neural Network(CNN)による超解像[論文紹介] Convolutional Neural Network(CNN)による超解像
[論文紹介] Convolutional Neural Network(CNN)による超解像Rei Takami
 
画像認識と深層学習
画像認識と深層学習画像認識と深層学習
画像認識と深層学習Yusuke Uchida
 
生活支援ロボットにおける 大規模データ収集に向けて
生活支援ロボットにおける大規模データ収集に向けて生活支援ロボットにおける大規模データ収集に向けて
生活支援ロボットにおける 大規模データ収集に向けてKomei Sugiura
 
Image net classification with Deep Convolutional Neural Networks
Image net classification with Deep Convolutional Neural NetworksImage net classification with Deep Convolutional Neural Networks
Image net classification with Deep Convolutional Neural NetworksShingo Horiuchi
 
ae-10. 中間まとめ(ディープラーニング)
ae-10. 中間まとめ(ディープラーニング)ae-10. 中間まとめ(ディープラーニング)
ae-10. 中間まとめ(ディープラーニング)kunihikokaneko1
 
ImageNet Classification with Deep Convolutional Neural Networks
ImageNet Classification with Deep Convolutional Neural NetworksImageNet Classification with Deep Convolutional Neural Networks
ImageNet Classification with Deep Convolutional Neural NetworksKouhei Nakajima
 
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化Yusuke Uchida
 

Similaire à mi-8. 人工知能とコンピュータビジョン (20)

Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~
 
ae-5. 物体検出,セグメンテーション
ae-5. 物体検出,セグメンテーションae-5. 物体検出,セグメンテーション
ae-5. 物体検出,セグメンテーション
 
Convolutional Neural Network @ CV勉強会関東
Convolutional Neural Network @ CV勉強会関東Convolutional Neural Network @ CV勉強会関東
Convolutional Neural Network @ CV勉強会関東
 
ae-4. ディープラーニングでの物体認識,画像分類
ae-4. ディープラーニングでの物体認識,画像分類ae-4. ディープラーニングでの物体認識,画像分類
ae-4. ディープラーニングでの物体認識,画像分類
 
ae-6. 顔情報処理
ae-6. 顔情報処理ae-6. 顔情報処理
ae-6. 顔情報処理
 
20150803.山口大学講演
20150803.山口大学講演20150803.山口大学講演
20150803.山口大学講演
 
20160601画像電子学会
20160601画像電子学会20160601画像電子学会
20160601画像電子学会
 
SAS Viyaのディープラーニングを用いた物体検出
SAS Viyaのディープラーニングを用いた物体検出SAS Viyaのディープラーニングを用いた物体検出
SAS Viyaのディープラーニングを用いた物体検出
 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
 
[論文紹介] Convolutional Neural Network(CNN)による超解像
[論文紹介] Convolutional Neural Network(CNN)による超解像[論文紹介] Convolutional Neural Network(CNN)による超解像
[論文紹介] Convolutional Neural Network(CNN)による超解像
 
画像認識と深層学習
画像認識と深層学習画像認識と深層学習
画像認識と深層学習
 
20150930
2015093020150930
20150930
 
生活支援ロボットにおける 大規模データ収集に向けて
生活支援ロボットにおける大規模データ収集に向けて生活支援ロボットにおける大規模データ収集に向けて
生活支援ロボットにおける 大規模データ収集に向けて
 
Image net classification with Deep Convolutional Neural Networks
Image net classification with Deep Convolutional Neural NetworksImage net classification with Deep Convolutional Neural Networks
Image net classification with Deep Convolutional Neural Networks
 
MIRU2014 tutorial deeplearning
MIRU2014 tutorial deeplearningMIRU2014 tutorial deeplearning
MIRU2014 tutorial deeplearning
 
ae-10. 中間まとめ(ディープラーニング)
ae-10. 中間まとめ(ディープラーニング)ae-10. 中間まとめ(ディープラーニング)
ae-10. 中間まとめ(ディープラーニング)
 
ImageNet Classification with Deep Convolutional Neural Networks
ImageNet Classification with Deep Convolutional Neural NetworksImageNet Classification with Deep Convolutional Neural Networks
ImageNet Classification with Deep Convolutional Neural Networks
 
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
 
20141008物体検出器
20141008物体検出器20141008物体検出器
20141008物体検出器
 
20150414seminar
20150414seminar20150414seminar
20150414seminar
 

Plus de kunihikokaneko1

cs-8. 表計算ソフトウエアを用いたデータの扱い
cs-8. 表計算ソフトウエアを用いたデータの扱い cs-8. 表計算ソフトウエアを用いたデータの扱い
cs-8. 表計算ソフトウエアを用いたデータの扱い kunihikokaneko1
 
cs-7. 乱数,シミュレーション
cs-7. 乱数,シミュレーション  cs-7. 乱数,シミュレーション
cs-7. 乱数,シミュレーション kunihikokaneko1
 
cs-6. データベースとデータサイエンス
cs-6. データベースとデータサイエンスcs-6. データベースとデータサイエンス
cs-6. データベースとデータサイエンスkunihikokaneko1
 
cs-5. 人工知能の概要
cs-5. 人工知能の概要 cs-5. 人工知能の概要
cs-5. 人工知能の概要 kunihikokaneko1
 
cs-4. プログラミング入門
cs-4. プログラミング入門cs-4. プログラミング入門
cs-4. プログラミング入門kunihikokaneko1
 
cs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックス
cs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックスcs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックス
cs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックスkunihikokaneko1
 
cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素
cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素 cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素
cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素 kunihikokaneko1
 
cs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタ
cs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタcs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタ
cs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタkunihikokaneko1
 
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線kunihikokaneko1
 
mi-5. ディープラーニング
mi-5. ディープラーニングmi-5. ディープラーニング
mi-5. ディープラーニングkunihikokaneko1
 
mi-3. データサイエンス・AIの演習
mi-3. データサイエンス・AIの演習mi-3. データサイエンス・AIの演習
mi-3. データサイエンス・AIの演習kunihikokaneko1
 
mi-2. データサイエンス・AIの事例
mi-2. データサイエンス・AIの事例mi-2. データサイエンス・AIの事例
mi-2. データサイエンス・AIの事例kunihikokaneko1
 
mi-1. 人工知能の概要
mi-1. 人工知能の概要mi-1. 人工知能の概要
mi-1. 人工知能の概要kunihikokaneko1
 
Coding Standards of C++ について
 Coding Standards of C++ について  Coding Standards of C++ について
Coding Standards of C++ について kunihikokaneko1
 
co-3. サブクラス、継承
co-3. サブクラス、継承co-3. サブクラス、継承
co-3. サブクラス、継承kunihikokaneko1
 
co-2. メソッド定義と呼び出し
co-2. メソッド定義と呼び出しco-2. メソッド定義と呼び出し
co-2. メソッド定義と呼び出しkunihikokaneko1
 
co-1. クラスとメソッド
 co-1. クラスとメソッド co-1. クラスとメソッド
co-1. クラスとメソッドkunihikokaneko1
 
Visual Studio 2013 の起動とプロジェクトの新規作成
Visual Studio 2013 の起動とプロジェクトの新規作成Visual Studio 2013 の起動とプロジェクトの新規作成
Visual Studio 2013 の起動とプロジェクトの新規作成kunihikokaneko1
 

Plus de kunihikokaneko1 (20)

cs-8. 表計算ソフトウエアを用いたデータの扱い
cs-8. 表計算ソフトウエアを用いたデータの扱い cs-8. 表計算ソフトウエアを用いたデータの扱い
cs-8. 表計算ソフトウエアを用いたデータの扱い
 
cs-7. 乱数,シミュレーション
cs-7. 乱数,シミュレーション  cs-7. 乱数,シミュレーション
cs-7. 乱数,シミュレーション
 
cs-6. データベースとデータサイエンス
cs-6. データベースとデータサイエンスcs-6. データベースとデータサイエンス
cs-6. データベースとデータサイエンス
 
cs-5. 人工知能の概要
cs-5. 人工知能の概要 cs-5. 人工知能の概要
cs-5. 人工知能の概要
 
cs-4. プログラミング入門
cs-4. プログラミング入門cs-4. プログラミング入門
cs-4. プログラミング入門
 
cs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックス
cs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックスcs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックス
cs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックス
 
cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素
cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素 cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素
cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素
 
cs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタ
cs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタcs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタ
cs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタ
 
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
 
mi-5. ディープラーニング
mi-5. ディープラーニングmi-5. ディープラーニング
mi-5. ディープラーニング
 
mi-4. 機械学習
mi-4. 機械学習mi-4. 機械学習
mi-4. 機械学習
 
mi-3. データサイエンス・AIの演習
mi-3. データサイエンス・AIの演習mi-3. データサイエンス・AIの演習
mi-3. データサイエンス・AIの演習
 
mi-2. データサイエンス・AIの事例
mi-2. データサイエンス・AIの事例mi-2. データサイエンス・AIの事例
mi-2. データサイエンス・AIの事例
 
mi-1. 人工知能の概要
mi-1. 人工知能の概要mi-1. 人工知能の概要
mi-1. 人工知能の概要
 
kaneko202304.pptx
kaneko202304.pptxkaneko202304.pptx
kaneko202304.pptx
 
Coding Standards of C++ について
 Coding Standards of C++ について  Coding Standards of C++ について
Coding Standards of C++ について
 
co-3. サブクラス、継承
co-3. サブクラス、継承co-3. サブクラス、継承
co-3. サブクラス、継承
 
co-2. メソッド定義と呼び出し
co-2. メソッド定義と呼び出しco-2. メソッド定義と呼び出し
co-2. メソッド定義と呼び出し
 
co-1. クラスとメソッド
 co-1. クラスとメソッド co-1. クラスとメソッド
co-1. クラスとメソッド
 
Visual Studio 2013 の起動とプロジェクトの新規作成
Visual Studio 2013 の起動とプロジェクトの新規作成Visual Studio 2013 の起動とプロジェクトの新規作成
Visual Studio 2013 の起動とプロジェクトの新規作成
 

Dernier

NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 

Dernier (9)

NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 

mi-8. 人工知能とコンピュータビジョン

Notes de l'éditeur

  1. AIが画像分類する時代 ただし,ImageNet にぴったりあてはまるものの限る
  2. しばらく待つと, 最後のコードセルまで,すべてのコードセルの実行が終わります. コードセルを実行することにより, いくつかの画像について物体検出が行われます. ここにありますように, バウンディングボックス,ラベル,確率が得られます. コードセルのプログラムは Python です. ここにあるたくさんの コードセルのプログラム全体で,設定や,画像データのダウンロードや読み込み, 人工知能を動かすための,学習済みモデルのダウンロード,物体検出の実行結果の確認などを行っています. プログラムの説明は省略します. このように,Python で書かれたプログラムを Web ブラウザで, オンラインで実行し,確認できます. みなさんも,このページなどを使って,パソコンのWEBブラウザで動かしてみてはいかがでしょうか. 以上,物体検出について説明しました. 視聴ありがとうございました.