Contenu connexe Similaire à ae-4. ディープラーニングでの物体認識,画像分類 (20) Plus de kunihikokaneko1 (20) ae-4. ディープラーニングでの物体認識,画像分類6. 画像分類の精度の向上
• ディープラーニングの進展
• 画像分類は,場合によっては,AI
が人間と同等の精度 とも考えら
るように
画像分類の誤り率 (top 5 error)
人間: 5.1 %
PReLU による画像分類: 4.9 %
(2015年発表)
6
ImageNet データセット
の画像分類の結果
文献: Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun,
Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification
arXiv:1502.01852, 2015.
8. ニューラルネットワークのユニット
ニューラルネットワークのユニットは,数理により
動く
① 入力は複数
② 入力を重みづけし合計をとる
③ その合計から出力値を得る
8
入力
1 2 3
4 5 6
7 8 9
1 1
2 1
3 1
4 0
5 1
6 1
7 0
8 0
9 1
白黒の画像
(画素は 0 または 1)
重み w1 ~ w9
ユニット
w1
w2
w3
w4
w5
w6
w7
w8
w9
合計
・合計に,バイアスという値を
足し引きしたあと,活性化関数
が適用され出力値が得られる.
・活性化関数はさまざまな種類
シグモイド
ReLU
(2011年発表)
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
合計は,
1 × w1 + 1 × w2 + 1 × w3 +
0 × w4 + 1 × w5 + 1 × w6 +
0 × w7 + 0 × w8 + 1 × w9
9. 9
入力 正解
1, 1 1
0, 1 0
1, 0 0
0, 0 1
訓練データ
ユニット
1
1
重み
ユニット
1
1
重み
活性化関数
ReLU
2.0
1.0
0
-2.0 -1.0 0.0 1.0 2.0
重み
-1
2
ReLU
+ バイアス
(バイアス
は +1)
2.0
1.0
0
-2.0 -1.0 0.0 1.0 2.0
ReLU
+ バイアス
(バイアス
は -1)
2.0
1.0
0
-2.0 -1.0 0.0 1.0 2.0
1 2
10. 10
1, 1 1
0, 1 0
1, 0 0
0, 0 1
1
1
1
1
ReLU
2.0
1.0
0
-2.0 -1.0 0.0 1.0 2.0
2.0
1.0
0
-2.0 -1.0 0.0 1.0 2.0
-1
2
2.0
1.0
0
-2.0 -1.0 0.0 1.0 2.0
それぞれのユニットが「特定のパターンを識別して
いる」と考えることもできる
ユニットが
識別する
パターン
ユニットが
識別する
パターン
ユニットが
識別する
パターン
1 2
ReLU
+ バイアス
(バイアス
は +1)
ReLU
+ バイアス
(バイアス
は -1)
20. 畳み込みの例
20
0 1 0 1 0 0 1 1 1 0
0
1 0 1
0×1 1×0 0×1
この部分を切り出す
重ね合わせの結果: 0×1 + 1×0 + 0×1 = 0
データ
カーネル
21. 畳み込みの例
21
0
1 0 1
0×1 1×0 0×1
1 0 1
1×1 0×0 1×1
1 0 1
0×1 1×0 0×1
2 0
0 1 0 1 0 0 1 1 1 0
1 0 1
1×1 0×0 0×1
1 0 1
0×1 0×0 0×1
1 0 1
0×1 1×0 1×1
1 0 1
1×1 1×0 1×1
1 0 1
1×1 1×0 0×1
1 1 1 2 1
移動
38. 畳み込み層②
• 畳み込み層は,一度に複数の畳み込み(数十以
上)を行うように作る のがふつうである.
• それぞれの畳み込みについて,全ユニットで,重
みとバイアスが同じ
38
前の層 1つの畳み込み層
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
〇
複数のカーネル
40. ニューラルネットワーク
畳み込み層も,全結合層も,同じ原理で動作する.
「学習」も行われる
① 入力は複数
② 入力を重みづけし合計をとる
③ その合計から出力値を得る
40
入力
1 2 3
4 5 6
7 8 9
1 1
2 1
3 1
4 0
5 1
6 1
7 0
8 0
9 1
白黒の画像
(画素は 0 または 1)
重み w1 ~ w9
ユニット
w1
w2
w3
w4
w5
w6
w7
w8
w9
合計
・合計に,バイアスという値を
足し引きしたあと,活性化関数
が適用され出力値が得られる.
・活性化関数はさまざまな種類
シグモイド
ReLU
(2011年発表)
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
合計は,
1 × w1 + 1 × w2 + 1 × w3 +
0 × w4 + 1 × w5 + 1 × w6 +
0 × w7 + 0 × w8 + 1 × w9
46. CNN Explainer
• CNN Explainer ジョージア工科大学 Polo Club
• 畳み込み層などの仕組みをビジュアルに学ぶこと
ができるサイト
Webブラウザで次の URL を開く
https://poloclub.github.io/cnn-explainer/
46
52. プーリングを行う Max Pooling 層
• 2次元のデータの縮小
(例)サイズ 100 × 100 ⇒ 50 × 50 のように
• 一定領域内の結果を,1つにまとめる.
• 定まった計算を行う(学習の対象ではない)
• Max Pooling は,縮小後に,最大値が残る
範囲内のユニットの活性度の最大を得る
52
・4, 8, 7, 1 の最大値は 4
・「4, 8, 7, 1」の 4マス
から,最大値の 8 を選ぶ.
出典: https://github.com/jeffheaton/t81_558_deep_learning/blob/084023876b6cf09c931b452584dbd44c56314a03/t81_558_class_06_2_cnn.ipynb
56. MNISTデータセット
• 0 ~ 9 の手書き文字.濃淡画像 28 × 28
• 訓練データ (学習用)
• 検証データ (検証用)
56
60000枚の画像と正解
10000枚の画像と正解
抜粋
抜粋
58. ニューラルネットワーク作成のプログラム例
58
import tensorflow as tf
m = tf.keras.models.Sequential([
tf.keras.layers.Conv2D(32, kernel_size=(3, 3),
activation='relu',
input_shape=(28, 28, 1)),
tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
tf.keras.layers.Dropout(0.25),
tf.keras.layers.Flatten(),
tf.keras.layers.Dense(units=128, activation='relu'),
tf.keras.layers.Dropout(0.5),
tf.keras.layers.Dense(units=10, activation='softmax')
])
←畳み込み層
←畳み込み層
←プーリング層
←全結合層
←全結合層
https://colab.research.google.com/drive/18IPPkY96Oc6jkYD2su4cFgWcoYAskLo_?usp
=sharing
Notes de l'éditeur AIが画像分類する時代 ただし,ImageNet にぴったりあてはまるものの限る 良好な学習能力をもち,機械学習が脚光をあびるきっかけにも
機械学習を勉強するとき,ニューラルネットワークは良い手段と考える
機械学習では,ニューラルネットワークを使う場合もあれば,ニューラルネットワークではない他のものもある(あとで詳しく)
画像分類は,画像に対して,ラベルとその確率を得ることです.
ラベルというのは,画像分類した結果の,画像の種類を表すキーワードのことです.
このラベルと確率を精度よく自動で求めるために,人工知能を使うことができます. 画像分類の例
画像に対して,いくつかのラベル,
それぞれのラベルに対しての確率が得られています.
例えば,この結果を見ると,この画像,ラベルが lab_coat である確率が,約 0.98 のように結果が得られています.
このように,1枚の画像に対して,複数のラベルとそれぞれの確率を得ること.
それが画像分類です.
画像分類は,画像を扱う他の人工知能,例えば,物体検出などの基礎になっています.
画像分類の説明は以上です.
視聴ありがとうございました. 良好な学習能力をもち,機械学習が脚光をあびるきっかけにも
機械学習を勉強するとき,ニューラルネットワークは良い手段と考える
機械学習では,ニューラルネットワークを使う場合もあれば,ニューラルネットワークではない他のものもある(あとで詳しく)