Contenu connexe
Similaire à [DL輪読会]Collective dynamics of repeated inference in variational autoencoder rapidly find cluster structure (20)
Plus de Deep Learning JP (20)
[DL輪読会]Collective dynamics of repeated inference in variational autoencoder rapidly find cluster structure
- 1. 1
DEEP LEARNING JP
[DL Papers]
http://deeplearning.jp/
Collective dynamics of repeated inference in
variational autoencoder rapidly find cluster
structure
Hiroshi Sekiguchi, Morikawa Lab
- 2. 書誌情報
• “Collective dynamics of repeated inference in variational
autoencoder rapidly find cluster structure”,
– Nagano, Y., Karakida, R. & Okada, M., The University of Tokyo
– Sci Rep 10, 16001 (2020). https://doi.org/10.1038/s41598-020-72593-4
• 概要:
– クラスタ-構造を持つ画像群で教師なし学習したVariational Autoencoder(VAE)を
用いて,ノイジーな画像をテストデータとして入力し、認識(Encode)と生成
(Decode)を複数回繰り返し(反復推論)て得た再構成画像はノイズ除去される.
この時の,反復推論時の潜在変数の活動パターン時間軌跡は,クラスターの代表
点に接近するダイナミクスになっていることを定量的に示す
• 動機:
– 教師なし学習で、観測データから,低次の潜在空間での知識(メモリパターン)
を構築するモデルに興味がある 2
- 4. 背景・目的
• <背景>
– Variational Autoencoder:ラベル無のデータに内在する重要な特徴を抽出可能
– 視覚のAssociative memory model:クラスター*構造を持つ視覚情報を教師なし学習し、各
クラスターに反応するニューロン群を生成し,クラスターに属する視覚情報を引き出す(認識す
る)機構をモデル化したもの.
*クラスター=分類のカテゴリ
同一クラスターに属するメンバーは相関が高い
• <目的>クラスター構造の画像群で学習したVariational Autoencoderに,ノ
イジーな画像で,認識(Encode)と生成(Decode)を複数回反復推論して得
た再構成画像はノイズ低減されており、その際の潜在空間上の活動パターン
軌跡は,連想メモリモデル(Associative memory model)と類似のダイナミク
スを持つことを定量的に示す
•
4
- 5. 先行研究
• 目的:視覚の下側頭皮質(inferior-temporal cortex)に存在する、物体
形状に反応するニューロンの推論時のダイナミクスをassociative
memory modelを用いて解明する
• 動機:顔の形状に反応するニューロンのダイナミクスを調査
• 視覚のAssociative memory modelを以下で構築
– モデル:Excitatory cellとInhibitory cellで構成
– 入力:クラスタ構造のUltrametric画像 𝛏 𝛍,𝛎
: クラスターμ ∈ [1, 𝑝]のメンバーν∈
[1, 𝑠]番目のパターンを入力、ここで ξ𝑖
μ,ν
, 𝑖 ∈ [1, 𝑁]番目の要素
𝑝𝑟𝑜𝑏 ξ𝑖
μ
= 1 = 1 − 𝑝𝑟𝑜𝑏[ ξ𝑖
μ
= 0 = 𝑓 ←クラスターセンタ値は与えない
𝑃𝑟𝑜𝑏 ξ𝑖
μ,ν
= 0 ξ𝑖
μ
= 1 = 1 − 𝑃𝑟𝑜𝑏 ξ𝑖
μ,ν
= 1 ξ𝑖
μ
= 1 = 𝐹
𝑃𝑟𝑜𝑏 ξ𝑖
μ,ν
= 1 ξ𝑖
μ
= 0 = 1 − 𝑃𝑟𝑜𝑏 ξ𝑖
μ,ν
= 0 ξ𝑖
μ
= 0 = 𝐺
– Hebb則:Neuron𝑖から𝑗へのシノプス係数、𝐽𝑖𝑗 =
1
𝑓𝑁 μ=1
𝑝
ν=1
𝑠
𝝃𝒊
𝝁,𝝂
𝝃𝒋
𝝁,𝝂
とする(各
ニューロンの強度の乗算)
• 推論時
– 微分方程式に従う→初期値が入力画像 t=0~∞とした時ニューロン集団
𝑉 𝑒𝑥𝑡
(𝑡)の軌跡
– 入力画像にノイズを付加する a=0(ノイズゼロ)→1(ノイズ最大)
• 結果
– ノイズ追加の場合、集団軌跡は、まず、入力したUltrametricに近づいた後、クラスタ
のセンター値η1
に近づく:クラスターセンタ値をmodelが創出している 5
Neuronal Mechanisms Encoding Global-to-Fine Information in Inferior-Temporal Cortex*,
N.Matsumoto, M.Okada, Y. Sugase and S. Yamane, Journal of Computational Neuroscience 18,
85–103, 2005
図は論文*から抜粋
同一クラス
ノメンバー
は相関あり
- 6. 提案手法
• 学習:標準の VAEを使用:
– Network: Full Connection
– 入力:クリーンな画像(MNIST or
Fashion-MNIST)
• 学習データ:50000
• Testデータ:10000(再構成エラー計算用)
– Loss関数:ELBO
– 最適化:Adam
– Epoch: 1500
• 繰り返し推論:
– Network:学習済VAE
– 入力:ノイズ不可の画像(MNIST or
Fashion-MNIST)
– 認識(Enc)と生成(Dec)をtステップ繰り
返して潜在変数z(t)を得る
x t + 1 = 𝐸 𝑝θ(𝑥|𝑧 𝑡 ) 𝑥
𝑧 𝑡 = 𝐸𝑞Φ 𝑧 𝑥 𝑡 [𝑧]:活動パターン
6
𝑔𝑖𝑣𝑒𝑛 𝑥 𝑥(𝑡 + 1)𝑧(𝑡) 𝐸 𝑝θ(𝑥|𝑧 𝑡 ) 𝑥𝑞Φ 𝑧 𝑥
𝑔𝑖𝑣𝑒𝑛 𝑧 𝑥(𝑡)𝑝θ(𝑥|𝑧)
𝐸𝑞Φ 𝑧 𝑥 𝑡 [𝑧]
𝒛(𝒕)
tステッ
プ繰り
返す
- 10. 活動パターンZ(t)軌跡はクラスターセンターに近づく
10
• 以降は、1ラベルに1クラスタが存在すると仮定す
る(ラベル∈[0,9])
• 潜在空間で、活動パターン軌跡が引き込まれるポイ
ントが複数ある
– ラベルnumに属する𝑖番目の学習データ𝑥 𝑛𝑢𝑚
(𝑖)
に対応する
活動パターン:
ξ 𝑛𝑢𝑚
(𝑖)
= 𝐸𝑞Φ 𝑧 𝑥 𝑛𝑢𝑚
(𝑖)
[𝑧]:メモリベクトル
– ラベルnumに属する全学習データに対応する活動パター
ン群のセンター(平均):ξ 𝑛𝑢𝑚 =
1
𝑁 𝑛𝑢𝑚
𝑖
𝑁 𝑛𝑢𝑚
ξ 𝑛𝑢𝑚
(𝑖)
:クラス
ターセンターあるいはコンセプトベクトル
• 活動パターン軌跡と上記のポイントの最小距離
を計算: min
𝑡
𝑧 𝑡 − ξ 、ξ= ξ 𝑛𝑢𝑚
(𝑖)
or ξ 𝑛𝑢𝑚
– 活動パターンは、直ぐにメモリベクトル近づき、そのあとは、
クラスターセンターに近づく
– 先行研究Associative memory modelの結果と合致
実線:平均、シェード:±1xSTD Dev.
メ
モ
リ
パ
タ
ー
ン
と
の
距
離
ク
ラ
ス
タ
セ
ン
タ
ー
と
の
距
離
短い
短い
試行回数300回、ノイズp=0.2
- 11. ノイズと階層クラスターの関係
• さらに、人工的に全クラスターセンターのセンターを作
る
– ξ 𝑛𝑢𝑚
(𝑖)
= 𝐸𝑞Φ 𝑧 𝑥 𝑛𝑢𝑚
(𝑖)
[𝑧]:メモリ
– ξ 𝑛𝑢𝑚 =
1
𝑁 𝑛𝑢𝑚
𝑖
𝑁 𝑛𝑢𝑚
ξ 𝑛𝑢𝑚
(𝑖)
:クラスターセンターあるいはコンセプ
トベクトル
– 全クラスターセンターのセンター:
ξ 𝑎𝑙𝑙 =
1
10
𝑛𝑢𝑚=0
9
ξ 𝑛𝑢𝑚
• 上記三つは、情報の粗さで階層になっている
• 活動パターン軌跡と上記の3エリアの最小距離を計
算: min
𝑡
𝑧 𝑡 − ξ 、ξ= ξ 𝑛𝑢𝑚
(𝑖)
or ξ 𝑛𝑢𝑚 or ξ 𝑎𝑙𝑙
– “6”を試行回数500回
• 結果:図a:ノイズ小の場合(I)はメモリベクトルとの
距離が一番小さい,中庸のノイズ(II)ではクラスタセ
ンターが、ノイズ大(III)では、全クラスターセンタ
のセンターが短い。ノイズによって、最適な軌跡を取
ろうとする。よって、(III)では、誤ったポイントに
近づくのでラベル推定が誤る 11
実線:平均、バー゙:±2xSTD Dev.
• 図b:距離が最小になるstepを示す。
• ξ 𝑛𝑢𝑚
(𝑖)
との距離:入力との再構成エラーを最少
にするにはノイズと共に、多くの時間が必要
• ξ 𝑛𝑢𝑚との距離:ラベル推定には、ノイズに関
わらず30-40ステップで良い
- 15. 潜在空間次元数、直行性、汎化性との関係
• クラスターセンター間の直行性と活動パ
ターンの関係を評価した
• 𝐶𝑖𝑗 =
ξ 𝑖 ∙ ξ 𝑗
ξ 𝑖 𝐹
2
∙ ξ 𝑗 𝐹
2, 𝐴 𝐹
2
= 𝑖𝑗 𝐴𝑖𝑗
2
: 𝐹𝑟𝑜𝑏𝑖𝑛𝑖𝑢𝑠 𝑛𝑜𝑟𝑚
• 𝑁𝑧 ≥ 14で、 𝐶 − 𝐼 𝐹
2
が十分最小値に漸近
している
• 𝑁𝑧 ≥ 14での、活動パターンとクラスター
センターの距離のグラフは正常
• 次元数が小さいと、活動パターンの空間を
直行したクラスタ-センタで張れず、活動
パターンが正しいクラスターに近づきにく
くなる
• VAE Loss: 𝑁𝑧を変化させたところ𝑁𝑧 ≥ 14 15