3. 線形モデル
T
101
0
],,,,[,],,,1[, K
T
Ki
K
i
i wwwxxxwy
wxwx ただし、
入力ベクトル:x から出力:y を得る関数がxの線形関数
(wとxの内積)
一般に観測データはノイズを含んでいる。つまり
得られたN個の観測データ の組(y,X)に対して最適なwを推
定する。
そこで、yと の2乗誤差を最小化するようにwを選ぶ。
と考える。はノイズで ),0(, 2
Ny wx
wX
12. バイアスw0の部分だけに注目してみると
• 対数近似関数から最適なw0を によって求めると
K
j
N
i
jj
N
i
i
N
i
K
Ki
N
i
K
Ki
N
i
K
Ki
N
i
K
Ki
w
N
y
N
w
w
w
w
y
w
w
w
y
w
w
w
w
y
w
w
w
w
y
w
L
1 11
0
1
0
1
1
1
1
0
1
0
1
2
0
1
1
0
1
2
1
0
1
0
)
11
0))),..(2))),..,1(2
))),..(
))),..,1(
i
iiii
ii
ii
(x
(x(x(x(x
(x(x
(x(x
w
yの平均 基底関数の学習データの平均のw
重み付き和
30. 例:事前分布、事後分布とも正規分布
ノルムによる正則化項
とすると 事前分布の重みをここで、
も同様にすると事前分布
L2
2
),(
2
1
maxarg
,0
2
1
),(
2
1
minarg
),|(log),|(logminarg
2/),|(log
,|
2/),()1,),(|(log)1,|(log
)1,0()(
),,(
2
2
2
1
0
1
wwwx
wwwx
ww,x
www
w
wxwxw,x
wx
w
x
x
Xy
w
w
w
N
1
T
i
ii
T
i
ii
i
ii
T
i
ii
i
ii
i
ii
K
T
T
T
N
φy
φy
pyp
p
p
φyφyNyp
Nφy
w
w
w
yy
事前分布のwの
分散:λー1 とも見
える。
31. 例:事前分布がLaplace分布、事後分布が正規分布
ノルムによる正則化項
も同様にすると分布の事前分布は期待値
L1
2
),(
2
1
minarg
)|(log),|(logminarg
2
)|(log
2
exp
4
|0
2/),()1,),(|(log)1,|(log
)1,0()(
2
2
wwx
ww,x
w
w
w
w
wxwxw,x
wx
w
w
i
ii
i
ii
i
ii
i
ii
i
ii
φy
pyp
p
pLaplace
φyφyNyp
Nφy
51. 次に Maximum likelihood solution (つまりw,w0)を
求める。これによって、各クラスの事後確率が求まる
ここで各クラスの事前確率が以下だったとする
)10(,....,
1,|)1(,|),,,|(
,|)1()|()(),(
0
,|)|()(),(
1
1)()(
1
2
1
121
2222
2
1111
1
21
sttwhere
ntN
nt
Np
Nlikelihood
NCpCpCp
tC
NCpCpCp
tC
CpCp
T
N
n
N
n
n
nnn
nn
nnn
nn
t
xxt
xxx
x
xxx
x
う個あることを思い出そ観測データはは次式ここで
としに属するときが観測データ
としに属するときがこのとき観測データ
52. (s-10)のlogすなわち log likelihood function を最大化すること
が目標
まず、最大化するπを求める。
(s-10)のlogのπに関する部分は次式(s-20) logp (π)
に属するデータ数。はクラス
に属するデータ数。はクラス
22
11
21
11
1
1
1
0
)(log
)1log()1(log)(log
CN
CN
where
NN
N
N
N
t
N
p
ttp
N
n
n
N
n
nn
53. 次に (s-10)の log を最大化する μ1 を求める。
(s-10)のlogのμ2 に関する部分は次式(s-30) logp (μ1 )
N
n
nn
n
T
n
N
n
nn
N
n
n
t
N
p
tNtp
11
1
1
1
1
1
1
1
1
1
1
1
0
)(log
const
2
1
),|(log)(log
x
xxx
同様にしてμ1も求めると
N
n
nn
n
T
n
N
n
nn
N
n
n
t
N
p
tNtp
12
2
2
2
2
1
2
1
2
1
2
)1(
1
0
)(log
const
)1(
2
1
),|(log)1()(log
x
xxx
54. 最後に (s-10)の log を最大化する精度行列 Λ=∑-1 (C1
とC2共分散) を求める。
(s-10)のlogの∑ に関する部分は次式(s-40) logp (∑ )
logp (Λ )をΛ で微分して0とおき、 (s-10)の log を最大化
するΛ =∑-1 を求める。
まず第1項の微分は線形代数学の公式より
)40()(
2
||log
2
)())(1(
2
1
||log)1(
2
1
)()(
2
1
||log
2
1
)(log
22
11
11
11
sSTr
NN
tt
ttp
n
T
n
N
n
n
N
n
n
n
T
n
N
n
n
N
n
n
xx
xx
が対称が対称 1
11
)50(
22
||log
2
s
NN
N T