6. 3.1.1 最尤推定と最小二乗法
目的変数 が関数 とノイズ で与えられる時
t y(x, w) ✏
t = y(x, w) + ✏
ノイズがガウス分布に従うとすると
p(t|x, w, ) = N (t|y(x, w), 1 )
入力ベクトルと目標値が与えられた時の尤度関数は
N
Y
T 1
p(t|X, w, ) = N (tn |w (xn ), )
n=1
7. 両辺対数を取って N
X
T 1
ln p(t|X, w, ) = N (tn |w (xn ), )
n=1
N N
= ln ln 2⇡ ED (w)
2 2
このとき,二乗和誤差関数は
XN
1 T 2
ED (w) = {tn w (xn )}
2 n=1
尤度関数の最大化 = 二乗和誤差関数の最小化 なので
N
X
T T
r ln p(t|X, w, ) = {tn w (xn )} (xn )
n=1
8. 勾配を0とおいて w について解く
N N
!
X T
X T
T
0= tn (xn ) w (xn ) (xn )
n=1 n=1
(展開しただけ)
w について解く
wML = ( T ) 1 T
t
計画行列
9. バイアスパラメータw0 の解釈
バイアスパラメータを残したまま
二乗和誤差関数を求めると
XN M 1
X
1 2
ED (w) = {tn w0 wj j (xn )}
2 n=1 j=1
w0 について解くと
M 1
X
¯
w0 = t wj j
j=1
N XN
1 X 1
ただし, =
¯
t tn j = j (xn )
N n=1 N n=1
10. バイアスパラメータw0 の解釈
M 1
X
¯
w0 = t wj j
j=1
目標変数の平均 ー 基底関数の平均
N
¯ 1X 1X
N
t= tn j = j (xn )
N n=1 N n=1
また,ノイズの精度パラメータ について
XN
1 1 T 2
= {tn wM L (xn )}
ML N n=1
これは回帰関数周りでの目標値との残差分散