11. /409
a
h
h
h
h
d
h
h
a
h
r
r
r
r
r
r
r
rr
r
r
r
C
O
N
S
CC
C
C C
C
C
C
C
C
C
C
C
C
C C
C
C
O2x
C1x
C1x
C1x
C1x
N1x
C1b C1b
S2a
C1c
C8y
C8y
C8x
C8x
C8x
C8x
C8x
C8xC8x
C8x
C8x
C8x
RA
L
L
Ar
Ar
A
Structure
diagram
Skeletal
topology
Atom/bond
labeled graph
KEGG atom
labeled graph
(KCF)
Pharmacophore
type labeled graph
(ChemAxon Screen)
Reduced graph
1
1
1 1
1
1
1
1
1
1 1
2
1
1
1
1
1
2
2
2
2
2
1
1
背景:グラフ表現を持つデータの統計解析の需要↑
グラフ(graph)= 何種類かの点と線の集合で表される数学的対象/データ構造
化合物の分⼦表現とグラフは因縁深い関係:
「graph」というtermが最初に使われたのは分⼦グラフ研究
(参考:「グラフ理論への道」Biggs, Lloyd, Wilson, 翻訳:⼀松 信ら, 1986)
※頂点と辺のラベルは離散的と仮定
26. /40
0 1 0 0 1
0 0 1 0 1
1 2 0 0 0
0 0 0 1 2
21
❷ Graph Kernels
a a a b a c b b b c
a b c
a c b
a a b
b
b b c
g1
g2
g3
x1 x2 x3 x4 x5
例) スペクトルカーネル (⽂字列と同様)
モデルの学習に
⽤いる特徴集合
2
1 2
2 0 5
2 2 0 5
g1
g2
g3
g1 g2 g3
グラム⾏列
これだけ計算
できればOK
27. /40
(ゆえに )
22
❷ Graph Kernels
• Marginalized Kernels
(Kashima et al, 2003, 2004; Máhe et al, 2005)
• Walk Kernels
(Gärtner et al, 2003; Borgwardt et al, 2005;
Vishwanathan et al, 2010)
• Weighted Decomposition Kernels
(Menchetti et al, 2005)
• Subtree Kernels
(Mahé and Vert, 2009)
• Weisfeiler-Lehman Kernel
(Shervashidze et al, 2011)
特徴空間Vでの内積値k(g,gʼ)
が効率的に計算可能かが⼤事
ユークリッド的な空間 V
(再⽣核Hilbert空間)
再⽣性
⼀般のカーネル法の原理
陽に特徴空間Vを作る事でカーネル法が適⽤
できること(kの正定値性)を⽰す事が多い?