SlideShare une entreprise Scribd logo
1  sur  20
Télécharger pour lire hors ligne
量子アニーリングを用いた
クラスタ分析
田中 宗 (早稲田大学 高等研究所)
機械学習における重要な技術であるクラスタ分析に
対する、量子アニーリングの性能評価を行った。
量子モンテカルロ法を用いた擬似シミュレーションの結果、
シミュレーテッドアニーリングに比べ、量子アニーリングの
方が、性能面で優位であることを示唆する結果を得た。
K. Kurihara, S. Tanaka, and S. Miyashita, UAI2009
I. Sato, K. Kurihara, S. Tanaka, H. Nakagawa, and S. Miyashita, UAI2009
I. Sato, S. Tanaka, K. Kurihara, S. Miyashita, and H. Nakagawa, Neurocomputing,121, 523 (2013)
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
共同研究者
2
佐藤 一誠 博士 (東大 情報基盤センター、さきがけ研究員)
栗原 賢一 博士 (グーグル株式会社)
宮下 精二 教授 (東大院理 物理学専攻)
中川 裕志 教授 (東大 情報基盤センター)
量子アニーリング
2つのキーワード
クラスタ分析
量子性を用いた
新計算技術
分かることは
分けること
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
量子アニーリング
4
温度
(熱ゆらぎ効果)
シミュレーテッドアニーリング
温度を徐々に下げる
量子ゆらぎ効果
量子アニーリング
量子効果を徐々に弱める
T. Kadowaki and H. Nishimori,
Phys. Rev. E, 58, 5355 (1998).
絶対ゼロ度(基底状態)
S. Kirkpatrick, C. D. Gelatt, and M. P. Vecchi, Science, 220, 671 (1983).
イジングモデルの基底状態を効率よく求める方法
Hopt. =
i,j
Jij
z
i
z
j
i
hi
z
i
z
i = ±1
イジングモデル
✔ 組合せ最適化問題のハミルトニアン
✔ 基底状態を求めることは困難(組合せ爆発)
スピン(ビット)間
相互作用
磁場(強制力)
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
組合せ最適化問題
5
集積回路設計
グラフ二分割問題
高分子安定構造決定
組合せ最適化問題の最適解 = イジングモデルの基底状態
巡回セールスマン問題
Hopt. =
i,j
Jij
z
i
z
j
i
hi
z
i
z
i = ±1
イジングモデル
✔ 組合せ最適化問題のハミルトニアン
✔ 基底状態を求めることは困難(組合せ爆発)
スピン(ビット)間
相互作用
磁場(強制力)
様々な分野に、応用展開可能
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
ning CRPs in which sjðj ¼ 1; …; mÞ
ment of the j-th CRP and represents
espond Bj;i;n ¼ 1 to ~sj;i;n ¼ ð1; 0Þ⊤
and
means that we can represent Bj as
the following theorem:
(10) is approximated by the Suzuki–
regarded as a similarity function between the j-th and (j+1)-th bit
matrices. If they are the same matrices, then sðsj; sjþ1Þ ¼ N2
. In
Eq. (2), log pSAðsjÞ corresponds to log e−β=mEðsjÞ
=Z and the regularizer
term f Á Rðs1; …; smÞ is log ∏m
j ¼ 1ef ðβ;ΓÞsðsj;sjþ1Þ
¼ f ðβ; ΓÞ∑m
j ¼ 1sðsj; sjþ1Þ.
Note that we aim at deriving the approximation inference for
pQAð~sijs~si; β; ΓÞ in Eq. (13). Using Theorem 3.1, we can derive
Eq. (4) as the approximation inference. The details of the deriva-
tion are provided in Appendix B.
. (a) Social network (assortive network), (b) election network (disassortative network) and (c) citation network (mixture of assortative
I. Sato et al. / Neurocomputing 121 (2013) 523–531 527
クラスタ分析
6
膨大なデータを、潜在的意味によって分類
共著者ネットワーク分類 投票者・非投票者分類研究論文分類
分かることは分けること
I. Sato et al. / Neurocomputing 121 (2013) 523–531
I. Sato et al. / Neurocomputing 121 (2013) 523–531
t QA-ST can find a better
ptimal ones.
the notation used in this
ve n data points, and they
. The assignment of the i-
by binary indicator vector
is equal to two, we denote
ed to the first and the sec-
0)T
and ˜σi = (0, 1)T
, re-
nt of all data points is also
ector, σ, whose length is kn
ailable assignments is kn
. σ
1, σ =
n
i=1 ˜σi, where ⊗ is
hich is a special case of the
s. Let A and B be matrices
hen, A⊗B =
a11B a12B
a21B a22B
ample). Only one element
ers are zero. For example,
when k = 2, n = 2, the first
e first cluster (˜σ1 = (1, 0)T
)
σ∗
(global optimum)
Figure 3: Three clustering results by a mixture of four
Gaussians (i.e. #clusters=4).
parallel m SAs. We denote the j-th SA of the parallel
SA by σj. The i-th data point in σj is denoted by ˜σj,i,
s.t. σj =
n
i=1 ˜σj,i. When A is a matrix, eA
is the
matrix exponential of A defined by eA
=
∞
l=0
1
l! Al
.
3 Simulated Annealing for Clustering
We briefly review simulated annealing (SA) (Kirk-
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
中華料理店過程
7
データのクラスタ形成プロセスをモデリング
1 2 3 5
4
1 2 3
レストラン(全集合)
客(データ点)
テーブル(データクラス)
新たに入ってきた客は、どのテーブルに座るか?
: k番目のテーブル
に座っている客数
N
Nk
N +
確率    で、k番目のテーブルに座る。
N +
確率    で、誰も座っていないテーブルに座る。
Nk
: レストラン内
客総数
: ハイパーパラメタ
平衡状態の確率分布
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
中華料理店過程
8
データのクラスタ形成プロセスをモデリング
1 2 3 5
4
1 2 3
レストラン(全集合)
客(データ点)
テーブル(データクラス)
状態更新確率
p(˜i| ˜i; )
Nk
+N 1
+N 1
k番目のテーブルに座る。
誰も座っていないテーブルに座る。
レストラン内の状態
客 i が居る
テーブル
平衡状態を定常状態とする確率過程
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
中華料理店過程
9
データのクラスタ形成プロセスをモデリング
1 2 3 5
4
1 2 3
レストラン(全集合)
客(データ点)
テーブル(データクラス)
尤度
p(Z) =
K(Z)
N
=1(N + )
K(Z)
k=1
(Nk 1)!
: k番目のテーブル
に座っている客数
N
Nk
: レストラン内
客総数
: ハイパーパラメタ
レストラン内の状態Zにおいて、
1人以上の客が居るテーブルの個数
ハミルトニアンの定義
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
イジングモデルへのマッピング
10
1 4 3 5
2
1 1 0 1 0
1 2 3 4 5
1 1 0 1 0
0 0 1 0 1
1 1 0 1 0
0
1
2
3
4
5 0 1 0 1
B = N
i=1
N
i=1 ˜i,n
Bi,n = Bn,i
Bi,i = 1 (i = 1, 2, · · · , N)
i, , Bi/|Bi| · B /|B | = 1 or 0
Seating conditions ˜
対称行列
自分自身
ビット行列(隣接行列)による状態の記述
レストラン内の客配置 隣接行列
誰とテーブルを
共有しているか
N 人の客=N2 個のイジングスピン
巡回セールスマン問題と同じ規模
拘束条件付きイジングモデル
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
イジングモデルへのマッピング
11
Seating conditions を満たす状態空間内で更新
1 4 3 5
2
1 1 0 1 0
1 2 3 4 5
1 1 0 1 0
0 0 1 0 1
1 1 0 1 0
0
1
2
3
4
5 0 1 0 1
1
2
1 1 0 1 0
0
1
2
0
1 4 3 5
1 0 1 0
1 2 3 4 5
0 1 0 1
1 0 1 0
0
1
2
3
4
5 1 0 1
客2のテーブル共有情報
1
1 1 0 1 0
0
1
0
0
0 1 1 0 1
1
0
1
0
0 1 0 0 0
0
0
0
客2が seating conditions を満たしながら取れる状態の集合
モンテカルロ
法による更新
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
量子揺らぎの導入
12
横磁場を用いて量子アニーリングを実装
H = Hc + Hq
Hc = diag E( (1)
), · · · , E( (2N
)
)
Hq =
N
i=1
N
n=1
x
i,n
x
=
0 1
1 0
1 4 3 5
2
1 1 0 1 0
1 2 3 4 5
1 1 0 1 0
0 0 1 0 1
1 1 0 1 0
0
1
2
3
4
5 0 1 0 1
B = N
i=1
N
i=1 ˜i,n
レストラン内の客配置
隣接行列
誰とテーブルを
共有しているか横磁場(量子揺らぎ)
イジングモデル(組合せ最適化問題)
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
Suzuki-Trotter分解
13
H = Hc + Hq
最適化問題を表現する
古典ハミルトニアン
量子揺らぎを表現する
ハミルトニアン
[Hc, Hq] = 0
e H
= e Hc
e Hq
指数関数   を計算することが困難e H
経路積分表示(Suzuki-Trotter分解)による近似解法
exp
m
H = exp
m
(Hc + Hq)
= exp
m
Hc exp
m
Hq + O
m
2
d次元量子系をd+1次元にマップ
Trotter数(擬並列度)
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
擬似シミュレーションの図解
14
MCS
1
2
...
m
1
2
...
m
1
2
...
m
1
2
...
m
1
2
...
m
1
2
...
m
1
2
...
m
K. Kurihara, S. Tanaka, and S. Miyashita, UAI2009  (2009年出版)  
K. K. Pudenz et al. Phys. Rev. A, 91, 042302 (2015) Quantum Annealing Correction (QAC)も類似概念とみなせる。
m個のレプリカ間に相互作用が入った擬並列化計算
時間とともに量子揺らぎが弱められる。
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
実データセット
15
es of network structures. (a) Social network (assortive network), (b) election network (disassortative network) and (c) citation network (mixture of assortative
tive network).
I. Sato et al. / Neurocomputing 121 (2013) 523–531 527
urocomputing 121 (2013) 523–531 527
ng CRPs in which sjðj ¼ 1; …; mÞ
nt of the j-th CRP and represents
pond Bj;i;n ¼ 1 to ~sj;i;n ¼ ð1; 0Þ⊤
and
means that we can represent Bj as
he following theorem:
10) is approximated by the Suzuki–
sm; β; ΓÞ þ O
β2
m
!
; ð15Þ
1
Zðβ; ΓÞ
e−β=mEðsjÞ
ef ðβ;ΓÞsðsj;sjþ1Þ
; ð16Þ
ð17Þ
regarded as a similarity function between the j-th and (j+1)-th bit
matrices. If they are the same matrices, then sðsj; sjþ1Þ ¼ N2
. In
Eq. (2), log pSAðsjÞ corresponds to log e−β=mEðsjÞ
=Z and the regularizer
term f Á Rðs1; …; smÞ is log ∏m
j ¼ 1ef ðβ;ΓÞsðsj;sjþ1Þ
¼ f ðβ; ΓÞ∑m
j ¼ 1sðsj; sjþ1Þ.
Note that we aim at deriving the approximation inference for
pQAð~sijs~si; β; ΓÞ in Eq. (13). Using Theorem 3.1, we can derive
Eq. (4) as the approximation inference. The details of the deriva-
tion are provided in Appendix B.
4. Experiments
We evaluated QA in a real application. We applied QA to a DPM
model for clustering vertices in a network where a seating
arrangement of the CRP indicates a network partition.
a) Social network (assortive network), (b) election network (disassortative network) and (c) citation network (mixture of assortative
Citeseer
論文引用ネットワーク
2110論文
Netscience
共著者ネットワーク
研究者1589人
Wikivote
投票ネットワーク
7115人
様々なネットワーク構造を取る膨大なデータ
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
熱・量子同時制御型アニーリング
16
温度
(熱ゆらぎ効果)
シミュレーテッドアニーリング
温度を徐々に下げる
量子ゆらぎ効果
量子アニーリング
量子効果を徐々に弱める
T. Kadowaki and H. Nishimori,
Phys. Rev. E, 58, 5355 (1998).
絶対ゼロ度(基底状態)
S. Kirkpatrick, C. D. Gelatt, and M. P. Vecchi, Science, 220, 671 (1983).
最適解を得る経路
第一段階で温度を下げ、
第二段階で量子効果を下げる
効率の悪い経路
第一段階で量子効果を下げ、
第二段階で温度を下げる
K. Kurihara, S. Tanaka, and S. Miyashita, UAI2009.
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
擬似シミュレーション条件
17
熱揺らぎと量子揺らぎを同時に制御
逆温度:
量子揺らぎ項:
(t) = 0 log(1 + t), 0 t, 0t
(t) (t)
m
= 0
t
( 0 = 0.2m, 0.4m, 0.6m)
比較実験条件
(シミュレーテッドアニーリング)
(t) = 0.4m t
最もSAがうまくいく条件を変えて数値実験を行った。0
Trotter数(擬並列数) は固定。m = 16
状態更新確率(量子)
p(˜i| ˜i; )
Nk
+N 1
/m
e(cj,k(i)+c+
j,k(i))f( , )
+N 1
/m
k番目のテーブルに座る。
誰も座っていないテーブルに座る。
f( , ) = 2 log coth
m
量子モンテカルロ法を適用
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
擬似シミュレーション結果
18
21000
21100
21200
21300
2.5 3 3.5 4 4.5 5
Diff.oflog-likelihood
Γ0
Wikivote
Better
対数尤度(高いほうが良い解)の量子パラメータ初期値依存性
Beam search法によって得られた
最大対数尤度
16回のSAで得られた
最大対数尤度
1600回のSAで得られた
最大対数尤度
量子パラメータが小さすぎて、
量子揺らぎ効果が効いていない。 最終ステップでの残留
量子効果による性能低減
(mを増やせば回避可能)
m=16のQAで得られ
た対数尤度と、
Beam search法に
よって得られた最大
対数尤度との差
量子パラメータ初期値
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
擬似シミュレーション結果
19
21000
21100
21200
21300
2.5 3 3.5 4 4.5 5
Diff.oflog-likelihood
Γ0
Wikivote
400
500
600
700
1 1.5 2 2.5 3
Diff.oflog-likelihood
Γ0
Netscience
1200
1400
1600
1.5 2 2.5 3 3.5
Diff.oflog-likelihood
Γ0
Citeseer SA(T=30,m=1) QA(T=30,m=16)
calc. time 13 sec. 15 sec.
16 SAs 1600 SAs beam search QA(m=16)
# classes 35 30 57 37
SA(T=30,m=1) QA(T=30,m=16)
calc. time 22 sec. 25 sec.
16 SAs 1600 SAs beam search QA(m=16)
# classes 22 65 61 26
SA(T=30,m=1) QA(T=30,m=16)
calc. time 76 sec. 79 sec.
16 SAs 1600 SAs beam search QA(m=16)
# classes 8 8 27 8
田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25)
まとめ・今後の展望
20
機械学習における重要な技術であるクラスタ分析に対する、量子アニーリング
の性能評価を行った。
量子モンテカルロ法を用いた擬似シミュレーションの結果、シミュレーテッド
アニーリングに比べ、量子アニーリングの方が、性能面で優位であることを示
唆する結果を得た。
これまでの我々の研究で行ったこと
量子モンテカルロ法を用いた研究
✔ MNISTデータ(手書き文字5000データ)を30個のクラスタに分類
✔ NIPSコーパス(論文1684報,1000語)を20個のクラスタに分類
✔ Reutersコーパス(記事1000報,2000語)を20個のクラスタに分類
変分ベイズ法を用いた研究
✔ Reutersコーパス(記事1000報, 12788語)を20個のクラスタに分類
✔ Medlineコーパス(論文1000報, 14252語)を20個のクラスタに分類
量子モンテカルロ法を用いた研究
✔ Citeseer(論文2110報)をクラスタ分析
✔ Netscience(研究者1589人)をクラスタ分析
✔ Wikivote(7115人)をクラスタ分析
K. Kurihara, S. Tanaka, and S. Miyashita, UAI2009
I. Sato, K. Kurihara, S. Tanaka, H. Nakagawa, and S. Miyashita, UAI2009
I. Sato, S. Tanaka, K. Kurihara, S. Miyashita, and H. Nakagawa,
Neurocomputing,121, 523 (2013)

Contenu connexe

Tendances

ディジタル信号処理 課題解説 その4
ディジタル信号処理 課題解説 その4ディジタル信号処理 課題解説 その4
ディジタル信号処理 課題解説 その4
noname409
 
ディジタル信号処理の課題解説 その3
ディジタル信号処理の課題解説 その3ディジタル信号処理の課題解説 その3
ディジタル信号処理の課題解説 その3
noname409
 
Nonparametric Factor Analysis with Beta Process Priors の式解説
Nonparametric Factor Analysis with Beta Process Priors の式解説Nonparametric Factor Analysis with Beta Process Priors の式解説
Nonparametric Factor Analysis with Beta Process Priors の式解説
Tomonari Masada
 
ディジタル信号処理の課題解説
ディジタル信号処理の課題解説ディジタル信号処理の課題解説
ディジタル信号処理の課題解説
noname409
 
卒論プレゼンテーション -DRAFT-
卒論プレゼンテーション -DRAFT-卒論プレゼンテーション -DRAFT-
卒論プレゼンテーション -DRAFT-
Tomoshige Nakamura
 

Tendances (20)

coordinate descent 法について
coordinate descent 法についてcoordinate descent 法について
coordinate descent 法について
 
大規模凸最適化問題に対する勾配法
大規模凸最適化問題に対する勾配法大規模凸最適化問題に対する勾配法
大規模凸最適化問題に対する勾配法
 
SGD+α: 確率的勾配降下法の現在と未来
SGD+α: 確率的勾配降下法の現在と未来SGD+α: 確率的勾配降下法の現在と未来
SGD+α: 確率的勾配降下法の現在と未来
 
ディジタル信号処理 課題解説 その4
ディジタル信号処理 課題解説 その4ディジタル信号処理 課題解説 その4
ディジタル信号処理 課題解説 その4
 
ディジタル信号処理の課題解説 その3
ディジタル信号処理の課題解説 その3ディジタル信号処理の課題解説 その3
ディジタル信号処理の課題解説 その3
 
Nonparametric Factor Analysis with Beta Process Priors の式解説
Nonparametric Factor Analysis with Beta Process Priors の式解説Nonparametric Factor Analysis with Beta Process Priors の式解説
Nonparametric Factor Analysis with Beta Process Priors の式解説
 
ディジタル信号処理の課題解説
ディジタル信号処理の課題解説ディジタル信号処理の課題解説
ディジタル信号処理の課題解説
 
東京都市大学 データ解析入門 9 クラスタリングと分類分析 2
東京都市大学 データ解析入門 9 クラスタリングと分類分析 2東京都市大学 データ解析入門 9 クラスタリングと分類分析 2
東京都市大学 データ解析入門 9 クラスタリングと分類分析 2
 
1次式とノルムで構成された最適化問題とその双対問題
1次式とノルムで構成された最適化問題とその双対問題1次式とノルムで構成された最適化問題とその双対問題
1次式とノルムで構成された最適化問題とその双対問題
 
テンソル多重線形ランクの推定法について(Estimation of Multi-linear Tensor Rank)
テンソル多重線形ランクの推定法について(Estimation of Multi-linear Tensor Rank)テンソル多重線形ランクの推定法について(Estimation of Multi-linear Tensor Rank)
テンソル多重線形ランクの推定法について(Estimation of Multi-linear Tensor Rank)
 
卒論プレゼンテーション -DRAFT-
卒論プレゼンテーション -DRAFT-卒論プレゼンテーション -DRAFT-
卒論プレゼンテーション -DRAFT-
 
線形識別モデル
線形識別モデル線形識別モデル
線形識別モデル
 
ディジタル信号処理 課題解説(その1) 2014年度版
ディジタル信号処理 課題解説(その1) 2014年度版ディジタル信号処理 課題解説(その1) 2014年度版
ディジタル信号処理 課題解説(その1) 2014年度版
 
独立成分分析 ICA
独立成分分析 ICA独立成分分析 ICA
独立成分分析 ICA
 
20170327_レムニスケートにまつわる色々な計算
20170327_レムニスケートにまつわる色々な計算20170327_レムニスケートにまつわる色々な計算
20170327_レムニスケートにまつわる色々な計算
 
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
 
ディジタル信号処理 課題解説(その3) 2014年度版
ディジタル信号処理 課題解説(その3) 2014年度版ディジタル信号処理 課題解説(その3) 2014年度版
ディジタル信号処理 課題解説(その3) 2014年度版
 
20150922_楕円関数とおもしろい応用
20150922_楕円関数とおもしろい応用20150922_楕円関数とおもしろい応用
20150922_楕円関数とおもしろい応用
 
2015年度秋学期 応用数学(解析) 第6回 変数分離形の変形 (2015. 11. 5)
2015年度秋学期 応用数学(解析) 第6回 変数分離形の変形 (2015. 11. 5)2015年度秋学期 応用数学(解析) 第6回 変数分離形の変形 (2015. 11. 5)
2015年度秋学期 応用数学(解析) 第6回 変数分離形の変形 (2015. 11. 5)
 
Kim120 lt 12_6
Kim120 lt 12_6Kim120 lt 12_6
Kim120 lt 12_6
 

En vedette

Unconventional phase transitions in frustrated systems (March, 2014)
Unconventional phase transitions in frustrated systems (March, 2014)Unconventional phase transitions in frustrated systems (March, 2014)
Unconventional phase transitions in frustrated systems (March, 2014)
Shu Tanaka
 

En vedette (7)

量子アニーリングの研究開発最前線
量子アニーリングの研究開発最前線量子アニーリングの研究開発最前線
量子アニーリングの研究開発最前線
 
Interlayer-Interaction Dependence of Latent Heat in the Heisenberg Model on a...
Interlayer-Interaction Dependence of Latent Heat in the Heisenberg Model on a...Interlayer-Interaction Dependence of Latent Heat in the Heisenberg Model on a...
Interlayer-Interaction Dependence of Latent Heat in the Heisenberg Model on a...
 
Network-Growth Rule Dependence of Fractal Dimension of Percolation Cluster on...
Network-Growth Rule Dependence of Fractal Dimension of Percolation Cluster on...Network-Growth Rule Dependence of Fractal Dimension of Percolation Cluster on...
Network-Growth Rule Dependence of Fractal Dimension of Percolation Cluster on...
 
Second-Order Phase Transition in Heisenberg Model on Triangular Lattice with ...
Second-Order Phase Transition in Heisenberg Model on Triangular Lattice with ...Second-Order Phase Transition in Heisenberg Model on Triangular Lattice with ...
Second-Order Phase Transition in Heisenberg Model on Triangular Lattice with ...
 
Entanglement Behavior of 2D Quantum Models
Entanglement Behavior of 2D Quantum ModelsEntanglement Behavior of 2D Quantum Models
Entanglement Behavior of 2D Quantum Models
 
Quantum Annealing for Dirichlet Process Mixture Models with Applications to N...
Quantum Annealing for Dirichlet Process Mixture Models with Applications to N...Quantum Annealing for Dirichlet Process Mixture Models with Applications to N...
Quantum Annealing for Dirichlet Process Mixture Models with Applications to N...
 
Unconventional phase transitions in frustrated systems (March, 2014)
Unconventional phase transitions in frustrated systems (March, 2014)Unconventional phase transitions in frustrated systems (March, 2014)
Unconventional phase transitions in frustrated systems (March, 2014)
 

Similaire à 量子アニーリングを用いたクラスタ分析 (QIT32)

ネットワーク科学最前線2017 -インフルエンサーと機械学習からの接近-
ネットワーク科学最前線2017  -インフルエンサーと機械学習からの接近-ネットワーク科学最前線2017  -インフルエンサーと機械学習からの接近-
ネットワーク科学最前線2017 -インフルエンサーと機械学習からの接近-
hayashiresearchlab
 

Similaire à 量子アニーリングを用いたクラスタ分析 (QIT32) (20)

ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介
 
[DL輪読会]Factorized Variational Autoencoders for Modeling Audience Reactions to...
[DL輪読会]Factorized Variational Autoencoders for Modeling Audience Reactions to...[DL輪読会]Factorized Variational Autoencoders for Modeling Audience Reactions to...
[DL輪読会]Factorized Variational Autoencoders for Modeling Audience Reactions to...
 
Hayashi tutorial ne2017
Hayashi tutorial ne2017Hayashi tutorial ne2017
Hayashi tutorial ne2017
 
Information extraction 1
Information extraction 1Information extraction 1
Information extraction 1
 
ネットワーク科学 空間システムデザイン
ネットワーク科学 空間システムデザインネットワーク科学 空間システムデザイン
ネットワーク科学 空間システムデザイン
 
El text.life science6.ikeguchi1911211.
El text.life science6.ikeguchi1911211.El text.life science6.ikeguchi1911211.
El text.life science6.ikeguchi1911211.
 
ネットワーク科学 中心性とGoogleのPageRank
ネットワーク科学 中心性とGoogleのPageRankネットワーク科学 中心性とGoogleのPageRank
ネットワーク科学 中心性とGoogleのPageRank
 
打ち切りデータのヒストグラム
打ち切りデータのヒストグラム打ち切りデータのヒストグラム
打ち切りデータのヒストグラム
 
201803NC
201803NC201803NC
201803NC
 
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
 
200604material ozaki
200604material ozaki200604material ozaki
200604material ozaki
 
ネットワーク科学最前線2017 -インフルエンサーと機械学習からの接近-
ネットワーク科学最前線2017  -インフルエンサーと機械学習からの接近-ネットワーク科学最前線2017  -インフルエンサーと機械学習からの接近-
ネットワーク科学最前線2017 -インフルエンサーと機械学習からの接近-
 
第10回 配信講義 計算科学技術特論A(2021)
第10回 配信講義 計算科学技術特論A(2021)第10回 配信講義 計算科学技術特論A(2021)
第10回 配信講義 計算科学技術特論A(2021)
 
Scan Registration for Autonomous Mining Vehicles Using 3D-NDT
Scan Registration for Autonomous Mining Vehicles Using 3D-NDTScan Registration for Autonomous Mining Vehicles Using 3D-NDT
Scan Registration for Autonomous Mining Vehicles Using 3D-NDT
 
CMSI計算科学技術特論B(8) オーダーN法1
 CMSI計算科学技術特論B(8) オーダーN法1 CMSI計算科学技術特論B(8) オーダーN法1
CMSI計算科学技術特論B(8) オーダーN法1
 
充足可能性問題のいろいろ
充足可能性問題のいろいろ充足可能性問題のいろいろ
充足可能性問題のいろいろ
 
3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)
 
NL20161222invited
NL20161222invitedNL20161222invited
NL20161222invited
 
0621
06210621
0621
 
Long short-term memory (LSTM)
Long short-term memory (LSTM)Long short-term memory (LSTM)
Long short-term memory (LSTM)
 

量子アニーリングを用いたクラスタ分析 (QIT32)

  • 1. 量子アニーリングを用いた クラスタ分析 田中 宗 (早稲田大学 高等研究所) 機械学習における重要な技術であるクラスタ分析に 対する、量子アニーリングの性能評価を行った。 量子モンテカルロ法を用いた擬似シミュレーションの結果、 シミュレーテッドアニーリングに比べ、量子アニーリングの 方が、性能面で優位であることを示唆する結果を得た。 K. Kurihara, S. Tanaka, and S. Miyashita, UAI2009 I. Sato, K. Kurihara, S. Tanaka, H. Nakagawa, and S. Miyashita, UAI2009 I. Sato, S. Tanaka, K. Kurihara, S. Miyashita, and H. Nakagawa, Neurocomputing,121, 523 (2013)
  • 2. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) 共同研究者 2 佐藤 一誠 博士 (東大 情報基盤センター、さきがけ研究員) 栗原 賢一 博士 (グーグル株式会社) 宮下 精二 教授 (東大院理 物理学専攻) 中川 裕志 教授 (東大 情報基盤センター)
  • 4. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) 量子アニーリング 4 温度 (熱ゆらぎ効果) シミュレーテッドアニーリング 温度を徐々に下げる 量子ゆらぎ効果 量子アニーリング 量子効果を徐々に弱める T. Kadowaki and H. Nishimori, Phys. Rev. E, 58, 5355 (1998). 絶対ゼロ度(基底状態) S. Kirkpatrick, C. D. Gelatt, and M. P. Vecchi, Science, 220, 671 (1983). イジングモデルの基底状態を効率よく求める方法 Hopt. = i,j Jij z i z j i hi z i z i = ±1 イジングモデル ✔ 組合せ最適化問題のハミルトニアン ✔ 基底状態を求めることは困難(組合せ爆発) スピン(ビット)間 相互作用 磁場(強制力)
  • 5. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) 組合せ最適化問題 5 集積回路設計 グラフ二分割問題 高分子安定構造決定 組合せ最適化問題の最適解 = イジングモデルの基底状態 巡回セールスマン問題 Hopt. = i,j Jij z i z j i hi z i z i = ±1 イジングモデル ✔ 組合せ最適化問題のハミルトニアン ✔ 基底状態を求めることは困難(組合せ爆発) スピン(ビット)間 相互作用 磁場(強制力) 様々な分野に、応用展開可能
  • 6. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) ning CRPs in which sjðj ¼ 1; …; mÞ ment of the j-th CRP and represents espond Bj;i;n ¼ 1 to ~sj;i;n ¼ ð1; 0Þ⊤ and means that we can represent Bj as the following theorem: (10) is approximated by the Suzuki– regarded as a similarity function between the j-th and (j+1)-th bit matrices. If they are the same matrices, then sðsj; sjþ1Þ ¼ N2 . In Eq. (2), log pSAðsjÞ corresponds to log e−β=mEðsjÞ =Z and the regularizer term f Á Rðs1; …; smÞ is log ∏m j ¼ 1ef ðβ;ΓÞsðsj;sjþ1Þ ¼ f ðβ; ΓÞ∑m j ¼ 1sðsj; sjþ1Þ. Note that we aim at deriving the approximation inference for pQAð~sijs~si; β; ΓÞ in Eq. (13). Using Theorem 3.1, we can derive Eq. (4) as the approximation inference. The details of the deriva- tion are provided in Appendix B. . (a) Social network (assortive network), (b) election network (disassortative network) and (c) citation network (mixture of assortative I. Sato et al. / Neurocomputing 121 (2013) 523–531 527 クラスタ分析 6 膨大なデータを、潜在的意味によって分類 共著者ネットワーク分類 投票者・非投票者分類研究論文分類 分かることは分けること I. Sato et al. / Neurocomputing 121 (2013) 523–531 I. Sato et al. / Neurocomputing 121 (2013) 523–531 t QA-ST can find a better ptimal ones. the notation used in this ve n data points, and they . The assignment of the i- by binary indicator vector is equal to two, we denote ed to the first and the sec- 0)T and ˜σi = (0, 1)T , re- nt of all data points is also ector, σ, whose length is kn ailable assignments is kn . σ 1, σ = n i=1 ˜σi, where ⊗ is hich is a special case of the s. Let A and B be matrices hen, A⊗B = a11B a12B a21B a22B ample). Only one element ers are zero. For example, when k = 2, n = 2, the first e first cluster (˜σ1 = (1, 0)T ) σ∗ (global optimum) Figure 3: Three clustering results by a mixture of four Gaussians (i.e. #clusters=4). parallel m SAs. We denote the j-th SA of the parallel SA by σj. The i-th data point in σj is denoted by ˜σj,i, s.t. σj = n i=1 ˜σj,i. When A is a matrix, eA is the matrix exponential of A defined by eA = ∞ l=0 1 l! Al . 3 Simulated Annealing for Clustering We briefly review simulated annealing (SA) (Kirk-
  • 7. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) 中華料理店過程 7 データのクラスタ形成プロセスをモデリング 1 2 3 5 4 1 2 3 レストラン(全集合) 客(データ点) テーブル(データクラス) 新たに入ってきた客は、どのテーブルに座るか? : k番目のテーブル に座っている客数 N Nk N + 確率    で、k番目のテーブルに座る。 N + 確率    で、誰も座っていないテーブルに座る。 Nk : レストラン内 客総数 : ハイパーパラメタ 平衡状態の確率分布
  • 8. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) 中華料理店過程 8 データのクラスタ形成プロセスをモデリング 1 2 3 5 4 1 2 3 レストラン(全集合) 客(データ点) テーブル(データクラス) 状態更新確率 p(˜i| ˜i; ) Nk +N 1 +N 1 k番目のテーブルに座る。 誰も座っていないテーブルに座る。 レストラン内の状態 客 i が居る テーブル 平衡状態を定常状態とする確率過程
  • 9. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) 中華料理店過程 9 データのクラスタ形成プロセスをモデリング 1 2 3 5 4 1 2 3 レストラン(全集合) 客(データ点) テーブル(データクラス) 尤度 p(Z) = K(Z) N =1(N + ) K(Z) k=1 (Nk 1)! : k番目のテーブル に座っている客数 N Nk : レストラン内 客総数 : ハイパーパラメタ レストラン内の状態Zにおいて、 1人以上の客が居るテーブルの個数 ハミルトニアンの定義
  • 10. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) イジングモデルへのマッピング 10 1 4 3 5 2 1 1 0 1 0 1 2 3 4 5 1 1 0 1 0 0 0 1 0 1 1 1 0 1 0 0 1 2 3 4 5 0 1 0 1 B = N i=1 N i=1 ˜i,n Bi,n = Bn,i Bi,i = 1 (i = 1, 2, · · · , N) i, , Bi/|Bi| · B /|B | = 1 or 0 Seating conditions ˜ 対称行列 自分自身 ビット行列(隣接行列)による状態の記述 レストラン内の客配置 隣接行列 誰とテーブルを 共有しているか N 人の客=N2 個のイジングスピン 巡回セールスマン問題と同じ規模 拘束条件付きイジングモデル
  • 11. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) イジングモデルへのマッピング 11 Seating conditions を満たす状態空間内で更新 1 4 3 5 2 1 1 0 1 0 1 2 3 4 5 1 1 0 1 0 0 0 1 0 1 1 1 0 1 0 0 1 2 3 4 5 0 1 0 1 1 2 1 1 0 1 0 0 1 2 0 1 4 3 5 1 0 1 0 1 2 3 4 5 0 1 0 1 1 0 1 0 0 1 2 3 4 5 1 0 1 客2のテーブル共有情報 1 1 1 0 1 0 0 1 0 0 0 1 1 0 1 1 0 1 0 0 1 0 0 0 0 0 0 客2が seating conditions を満たしながら取れる状態の集合 モンテカルロ 法による更新
  • 12. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) 量子揺らぎの導入 12 横磁場を用いて量子アニーリングを実装 H = Hc + Hq Hc = diag E( (1) ), · · · , E( (2N ) ) Hq = N i=1 N n=1 x i,n x = 0 1 1 0 1 4 3 5 2 1 1 0 1 0 1 2 3 4 5 1 1 0 1 0 0 0 1 0 1 1 1 0 1 0 0 1 2 3 4 5 0 1 0 1 B = N i=1 N i=1 ˜i,n レストラン内の客配置 隣接行列 誰とテーブルを 共有しているか横磁場(量子揺らぎ) イジングモデル(組合せ最適化問題)
  • 13. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) Suzuki-Trotter分解 13 H = Hc + Hq 最適化問題を表現する 古典ハミルトニアン 量子揺らぎを表現する ハミルトニアン [Hc, Hq] = 0 e H = e Hc e Hq 指数関数   を計算することが困難e H 経路積分表示(Suzuki-Trotter分解)による近似解法 exp m H = exp m (Hc + Hq) = exp m Hc exp m Hq + O m 2 d次元量子系をd+1次元にマップ Trotter数(擬並列度)
  • 14. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) 擬似シミュレーションの図解 14 MCS 1 2 ... m 1 2 ... m 1 2 ... m 1 2 ... m 1 2 ... m 1 2 ... m 1 2 ... m K. Kurihara, S. Tanaka, and S. Miyashita, UAI2009  (2009年出版)   K. K. Pudenz et al. Phys. Rev. A, 91, 042302 (2015) Quantum Annealing Correction (QAC)も類似概念とみなせる。 m個のレプリカ間に相互作用が入った擬並列化計算 時間とともに量子揺らぎが弱められる。
  • 15. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) 実データセット 15 es of network structures. (a) Social network (assortive network), (b) election network (disassortative network) and (c) citation network (mixture of assortative tive network). I. Sato et al. / Neurocomputing 121 (2013) 523–531 527 urocomputing 121 (2013) 523–531 527 ng CRPs in which sjðj ¼ 1; …; mÞ nt of the j-th CRP and represents pond Bj;i;n ¼ 1 to ~sj;i;n ¼ ð1; 0Þ⊤ and means that we can represent Bj as he following theorem: 10) is approximated by the Suzuki– sm; β; ΓÞ þ O β2 m ! ; ð15Þ 1 Zðβ; ΓÞ e−β=mEðsjÞ ef ðβ;ΓÞsðsj;sjþ1Þ ; ð16Þ ð17Þ regarded as a similarity function between the j-th and (j+1)-th bit matrices. If they are the same matrices, then sðsj; sjþ1Þ ¼ N2 . In Eq. (2), log pSAðsjÞ corresponds to log e−β=mEðsjÞ =Z and the regularizer term f Á Rðs1; …; smÞ is log ∏m j ¼ 1ef ðβ;ΓÞsðsj;sjþ1Þ ¼ f ðβ; ΓÞ∑m j ¼ 1sðsj; sjþ1Þ. Note that we aim at deriving the approximation inference for pQAð~sijs~si; β; ΓÞ in Eq. (13). Using Theorem 3.1, we can derive Eq. (4) as the approximation inference. The details of the deriva- tion are provided in Appendix B. 4. Experiments We evaluated QA in a real application. We applied QA to a DPM model for clustering vertices in a network where a seating arrangement of the CRP indicates a network partition. a) Social network (assortive network), (b) election network (disassortative network) and (c) citation network (mixture of assortative Citeseer 論文引用ネットワーク 2110論文 Netscience 共著者ネットワーク 研究者1589人 Wikivote 投票ネットワーク 7115人 様々なネットワーク構造を取る膨大なデータ
  • 16. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) 熱・量子同時制御型アニーリング 16 温度 (熱ゆらぎ効果) シミュレーテッドアニーリング 温度を徐々に下げる 量子ゆらぎ効果 量子アニーリング 量子効果を徐々に弱める T. Kadowaki and H. Nishimori, Phys. Rev. E, 58, 5355 (1998). 絶対ゼロ度(基底状態) S. Kirkpatrick, C. D. Gelatt, and M. P. Vecchi, Science, 220, 671 (1983). 最適解を得る経路 第一段階で温度を下げ、 第二段階で量子効果を下げる 効率の悪い経路 第一段階で量子効果を下げ、 第二段階で温度を下げる K. Kurihara, S. Tanaka, and S. Miyashita, UAI2009.
  • 17. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) 擬似シミュレーション条件 17 熱揺らぎと量子揺らぎを同時に制御 逆温度: 量子揺らぎ項: (t) = 0 log(1 + t), 0 t, 0t (t) (t) m = 0 t ( 0 = 0.2m, 0.4m, 0.6m) 比較実験条件 (シミュレーテッドアニーリング) (t) = 0.4m t 最もSAがうまくいく条件を変えて数値実験を行った。0 Trotter数(擬並列数) は固定。m = 16 状態更新確率(量子) p(˜i| ˜i; ) Nk +N 1 /m e(cj,k(i)+c+ j,k(i))f( , ) +N 1 /m k番目のテーブルに座る。 誰も座っていないテーブルに座る。 f( , ) = 2 log coth m 量子モンテカルロ法を適用
  • 18. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) 擬似シミュレーション結果 18 21000 21100 21200 21300 2.5 3 3.5 4 4.5 5 Diff.oflog-likelihood Γ0 Wikivote Better 対数尤度(高いほうが良い解)の量子パラメータ初期値依存性 Beam search法によって得られた 最大対数尤度 16回のSAで得られた 最大対数尤度 1600回のSAで得られた 最大対数尤度 量子パラメータが小さすぎて、 量子揺らぎ効果が効いていない。 最終ステップでの残留 量子効果による性能低減 (mを増やせば回避可能) m=16のQAで得られ た対数尤度と、 Beam search法に よって得られた最大 対数尤度との差 量子パラメータ初期値
  • 19. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) 擬似シミュレーション結果 19 21000 21100 21200 21300 2.5 3 3.5 4 4.5 5 Diff.oflog-likelihood Γ0 Wikivote 400 500 600 700 1 1.5 2 2.5 3 Diff.oflog-likelihood Γ0 Netscience 1200 1400 1600 1.5 2 2.5 3 3.5 Diff.oflog-likelihood Γ0 Citeseer SA(T=30,m=1) QA(T=30,m=16) calc. time 13 sec. 15 sec. 16 SAs 1600 SAs beam search QA(m=16) # classes 35 30 57 37 SA(T=30,m=1) QA(T=30,m=16) calc. time 22 sec. 25 sec. 16 SAs 1600 SAs beam search QA(m=16) # classes 22 65 61 26 SA(T=30,m=1) QA(T=30,m=16) calc. time 76 sec. 79 sec. 16 SAs 1600 SAs beam search QA(m=16) # classes 8 8 27 8
  • 20. 田中 宗 (早稲田大学 高等研究所)QIT32 (2015/05/25) まとめ・今後の展望 20 機械学習における重要な技術であるクラスタ分析に対する、量子アニーリング の性能評価を行った。 量子モンテカルロ法を用いた擬似シミュレーションの結果、シミュレーテッド アニーリングに比べ、量子アニーリングの方が、性能面で優位であることを示 唆する結果を得た。 これまでの我々の研究で行ったこと 量子モンテカルロ法を用いた研究 ✔ MNISTデータ(手書き文字5000データ)を30個のクラスタに分類 ✔ NIPSコーパス(論文1684報,1000語)を20個のクラスタに分類 ✔ Reutersコーパス(記事1000報,2000語)を20個のクラスタに分類 変分ベイズ法を用いた研究 ✔ Reutersコーパス(記事1000報, 12788語)を20個のクラスタに分類 ✔ Medlineコーパス(論文1000報, 14252語)を20個のクラスタに分類 量子モンテカルロ法を用いた研究 ✔ Citeseer(論文2110報)をクラスタ分析 ✔ Netscience(研究者1589人)をクラスタ分析 ✔ Wikivote(7115人)をクラスタ分析 K. Kurihara, S. Tanaka, and S. Miyashita, UAI2009 I. Sato, K. Kurihara, S. Tanaka, H. Nakagawa, and S. Miyashita, UAI2009 I. Sato, S. Tanaka, K. Kurihara, S. Miyashita, and H. Nakagawa, Neurocomputing,121, 523 (2013)