SlideShare une entreprise Scribd logo
1  sur  79
Télécharger pour lire hors ligne
Copyright 2014 Shiroyagi Corporation. All rights reserved.
シバタアキラ, Ph.D.
LHCにおける素粒子

ビッグデータの解析と
ROOTライブラリ
白ヤギコーポレーション
Tokyo Web Mining #45
Ex LHC Physicist, now CEO
Akira Shibata (シバタアキラ), PhD. @madyagi
• 2013 -:CEO @Shiroyagi Corporation
• Kamelio : News curation that learns your interests
• Kamelio API: Contents Recommendation API
• 2010 - 2013: Strategy Consulting @BCG
• 2007 - 2010: Data Scientist @NYU
• Statistical tools for Higgs discovery @LHC, CERN
• 2004 - 2007: Ph.D. HEP @London University
Copyright 2014 Shiroyagi Corporation. All rights reserved. 3
Copyright 2014 Shiroyagi Corporation. All rights reserved. 4
Copyright 2014 Shiroyagi Corporation. All rights reserved. 5
Copyright 2014 Shiroyagi Corporation. All rights reserved. 6
PyData.Tokyoかなり盛り上がってます
-報道関係者様向け資料-
PyData.Tokyo これまでの活動
30人の座席にに毎回百人近い応募
• ディープラーニング
• 分散型機械学習
• データ解析インフラ
などの旬なテーマを扱い、毎回その
分野で活躍するデータサイエンティ
ストにご登壇いただいています。
例えば、第一回は東京大学で深層学
習研究をしている中山先生。次回は
ブレインパッドの佐藤さんをお招き
します。
http://pydatatokyo.connpass.com
-報道関係者様向け資料-
PyData.Tokyoチュートリアルの様子
イベントは渋谷のデンソーアイティーラボラトリにて開催
Copyright 2014 Shiroyagi Corporation. All rights reserved. 9
aial.connpass.comもよろしく
Copyright 2014 Shiroyagi Corporation. All rights reserved. 10
これも出ます
Copyright 2014 Shiroyagi Corporation. All rights reserved. 11
これも出ます
これでました
Copyright 2015 Shiroyagi Corporation. All rights reserved.
• HEPが浮世のデータ分析とどう違う
• ATLASというさらに狭い世界の話
→ でも多分いろんな意味でHEPの縮図
• 多分、中に入りすぎてたので、ちょっと細かい話とか多いかも
→ つまらなかったら言ってね
• 理論は当時からあんまりわかっていませんでした今はもっとわからないです
• 今回の登壇に際してちょっとリサーチしました
→ 相変わらず・・
• オープンデータはあまりありませんでした
13
本日お話したいこと
引退してから5年経ったので、お手柔らかに
Copyright 2015 Shiroyagi Corporation. All rights reserved. 14
2012年7月2日
Copyright 2015 Shiroyagi Corporation. All rights reserved. 15
物理をやってた頃の私
Copyright 2015 Shiroyagi Corporation. All rights reserved. 16
データ量はfb^-1で
測ります??
重さはGeVで
測ります??
Copyright 2015 Shiroyagi Corporation. All rights reserved. 17
10fb-1 = 100PB??
Copyright 2015 Shiroyagi Corporation. All rights reserved. 18
Elastic Scattering(弾性散乱)
入った粒子が出てくるだけ、ただし力学的特徴が異なる(角度とか)
Copyright 2015 Shiroyagi Corporation. All rights reserved. 19
散乱断面積(Cross Section)
Copyright 2015 Shiroyagi Corporation. All rights reserved. 20
断面が小さい→Inelastic Scattering
出てくる粒子が、入る粒子と違うのがInelastic

Elasticより小さい断面をめがけて衝突→反応確率は比例して小さい
Copyright 2015 Shiroyagi Corporation. All rights reserved. 21
更には、新しい粒子が作られる
ビームのエネルギー
は合計7 8TeV
高いエネルギーの交換の発生確率は更に低い
=
更に小さいエリアをめがけて何回も衝突させなくてはならない
E=mc2
それだけ大きいエネルギーが必要
Copyright 2015 Shiroyagi Corporation. All rights reserved. 22
E=mc2 ; m= E/c2
重さの単位は ev/c2
多くの場合c2は省
略される(c=1)
「素」粒子と言いながら重さは幅広い
陽子・中性子は約1GeV
Copyright 2015 Shiroyagi Corporation. All rights reserved. 23
ほぼ陽子の重さ
(LHCのビーム)
ほぼヒッグス
の重さ
ヒッグスを作るのは錬金術に近い
Copyright 2015 Shiroyagi Corporation. All rights reserved. 24
素粒子の散乱断面積は小さい
Inelastic Total: 108 nb
Higgs Boson: 10 pb
ただし、最終的に綺麗に見え
るものはもっと少ない
Copyright 2015 Shiroyagi Corporation. All rights reserved. 25
山手線並みのスケールのビームパイプ
ここにいました
Copyright 2015 Shiroyagi Corporation. All rights reserved. 26
Copyright 2015 Shiroyagi Corporation. All rights reserved. 27
ほとんどは、粒子の進路を曲げるdipoleマグネット
Copyright 2015 Shiroyagi Corporation. All rights reserved. 28
Luminosityを上げるのがquadrupole
Copyright 2015 Shiroyagi Corporation. All rights reserved. 29
面積はbで測る、データはb-1で測る
b=10-24cm2
• 108nb=10-25cm2
• 10pb=10-35cm2
• 1fb=10-39cm2
Cross Section Beam Luminosity N
L=N/cm-2
• 10fb-1=10x1039cm-2
• 10fb-1=10x1039cm-2
1015
105
x =
1つの衝突が生データで1.6MB、分析レベルで0.1 0.5MB
1015x1.6MB = 1,600,000PB = 1,600EB!!
100PB in three years
Copyright 2015 Shiroyagi Corporation. All rights reserved. 31
検出器=トラッカー+カロリーメーター
トラッカー
(位置を計測する)
カロリーメーター
(エネルギーを計測する)
トラッカー
(位置を計測する)
Copyright 2015 Shiroyagi Corporation. All rights reserved. 32
データが出てきたらまずは捨てる:トリガー
0.25%
0.008%
0.0006%
99.9995%は1秒以内に捨てる
Copyright 2015 Shiroyagi Corporation. All rights reserved. 33
データ(イベント)は少しずつ再構築される
計測値
(生データ)
クラスに分れた
電気信号の行列
検出器レベル
(ESD)
観測された位置、
方向や
エネルギーの値
物理レベル
(AOD)
観測された粒子
レベルの情報
分析レベル
(DPD)
最終的な分析に
必要な部分だけ
取り出した情報
トリガーレベル
簡易版の物理構築
イベント選択
に使ってあと
は捨てる
統計分析
様々なフォーマットがあり、かなり戸惑う
しかもメモリとディスクで表現が違ったりしてスキーマが直ぐ死ぬ
オンライン
オフライン
Copyright 2015 Shiroyagi Corporation. All rights reserved. 34
GRID < クラウドコンピューティング
Gridはイベントの再構築とDPDの生成のために使われる
分析は分散に向いているが、ほとんどローカルで行われる
Copyright 2015 Shiroyagi Corporation. All rights reserved. 35
GRID < クラウドコンピューティング
世界の大学や研究機関に3つのTierで配置されている
• T0: CERNのこと。全体の20%位のキャパを有する
• T1: 特に大きな研究所 - 生データのレプリカがある。

  分担してイベント再構築を行い、ESDを作る
• T2: 結構いろんな大学にある。

  主にシミュレーションと、AOD→DPDを行う
• T3: ローカル環境のこと
Copyright 2015 Shiroyagi Corporation. All rights reserved. 36
CERNはインターネットは生み出したが・・・
Copyright 2015 Shiroyagi Corporation. All rights reserved. 37
素粒子の実験は常にビッグデータの先端を走っていたが、イ
ンターネットが発達した2000年代からは、データ量でWeb
に抜かされ、技術の先端もそっちに移った感が強い
• データの取扱いはファイルベースのみ
• データの処理はプロセスレベルより細分化されない
• 「クラウド」は巨大なバッチキュー
• プログラムはシングルスレッド
• 開発はFortranとC++とPythonがちょっと
• 機械学習は「使ってる人もいる」くらい
自らの発明に先を越される
Copyright 2015 Shiroyagi Corporation. All rights reserved. 38
おりしも、CHEPが今週開催されていた
Copyright 2015 Shiroyagi Corporation. All rights reserved. 39
Copyright 2015 Shiroyagi Corporation. All rights reserved. 40
最終的に分析とは何をするの?
オブジェクトレベル
イベントレベル
分析(統計)レベル
• 計測値の補正を行う
• オブジェクトIDの精度を上げる
• S/B判別の素性を作る
• シグナルイベントの選択
• イベント数を数える
• シミュレーションとの比較
• 計測誤差の推定
• 統計的誤差
• 検出器による誤差
• アルゴリズムによる誤差
• 理論による誤差
Copyright 2015 Shiroyagi Corporation. All rights reserved. 41
ROOTってなに?
つまり:
HEP物理学者が必要とするツー
ルを雑多に詰め込んだOOデー
タ解析ライブラリ
結構長く使われているので、ド
キュメントはわるくない
データの保存とIO
ヒストグラムなど可視化
統計モデリングツール
(Roofit/RooStat)
機械学習(TMVA)
インタラクティブ環境
オープンソースライブラリ
Copyright 2015 Shiroyagi Corporation. All rights reserved. 42
インタラクティブ環境
もともとCINTというC/C++のReplだったが、最近

clangベースになって、clingになった、いい感じ
Copyright 2015 Shiroyagi Corporation. All rights reserved. 43
インタラクティブ環境
10年前は Advanced だったのかも
Copyright 2015 Shiroyagi Corporation. All rights reserved. 44
データの保存とIO
DBより少し賢いTTree形式
• イベントごとにループを回し
ながらデータを取得できる
• オブジェクトを書き出すこと
ができる(ptrも)
• ORMなしでいきなりオブジェ
クトになってる
テーブル型データとは互換性低
• Ntupleと呼ばれる
Copyright 2015 Shiroyagi Corporation. All rights reserved. 45
ヒストグラムなど可視化
かなり自由自在、matplotlibとかよりだいぶいいです
Copyright 2015 Shiroyagi Corporation. All rights reserved. 46
ヒストグラムなど可視化
Copyright 2015 Shiroyagi Corporation. All rights reserved. 47
ヒストグラムなど可視化
Copyright 2015 Shiroyagi Corporation. All rights reserved. 48
統計モデリングツール(Roofit/RooStat)
ROOTの中でも最もよく知られているアルゴリズム
Copyright 2015 Shiroyagi Corporation. All rights reserved. 49
統計モデリングツール(Roofit/RooStat)
統計的因果推論のモデリング&生成ツール
Copyright 2015 Shiroyagi Corporation. All rights reserved. 50
我々はいつ「発見」するのか(2010年)
Copyright 2015 Shiroyagi Corporation. All rights reserved. 51
2011年
Copyright 2015 Shiroyagi Corporation. All rights reserved. 52
2012年
Copyright 2015 Shiroyagi Corporation. All rights reserved. 53
Copyright 2015 Shiroyagi Corporation. All rights reserved. 54
Copyright 2015 Shiroyagi Corporation. All rights reserved. 55
Copyright 2015 Shiroyagi Corporation. All rights reserved. 56
Copyright 2015 Shiroyagi Corporation. All rights reserved. 57
画像認識などでも応用される技術
http://ss.sysu.edu.cn/ ll/files/lin_sketchrecognition_emmcvpr07.pdf
http://ss.sysu.edu.cn/ ll/project_objgrammar.html
Copyright 2015 Shiroyagi Corporation. All rights reserved. 58
統計モデリングツール(Roofit/RooStat)
Copyright 2015 Shiroyagi Corporation. All rights reserved. 59
RooStat
複数のモデルを組み合わせるためのフレームワーク
Copyright 2015 Shiroyagi Corporation. All rights reserved. 60
分析の最終段階であらゆる誤差を組み合わせることができる
Copyright 2015 Shiroyagi Corporation. All rights reserved. 61
http://tmva.sourceforge.net/docu/TMVAUsersGuide.pdf
機械学習(TMVA)
Copyright 2015 Shiroyagi Corporation. All rights reserved. 62
機械学習(TMVA)
かなりHEPに特化している&しばらくメンテされてない?
Copyright 2015 Shiroyagi Corporation. All rights reserved. 63
ところで今日はオープンデータ祭り、
ですね
Copyright 2015 Shiroyagi Corporation. All rights reserved. 64
The Higgs ML challenge
Copyright 2015 Shiroyagi Corporation. All rights reserved. 65
The Higgs ML challenge
Copyright 2015 Shiroyagi Corporation. All rights reserved. 66
Copyright 2015 Shiroyagi Corporation. All rights reserved. 67
よく使われるのは
s/sqrt(b)
シグナルを増やし、

ノイズをコントロール
Copyright 2015 Shiroyagi Corporation. All rights reserved. 68
The Higgs ML challenge: Leader Board
Copyright 2015 Shiroyagi Corporation. All rights reserved. 69
The Higgs ML challenge
今までより
10%向上
Copyright 2015 Shiroyagi Corporation. All rights reserved. 70
http://opendata.cern.ch/collection/ATLAS-Higgs-Challenge-2014
Copyright 2015 Shiroyagi Corporation. All rights reserved. 71
CERNのオープンデータの取り組み
データ出してるの
はCMSだけ:
AODレベルデータ
も公開している
開発環境も
提供していて、バ
イナリフォーマッ
トの読み込みがで
きる
Copyright 2015 Shiroyagi Corporation. All rights reserved. 72
Copyright 2015 Shiroyagi Corporation. All rights reserved. 73
Copyright 2015 Shiroyagi Corporation. All rights reserved. 74
Copyright 2015 Shiroyagi Corporation. All rights reserved. 75
Copyright 2014 Shiroyagi Corporation. All rights reserved. 76
Copyright 2014 Shiroyagi Corporation. All rights reserved. 77
Copyright 2014 Shiroyagi Corporation. All rights reserved. 78
Copyright 2014 Shiroyagi Corporation. All rights reserved. 79

Contenu connexe

Tendances

人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~
人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~
人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~Rakuten Group, Inc.
 
Pythonではじめる OpenAI Gymトレーニング
Pythonではじめる OpenAI GymトレーニングPythonではじめる OpenAI Gymトレーニング
Pythonではじめる OpenAI GymトレーニングTakahiro Kubo
 
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~Recruit Technologies
 
vCenter Operations Management Suite 検証支援プログラム結果報告とその後
 vCenter Operations Management Suite 検証支援プログラム結果報告とその後 vCenter Operations Management Suite 検証支援プログラム結果報告とその後
vCenter Operations Management Suite 検証支援プログラム結果報告とその後Recruit Technologies
 
営業向け ABテストの統計学 データアーティスト
営業向け ABテストの統計学 データアーティスト営業向け ABテストの統計学 データアーティスト
営業向け ABテストの統計学 データアーティストSatoru Yamamoto
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標圭輔 大曽根
 
3万人が利用するリクルートのワイヤレス環境 ~リアクティブからプロアクティブへ~
3万人が利用するリクルートのワイヤレス環境 ~リアクティブからプロアクティブへ~3万人が利用するリクルートのワイヤレス環境 ~リアクティブからプロアクティブへ~
3万人が利用するリクルートのワイヤレス環境 ~リアクティブからプロアクティブへ~Recruit Technologies
 
リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例Tetsutaro Watanabe
 
植物の画像解析の実例
植物の画像解析の実例植物の画像解析の実例
植物の画像解析の実例LPIXEL
 
医療×Itカンファレンス 150207
医療×Itカンファレンス 150207医療×Itカンファレンス 150207
医療×Itカンファレンス 150207LPIXEL
 
SIGSPATIAL 2020 参加報告資料
SIGSPATIAL 2020 参加報告資料SIGSPATIAL 2020 参加報告資料
SIGSPATIAL 2020 参加報告資料Tomoki Saito
 
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-Recruit Technologies
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介Recruit Technologies
 
データ中心の時代を生き抜くエンジニアに知ってほしい10?のこと
データ中心の時代を生き抜くエンジニアに知ってほしい10?のことデータ中心の時代を生き抜くエンジニアに知ってほしい10?のこと
データ中心の時代を生き抜くエンジニアに知ってほしい10?のことHideo Terada
 

Tendances (20)

人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~
人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~
人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~
 
Googleアシスタントアプリ実際のところ
Googleアシスタントアプリ実際のところ Googleアシスタントアプリ実際のところ
Googleアシスタントアプリ実際のところ
 
Pythonではじめる OpenAI Gymトレーニング
Pythonではじめる OpenAI GymトレーニングPythonではじめる OpenAI Gymトレーニング
Pythonではじめる OpenAI Gymトレーニング
 
Sano hmm 20150512
Sano hmm 20150512Sano hmm 20150512
Sano hmm 20150512
 
Spring “BigData”
Spring “BigData”Spring “BigData”
Spring “BigData”
 
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~
運用で泣かないアーキテクチャで動く原稿作成支援システム ~リクルートにおけるDeepLearning活用事例~
 
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
 
vCenter Operations Management Suite 検証支援プログラム結果報告とその後
 vCenter Operations Management Suite 検証支援プログラム結果報告とその後 vCenter Operations Management Suite 検証支援プログラム結果報告とその後
vCenter Operations Management Suite 検証支援プログラム結果報告とその後
 
営業向け ABテストの統計学 データアーティスト
営業向け ABテストの統計学 データアーティスト営業向け ABテストの統計学 データアーティスト
営業向け ABテストの統計学 データアーティスト
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
 
3万人が利用するリクルートのワイヤレス環境 ~リアクティブからプロアクティブへ~
3万人が利用するリクルートのワイヤレス環境 ~リアクティブからプロアクティブへ~3万人が利用するリクルートのワイヤレス環境 ~リアクティブからプロアクティブへ~
3万人が利用するリクルートのワイヤレス環境 ~リアクティブからプロアクティブへ~
 
リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例
 
植物の画像解析の実例
植物の画像解析の実例植物の画像解析の実例
植物の画像解析の実例
 
医療×Itカンファレンス 150207
医療×Itカンファレンス 150207医療×Itカンファレンス 150207
医療×Itカンファレンス 150207
 
SIGSPATIAL 2020 参加報告資料
SIGSPATIAL 2020 参加報告資料SIGSPATIAL 2020 参加報告資料
SIGSPATIAL 2020 参加報告資料
 
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
 
アプリのプロダクトマネージャーからみるScrum開発
アプリのプロダクトマネージャーからみるScrum開発アプリのプロダクトマネージャーからみるScrum開発
アプリのプロダクトマネージャーからみるScrum開発
 
YJTC18 Keynote Shape the Future - through the Power of Technology
YJTC18 Keynote Shape the Future - through the Power of TechnologyYJTC18 Keynote Shape the Future - through the Power of Technology
YJTC18 Keynote Shape the Future - through the Power of Technology
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
 
データ中心の時代を生き抜くエンジニアに知ってほしい10?のこと
データ中心の時代を生き抜くエンジニアに知ってほしい10?のことデータ中心の時代を生き抜くエンジニアに知ってほしい10?のこと
データ中心の時代を生き抜くエンジニアに知ってほしい10?のこと
 

En vedette

SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)pinmarch_t Tada
 
The LHC Explained by CNN
The LHC Explained by CNNThe LHC Explained by CNN
The LHC Explained by CNNAkira Shibata
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)Takanori Ogata
 
Improving ip geolocation using query logs
Improving ip geolocation using query logsImproving ip geolocation using query logs
Improving ip geolocation using query logsKoichiro Kondo
 
オークション理論と実証入門
オークション理論と実証入門オークション理論と実証入門
オークション理論と実証入門Kazuki Baba
 
Rで塩基配列を扱う方法
Rで塩基配列を扱う方法Rで塩基配列を扱う方法
Rで塩基配列を扱う方法Haruka Ozaki
 
Kashiwa.R#9 Rでゲノム解析
Kashiwa.R#9 Rでゲノム解析Kashiwa.R#9 Rでゲノム解析
Kashiwa.R#9 Rでゲノム解析Haruka Ozaki
 
Rでゲノム上の区間データを扱う話 (15.09.05 WACODE 2nd)
Rでゲノム上の区間データを扱う話 (15.09.05 WACODE 2nd)Rでゲノム上の区間データを扱う話 (15.09.05 WACODE 2nd)
Rでゲノム上の区間データを扱う話 (15.09.05 WACODE 2nd)Haruka Ozaki
 
Analysis Software Development
Analysis Software DevelopmentAnalysis Software Development
Analysis Software DevelopmentAkira Shibata
 
Top Cross Section Measurement
Top Cross Section MeasurementTop Cross Section Measurement
Top Cross Section MeasurementAkira Shibata
 
SIer出身者を採用したい非SI経験+採用責任者の叫び
SIer出身者を採用したい非SI経験+採用責任者の叫びSIer出身者を採用したい非SI経験+採用責任者の叫び
SIer出身者を採用したい非SI経験+採用責任者の叫び真一 藤川
 
Application Logging With Logstash
Application Logging With LogstashApplication Logging With Logstash
Application Logging With Logstashbenwaine
 
可視化周辺の進化がヤヴァイ 〜2016〜
可視化周辺の進化がヤヴァイ 〜2016〜可視化周辺の進化がヤヴァイ 〜2016〜
可視化周辺の進化がヤヴァイ 〜2016〜Takashi Kitano
 
PyData NYC by Akira Shibata
PyData NYC by Akira ShibataPyData NYC by Akira Shibata
PyData NYC by Akira ShibataAkira Shibata
 
ドラえもんでわかる統計的因果推論 #TokyoR
ドラえもんでわかる統計的因果推論 #TokyoRドラえもんでわかる統計的因果推論 #TokyoR
ドラえもんでわかる統計的因果推論 #TokyoRShuyo Nakatani
 

En vedette (20)

SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
 
The LHC Explained by CNN
The LHC Explained by CNNThe LHC Explained by CNN
The LHC Explained by CNN
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
 
Improving ip geolocation using query logs
Improving ip geolocation using query logsImproving ip geolocation using query logs
Improving ip geolocation using query logs
 
オープンサイエンスとオープンデータ
オープンサイエンスとオープンデータオープンサイエンスとオープンデータ
オープンサイエンスとオープンデータ
 
オークション理論と実証入門
オークション理論と実証入門オークション理論と実証入門
オークション理論と実証入門
 
Rで塩基配列を扱う方法
Rで塩基配列を扱う方法Rで塩基配列を扱う方法
Rで塩基配列を扱う方法
 
Kashiwa.R#9 Rでゲノム解析
Kashiwa.R#9 Rでゲノム解析Kashiwa.R#9 Rでゲノム解析
Kashiwa.R#9 Rでゲノム解析
 
Rでゲノム上の区間データを扱う話 (15.09.05 WACODE 2nd)
Rでゲノム上の区間データを扱う話 (15.09.05 WACODE 2nd)Rでゲノム上の区間データを扱う話 (15.09.05 WACODE 2nd)
Rでゲノム上の区間データを扱う話 (15.09.05 WACODE 2nd)
 
Analysis Software Development
Analysis Software DevelopmentAnalysis Software Development
Analysis Software Development
 
Top Cross Section Measurement
Top Cross Section MeasurementTop Cross Section Measurement
Top Cross Section Measurement
 
SIer出身者を採用したい非SI経験+採用責任者の叫び
SIer出身者を採用したい非SI経験+採用責任者の叫びSIer出身者を採用したい非SI経験+採用責任者の叫び
SIer出身者を採用したい非SI経験+採用責任者の叫び
 
Mutation and DNA repair
Mutation and DNA repairMutation and DNA repair
Mutation and DNA repair
 
Mol evolution
Mol evolutionMol evolution
Mol evolution
 
Application Logging With Logstash
Application Logging With LogstashApplication Logging With Logstash
Application Logging With Logstash
 
可視化周辺の進化がヤヴァイ 〜2016〜
可視化周辺の進化がヤヴァイ 〜2016〜可視化周辺の進化がヤヴァイ 〜2016〜
可視化周辺の進化がヤヴァイ 〜2016〜
 
LHC for Students
LHC for StudentsLHC for Students
LHC for Students
 
20150128 cross2015
20150128 cross201520150128 cross2015
20150128 cross2015
 
PyData NYC by Akira Shibata
PyData NYC by Akira ShibataPyData NYC by Akira Shibata
PyData NYC by Akira Shibata
 
ドラえもんでわかる統計的因果推論 #TokyoR
ドラえもんでわかる統計的因果推論 #TokyoRドラえもんでわかる統計的因果推論 #TokyoR
ドラえもんでわかる統計的因果推論 #TokyoR
 

Similaire à LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)

第26回八子クラウド座談会当日メモ付き_20180407
第26回八子クラウド座談会当日メモ付き_20180407第26回八子クラウド座談会当日メモ付き_20180407
第26回八子クラウド座談会当日メモ付き_20180407知礼 八子
 
Webデザイン入門2-HTML5 フォーム,映像再生,音声再生, CSS3, レスポンシブWebデザイン-
Webデザイン入門2-HTML5 フォーム,映像再生,音声再生, CSS3, レスポンシブWebデザイン-Webデザイン入門2-HTML5 フォーム,映像再生,音声再生, CSS3, レスポンシブWebデザイン-
Webデザイン入門2-HTML5 フォーム,映像再生,音声再生, CSS3, レスポンシブWebデザイン-Yossy Taka
 
高速処理と高信頼性を両立し、ペタバイト級の多種大量データを蓄積する、ビッグデータ/ IoT時代のデータベースとは??
高速処理と高信頼性を両立し、ペタバイト級の多種大量データを蓄積する、ビッグデータ/ IoT時代のデータベースとは??高速処理と高信頼性を両立し、ペタバイト級の多種大量データを蓄積する、ビッグデータ/ IoT時代のデータベースとは??
高速処理と高信頼性を両立し、ペタバイト級の多種大量データを蓄積する、ビッグデータ/ IoT時代のデータベースとは??griddb
 
Towards Performant Video Recognition
Towards Performant Video RecognitionTowards Performant Video Recognition
Towards Performant Video Recognitioncvpaper. challenge
 
【Cisco Data Center Forum 2015】 生活者シングルソースデータ「ACR/ex」と新ASPサービス「VR-CIP」が提供する顧客価値
【Cisco Data Center Forum 2015】 生活者シングルソースデータ「ACR/ex」と新ASPサービス「VR-CIP」が提供する顧客価値【Cisco Data Center Forum 2015】 生活者シングルソースデータ「ACR/ex」と新ASPサービス「VR-CIP」が提供する顧客価値
【Cisco Data Center Forum 2015】 生活者シングルソースデータ「ACR/ex」と新ASPサービス「VR-CIP」が提供する顧客価値シスコシステムズ合同会社
 
リモートチームとふりかえり改善フレームワーク
リモートチームとふりかえり改善フレームワークリモートチームとふりかえり改善フレームワーク
リモートチームとふりかえり改善フレームワークMaehana Tsuyoshi
 
JDLA主催「CVPR2023技術報告会」発表資料
JDLA主催「CVPR2023技術報告会」発表資料JDLA主催「CVPR2023技術報告会」発表資料
JDLA主催「CVPR2023技術報告会」発表資料Morpho, Inc.
 
モデリングの彼方に未来を見た
モデリングの彼方に未来を見たモデリングの彼方に未来を見た
モデリングの彼方に未来を見たHagimoto Junzo
 
Itエンジニアとして身に付けるべきビジネス&プロジェクト・デザイン
Itエンジニアとして身に付けるべきビジネス&プロジェクト・デザインItエンジニアとして身に付けるべきビジネス&プロジェクト・デザイン
Itエンジニアとして身に付けるべきビジネス&プロジェクト・デザインHagimoto Junzo
 
Miu紹介最新版20130711
Miu紹介最新版20130711Miu紹介最新版20130711
Miu紹介最新版20130711Jun Imai
 
Rancher Virtual Rodeo Japan 2020/04「初回編」
Rancher Virtual Rodeo Japan 2020/04「初回編」Rancher Virtual Rodeo Japan 2020/04「初回編」
Rancher Virtual Rodeo Japan 2020/04「初回編」Junji Nishihara
 
ATTA2014基盤B導入(片桐)
ATTA2014基盤B導入(片桐)ATTA2014基盤B導入(片桐)
ATTA2014基盤B導入(片桐)Takahiro Katagiri
 
JavaからAkkaハンズオン
JavaからAkkaハンズオンJavaからAkkaハンズオン
JavaからAkkaハンズオンTIS Inc.
 
2015年5月期 AITCオープンラボ 「第二回 デジタルガジェット祭り!」
2015年5月期 AITCオープンラボ 「第二回 デジタルガジェット祭り!」2015年5月期 AITCオープンラボ 「第二回 デジタルガジェット祭り!」
2015年5月期 AITCオープンラボ 「第二回 デジタルガジェット祭り!」aitc_jp
 
第29回八子クラウド座談会(当日討議メモ付き) 20181215
第29回八子クラウド座談会(当日討議メモ付き) 20181215第29回八子クラウド座談会(当日討議メモ付き) 20181215
第29回八子クラウド座談会(当日討議メモ付き) 20181215知礼 八子
 
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアルリクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアルRecruit Technologies
 
ナレッジを共有する文化をつくるために
ナレッジを共有する文化をつくるためにナレッジを共有する文化をつくるために
ナレッジを共有する文化をつくるためにRecruit Lifestyle Co., Ltd.
 
Startup science 2018 4 ビジネスモデルの型とPlanAの作成
Startup science 2018 4 ビジネスモデルの型とPlanAの作成Startup science 2018 4 ビジネスモデルの型とPlanAの作成
Startup science 2018 4 ビジネスモデルの型とPlanAの作成Masa Tadokoro
 
八子クラウド座談会 当日討議メモ付き資料 20180721
八子クラウド座談会 当日討議メモ付き資料 20180721八子クラウド座談会 当日討議メモ付き資料 20180721
八子クラウド座談会 当日討議メモ付き資料 20180721知礼 八子
 

Similaire à LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT) (20)

第26回八子クラウド座談会当日メモ付き_20180407
第26回八子クラウド座談会当日メモ付き_20180407第26回八子クラウド座談会当日メモ付き_20180407
第26回八子クラウド座談会当日メモ付き_20180407
 
Webデザイン入門2-HTML5 フォーム,映像再生,音声再生, CSS3, レスポンシブWebデザイン-
Webデザイン入門2-HTML5 フォーム,映像再生,音声再生, CSS3, レスポンシブWebデザイン-Webデザイン入門2-HTML5 フォーム,映像再生,音声再生, CSS3, レスポンシブWebデザイン-
Webデザイン入門2-HTML5 フォーム,映像再生,音声再生, CSS3, レスポンシブWebデザイン-
 
高速処理と高信頼性を両立し、ペタバイト級の多種大量データを蓄積する、ビッグデータ/ IoT時代のデータベースとは??
高速処理と高信頼性を両立し、ペタバイト級の多種大量データを蓄積する、ビッグデータ/ IoT時代のデータベースとは??高速処理と高信頼性を両立し、ペタバイト級の多種大量データを蓄積する、ビッグデータ/ IoT時代のデータベースとは??
高速処理と高信頼性を両立し、ペタバイト級の多種大量データを蓄積する、ビッグデータ/ IoT時代のデータベースとは??
 
Towards Performant Video Recognition
Towards Performant Video RecognitionTowards Performant Video Recognition
Towards Performant Video Recognition
 
【Cisco Data Center Forum 2015】 生活者シングルソースデータ「ACR/ex」と新ASPサービス「VR-CIP」が提供する顧客価値
【Cisco Data Center Forum 2015】 生活者シングルソースデータ「ACR/ex」と新ASPサービス「VR-CIP」が提供する顧客価値【Cisco Data Center Forum 2015】 生活者シングルソースデータ「ACR/ex」と新ASPサービス「VR-CIP」が提供する顧客価値
【Cisco Data Center Forum 2015】 生活者シングルソースデータ「ACR/ex」と新ASPサービス「VR-CIP」が提供する顧客価値
 
リモートチームとふりかえり改善フレームワーク
リモートチームとふりかえり改善フレームワークリモートチームとふりかえり改善フレームワーク
リモートチームとふりかえり改善フレームワーク
 
JDLA主催「CVPR2023技術報告会」発表資料
JDLA主催「CVPR2023技術報告会」発表資料JDLA主催「CVPR2023技術報告会」発表資料
JDLA主催「CVPR2023技術報告会」発表資料
 
モデリングの彼方に未来を見た
モデリングの彼方に未来を見たモデリングの彼方に未来を見た
モデリングの彼方に未来を見た
 
Itエンジニアとして身に付けるべきビジネス&プロジェクト・デザイン
Itエンジニアとして身に付けるべきビジネス&プロジェクト・デザインItエンジニアとして身に付けるべきビジネス&プロジェクト・デザイン
Itエンジニアとして身に付けるべきビジネス&プロジェクト・デザイン
 
ICRA 2018 速報
ICRA 2018 速報ICRA 2018 速報
ICRA 2018 速報
 
Miu紹介最新版20130711
Miu紹介最新版20130711Miu紹介最新版20130711
Miu紹介最新版20130711
 
Rancher Virtual Rodeo Japan 2020/04「初回編」
Rancher Virtual Rodeo Japan 2020/04「初回編」Rancher Virtual Rodeo Japan 2020/04「初回編」
Rancher Virtual Rodeo Japan 2020/04「初回編」
 
ATTA2014基盤B導入(片桐)
ATTA2014基盤B導入(片桐)ATTA2014基盤B導入(片桐)
ATTA2014基盤B導入(片桐)
 
JavaからAkkaハンズオン
JavaからAkkaハンズオンJavaからAkkaハンズオン
JavaからAkkaハンズオン
 
2015年5月期 AITCオープンラボ 「第二回 デジタルガジェット祭り!」
2015年5月期 AITCオープンラボ 「第二回 デジタルガジェット祭り!」2015年5月期 AITCオープンラボ 「第二回 デジタルガジェット祭り!」
2015年5月期 AITCオープンラボ 「第二回 デジタルガジェット祭り!」
 
第29回八子クラウド座談会(当日討議メモ付き) 20181215
第29回八子クラウド座談会(当日討議メモ付き) 20181215第29回八子クラウド座談会(当日討議メモ付き) 20181215
第29回八子クラウド座談会(当日討議メモ付き) 20181215
 
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアルリクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
 
ナレッジを共有する文化をつくるために
ナレッジを共有する文化をつくるためにナレッジを共有する文化をつくるために
ナレッジを共有する文化をつくるために
 
Startup science 2018 4 ビジネスモデルの型とPlanAの作成
Startup science 2018 4 ビジネスモデルの型とPlanAの作成Startup science 2018 4 ビジネスモデルの型とPlanAの作成
Startup science 2018 4 ビジネスモデルの型とPlanAの作成
 
八子クラウド座談会 当日討議メモ付き資料 20180721
八子クラウド座談会 当日討議メモ付き資料 20180721八子クラウド座談会 当日討議メモ付き資料 20180721
八子クラウド座談会 当日討議メモ付き資料 20180721
 

Plus de Akira Shibata

大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さんAkira Shibata
 
W&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdfW&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdfAkira Shibata
 
20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdf20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdfAkira Shibata
 
W&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdfW&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdfAkira Shibata
 
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdfmakoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdfAkira Shibata
 
LLM Webinar - シバタアキラ to share.pdf
LLM Webinar - シバタアキラ to share.pdfLLM Webinar - シバタアキラ to share.pdf
LLM Webinar - シバタアキラ to share.pdfAkira Shibata
 
Kaggle and data science
Kaggle and data scienceKaggle and data science
Kaggle and data scienceAkira Shibata
 
人工知能をビジネスに活かす
人工知能をビジネスに活かす人工知能をビジネスに活かす
人工知能をビジネスに活かすAkira Shibata
 
PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1Akira Shibata
 
20141127 py datatokyomeetup2
20141127 py datatokyomeetup220141127 py datatokyomeetup2
20141127 py datatokyomeetup2Akira Shibata
 
Analysis Software Benchmark
Analysis Software BenchmarkAnalysis Software Benchmark
Analysis Software BenchmarkAkira Shibata
 
Top quark physics at the LHC
Top quark physics at the LHCTop quark physics at the LHC
Top quark physics at the LHCAkira Shibata
 

Plus de Akira Shibata (14)

大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
 
W&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdfW&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdf
 
20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdf20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdf
 
W&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdfW&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdf
 
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdfmakoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
 
LLM Webinar - シバタアキラ to share.pdf
LLM Webinar - シバタアキラ to share.pdfLLM Webinar - シバタアキラ to share.pdf
LLM Webinar - シバタアキラ to share.pdf
 
W&B Seminar #4.pdf
W&B Seminar #4.pdfW&B Seminar #4.pdf
W&B Seminar #4.pdf
 
Kaggle and data science
Kaggle and data scienceKaggle and data science
Kaggle and data science
 
Data x
Data xData x
Data x
 
人工知能をビジネスに活かす
人工知能をビジネスに活かす人工知能をビジネスに活かす
人工知能をビジネスに活かす
 
PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1
 
20141127 py datatokyomeetup2
20141127 py datatokyomeetup220141127 py datatokyomeetup2
20141127 py datatokyomeetup2
 
Analysis Software Benchmark
Analysis Software BenchmarkAnalysis Software Benchmark
Analysis Software Benchmark
 
Top quark physics at the LHC
Top quark physics at the LHCTop quark physics at the LHC
Top quark physics at the LHC
 

LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)

  • 1. Copyright 2014 Shiroyagi Corporation. All rights reserved. シバタアキラ, Ph.D. LHCにおける素粒子
 ビッグデータの解析と ROOTライブラリ 白ヤギコーポレーション Tokyo Web Mining #45
  • 2. Ex LHC Physicist, now CEO Akira Shibata (シバタアキラ), PhD. @madyagi • 2013 -:CEO @Shiroyagi Corporation • Kamelio : News curation that learns your interests • Kamelio API: Contents Recommendation API • 2010 - 2013: Strategy Consulting @BCG • 2007 - 2010: Data Scientist @NYU • Statistical tools for Higgs discovery @LHC, CERN • 2004 - 2007: Ph.D. HEP @London University
  • 3. Copyright 2014 Shiroyagi Corporation. All rights reserved. 3
  • 4. Copyright 2014 Shiroyagi Corporation. All rights reserved. 4
  • 5. Copyright 2014 Shiroyagi Corporation. All rights reserved. 5
  • 6. Copyright 2014 Shiroyagi Corporation. All rights reserved. 6 PyData.Tokyoかなり盛り上がってます
  • 7. -報道関係者様向け資料- PyData.Tokyo これまでの活動 30人の座席にに毎回百人近い応募 • ディープラーニング • 分散型機械学習 • データ解析インフラ などの旬なテーマを扱い、毎回その 分野で活躍するデータサイエンティ ストにご登壇いただいています。 例えば、第一回は東京大学で深層学 習研究をしている中山先生。次回は ブレインパッドの佐藤さんをお招き します。 http://pydatatokyo.connpass.com
  • 9. Copyright 2014 Shiroyagi Corporation. All rights reserved. 9 aial.connpass.comもよろしく
  • 10. Copyright 2014 Shiroyagi Corporation. All rights reserved. 10 これも出ます
  • 11. Copyright 2014 Shiroyagi Corporation. All rights reserved. 11 これも出ます
  • 13. Copyright 2015 Shiroyagi Corporation. All rights reserved. • HEPが浮世のデータ分析とどう違う • ATLASというさらに狭い世界の話 → でも多分いろんな意味でHEPの縮図 • 多分、中に入りすぎてたので、ちょっと細かい話とか多いかも → つまらなかったら言ってね • 理論は当時からあんまりわかっていませんでした今はもっとわからないです • 今回の登壇に際してちょっとリサーチしました → 相変わらず・・ • オープンデータはあまりありませんでした 13 本日お話したいこと 引退してから5年経ったので、お手柔らかに
  • 14. Copyright 2015 Shiroyagi Corporation. All rights reserved. 14 2012年7月2日
  • 15. Copyright 2015 Shiroyagi Corporation. All rights reserved. 15 物理をやってた頃の私
  • 16. Copyright 2015 Shiroyagi Corporation. All rights reserved. 16 データ量はfb^-1で 測ります?? 重さはGeVで 測ります??
  • 17. Copyright 2015 Shiroyagi Corporation. All rights reserved. 17 10fb-1 = 100PB??
  • 18. Copyright 2015 Shiroyagi Corporation. All rights reserved. 18 Elastic Scattering(弾性散乱) 入った粒子が出てくるだけ、ただし力学的特徴が異なる(角度とか)
  • 19. Copyright 2015 Shiroyagi Corporation. All rights reserved. 19 散乱断面積(Cross Section)
  • 20. Copyright 2015 Shiroyagi Corporation. All rights reserved. 20 断面が小さい→Inelastic Scattering 出てくる粒子が、入る粒子と違うのがInelastic
 Elasticより小さい断面をめがけて衝突→反応確率は比例して小さい
  • 21. Copyright 2015 Shiroyagi Corporation. All rights reserved. 21 更には、新しい粒子が作られる ビームのエネルギー は合計7 8TeV 高いエネルギーの交換の発生確率は更に低い = 更に小さいエリアをめがけて何回も衝突させなくてはならない E=mc2 それだけ大きいエネルギーが必要
  • 22. Copyright 2015 Shiroyagi Corporation. All rights reserved. 22 E=mc2 ; m= E/c2 重さの単位は ev/c2 多くの場合c2は省 略される(c=1) 「素」粒子と言いながら重さは幅広い 陽子・中性子は約1GeV
  • 23. Copyright 2015 Shiroyagi Corporation. All rights reserved. 23 ほぼ陽子の重さ (LHCのビーム) ほぼヒッグス の重さ ヒッグスを作るのは錬金術に近い
  • 24. Copyright 2015 Shiroyagi Corporation. All rights reserved. 24 素粒子の散乱断面積は小さい Inelastic Total: 108 nb Higgs Boson: 10 pb ただし、最終的に綺麗に見え るものはもっと少ない
  • 25. Copyright 2015 Shiroyagi Corporation. All rights reserved. 25 山手線並みのスケールのビームパイプ ここにいました
  • 26. Copyright 2015 Shiroyagi Corporation. All rights reserved. 26
  • 27. Copyright 2015 Shiroyagi Corporation. All rights reserved. 27 ほとんどは、粒子の進路を曲げるdipoleマグネット
  • 28. Copyright 2015 Shiroyagi Corporation. All rights reserved. 28 Luminosityを上げるのがquadrupole
  • 29. Copyright 2015 Shiroyagi Corporation. All rights reserved. 29 面積はbで測る、データはb-1で測る b=10-24cm2 • 108nb=10-25cm2 • 10pb=10-35cm2 • 1fb=10-39cm2 Cross Section Beam Luminosity N L=N/cm-2 • 10fb-1=10x1039cm-2 • 10fb-1=10x1039cm-2 1015 105 x = 1つの衝突が生データで1.6MB、分析レベルで0.1 0.5MB 1015x1.6MB = 1,600,000PB = 1,600EB!!
  • 30. 100PB in three years
  • 31. Copyright 2015 Shiroyagi Corporation. All rights reserved. 31 検出器=トラッカー+カロリーメーター トラッカー (位置を計測する) カロリーメーター (エネルギーを計測する) トラッカー (位置を計測する)
  • 32. Copyright 2015 Shiroyagi Corporation. All rights reserved. 32 データが出てきたらまずは捨てる:トリガー 0.25% 0.008% 0.0006% 99.9995%は1秒以内に捨てる
  • 33. Copyright 2015 Shiroyagi Corporation. All rights reserved. 33 データ(イベント)は少しずつ再構築される 計測値 (生データ) クラスに分れた 電気信号の行列 検出器レベル (ESD) 観測された位置、 方向や エネルギーの値 物理レベル (AOD) 観測された粒子 レベルの情報 分析レベル (DPD) 最終的な分析に 必要な部分だけ 取り出した情報 トリガーレベル 簡易版の物理構築 イベント選択 に使ってあと は捨てる 統計分析 様々なフォーマットがあり、かなり戸惑う しかもメモリとディスクで表現が違ったりしてスキーマが直ぐ死ぬ オンライン オフライン
  • 34. Copyright 2015 Shiroyagi Corporation. All rights reserved. 34 GRID < クラウドコンピューティング Gridはイベントの再構築とDPDの生成のために使われる 分析は分散に向いているが、ほとんどローカルで行われる
  • 35. Copyright 2015 Shiroyagi Corporation. All rights reserved. 35 GRID < クラウドコンピューティング 世界の大学や研究機関に3つのTierで配置されている • T0: CERNのこと。全体の20%位のキャパを有する • T1: 特に大きな研究所 - 生データのレプリカがある。
   分担してイベント再構築を行い、ESDを作る • T2: 結構いろんな大学にある。
   主にシミュレーションと、AOD→DPDを行う • T3: ローカル環境のこと
  • 36. Copyright 2015 Shiroyagi Corporation. All rights reserved. 36 CERNはインターネットは生み出したが・・・
  • 37. Copyright 2015 Shiroyagi Corporation. All rights reserved. 37 素粒子の実験は常にビッグデータの先端を走っていたが、イ ンターネットが発達した2000年代からは、データ量でWeb に抜かされ、技術の先端もそっちに移った感が強い • データの取扱いはファイルベースのみ • データの処理はプロセスレベルより細分化されない • 「クラウド」は巨大なバッチキュー • プログラムはシングルスレッド • 開発はFortranとC++とPythonがちょっと • 機械学習は「使ってる人もいる」くらい 自らの発明に先を越される
  • 38. Copyright 2015 Shiroyagi Corporation. All rights reserved. 38 おりしも、CHEPが今週開催されていた
  • 39. Copyright 2015 Shiroyagi Corporation. All rights reserved. 39
  • 40. Copyright 2015 Shiroyagi Corporation. All rights reserved. 40 最終的に分析とは何をするの? オブジェクトレベル イベントレベル 分析(統計)レベル • 計測値の補正を行う • オブジェクトIDの精度を上げる • S/B判別の素性を作る • シグナルイベントの選択 • イベント数を数える • シミュレーションとの比較 • 計測誤差の推定 • 統計的誤差 • 検出器による誤差 • アルゴリズムによる誤差 • 理論による誤差
  • 41. Copyright 2015 Shiroyagi Corporation. All rights reserved. 41 ROOTってなに? つまり: HEP物理学者が必要とするツー ルを雑多に詰め込んだOOデー タ解析ライブラリ 結構長く使われているので、ド キュメントはわるくない データの保存とIO ヒストグラムなど可視化 統計モデリングツール (Roofit/RooStat) 機械学習(TMVA) インタラクティブ環境 オープンソースライブラリ
  • 42. Copyright 2015 Shiroyagi Corporation. All rights reserved. 42 インタラクティブ環境 もともとCINTというC/C++のReplだったが、最近
 clangベースになって、clingになった、いい感じ
  • 43. Copyright 2015 Shiroyagi Corporation. All rights reserved. 43 インタラクティブ環境 10年前は Advanced だったのかも
  • 44. Copyright 2015 Shiroyagi Corporation. All rights reserved. 44 データの保存とIO DBより少し賢いTTree形式 • イベントごとにループを回し ながらデータを取得できる • オブジェクトを書き出すこと ができる(ptrも) • ORMなしでいきなりオブジェ クトになってる テーブル型データとは互換性低 • Ntupleと呼ばれる
  • 45. Copyright 2015 Shiroyagi Corporation. All rights reserved. 45 ヒストグラムなど可視化 かなり自由自在、matplotlibとかよりだいぶいいです
  • 46. Copyright 2015 Shiroyagi Corporation. All rights reserved. 46 ヒストグラムなど可視化
  • 47. Copyright 2015 Shiroyagi Corporation. All rights reserved. 47 ヒストグラムなど可視化
  • 48. Copyright 2015 Shiroyagi Corporation. All rights reserved. 48 統計モデリングツール(Roofit/RooStat) ROOTの中でも最もよく知られているアルゴリズム
  • 49. Copyright 2015 Shiroyagi Corporation. All rights reserved. 49 統計モデリングツール(Roofit/RooStat) 統計的因果推論のモデリング&生成ツール
  • 50. Copyright 2015 Shiroyagi Corporation. All rights reserved. 50 我々はいつ「発見」するのか(2010年)
  • 51. Copyright 2015 Shiroyagi Corporation. All rights reserved. 51 2011年
  • 52. Copyright 2015 Shiroyagi Corporation. All rights reserved. 52 2012年
  • 53. Copyright 2015 Shiroyagi Corporation. All rights reserved. 53
  • 54. Copyright 2015 Shiroyagi Corporation. All rights reserved. 54
  • 55. Copyright 2015 Shiroyagi Corporation. All rights reserved. 55
  • 56. Copyright 2015 Shiroyagi Corporation. All rights reserved. 56
  • 57. Copyright 2015 Shiroyagi Corporation. All rights reserved. 57 画像認識などでも応用される技術 http://ss.sysu.edu.cn/ ll/files/lin_sketchrecognition_emmcvpr07.pdf http://ss.sysu.edu.cn/ ll/project_objgrammar.html
  • 58. Copyright 2015 Shiroyagi Corporation. All rights reserved. 58 統計モデリングツール(Roofit/RooStat)
  • 59. Copyright 2015 Shiroyagi Corporation. All rights reserved. 59 RooStat 複数のモデルを組み合わせるためのフレームワーク
  • 60. Copyright 2015 Shiroyagi Corporation. All rights reserved. 60 分析の最終段階であらゆる誤差を組み合わせることができる
  • 61. Copyright 2015 Shiroyagi Corporation. All rights reserved. 61 http://tmva.sourceforge.net/docu/TMVAUsersGuide.pdf 機械学習(TMVA)
  • 62. Copyright 2015 Shiroyagi Corporation. All rights reserved. 62 機械学習(TMVA) かなりHEPに特化している&しばらくメンテされてない?
  • 63. Copyright 2015 Shiroyagi Corporation. All rights reserved. 63 ところで今日はオープンデータ祭り、 ですね
  • 64. Copyright 2015 Shiroyagi Corporation. All rights reserved. 64 The Higgs ML challenge
  • 65. Copyright 2015 Shiroyagi Corporation. All rights reserved. 65 The Higgs ML challenge
  • 66. Copyright 2015 Shiroyagi Corporation. All rights reserved. 66
  • 67. Copyright 2015 Shiroyagi Corporation. All rights reserved. 67 よく使われるのは s/sqrt(b) シグナルを増やし、
 ノイズをコントロール
  • 68. Copyright 2015 Shiroyagi Corporation. All rights reserved. 68 The Higgs ML challenge: Leader Board
  • 69. Copyright 2015 Shiroyagi Corporation. All rights reserved. 69 The Higgs ML challenge 今までより 10%向上
  • 70. Copyright 2015 Shiroyagi Corporation. All rights reserved. 70 http://opendata.cern.ch/collection/ATLAS-Higgs-Challenge-2014
  • 71. Copyright 2015 Shiroyagi Corporation. All rights reserved. 71 CERNのオープンデータの取り組み データ出してるの はCMSだけ: AODレベルデータ も公開している 開発環境も 提供していて、バ イナリフォーマッ トの読み込みがで きる
  • 72. Copyright 2015 Shiroyagi Corporation. All rights reserved. 72
  • 73. Copyright 2015 Shiroyagi Corporation. All rights reserved. 73
  • 74. Copyright 2015 Shiroyagi Corporation. All rights reserved. 74
  • 75. Copyright 2015 Shiroyagi Corporation. All rights reserved. 75
  • 76. Copyright 2014 Shiroyagi Corporation. All rights reserved. 76
  • 77. Copyright 2014 Shiroyagi Corporation. All rights reserved. 77
  • 78. Copyright 2014 Shiroyagi Corporation. All rights reserved. 78
  • 79. Copyright 2014 Shiroyagi Corporation. All rights reserved. 79