Contenu connexe
Similaire à Distribution naite19 (20)
Plus de Asako Yanuki (11)
Distribution naite19
- 2. 自己紹介
• 岡野 麻子(おかのあさこ)
• 経歴
• 自社では、SEPGに所属(2010~)。
• 主に、CMMIによるプロセス改善に従事。「定量的プロジェクト管理」の推進を
しています。統計分析(プロセス実績ベースラインやプロセス実績モデルの構
築)、ツールの管理、プロジェクト推進、・・・なんでも屋さんです。
• その前はQAをやっていました(2004~2010)。
• 所属しているコミュニティなど
• NaITE(長崎IT技術者会) スタッフ
• PM学会 PDA研究会
• JFPUG FP活用研究会 など
• Twitter:@acha_821 (あさこ)
©NaITE 22017/1/21
- 3. 参考資料
• 統計学入門 東京大学教養学部統計学教室 (編集)
• 数学ガールの秘密ノート/やさしい統計 結城 浩 著
• ソフトウェアメトリクス統計分析入門
―現場エンジニアによる直観的解説と実践ドリル 小池 利和 著
©NaITE 32017/1/21
- 11. アジェンダ
1. 事例:探針テスト
i. 探針テストの意味と目的
ii. 探針テストの使用事例(リリカルくんより)
iii. サンプリングテスト
iv. 推定?
2. 統計学
i. 母集団と標本、その関係
ii. 統計学の目的
iii. 平均・分散・標準偏差
iv. 正規分布(イメージ)
3. 区間推定
i. 信頼区間とは?
ii. 標準誤差
iii. 信頼区間
iv. 実際に導いてみよう!
4. まとめ! 2017/1/21 11©NaITE
- 12. アジェンダ
1. 事例:探針テスト
i. 探針テストの意味と目的
ii. 探針テストの使用事例(リリカルくんより)
iii. サンプリングテスト
iv. 推定?
2. 統計学
i. 母集団と標本、その関係
ii. 統計学の目的
iii. 平均・分散・標準偏差
iv. 正規分布(イメージ)
3. 区間推定
i. 信頼区間とは?
ii. 標準誤差
iii. 信頼区間
iv. 実際に導いてみよう!
4. まとめ! 2017/1/21 12©NaITE
- 18. アジェンダ
1. 事例:探針テスト
i. 探針テストの意味と目的
ii. 探針テストの使用事例(リリカルくんより)
iii. サンプリングテスト
iv. 推定?
2. 統計学
i. 母集団と標本、その関係
ii. 統計学の目的
iii. 平均・分散・標準偏差
iv. 正規分布(イメージ)
3. 区間推定
i. 信頼区間とは?
ii. 標準誤差
iii. 信頼区間
iv. 実際に導いてみよう!
4. まとめ! 2017/1/21 18©NaITE
- 23. 平均・分散・標準偏差
平均
• 𝑛 回試行したときの値の合計を試行回数 𝑛で
割ったもの
• ҧ𝑥 =
1
𝑛
σ𝑖=1
𝑛
𝑥𝑖
分散 (標準偏差の二乗)
標準偏差:平均からのズレ
• 確率変数 𝑋1 − ത𝑋, 𝑋2 − ത𝑋, ⋯ , 𝑋 𝑛 − ത𝑋 に対
しては,恒等式 𝑋1 − ത𝑋 + 𝑋2 − ത𝑋 + ⋯ +
𝑋 𝑛 − ത𝑋 ≡ 0が成り立つため,変数 𝑋𝑖 − ത𝑋
の自由度は 𝑛 から 𝑛 − 1 に減少する.した
がって,分散は 𝑛 − 1 で割って
• 𝑆2 =
1
𝑛−1
σ𝑖=1
𝑛
𝑋𝑖 − ത𝑋 2
2017/1/21©NaITE 23
- 27. アジェンダ
1. 事例:探針テスト
i. 探針テストの意味と目的
ii. 探針テストの使用事例(リリカルくんより)
iii. サンプリングテスト
iv. 推定?
2. 統計学
i. 母集団と標本、その関係
ii. 統計学の目的
iii. 平均・分散・標準偏差
iv. 正規分布(イメージ)
3. 区間推定
i. 信頼区間とは?
ii. 標準誤差
iii. 信頼区間
iv. 実際に導いてみよう!
4. まとめ! 2017/1/21 27©NaITE
- 30. 標準誤差
•ある実験で 𝑛 個のデータ {𝑥1
(1)
, 𝑥2
(1)
, ⋯ , 𝑥 𝑛
(1)
} をとり,平均値 ҧ𝑥(1)
= σ𝑖 𝑥𝑖
(1)
/𝑛 を計算する.
•引き続き同じ実験を 𝑁 回繰り返し,平均値 ҧ𝑥(2)
, ⋯ , ҧ𝑥(𝑁)
を算出する.
•同じ条件で実験をしても,これらの平均値 は 𝒎 ≡ (ഥ𝒙(𝟏)
+ ⋯ + ഥ𝒙(𝑵)
)/𝑵のまわりにばらつく.
•このばらつきを表す指標が標準誤差
概念
• 実験で標本平均 ҧ𝑥 = σ𝑖=1
𝑛
𝑥𝑖 /𝑛 と標本分散 𝑠2
= σ𝑖=1
𝑛
𝑥𝑖 − ҧ𝑥 2
/(𝑛 − 1)が得られているとする.
• 母平均 𝜇 の推定値は 𝐸 ത𝑋 = 𝜇 より 𝜇 = ҧ𝑥
• その推定精度である標準誤差は 𝑉 ഥX = 𝜎2
/𝑛 と 𝐸 𝑆2
= 𝜎2
より 𝑆𝐸 ≃ 𝜎/ 𝑛 ≃ 𝑠/ 𝑛
• 𝑆𝐸 ≃
𝑠
𝑛
=
σ 𝑖=1
𝑛
𝑥 𝑖− ҧ𝑥 2
𝑛(𝑛−1)
成り立つ式
2017/1/21©NaITE 30
- 31. 信頼区間・t分布・二項分布
• 信頼区間=標本平均 ± t × 標本標準誤差
成り立つ式
• 結果が成功か失敗のいずれかである n 回の独立な試行を行ったときの成功数で表される離散確
率分布である(wikipediaより)
• サンプリングしたテストケースにおいて、「バグがでる」「バグが出ない」という結果を想定
した独立なテストを実施
二項分布
• 連続確率分布の一つであり、正規分布する母集団の平均と分散が未知で標本サイズが小さい場
合に平均を推定する問題に利用される(wikipediaより)
t 分布
2017/1/21©NaITE 31
- 33. 実際に導く:信頼区間 関係式の導出
Pu = p + u(α) √(p(p-1)/n) を出す!
⇒二項分布を利用する
• 上限信頼区間=標本平均 + t × 標本標準誤差
=𝑝 + 𝑢 α ×
𝑝(1−𝑝)
𝑛
このとき、標本平均(標本不良率) = p , t = u(α)
tは、二項確率紙を参照
2017/1/21 33©NaITE
- 34. 導いてみよう(二項分布)
• 期待値 𝐸 𝑋 = 𝑖𝑝
• 分散 𝑉 𝑋 = 𝑖𝑝 1 − 𝑝 =σ2
• 標準誤差 𝑆𝐸 = 𝑉 𝑋 ≃
σ
𝑛
上記をもちいて、
標準誤差=
𝑖𝑝(1−𝑝)
𝑛
となる。
注:探針テスト(※)では、サンプリング1回により、期待値はpとなってい
る。数回実施するときは 𝑖 をかけること。
(※:http://www.hayst.com/Pages/qptest.aspx)
2017/1/21 34©NaITE
- 39. 議論結果(抜粋)
• 見積もり
• 規模(kstep,fp)とテスト項目⇒テスト密度
• 規模と工数
• 最大値、最小値
• 探索的テストをやめる判断←信頼度成長曲線、信頼区間
• センサの精度、実測と計画の差
• モジュールごとの難易度
• バグ予測、テストケース見積もり
• ほかにも必要なメトリクスがあるのでは。
⇒複雑度、難易度・・・ドメイン、関連技術を示すようなもの・・・
• こういった判断基準になるようなものをツール化し、やり方を書いたドキュメントとともに提供しても、やらない人は
やらない。。。。。
• 探針テストはバグを見つけるために実施されるのではない。最初の層別やサンプリングするとことに技術が集約されて
いる!!
2017/1/21©NaITE 39