Contenu connexe
Plus de Kevin Chun-Hsien Hsu
Plus de Kevin Chun-Hsien Hsu (16)
Kirk' Experimental Design, Chapter 2
- 2. 關於作業
✤ 請在今天決定分組,每一組上限四人
✤ 每組繳一份作業,請回答下列這些題目:
✤ Kirk
Ch
1,
Review
Exercise:
3,
4,
5,
9,
10,
11
✤ Kirk
Ch
2,
Review
Exercise:
2,
4,
5,
9,
10,
12,
13,
15,
17,
19
✤ 格式:請以
word
檔交件。字體12
point,1.5行高。每一題之間要分
頁,作答的字數請限制在一頁之內。第一行請以章節、題號開始。
✤ 繳交期限:3月
11日
13年3月5⽇日星期⼆二
- 3. Previously in Experimental Design...
✤ 上週介紹實驗法的基本概念:
✤ manipulation:
操弄
✤ 研究者操弄一個或數個獨變項
✤ random
assignment
✤ 採用隨機分配的方式排除干擾變項
✤ observation/
measurement
✤ 觀察依變項
✤ 本週進一步介紹基本的實驗設計類型
13年3月5⽇日星期⼆二
- 4. 實驗設計類型
✤ t test for independent samples 獨立樣本t
檢定
✤ Completely Randomized Design (CRD)
完全隨機化設計
✤ Randomized Block Design (RBD) 隨機化區集設計
✤ Latin Square Design (LSD)
拉丁方格
✤ Completely Randomized Factorial Design (CRFD) 完全隨機化複因子
設計
13年3月5⽇日星期⼆二
- 5. ✤ t test for independent samples 獨立樣本t
檢定
✤ 用法:從兩個母群抽樣並且估計各自的平均值,然後檢驗平均值是
否相等。
✤ 統計假設:
13年3月5⽇日星期⼆二
- 6. ✤ t test for independent samples 獨立樣本t
檢定
✤ 用法:從兩個母群抽樣並且估計各自的平均值,然後檢驗平均值是
否相等。
✤ 統計假設:
✤ H0: µ1 - µ2 = 0
✤ H1: µ1 - µ2 ≠ 0
13年3月5⽇日星期⼆二
- 7. ✤ t test for independent samples 獨立樣本t
檢定
✤ 範例:比較兩種矯正煙癮的治療方式的效果,以每天消耗的香煙數
量當作依變項。
✤ 受試者
(Si)
✤ i
=
1~30
✤ IV:
治療方式
(A)
✤ aj
;
j
=
1,
2
✤ DV:
Yij
Levels
Group1
Subjects1
Subjects2
:
:
Subjects15
a1
a1
:
:
a1
Group2
Subjects16
Subjects17
:
:
Subjects30
a2
a2
:
:
a2
13年3月5⽇日星期⼆二
- 8. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計
✤ p:
實驗組別的數量
✤ 用法:獨變項的組別數量有三組以上,觀察各組的依變項之平均值
有無差異。
✤ 統計假設:
13年3月5⽇日星期⼆二
- 9. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計
✤ p:
實驗組別的數量
✤ 用法:獨變項的組別數量有三組以上,觀察各組的依變項之平均值
有無差異。
✤ 統計假設:
✤ H0: µ1 = µ2 = µ3
✤ H1: µj ≠ µj’ for some j and j’, j ≠ j’
13年3月5⽇日星期⼆二
- 10. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計
✤ 範例:比較三種矯正煙癮的治療方式的效果,以每天消耗的香煙數
量當作依變項。
✤ 受試者
(Si)
✤ i
=
1~45
✤ IV:
治療方式
(A)
✤ aj
;
j
=
1,
2,
3
✤ DV:
Yij
Levels
Group1
Subjects1
Subjects2
:
:
Subjects15
a1
a1
:
:
a1
Group2
Subjects16
Subjects17
:
:
Subjects30
a2
a2
:
:
a2
Group3
Subjects31
Subjects32
:
:
Subjects45
a3
a3
:
:
a3
13年3月5⽇日星期⼆二
- 11. ✤ DV 的表現主要來自五個效果:
1.獨變項
IV
(aj)
2.個別受試者,或者實驗情境的限制
3.受試者每次表現反應時隨機的變動
4.測量/紀錄
過程的誤差
5.其他無法排除的干擾變項
✤ 前述的“煙癮治療”研究的測量值如何被這些因素影
響?
13年3月5⽇日星期⼆二
- 12. ✤ DV: Yij
✤ i: 受試者;
j:
實驗組別
(treatment)
✤ Y17,2
=
3
✤ 第17號受試者在第二個實驗組別下的測量值為
3
✤ 以煙癮治療的例子來說:
✤ 第17號受試者接受第二種治療方式之後每日消耗3根
香煙
13年3月5⽇日星期⼆二
- 13. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計
✤ 範例:針對45位受試者比較三種矯正煙癮的治療方式的效果,以每
天消耗的香煙數量當作依變項。
✤ Yij = µ + "j + #i(j) (i = 1,..., n; j = 1,...,p)
Yij 受試者
i
在第
j
個實驗組別下的依變項
µ 母群的平均值,各實驗組別平均觀察值(µ1,
µ2,
µ3)的總平均值。µ
為固定值。
"j
(alpha) 第j個實驗組別的效果,等於該組平均值與母群平均值的
差異量(µj–µ)。同一個實驗組別之下每個觀察值有一樣的 "j。
#i(j) (epsilon) Yij的殘差值,等於
Yij – µ – "j。
13年3月5⽇日星期⼆二
- 14. ✤ 干擾因素可以分為可控制的與不可控制的兩類。
✤ 隨機化
(randomization)
✤ 不可控制的因素可利用隨機化程序來削減其影響,比如受試者的氣
質。
✤ 隨機指定哪些受試者應該接受哪些處理(treatments),以及實驗進行的
次序(order)。
✤ 區集
(blocking)
✤ 將可控制的因素變成區集(Blocks),同一個區集之內受試者的狀態盡
量一致。
隨機化與區集
13年3月5⽇日星期⼆二
- 15. ✤ dependent samples 相依樣本
✤ 針對受試者的氣質進行控制,確保不同實驗組別之間的差別來自獨
變項的影響。
✤ 消除內在校度的威脅
(threats
of
internal
validity)
✤ 採用相依樣本的時候「隨機分配」以及「分析」的做法都比獨立樣
本的情況更為複雜。下列各種狀況都視為相依樣本:
✤ 受試者接受每一種實驗組別,重複測量(repeated
measure)各種組別
之下的表現
✤ 先測量某個與研究議題有關的指標,然後採用這個指標將受試者
分成數個區集(blocking,
subject
matching)
✤ 搜集許多組雙胞胎,或者採用來自同一個家庭成長的個體
✤ 由受試者自己指定的匹配對象
13年3月5⽇日星期⼆二
- 16. ✤ 以相依樣本的方式來改進煙癮治療研究:
✤ IV:
兩種治療程序
✤ DV:
持續治療六個月之後每天抽幾根煙
✤ 假設每個受試者只能接受一種實驗組別,不適合進行重複測量。
✤ 什麼因素會影響
DV的效果?
✤ e.g.:
接受治療之前每天抽幾根煙?
✤ 根據治療前的抽煙習慣將受試者分組,將每一個區集的受試者隨
機分到實驗組別之下。
13年3月5⽇日星期⼆二
- 17. ✤ 以相依樣本的方式來改進煙癮治療研究:
✤ 根據治療前的抽煙習慣將受試者分組,
將每一個區集的受試者隨機分到實
驗組別之下。
✤
LevelsLevels
Block1 a1 a2
Block2 a1 a2
Block3 a1 a2
: : :
Block15 a1 a2
Levels
Group1
Subjects1
Subjects2
:
:
Subjects15
a1
a1
:
:
a1
Group2
Subjects16
Subjects17
:
:
Subjects30
a2
a2
:
:
a2
13年3月5⽇日星期⼆二
- 18. ✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計
✤ p:
實驗組別的數量
✤ 用法:獨變項的組別數量有三組以上,
將受試者依照某個特性分成
區集,然後將各區集之下的受試者隨機分配到實驗組別之下。
✤ e.g.:
將45個受試者分成15個區集
✤ 統計假設:
✤ 如果第二個虛無假設不成立,代表將某個干擾效果移除殘差項。
✤ H0: µ.1 = µ.2 = µ.3
✤ H0: µ1. = µ2. = ⋯⋯ = µ15.
✤ H1: µ.j ≠ µ.j’ for some j and j’, j ≠ j’
LevelsLevelsLevels
Block1 a1 a2 a3
Block2 a1 a2 a3
Block3 a1 a2 a3
: : : :
Block15 a1 a2 a3
13年3月5⽇日星期⼆二
- 19. ✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計
✤ Yij = µ + "j + $i + #ij (i = 1,..., n; j = 1,...,p)
LevelsLevelsLevels
Block1 a1 a2 a3
Block2 a1 a2 a3
Block3 a1 a2 a3
: : : :
Block15 a1 a2 a3
Yij 受試者
i
在第
j
個實驗組別下的依變項
µ 母群的平均值。µ為固定值。
"j
(alpha) 第j個實驗組別的效果,等於該組平均
值與母群平均值的差異量(µ.j–µ)。同一個實驗
組別之下每個觀察值有一樣的 "j。
$i
(pi) 第i個區集的效果,等於該區集平均值與母
群平均值的差異量(µ i.–µ)。
#i(j) (epsilon) Yij的殘差值,等於
Yij – µ – "j – $i。
13年3月5⽇日星期⼆二
- 20. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計
✤ Yij = µ + "j + #i(j) (i = 1,..., n; j = 1,...,p)
✤ #ij = Yij – µ – "j
✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計
✤ Yij = µ + "j + $i + #ij (i = 1,..., n; j = 1,...,p)
✤ #ij = Yij – µ – "j – $i
13年3月5⽇日星期⼆二
- 21. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計
✤ #ij = Yij – µ – "j
✤
∑∑#2 = ∑∑(Yij – µ – "j)2
✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計
✤ #ij = Yij – µ – "j – $i
✤
∑∑#2 = ∑∑(Yij – µ – "j – $i)2
✤ 採用 RB-p 設計來進行變異數分析時,其殘差平方和不包含區集的效
果,並且小於 CR-p的殘差平方和。
✤ RB-p 設計可以提供比較大的F統計值,較容易拒絕H0。
13年3月5⽇日星期⼆二
- 22. ✤ Latin Square Design (LSD, LS-p) 拉丁方格
✤ p:
實驗組別的數量
✤ 特點:排除兩個干擾變項
✤ 用法:將受試者依照兩個特性分成區集,然後將各區集之下的受試
者隨機分配到實驗組別之下。兩種特性的區集數量必須和實驗組別
一樣。
✤ e.g.:
觀察三種治療方式。根據治療前每天抽煙數量、抽煙年數定出
九個區集(3
x
3)。
< 1 年 1~5年 >5年
c1 c2 c3
<1包 b1 a1 a2 a3
1~3包 b2 a2 a3 a1
>3包 b3 a3 a1 a2
13年3月5⽇日星期⼆二
- 23. ✤ Latin Square Design (LSD, LS-p) 拉丁方格
✤ p:
實驗組別的數量
✤ 特點:排除兩個干擾變項
✤ 用法:將受試者依照兩個特性分成區集,然後將各區集之下的受試
者隨機分配到實驗組別之下。兩種特性的區集數量必須和實驗組別
一樣。
✤ e.g.:
觀察三種治療方式。根據治療前每天抽煙數量、抽煙年數定出
九個區集(3
x
3)。
✤ 統計假設:
✤ H0: µ1.. = µ2.. = µ3.. (實驗組別的平均表現一致)
✤ H0: µ.1. = µ.2. = µ.3. (第一類區集的平均值無差異)
✤ H0: µ..1 = µ..2 = µ..3 (第二類區集的平均值無差異)
13年3月5⽇日星期⼆二
- 24. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計
✤ Yij = µ + "j + #i(j)
✤
∑∑#2 = ∑∑(Yij – µ – "j)2
✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計
✤ Yij = µ + "j + $i + #ij
✤
∑∑#2 = ∑∑(Yij – µ – "j – $i)2
✤ Latin Square Design (LSD, LS-p) 拉丁方格
✤ Yij = µ + "j + !k + "l + $i + #ij
✤
∑∑#2 = ∑∑(Yij – µ – "j – !k – "l – $i)2
13年3月5⽇日星期⼆二
- 25. ✤ 目前為止介紹了三種基本的實驗設計,而且都只考量一個獨變項。
✤ CR-p 完全隨機化設計
✤ 無法排除任何干擾變項的影響。
✤ RB-p 隨機化區集設計
✤ 針對一個干擾變項將受試者分成數個區集,觀察區集的效果,同
時減少殘差項
(∑∑#2)。
✤ LS-p
拉丁方格
✤ 針對兩個干擾變項將受試者分成數個區集,兩種區集的數量與實
驗組別一樣。有效的 LS-p可以取得更小的殘差項。
13年3月5⽇日星期⼆二
- 26. ✤ Completely Randomized Factorial Design (CRF-pq) 完全隨機化複因子
設計
✤ 特點:觀察兩種獨變項各自的效果,以及兩者的交互作用。
✤ e.g.:
室內光照(5燭光,
30燭光)與字體大小(9-point,
12-point,
15-point)對
閱讀速度的影響
✤ 實驗組別:
a1b1、
a1b2、
a1b3、
a2b1、
a2b2、
a2b3
✤ 將受試者隨機分配到各實驗組別,然後進行二因子變異數分析。
13年3月5⽇日星期⼆二
- 27. ✤ Completely Randomized Factorial Design (CRF-pq) 完全隨機化複因子
設計
✤ 特點:觀察兩種獨變項各自的效果,以及兩者的交互作用。
✤ e.g.:
室內光照(5燭光,
30燭光)與字體大小(9-point,
12-point,
15-point)對
閱讀速度的影響
✤ Yijk = µ + "j + !k + ("!)jk + #i(jk)
✤
Yijk 受試者
i
在每一種實驗組合之下的表現
µ 母群的平均值。µ為固定值。
"j
第一個獨變項的j個實驗組別的效果,等於該組平
均值與母群平均值的差異量(µ.j–µ)。
&k
第二個獨變項的k個實驗組別的效果,等於該組
平均值與母群平均值的差異量(µ.k–µ)。
("&)jk 交互作用
#i(j) (epsilon) Yij的殘差值,等於
Yij – µ – "j – $i。
13年3月5⽇日星期⼆二
- 28. ✤ Completely Randomized Factorial Design (CRF-pq) 完全隨機化複因子
設計
✤ 特點:觀察兩種獨變項各自的效果,以及兩者的交互作用。
✤ e.g.:
室內光照(5燭光,
30燭光)與字體大小(9-point,
12-point,
15-point)對
閱讀速度的影響
✤ 統計假設:
✤ H0: µ1. = µ2.
✤ H0: µ.1 = µ.2 = µ.3
✤ H0: µjk – µj’k – µjk’ + µj’k’ = 0
✤ 室內光照之主效果
(main
effect)
✤ 字體大小之主效果
(main
effect)
✤ 交互作用
(interaction)
13年3月5⽇日星期⼆二
- 33. 假設檢定(hypothesis testing)
✤ sampling distribution (抽樣分佈)
✤ 研究者常常從母群中隨機選出一組樣本,然後取得這組樣本的統計
值。下一次抽樣取得的統計值與先前抽樣的結果往往有差異。進行
許多次抽樣之後每一次的統計值形成一組分布,該分布稱為「
抽樣
分佈」。
✤ central limit theorem (中央極限定理)
✤ 採用適當數量的樣本計算平均數的時後,不論母群的機率分佈的形
狀為何,抽樣分佈的形狀會趨近於常態分佈。
13年3月5⽇日星期⼆二
- 40. 假設檢定(hypothesis testing)
✤ test statistics 檢定統計量/統計數
✤ 驗證「統計假設」的統計數值
✤ 比如,檢驗兩個平均數是否相等:
✤ Z
統計數
(z
statistics):已知母群的標準差
✤ T
統計數
(t
statistics):未知母群的標準差
13年3月5⽇日星期⼆二
- 43. ✤ 4.
指定顯著水準
✤ T分數越接近零表示樣本的平均數與期望值相似。T分數距離中央越
遠,|T|
越大,表示極有可能樣本的µ
不等於期望值,就可以拒絕
H0。根據機率函數可以將T
分數轉換為機率值,一般認為H0發生的
機率低於
0.05的時候表示可以承擔錯誤的判斷。
臨界區
臨界值
13年3月5⽇日星期⼆二
- 44. ✤ 4.
指定顯著水準
✤ 統計假設明確的預期統計量之間
的差異方向時採用單尾檢定:
✤ H0:
µ
≤
115
H1:
µ
>
115
✤ 統計假設不預期統計量之間的差
異方向,只預期有無差異時採用
雙尾檢定:
✤ H0:
µ
=
115
H1:
µ
≠
115
✤
此時臨界值定在"/2
✤ 比較一下,單尾/雙尾
檢定之下,哪
一種情況的臨界值距離0比較近?會
不會影響結果?
13年3月5⽇日星期⼆二
- 45. ✤ 依據統計檢定量作出決定的後果:
✤ 一般將 " 定在
0.05。
✤ 將實驗數據帶入公式2.5-1可以估計β。
✤ 1–β就是統計效果量(power),代表可以拒絕H0的機率。一般研究者
認為β大於0.8代表該研究效果值得信任。
真實情況真實情況
H0為真 H0為假
研究者的決定
無法拒絕 H0
正確接受H0
probability = 1 – "
第二類型錯誤
probability = β
研究者的決定
拒絕H0
第一類型錯誤
Type I error
probability = "
正確拒絕H0
probability = 1 – β
13年3月5⽇日星期⼆二
- 48. ✤ 常見的信賴區間做法
(未知母群的標準差):
✤ 以樣本平均數為中心,估計上限(97.5%)、下限
(2.5%)
的位置
✤ 如果期望值介於上限、下限之內就表示無法拒絕H0
✤ 相較於假設檢定,估計信賴區間可以提供平均值以及樣本變異的狀
況
13年3月5⽇日星期⼆二
- 50. 「實驗設計」與「推論統計」的步驟
✤ 1.
提出統計假設(H0 & H1)
✤ 2.
選擇檢定統計量。未知母群的
變異情況,採用T分數。
✤ 3.
決定樣本數以及抽樣分佈。
✤ 4.
指定顯著水準
(α)
✤ 5.
搜集數據並且決定是否接受虛
無假設
✤ 1.
列出與研究主題相關的獨變
項、依變項、干擾變項
✤ 2.
選擇受試的單位及數量
✤ 3.
決定分配受試者、實驗刺激的
方式
✤ 4.
選擇統計方法,進行推論統計
✤ 5.
搜集數據並且決定是否接受虛
無假設
13年3月5⽇日星期⼆二