Statistik 2

Test statistik untuk kecocokan thd distribusi teoretik
Situasi: Ingin diketahui seberapa mirip distribusi data yg diperoleh di
dalam sampel terhadap distribusi teoretis yg diasumsikan dimiliki
oleh populasi asal sampel tsb. Test ini disebut goodness of fit
test.

(Ok − Ek ) 2
χ2 = ∑
Ek
k =1
N

Test statistiknya adalah chi-squares:

Dengan Ok adalah frekuensi sampel yg terobservasi, Ek adalah
frekuensi teoretis (expected) untuk sel yang sama (k). Derajat
kebebasannya v=N-1
Hipotesa yg diuji adalah H0: Distribusi sampel = distribusi teoretis
(nilai chi-squares kecil)
terhadap H1 : distribusi sampel menyimpang dari distribusi teoretis
(nilai chi-squares besar)

Contoh.
Sebuah dadu bermuka 6 dilemparkan sebanyak 120 kali, hasilnya
adalah sbb:
Muka dadu 1
2
3
4
5
6
frek (obs) 20
22
17
18
19
24
frek (exp) 20
20
20
20
20
20
distribusi teoretis (expected ) f(x) =1/6 dengan x=1,2,3,…6, sehingga
untuk 120 kali pelemparan frek (teoretis) = 1/6*120=20 untuk tiap
mata dadu.
1. Hipotesa
H0: Distribusi frekuensi mata dadu sesuai distribusi teoretis
H1: Distribusi frekuensi mata dadu menyimpang dari teoretis

Contoh.
2. Tingkat signifikan
Misal diambil α =5%.
3. Daerah kristis
Variabel statistik untuk diuji:

(Ok − Ek ) 2
2
χ =∑
Ek
k =1
N

dengan v=N-1=6-1=5.
Nilai kritis, menurut tabel χ20.05 (v=5) = 11.070.
Tolak H0, jika χ2 > 11.070
4. Perhitungan
Obs
20
22
Exp

20

(O-E)2/E 0

17

18

19

24

20

20

20

20

20

0.2

0.45

0.2

0.05

0.8

Contoh.
4. Perhitungan
(Ok − Ek ) 2 (20 − 20) 2 (22 − 20) 2 (17 − 20) 2 (20 − 19) 2 (20 − 24) 2
χ =∑
=
+
+
+
+
=
Ek
20
20
20
20
20
k =1
2

6

(Ok − Ek ) 2
χ =∑
= 0 + 0.2 + 0.45 + 0.2 + 0.05 + 0.8 = 1.7
Ek
k =1
2

N

5. Keputusan
Karena χ2 < 11.070 maka H0 tidak bisa ditolak pada tingkat
signifikan 5%.
6. Kesimpuan:
Tidak bisa dikatakan bahwa distribusi frekuensi kemunculan mata
dadu berasal dari populasi yg menyimpang dari distribusi teoretis
yg seharusnya. Atau tidak cukup bukti menyatakan dadunya tidak
fair!

Test untuk independensi (data kategorikal)
Situasi: Ingin diketahui independensi antara dua buah variabel
kategorikal.
H0: Tidak ada hubungan (dua buah variabel tsb independen)
H1 : Ada hubungan antara kedua buah variabel
Sebagai distribusi teoretisnya adalah berdasarkan H0 yaitu distribusi
yg akan terjadi jikalau kedua variabel yg diperiksa independen.
Sedangkan test statistik yg dipergunakan adalah χ2 :

(Ok − Ek ) 2
χ2 = ∑
Ek
k =1
N

Contoh.
Ingin diketahui apakah tingkat pendapatan berpengaruh pada opini
terhadap rencana reformasi perpajakan yg akan dilakukan
pemerintah. Untuk itu dilakukan sampling terhadap 1000 orang
wajib pajak. Kepada mereka ditanyakan apakah setuju dengan
reformasi perpajakan yg akan dilakukan. Hasilnya ditabelkan
dalam tabel kontingensi berikut ini:

Tingkat Pendapatan
Rendah

Medium

Tinggi

Total Row

Setuju

182

213

203

598

Tidak

154

138

110

402

Total Col

336

351

313

1000

Contoh.
Periksalah hipotesa H0: tidak ada hubungan antara tingkat
pendapatan dan opini thd reformasi perpajakan, dengan tingkat
signifikan 5%.

Solusi.
1. Hipotesa
H0: tidak ada hubungan antara tingkat pendapatan dan opini thd
reformasi perpajakan,
H1: Ada hubungan ….
2. α = 5%.
3. Daerah kritis
Variabel untuk ditest:

(Ok − Ek ) 2
χ =∑
Ek
k =1
2

N

dengan derajat kebebasan v= (row-1)*(col-1)= (2-1)*(3-1)=2
Nilai kritis, dari tabel χ0.052(ν=2)=5.991
Tolak H0, jika χ2 > 5.991

Solusi.
4. Perhitungan
Menentukan frekuensi teoretis tiap cell berdasarkan asumsi
bahwa variabel pendapatan independen thd variabel opini,
sehingga probabilitas untuk cell dengan pendapatan Pa dan opini
Ob akan diberikan oleh:
P (Pa ∩ Ob)= P(Pa)*P(Ob)
Jika total datanya N, maka expected frequency untuk cell tsb
adalah:
n (Pa ∩ Ob)= P(Pa)*P(Ob) * N
Bagaimana menentukan Pa dan Ob dari tabel kontingensi?
Misal dari data, jumlah org yg pendapatannya a,b dan c masingmasing na, nb dan nc. Maka, probabilitas menemukan 1 orang
dengan pendapatan a adalah : P (Pa) = na/(na+nb+nc), dst.

Solusi.
4. Perhitungan

Tingkat Pendapatan

Tingkat Pendapatan

Total Row

Rendah

Medium

Setuju

200.9

209.9

187.2

598

Tidak

135.1

141.1

125.8

402

336

351

313

1000

Rendah

Medium

Tinggi

Setuju

598

Tidak

402

Total Col
Total Col

336

351

313

Tinggi

Total Row

1000

Disebelah kiri adalah tabel yg diperlukan untuk menghitung expected
frequency, sebelah kanan adalah hasilnya : expected frequency.
Contoh perhitungan expected freq. orang yg berpendapatan rendah
dan setuju.
P(rendah) = 336/1000
P(setuju)=598/1000
n(rendah dan setuju) = P(rendah)*P(setuju)*1000=
= 336/1000*598/1000*1000 = 200.9

Solusi.
4. Perhitungan
Untuk menghemat perhitungan tidak perlu semua dihitung, misalkan
seluruh baris “setuju” dihitung, maka jumlah expected yg di baris
“tidak” bisa diperoleh dengan pengurangan. Contoh expected
freq. yg pendapatan rendah dan tidak setuju:
n(rendah & tidak) = 336 – n(rendah & setuju) = 336 –
200.9=135.1
Tahap berikutnya menghitung chi-squares:(154 − 135.1) (138 − 141.1) (110 − 125.8)
(O − E )
(182 − 201.9)
(213 − 209.9) (203 − 187.2)
χ =∑
=
+
+
E
201.9
209.9
187.2
135.1
141.1
125.8
2

N

k =1

2

k

2

2

2

2

k

k

χ 2 = 7.878
5. Keputusan
Karena χ2 > 5.991 maka cukup bukti untuk menolak H0
6. Kesimpulan
Ada hubungan antara variabel pendapatan dan opini.

2

2

Catatan
1. Metoda ini bekerja baik jika jumlah expected freq di tiap cell ≥ 5.
2. Untuk mempermudah perhitungan biasanya dalam tiap cell
dicantumkan observed freq dan expected freq.

Tingkat Pendapatan

Rendah

Medium

Tinggi

Total Row

Setuju

182
(200.9) 213 (209.9)

203 (187.2)

598

Tidak

154
(135.1) 138 (141.1)

110 (125.8)

402

313

1000

Total Col

336

351

Test Beberapa Proporsi Sekaligus
Situasi: Ingin diketahui apakah proporsi untuk “sukses” di berbagai
populasi semuanya sama. Jadi
H0 : P1=P2=P3=…
H1: paling tidak ada 1 proporsi yg tidak sama
Variabel testnya adalah chi-squares:

(Ok − Ek ) 2
χ =∑
Ek
k =1
2

N

Contoh
Sebuah pabrik yg memiliki 3 shift pekerja ingin mengetahui apakah
persentase produk yg cacat dari berbagai shift tersebut sama.
Sampel data disusun dalam tabel berikut ini:
Shift
Cacat
Baik

Pagi

Siang

Malam

45

55

70

905

890

870

Pergunakan tingkat signifikan 2.5% untuk memeriksa apakah
persentase yg cacat sama di segala shift.

Solusi
1. Hipotesa
H0 : p1=p2=p3
H1: tidak semua p1,p2 dan p3 sama
2. α =0.025
3. Daerah Kritis
Test statistiknya :

(Ok − Ek ) 2
χ =∑
Ek
k =1
2

N

dengan derajat kebebasan v= (2-1)*(3-1)=2
Nilai kritis, dari tabel diperoleh χ0.0252(v=2) = 7.378
Tolak H0 jika χ2 > 7.378

Solusi
4. Perhitungan
Shift
Cacat

Pagi

Siang

Malam

Total

45 (57.0)

55 (56.7)

70 (56.4)

170

Baik

905
(893.0)

890
(888.3)

870
(883.6)

2665

Total

950

945

940

2835

Perhitungan expected frequency seperti contoh-contoh
sebelumnya. Sehingga chi-squares bisa dihitung:
(Ok − Ek ) 2 (45 − 57.0) 2 (55 − 56.7) 2 (70 − 56.4) 2 (905 − 893) 2 (890 − 888.3) 2 (870 − 883.6) 2
χ =∑
=
+
+
Ek
57.0
56.7
56.4
893
888.3
883.6
k =1
2

N

Χ2 = 6.23

Solusi

5. Keputusan
Karena χ2 <7.378, maka H0 tidak bisa ditolak.

6. Kesimpulan
Tidak cukup bukti untuk menyatakan bahwa ada perbedaan
proporsi produksi yg cacat di berbagai shift yg berbeda

Statistik 2

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

En vedette

En vedette (20)

Similaire à Statistik 2

Similaire à Statistik 2 (20)

Statistik 2