Tes kecocokan (goodness of fit test) digunakan untuk menguji seberapa mirip distribusi data sampel dengan distribusi teoretis. Statistik tesnya adalah chi-square yang menghitung penyimpangan antara frekuensi observasi dan yang diharapkan. Hipotesis nol menyatakan distribusi sampel sama dengan teoretis.
2. Test statistik untuk kecocokan thd distribusi teoretik
Situasi: Ingin diketahui seberapa mirip distribusi data yg diperoleh di
dalam sampel terhadap distribusi teoretis yg diasumsikan dimiliki
oleh populasi asal sampel tsb. Test ini disebut goodness of fit
test.
(Ok − Ek ) 2
χ2 = ∑
Ek
k =1
N
Test statistiknya adalah chi-squares:
Dengan Ok adalah frekuensi sampel yg terobservasi, Ek adalah
frekuensi teoretis (expected) untuk sel yang sama (k). Derajat
kebebasannya v=N-1
Hipotesa yg diuji adalah H0: Distribusi sampel = distribusi teoretis
(nilai chi-squares kecil)
terhadap H1 : distribusi sampel menyimpang dari distribusi teoretis
(nilai chi-squares besar)
3. Contoh.
Sebuah dadu bermuka 6 dilemparkan sebanyak 120 kali, hasilnya
adalah sbb:
Muka dadu 1
2
3
4
5
6
frek (obs) 20
22
17
18
19
24
frek (exp) 20
20
20
20
20
20
distribusi teoretis (expected ) f(x) =1/6 dengan x=1,2,3,…6, sehingga
untuk 120 kali pelemparan frek (teoretis) = 1/6*120=20 untuk tiap
mata dadu.
1. Hipotesa
H0: Distribusi frekuensi mata dadu sesuai distribusi teoretis
H1: Distribusi frekuensi mata dadu menyimpang dari teoretis
4. Contoh.
2. Tingkat signifikan
Misal diambil α =5%.
3. Daerah kristis
Variabel statistik untuk diuji:
(Ok − Ek ) 2
2
χ =∑
Ek
k =1
N
dengan v=N-1=6-1=5.
Nilai kritis, menurut tabel χ20.05 (v=5) = 11.070.
Tolak H0, jika χ2 > 11.070
4. Perhitungan
Obs
20
22
Exp
20
(O-E)2/E 0
17
18
19
24
20
20
20
20
20
0.2
0.45
0.2
0.05
0.8
5. Contoh.
4. Perhitungan
(Ok − Ek ) 2 (20 − 20) 2 (22 − 20) 2 (17 − 20) 2 (20 − 19) 2 (20 − 24) 2
χ =∑
=
+
+
+
+
=
Ek
20
20
20
20
20
k =1
2
6
(Ok − Ek ) 2
χ =∑
= 0 + 0.2 + 0.45 + 0.2 + 0.05 + 0.8 = 1.7
Ek
k =1
2
N
5. Keputusan
Karena χ2 < 11.070 maka H0 tidak bisa ditolak pada tingkat
signifikan 5%.
6. Kesimpuan:
Tidak bisa dikatakan bahwa distribusi frekuensi kemunculan mata
dadu berasal dari populasi yg menyimpang dari distribusi teoretis
yg seharusnya. Atau tidak cukup bukti menyatakan dadunya tidak
fair!
6. Test untuk independensi (data kategorikal)
Situasi: Ingin diketahui independensi antara dua buah variabel
kategorikal.
H0: Tidak ada hubungan (dua buah variabel tsb independen)
H1 : Ada hubungan antara kedua buah variabel
Sebagai distribusi teoretisnya adalah berdasarkan H0 yaitu distribusi
yg akan terjadi jikalau kedua variabel yg diperiksa independen.
Sedangkan test statistik yg dipergunakan adalah χ2 :
(Ok − Ek ) 2
χ2 = ∑
Ek
k =1
N
7. Contoh.
Ingin diketahui apakah tingkat pendapatan berpengaruh pada opini
terhadap rencana reformasi perpajakan yg akan dilakukan
pemerintah. Untuk itu dilakukan sampling terhadap 1000 orang
wajib pajak. Kepada mereka ditanyakan apakah setuju dengan
reformasi perpajakan yg akan dilakukan. Hasilnya ditabelkan
dalam tabel kontingensi berikut ini:
Tingkat Pendapatan
Rendah
Medium
Tinggi
Total Row
Setuju
182
213
203
598
Tidak
154
138
110
402
Total Col
336
351
313
1000
8. Contoh.
Periksalah hipotesa H0: tidak ada hubungan antara tingkat
pendapatan dan opini thd reformasi perpajakan, dengan tingkat
signifikan 5%.
9. Solusi.
1. Hipotesa
H0: tidak ada hubungan antara tingkat pendapatan dan opini thd
reformasi perpajakan,
H1: Ada hubungan ….
2. α = 5%.
3. Daerah kritis
Variabel untuk ditest:
(Ok − Ek ) 2
χ =∑
Ek
k =1
2
N
dengan derajat kebebasan v= (row-1)*(col-1)= (2-1)*(3-1)=2
Nilai kritis, dari tabel χ0.052(ν=2)=5.991
Tolak H0, jika χ2 > 5.991
10. Solusi.
4. Perhitungan
Menentukan frekuensi teoretis tiap cell berdasarkan asumsi
bahwa variabel pendapatan independen thd variabel opini,
sehingga probabilitas untuk cell dengan pendapatan Pa dan opini
Ob akan diberikan oleh:
P (Pa ∩ Ob)= P(Pa)*P(Ob)
Jika total datanya N, maka expected frequency untuk cell tsb
adalah:
n (Pa ∩ Ob)= P(Pa)*P(Ob) * N
Bagaimana menentukan Pa dan Ob dari tabel kontingensi?
Misal dari data, jumlah org yg pendapatannya a,b dan c masingmasing na, nb dan nc. Maka, probabilitas menemukan 1 orang
dengan pendapatan a adalah : P (Pa) = na/(na+nb+nc), dst.
14. Test Beberapa Proporsi Sekaligus
Situasi: Ingin diketahui apakah proporsi untuk “sukses” di berbagai
populasi semuanya sama. Jadi
H0 : P1=P2=P3=…
H1: paling tidak ada 1 proporsi yg tidak sama
Variabel testnya adalah chi-squares:
(Ok − Ek ) 2
χ =∑
Ek
k =1
2
N
16. Solusi
1. Hipotesa
H0 : p1=p2=p3
H1: tidak semua p1,p2 dan p3 sama
2. α =0.025
3. Daerah Kritis
Test statistiknya :
(Ok − Ek ) 2
χ =∑
Ek
k =1
2
N
dengan derajat kebebasan v= (2-1)*(3-1)=2
Nilai kritis, dari tabel diperoleh χ0.0252(v=2) = 7.378
Tolak H0 jika χ2 > 7.378
17. Solusi
4. Perhitungan
Shift
Cacat
Pagi
Siang
Malam
Total
45 (57.0)
55 (56.7)
70 (56.4)
170
Baik
905
(893.0)
890
(888.3)
870
(883.6)
2665
Total
950
945
940
2835
Perhitungan expected frequency seperti contoh-contoh
sebelumnya. Sehingga chi-squares bisa dihitung:
(Ok − Ek ) 2 (45 − 57.0) 2 (55 − 56.7) 2 (70 − 56.4) 2 (905 − 893) 2 (890 − 888.3) 2 (870 − 883.6) 2
χ =∑
=
+
+
Ek
57.0
56.7
56.4
893
888.3
883.6
k =1
2
N
Χ2 = 6.23
18. Solusi
5. Keputusan
Karena χ2 <7.378, maka H0 tidak bisa ditolak.
6. Kesimpulan
Tidak cukup bukti untuk menyatakan bahwa ada perbedaan
proporsi produksi yg cacat di berbagai shift yg berbeda