2. DATA ANALISIS
Objektif :
Kemahiran dalam menganalisis data menggunakan
teknik-teknik berstatistik
3. Analisis Statistik
Merupakan tatacara, teknik dan kaedah yang
digunakan untuk tujuan memahami data dan
maklumat, membuat penelitian, meringkas
dan membuat analisis bagi memperihalkan
berbagai ragam data.
Peranan utamanya ialah supaya data yang
berbagai macam ini mudah difahami oleh
orang ramai.
4. Kategori Statistik
Statistik deskriptif
Menggunakan kaedah berangka dan grafik untuk
menentukan corak set data, meringkaskan maklumat
daripada set data dan mempersembahkan maklumat yang
dikumpul daripada sampel dalam bentuk yang menarik.
Oleh kerana pemerihalannya terhad kepada sampel sahaja ia tidak
digunakan untuk tujuan membuat kesimpulan dan generalisasi
menyeluruh kepada populasi yang dikaji
Statistik Inferens
Prosidur-prosidur untuk membuat generalisasi mengenai
populasi yang dikaji berdasarkan maklumat daripada sampel
yang diambil dari populasi.
6. Analisis Univariate
1.Taburan Frekuensi
Paling basic (and least useful)
Percentage
Mod (nominal data)
2. Ukuran Kecenderungan Memusat
Min – (interval data )
Mod – (nominal data)
Median – (ordinal data)
7. Sambung …
3.Ukuran Serakan
Minimum
Maksimum
Julat – perbezaan di antara maksimum dan minimum
Sisihan piawai – ukuran sejauh mana subjek-subjek
yang dikaji berbeza daripada min kumpulan.(the
more heterogeneous the group, the higher the
standard deviation)
9. Analisis Bivariat
Korelasi
Arah
Kekuatan
Pearson r (interval data)
Spearman (ordinal data)
10. Data
Teknik--teknik berstatistik adalah
ditentukan oleh jenis data.
Pemahaman asas mengenai jenis data
membantu dalam pemilihan kaedah
analisis dan ujian statistik yang sesuai
11. Jenis Data
Dua jenis data iaitu:
Data Kuantitatif-numerik
nilai-nilai data adalah bilangan atau ukuran
berangka.
Data kuantitatif boleh dalam bentuk:
Diskret - Boleh mengambil nilai-nilai yang tepat
sahaja.
Contoh: bilangan buah bagi setiap pokok dalam kebun,
saiz kasut bagi pelajr sebuah kelas dan bilangan anak
dalam setiap keluarga dsbnya atau
Selanjar- Tidak boleh mengambil nilai yang tepat
tetapi boleh dihampirkan kepada ukuran tertentu
Contoh: tinggi pelajar, berat buah jambu , halaju kereta,
PNGK pelajar-pelajar sarjana UKM-NPC, gaji pensyarah
dan sebagainya.
12. Jenis Data
Data Kualitatif- bukan numerik
Nilai-nilai data adalah kategori bukan
berangka.
Cth: jenis darah, jantina
13. Skala Pengukuran
Data Nominal
Data nominal sesuai pada data yang hanya dapat
diklasifikasikan ke dalam kategori, nama atau label.
Kategori tidak dapat disusun mengikut urutan.
Dapat memberikan nilai numerik pada kategori tapi
tidak dapat melakukan operasi matematik terhadap
nilai-nilainya.
Cth: male = 0 dan female = 1, budak ceria = 1 dan
budak tak ceria = 2
14. Skala Pengukuran
Data Ordinal
Sama seperti data nominal.
Membezakan ialah data boleh disusun mengikut urutan.
Tetapi kita tidak boleh mengukur perbezaan di antara dua
data.
Kita dapat memberikan nilai numerik namun tidak dapat
melakukan operasi matematik
Cth:
Pengundi-pengundi diklasifikasikan sebagai low-income, middle-
income, or high-income
Frekuensis Penerbangan: tidak pernah, jarang, kadang-kadang,
selalu.·
Bagaimana penilaian anda terhadap restoran itu? Sangat baik, baik,
cukup, kurang.
15. Skala Pengukuran
Data Interval/Sela
Data interval adalah sama spt data ordinal iaitu data
boleh disusun.
Perbezaan antara data bermakna dan boleh diukur.
Cth. Senarai suhu-suhu didih bagi cecair yang berbeza.
Kita boleh tahu samada suhu didih cecair A lebih tinggi
daripada suhu didih cecair B. jika suhu didih cecair A
adalah 212darjah dan suhu didih cecair B adalah 284
darjah , suhu didih cecair B adalah lebih tinggi daripada
suhu didih cecair A.
Nilai sifar bersifat arbitrari.(tidak menggambarkan kosong
secara mutlak)
16. Skala Pengukuran
Data Nisbah(ratio data)
Data nisbah adalah sama seperti data interval kecuali nisbah
memberi makna..
Data ratio mempunyai nilai kosong secara mutlak. Nilai kosongnya
mempunyai maksud tiada kuantiti. Seseorang yang tidak bekerja
bermaksud gajinya RM 0.
Cth. 4 orang dipilih secara rawak dan ditanya berapa banyak duit yang
mereka bawa sekarang. Berikut adalah hasilnya : $21, $50, $65, and
$300.
Adakah data ini boleh disusun ikut urutan? Ya, $21 < $50 < $65 <
$300.
Bolehkah kita mengira nisbah ? Ya sebab $0 nilai paling maksimum
yang mereka bawa.
Individu yang mempunyai $300 adalah mempunyai 6 kali ganda
daripada individu yang mempunyai $50.
Cth lain: umur, skor ujian, jumlah jam belajar untuk suatu ujian.
19. Pengujian Hipotesis
Pengujian hipotesis merupakan kaedah yang
paling berkesan untuk membuat kesimpulan
mengenai suatu populasi yang dikaji
berpandukan keputusan yang didapati daripada
sampel.
Hipotesis statistik adalah satu kenyataan yang
dibuat tentang suatu populasi
Kenyataan ini mungkin benar atau tidak
Benar atau tidak +++> lakukan pengujian
hipotesis
20. Kepentingan & Keperluan
Penting untuk menguji adakah
perbezaan yang wujud di antara data
dalam sampel dan populasi adalah
benar-benar berbeza atau berbeza
secara kebetulan sahaja.
21. Takrif Hipotesis
Hipotesis statistik adalah suatu
pernyataan atau anggapan yang
mungkin benar atau tidak terhadap
suatu populasi atau lebih (Walpole,
1990).
Hipotesis yang baik mempunyai sifat-
sifat seperti berfokus, jelas, logik,
difahami dan dapat diuji.
22. Langkah-langkah Pengujian
Hipotesis
Penyataan hipotesis
Jenis Taburan Data
Aras keertian
Ujian Statistik
Kawasan Penolakan
Pengiraan ujian statistik
Keputusan
Kesimpulan
23. Pernyataan Hipotesis
Hipotesis nol ditandakan dengan H0 ialah
hipotesis yang hendak diuji dan diharap akan
ditolak.
oMesti yang membawa maksud kesamaan.
oJadi ada 3 kemungkinan: sama ada = atau ≥ atau
≤.
24. Contoh:
Ho: Purata pendapatan pelajar MIT UKM
Bangi adalah RM4,000.00 sebulan
atau
Ho: µ = RM 4,000.00 sebulan.
25. Pernyataan Hipotesis
Hipotesis alternatif ditandakan dengan H1 , biasanya
dinamakan hipotesis penyelidik yang dirumuskan dengan
harapan untuk menerimanya.
Kebiasaannya sebarang pernyataan yang hendak dibuktikan
benar, ditulis dalam hipotesis alternatif
Mesti membawa maksud ketaksamaan.
o Jadi ada 3 kemungkinan: sama ada ≠ atau < atau >.
o Diterima jika Ho ditolak.
Perhatikan!!! Pernyataan dalam Ho dan H1 tidak boleh bertindan.
26. Contoh:
H1: Purata pendapatan pelajar MIT UKM
Bangi adalah kurang RM4,000.00
sebulan
atau
H1: µ < 4,000.00 .
27. Pernyataan Hipotesis
Kesilapan-kesilapan yang dibuat:
Pernyataan hipotesis penyelidikan yang terlalu
kabur. Cth: terdapat hubungan kecerdasan dan
sikap
Pernyataan hipotesis penyelidikan yang terlalu
umum. Cth: pelajar yang bijak mempunyai sikap
yang baik
Pernyataan hipotesis penyelidikan dalam bentuk
yang tidak boleh diuji. Cth: pelajar yang rajin ke
kuliah lebih beriman
28. Taburan Data
Taburan data sampel perlu di kenalpasti terlebih
dahulu untuk membolehkan kita menggunakan
statistik ujian yang betul.
Bagi data yang diambil dari taburan normal, taburan
sampel nya juga normal. Bagi data yang diambil dari
taburan bukan normal, teorem had memusat
diperlukan.
Ujian kenormalan juga boleh digunakan untuk
menguji adakah data tertabur secara normal.
oBina histogram , Bina plot batang-daun
oKira pekali kepencongan dan kepuncakannya.
oGunakan hubungan min, mod dan median dengan
bentuk taburan.
oAtau gunakan perisian untuk menguji kenormalan
29. Aras Keertian
Menerima atau menolak H0 bergantung kepada tahap
signifikan atau aras keertian (level of significance)
Aras keertian ditandakan dengan simbol α
Juga dipanggil sebagai kebarangkalian berlakunya
ralat jenis I, iaitu dalam membuat keputusan,
hipotesis nol ditolak sedangkan pada hakikat ianya
benar.
Maka semakin besar nilai α, semakin besar
kemungkinan kita akan menolak hipotesis nol yang
benar
Lazimnya nilai α yang digunakan ialah 0.1, 0.01 atau
0.05
30. Ujian Statistik
Sebelum memilih suatu ujian statistik , tanya:
Berapa banyak pembolehubah kajian?
Adakah taburan data normal?
Adakah sampel independent atau dependent?
Apakah hipotesis anda?
Adakah data nominal, ordinal, selang/ratio?
31. Kajian hubungan
Correlation
Design Scale of Measurement
Coefficients
Phi
Two nominal variables
Coefficient
A nominal variable and
an interval or ratio Point-biserial
variable
Survey or Correlational Studies
Ordinal Spearman's r
Interval or ratio Pearson's r
32. Kajianof Perbandingan
Designs
Scale
Test Statistic
Measurement
Nominal Chi-Squared, sign test
Single-group
Z-test : Population variance is known
between-subject
Ratio or Interval
T-test: Population variance must be estimated
Nominal Chi-Squared
Two-group between-
Ordinal Sign test, Wilcoxon's rank-sum test ,U-Mann
subject
Whitney test(tidak bersandar)
Interval or Ratio Student's t-test
Ordinal Kruskal-Wallace's H-test
Three or more group
between subject Fisher's F-test If significant, test individual
Interval or ratio
(ANOVA) means with Tukey's HSD
33. Contoh
Seorang pensyarah ingin mengetahui adakah
belajar secara dalam kumpulan menyebabkan
peningkatan prestasi dalam exam berbanding
belajar secara individu..
1. Tujuan : menguji adakah teknik belajar memberi
kesan kepada pencapaian markah.
2. Mengkaji dua kumpulan sampel yang independent
3. Pembolehubah kajian : markah peperiksaan
4. Skala pengukuran: nisbah.
5. Hipotesis H0: Tiada perbezaan purata markah di
antara belajar berkumpulan dan belajar sendiri.
6. Statistik ujian yang sesuai :
1. Normal - independent t-test.
34. Kawasan Penolakan
Ada 3 jenis hujung ujian:
o 2 hujung
o 1 hujung sebelah kiri
o 1 hujung sebelah kanan
Bergantung kepada H1.
Kawasan penolakan adalah
kawasan yang membolehkan Ho di tolak
35. Nilai Kritikal
Nilai pemisah diantara kawasan
penolakan dan kawasan penerimaan.
Keputusan
Kesimpulan
36. Jenis ralat statistik
Semua keputusan ujian statistik bergantung kepada
samada menolak atau menerima hipotesis nol.
Namun ianya dipengaruhi oleh 2 ralat statistik
Ralat jenis I
berlaku jika kita menolak H0 apabila dalam keadaan sebenar,
ia benar dan
Ralat jeis II
berlaku apabila kita tidak menolak H0 sedangkan dalam
keadaan sebenar, ia palsu.
Kb (Ralat Jenis I ) = α dan Kb (Ralat Jenis II) = β
Oleh itu penyelidik menetapkan aras keertian pada 0.05 iaitu
hanya 5 dari 100 sahaja dibenarkan membuat ralat jenis 1
37. Secara Matematik
α = kb (Ralat jenis I )
= kb ( tolak H0| H0 benar )
dan
β = kb (Ralat jenis II)
= KB (Terima H0| H0 palsu)
39. Analisis Menggunakan SPSS
Apa itu SPSS?
SPSS (Statistical Package for the
Social Sciences)
Satu sistem yang berupaya mengurus data
dan menganalisis secara berstatistik.
Mudah digunakan dan boleh memanipulasi
data.
Tetapi SPSS tidak boleh menyelesaikan
sebarang masalah anda.
Ia boleh digunakan untuk menganalisis
data
Yang penting, anda mesti ada
pengetahuan asas mengenai statistik
untuk mentafsirkan output.
40. Analisis Grafik dan Diskriptif
Data Nominal – Frequency, Crosstabs,
bar charts dan pie charts
Data Ordinal - Frequency, Crosstabs
dan descriptivee statistics, bar charts,
pie charts, steam-lesf plots
Data selanjar – descriptive statistics,
histograms, boxplots, dan scatter plot
bagi dua pembolehubah
41. 3 kumpulan Ujian berstatistik
inferensi
Kumpulan 1. Menguji jika terdapat perbezaan
yang bererti di antara dua pembolehubah;
Kumpulan 2. Menguji kesignifikanan
hubungan di antara dua pembolehubah; dan
Kumpulan 3. Menguji jika terdapat perbezaan
yang signifikan diantara lebih daripada dua
pembolehubah.
42. Analisis Inferensi
Kumpulan 1. Menguji jika terdapat perbezaan
yang bererti di antara dua pembolehubah
Nominal atau ordinal – guna Crosstabs
Data selanjar –
Pertama, periksa jika data normal
Untuk periksa kenormalan, go to ‘Analyze’, ‘descriptive
statistics’, ‘explore’
Kedua, jika membandingkan dua atau lebih kumpulan,
periksa kehomogenan bagi varians di antara kumpulan.
Guna ‘explore’
Bagi perbandingan dua kumpulan, guna Independent t-
test bagi independent sample dan dependet t-test bagi
paired sample
Jika tidak normal guna analyze nonparametric
43. Analisis Inferensi
Kumpulan 2. Menguji kesignifikan
hubungan di antara dua pembolehubah
Nominal data – guna crosstab dan pilih
ujian yang sesuai untuk nominal data
Ordinal data – guna crosstabs, bivariate
correlation spt pekali korelasi Spearman
Data Selanjar – guna bivariate correlation
spt Pearson correlation
44. Analisis Inferensi
Kumpulan 3. Menguji jika terdapat
perbezaan yang bererti di antara lebih
dua pembolehubah
Bagi data tidak normal pilih
Analyze nonparametric test k independet
test
Bagi data normal
Analyze compare mean ANOVA