SlideShare une entreprise Scribd logo
1  sur  14
VALIDITAS
        Validitas berasal dari bahasa Inggris dari kata validity yang berarti keabsahan atau
kebenaran. Dalam konteks alat ukur atau instrumen asesmen, validitas berarti sejauh mana
kecermatan atau ketepatan alat ukur dalam melakukan fungsi ukurnya. Sebuah instrumen
yang valid akan menghasilkan data yang tepat seperti yang diinginkan. Sebagai contoh, jika
kita ingin mengetahui berat maka alat ukur yang tepat adalah timbangan atau neraca bukan
meteran, termometer, atau alat yang lain. Dengan kata lain, sifat valid memberikan pengertian
bahwa alat ukur yang digunakan mampu memberikan nilai yang sesungguhnya dari apa yang
diinginkan.

        Contoh di atas barang kali terlalu sederhana dan mudah untuk mengecek dan
mengendalikannya. Berbeda halnya jika kita akan melakukan pengukuran dalam dunia
pembelajaran atau dunia pendidikan, tidak sesederhana seperti pada pengukuran berat ataupun
panjang. Untuk mengetahui alat ukur prestasi belajar apakah valid atau tidak maka perlu
dipelajari dengan hati -hati.

       Validitas sangat berkaitan dengan tujuan pengukuran. Validitas tidak berlaku secara
umum bagi semua pengukuran. Suatu tes mempunyai hasil ukuran yang baik (valid) untuk
suatu tujuan tertentu yang sepesifik tetapi tidak valid untuk tujuan yang lain atau bahkan
untuk tujuan yang sama pada kelompok yang lain.

        Validitas secara umum menunjukkan ukuran yang mengukur apa yang akan diukur
(Anonim: 2006: 1). Validitas mengacu pada keberartian, kebenaran, kemanfaatan, dan
keseuaian skor tes (Jafar Ahiri: 1). Validitas adalah suatu konsep yang berkaitan dengan
sejauh mana tes telah mengukur apa yang seharusnya diukur (Sumarna Supranata: 2004: 50).
Dalam buku “ Encyclopedia of Educational Evaluation (Suharsimi A: 1987: 60) dikatakan,
bahwa sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur.
Validitas tes perlu ditentukan untuk mengetahui kualitas tes dalam kaitannya dengan
mengukur hal yang seharusnya diukur (Sumarna Supranata: 2004: 50). Menurut Nunnaly
(1972) dalam Sumarna Supranata (2004: 50), menyatakan, bahwa pengertian validitas
senantiasa dikaitkan dengan penelitian empiris dan pembuktian-pembuktiannya bergantung
kepada macam validitas yang digunakan. Kemudian, menurut Anastasi (1988) dalam
Sumarna Supranata (2004: 50), menyatakan, bahwa validitas adalah suatu tingkatan yang
menyatakan bahwa suatu alat ukur telah sesuai dengan apa yang diukur. Sedangkan Gronlund
(1985) dalam Sumarna Supranata (2004: 50), menyatakan bahwa validitas berkaitan dengan
hasil suatu alat ukur, menunjukkan tingkatan, dan bersifat khusus sesuai dengan tujuan
pengukuran yang akan dilakukan. Suatu tes dapat dikatakan mempunyai validitas tinggi
apabila tes tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur sesuai dengan
makna dan tujuan diadakannya tes tersebut.

Linn & Gronlund (2000) mengemukakan hakikat validitas tes dan asesmen
sebagai berikut :

1. Validitas menyatakan ketepatan interpretasi hasil bukan pada prosedurnya.
2. Validitas merupakan persoalan yang berkaitan dengan derajat (tingkatan),
   sebagai konsekuensinya kita harus menghindari pemikiran hasil asesmen
   sebagai valid atau tidak valid. Oleh karena validitas adalah persoalan derajad maka sebuah
   instrumen dapat dikategorikan mempunyai derajad validitas tinggi, sedang, dan rendah.
3. Validitas selalu bersifat khusus untuk penggunaan atau interpretasi tertentu. Tidak ada
   asesmen yang valid untuk semua tujuan. Sebagai contoh, hasil tes aritmatika mungkin
   mempunyai tingkat validitas yang tinggi untuk kemampuan hitung, validitas yang rendah
   untuk alasan-alasan aritmatika, dan mempunyai derajat validitas sedang untuk
   memprediksi kesuksesan prestasi matematika yang akan datang.
4. Validitas merupakan kesatuan konsep. Hakikat konsep validitas dipandang sebagai sebuah
   kesatuan konsep berdasark an berbagai macam bagian dari fakta.
5. Validitas melibatkan sebuah keputusan evaluatif yang menyeluruh.

A. Macam-macam Validitas

       Validitas dapat dibedakan menjadi 3 macam yaitu validitas isi ( content validity),
  validitas konstruksi (construct validity), dan validitas berdasar kriteria (criterion related
  validity). Validitas berdasar kriteria dapat dibedakan menjadi dua macam yaitu, validitas
  konkuren (validitas ada sekarang, concurent validity) dan validitas prediktif (predictive
  validity).

 1) Validitas Isi (Content Validity)

       Validitas isi disebut juga validitas kurikuler. Oleh karena itu, validitas ini erat
  kaitannya dengan materi yang akan diukur dalam tes. Tentu saja materi yang dimaksud
  adalah materi yang terdapat dalam kurikulum. Validitas isi mencerminkan sejauh mana
  butir-butir dalam tes mencerminkan materi yang disajikan dalam kurikulum. Sebuah tes
  dikatakan memiliki validitas isi jika butir - butir tes bersifat representatif terhadap isi
  materi dalam kurikulum tersebut. Pengujian validitas isi tidak melalui prosedur pengujian
  secara statistik, melainkan melalui analisis secara rasional. Pengetahuan terhadap
  kurikulum menjadi dasar berpijak yang penting untuk dapat melakukan analisis validitas
  isi.

       Cara yang praktis untuk melakukan analisis validitas isi adalah dengan melihat apakah
  butir-butir tes telah disusun sesuai dengan blue-print (kisi-kisi) yang sudah dirancang
  sebelumnya. Blue print menjadi acuan dalam menuangkan domain atau ranah dan indikator
  yang akan diukur dalam tes.

2) Validitas Konstruk (Construct Validity)
       Validitas konstruk adalah validitas yang menyangkut bangunan teoretik variabel yang
   akan diukur. Sebuah tes dikatakan mempunyai validitas konstruk apabila butir-butir soal
   yang disusun dalam tes mengukur setiap aspek berpikir dari sebuah variabel yang akan
   diukur melalui tes tersebut. Seperti halnya validitas isi, untuk mempertinggi validitas
   konstruk dapat dilakukan dengan cara memerinci dan memasangkan setiap butir soal
   dengan setiap aspek. Pengujian validitas konstruk diperlukan an alisis statistik yang
   kompleks seperti prosedur analisis faktor. Salah satu prosedur pengujian validitas konstruk
   yang tidak terlalu kompleks dapat dilakukan dengan pendekatan multi-trait multi-method.
       Dua atau lebih trait yang diukur melalui dua atau lebih metode dapat diuji secara
   serentak dengan pendekatan ini, sehingga akan diperoleh adanya bukti adanya validitas
   diskriminan dan validitas konvergen. Validitas diskriminan ditunjukkan oleh rendahnya
   korelasi antara faktor skala atau tes yang mengukur trai t yang berbeda terutama bila
   digunakan metode yang sama. Validitas konvergen ditunjukkan oleh tingginya korelasi
   skor tes –tes yang mengukur trait yang sama dengan menggunakan metode yang berbeda.
3) Validitas Berdasarkan Kriteria

       Sesuai dengan namanya, validitas ini didasarkan pada kriteria tertentu. Dengan
  demikian bukti adanya validitas ditunjukkan adanya hubungan korelasional skor pada tes
  yang bersangkutan dengan skor suatu kriteria.
       Pengujian validitas ini bersifat empirik, artinya pengujian hanya dapat dilakukan
  setelah mendapatkan data di lapangan. Apabila berdasarkan hasil analisis yang dilakukan
  terhadap data hasil pengamatan di lapangan terbukti bahwa tes hasil belajar dapat
  mengukur hasil belajar yang seharusnya diungkap secara tepat maka berarti alat tes
  tersebut mempunyai validitas empirik. Untuk keperluan pengujian jenis validitas ini dapat
  dilakukan dengan dua cara yaitu dari segi kemampuannya dalam melakukan ramalan (
  predictive validity) serta daya ketepatan bandingannya (concurent validity).

       Perbedaan utama antara validitas ramalan dengan validitas bandingan adalah
ketersediaan pembanding (kriterium). Pada validitas ramalan , kriterium diperoleh pada waktu
yang akan datang setelah dilakukan tes yang akan diukur validitasnya tersebut. Sedangkan
pada validitas bandingan, kriterium sudah ada atau dapat diperoleh pada saat yang sama
dengan waktu untuk memperoleh data tentang tes yang akan diukur validitasnya tersebut
tanpa harus menunggu masa yang akan datang.

B. Pengujian Validitas Tes Secara Empirik
      Validitas empirik adalah kerapatan mengukur yang didasarkan pada hasil analisis yang
bersifat empirik. Dengan kata lain validitas empirik adalah validitas yang bersumber pada
atau diperoleh atas dasar pengamatan di lapangan.
     Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas empirik
ataukah belum, dapat dilakukan penelusuran dari dua segi :

a) Validitas ramalan (predictive validity)
        Sebagai ilustrasi adalah adanya tes masuk Perguruan Tinggi Negeri. Setelah melalui
serangkaian tes maka hanya calon mahasiswa yang mempunyai skor tinggi yang diterima oleh
panitia seleksi mahasiswa baru. Sesungguhnya keputusan panitia seleksi yang hanya
menerima mahasiswa yang mempunyai skor tinggi saja berarti sudah memprediksikan bahwa
calon mahasiswa dengan skor tinggi tersebut kelak yang akan lebih berhasil dalam studinya.
Sedangkan para calon mahasiswa yang mempunyai skor sedang apalagi rendah diprediksikan
akan banyak menemui kendala dalam studinya. Oleh karena itu tes yang digunakan dalam
seleksi calon mahasiwa baru tersebut akan mempunyai tingkat validitas prediktif yang tinggi
apabila secara empirik terbukti bahwa prestasi belajar mereka juga baik. Dengan demikian
antara skor tes masuk dengan prestasi belajar harus mempunyai korelasi yang positif.
        Pada kasus di atas, yang dipermasalahkan validitasnya adalah tes masuk. Oleh karena
itu hasil belajar pada masa perkuliahan digunakan sebagai tolok ukur (kriterium). Adanya
kesejajaran, kesesuaian, kesamaan arah antara tes seleksi masuk dengan hasil belajar
mempunyai korelasi yang positif.

       Berdasarkan pada uraian di atas, dapatlah dipahami bahwa untuk mengetahui apakah
suatu tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas ramalan
ataukah belum, dapat ditempuh dengan cara mencari korelasi antara tes hasil belajar yang
sedang diuji validitas ramalan itu dapat dinyatakan sebagai tes hasil belajar yang telah
memiliki daya ramalan yang tepat.
Contoh : Nilai hasil tes seleksi bahasa arab di Fakultas
                Nilai         (Variabel y) yang berhasil dicapai oleh 5 orang.
 No
           X            Y
  1.       58           65
  2.       50           57    “ tidak terdapat korelasi fositif yang signifikan, antara variable
  3.       53           60    X dengan variable Y”
  4.       49           56
  5.       58           65




  a) Menyiapkan Peta Korelasi

                   No        X         Y                    Y                     2
                                                                                          Y2
                                                                       .Y
                   1.        58        65        4          4         16        16        16
                   2.        50        57        -4        -4         16        16        16
                   3.        53        60        -1        -1          1        -1         1
                   4.        49        56        -5         2        -10        25         4
                   5.        58        65        4          4         16        16        16

  b) Menghitung mean x dan y
  c) Menghitung Standard deviasi X dan Y
  d) Angka Indeks korelasi X Y


b) Validitas bandingan (Concurent Validity)
        Validitas ini sering pula disebut sebagai validitas ada sekarang, validitas sama saat,
validitas pengalaman, dan validitas empiris. Disebut sebagai validitas ada sekarang karena
pengujiannya berdasarkan pengalaman yang saat ini sudah ada di tangan. Disebut sebagai
validitas sama saat karena validitas ini segera dapat kita peroleh informasinya pada saat yang
sama dengan waktu diperolehnya data hasil tes yang diukur validitasnya tersebut. Disebut
validitas pengalaman (empiris) karena validitas ini dikaitkan dengan pengalaman yang sudah
ada.
         Dalam hal ini pengalaman digunakan sebagai kriterium. Guna menentukan validitas
bandingan ini tidak perlu menunggu waktu untuk membuktikannya. Seperti disebutkan pada
alenia di atas bahwa yang berfungsi sebagai kriterium adalah data hasil pengalaman. Apabila
data dari tes yang ada sekarang mempunyai hubungan yang searah dengan data hasil
pengalaman maka dikatakan telah mempunyai validitas bandingan.

Contoh : Bagaimana cara pengujian validitas bandingan.
          Misalnya pada tanggal 1 Agustus 1994 sebanyak 24 orang siswa. Dua minggu
          kemudian, yaitu pada tanggal 15 Agustus 1994, tanpa pemberitahuan terlebih
          dahulu, 20 orang siswa diatas dihadapkan pada tes formatif kedua dengan mata
          pelajaran yang sama dengan menggunakan butir soal yang sama dengan butir-butir
          soal yang telah dikeluarkan pada tes formatif pertama.
Tekhnik pengujian validitas item tes hasil belajar
a. Pengertian validitas item
          Dimaksud dengan validitas item dari sebuah tes adalah ketepatan mengukur yang
   dimiliki oleh sebutir item ( yang merupakan bagian yang tak terpisahkan dari tes bagian
   suatu totalitas ), dalam negukur apa yang seharusnya diukur lewat butir item tersebut.
b. Tehknik Pengujian Validitas Item Tes Hasil Belajar
          Memilih dan menentukan jenis tekhnik dalam rangka menguji validitas item itu.
   Seperti yang diketahui pada tes objektif maka hanya ada dua kemungkinan yaitu betul
   atau salah.

    Rumus : PB 1 = √


B. Faktor-faktor yang mempengaruhi validitas

       Banyak faktor yang menyebabkan hasil asesmen tidak valid. Beberapa di antaranya
tampak jelas dan mudah untuk menghindarinya. Tidak ada guru yang akan berpikir untuk
mengukur pengetahuan biologi dengan asesmen matematika. Demikian pula juga tidak ada
guru yang akan mengukur kemampuan memecahkan masalah (problem solving) biologi kelas
7 SMP dengan menggunakan asesmen yang didesain untuk kelas 12 SMA. Dalam dua contoh
tersebut sudah sangat jelas hasil asesmen akan menjadi tidak valid. Faktor yang
mempengaruhi validitas tes antara lain:

1. Faktor dari dalam tes itu sendiri

         Pengujian terhadap butir tes secara hati-hati akan menunjukkan apakah tes yang
digunakan untuk mengukur isi materi atau fungsi - fungsi mental yang akan diakses oleh
guru. Bagaimanapun juga, beberapa fak tor berikut dapat menjaga butir tes dari fungsi yang
dikehendaki dan dengan demikian juga terj aga dari rendahnya validitas hasil asesmen. Lima
faktor yang pertama dapat diterapkan sejajar dengan asesmen penampilan siswa secara luas
ser ta tes-tes tradisional.

Lima faktor yang terakhir lebih diterapkan secara langsung terhadap tes pilihan dan tes
dengan jawaban singkat dengan jawaban benar atau salah.

   a. Petunjuk yang tidak jelas . Petunjuk yang tidak jelas menyebabkan siswa kehilangan
      waktu untuk sekedar memahami petunjuk pengerjaan atau bahkan tidak dapat
      melakukan apa yang seharusnya dilakukan.
   b. Penggunaan kosa kata dan struktur kalimat yang sulit. Penggunaan kosa kata atau
      struktur kalimat yang sulit dapat menyebabkan siswa terjebak untuk pemahaman
      terhadap pemahaman maksud dari sebuah pertanyaan bukan untuk menyelesaikan
      pertanyaan itu sendiri.
   c. Ambiguitas. Ambiguitas yaitu adanya kemungkinan multi tafsir juga menyebabkan
      menurunnya validitas sebuah tes.
   d. Alokasi waktu yang tidak cukup. Seyogyanya sebuah tes disediakan waktu yang
      cukup untuk mengerjakan seluruh butir tes yang ada. Kekurangan waktu dalam
      menyelesaikan sebuah tes bisa jadi bukan karena siswa tidak mampu untuk
      menyelesaikan tesnya tetapi karena keterbatasan kesempatan untuk mengerjakannya.
e. Penekanan yang berlebihan terhadap aspek tertentu, sehingga terlalu mudah ditebak
      kecenderungan dari jawaban soal akan menyebabkan menurunnya tingkat validitas
      soal.
   f. Kualitas butir tes yang tidak memadai untuk mengukur hasil belajar . Kualitas yang
      tidak memadai misalnya tes dimaksudkan untuk megukur kemampuan berpikir tingkat
      tinggi (higher order thinking) jelas tidak cukup hanya digunakan tes yang bersifat
      untuk mengungkap pengetahuan faktual saja.
   g. Susunan tes yang jelek.
   h. Tes terlalu pendek.
   i. Penyusunan butir tes yang tidak runtut .
   j. Pola jawaban yang mudah ditebak, misalnya pada soal pilihan ganda jawabannya
      adalah A semua, atau B semua atau menunjukkan pola tertentu misalnya D, C, B, A,
      D, C, B, A, dan sebagainya.

2. Faktor berfungsinya tes dan prosedur mengajar

3. Faktor administrasi dan penskoran
   Pemberian skor terhadap jawaban siswa (testee) harus dilakukan secara hati-hati jangan
   sampai salah tulis atau meremehkan selisih angka walaupun hanya sedikit. Hal ini akan
   menyebabkan hasil pengujian terhadap validitas akan memberikan makna yang berbeda.

4. Faktor tanggapan siswa
   Tanggapan siswa yang tidak serius bias anya dijumpai pada saat siswa diminta untuk
   mengisi sebuah angket. Hal ini akan menyebabkan siswa mengisi angket secara
   sembarangan karena merasa tidak penting maupun alasan -alasan yang lain. Oleh karena
   itu berikan angket pada waktu dan kondisi yang tepat .

5. Hakikat kelompok dan kriteria
   Seperti sudah dijelaskan di atas bahwa validitas bersifat spesifik. Sebuah asesmen atau
   instrumen alat ukur mungkin hanya valid untuk kelompok tertentu saja dan tidak valid
   untuk kelompok yang lain. Sebagai contoh misalnya sebuah tes diujicobakan pada
   sekelompok siswa pada sebuah sekolah dengan kualitas biasa –biasa saja tentu akan
   berbeda hasilnya jika tes yang sama diberikan pada sekelompok siswa pada sekolah yang
   favorit.




                                 RELIABILITAS
        Pada bagian di atas telah dibahas mengenai validitas. Validitas adalah sebuah evaluasi
terhadap ketepatan interpretasi dan penggunaan hasil asesmen. Validitas mempunyai arti
sejauh mana ketepatan dan kecermatan alat ukur mampu melakukan fungsi ukurnya. Selain
validitas, alat ukur yang baik juga harus reliabel. Oleh karena itu, alat ukur yang baik adalah
alat ukur yang valid dan reliabel. Hubungan antara validitas dengan reliabilitas dapat
digambarkansebagaimana tembakan yang selalu tepat mengenai sasaran yang diinginkan,
seperti ilustrasi pada gambar di bawah ini.
Reliabilitas diterjemahkan dari kata reliability yang berarti hal yang dapat dipercaya
(tahan uji). Sebuah tes dikatakan mempunyai reliabilitas yang tinggi jika tes terebut
memberikan data hasil yang ajeg (tetap) walaupun diberikan pada waktu yang berbeda kepada
responden yang sama. Hasil tes yang tetap atau seandainya berubah maka perubahan i tu tidak
signifikan maka tes tersebut dikatakan reliabel. Oleh karena itu reliabilitas sering disebut
dengan keterpercayaan, keterandalan, keajegan, konsistensi, kestabilan, dan sebagainya.
Seperti diuraikan di atas sebuah alat ukur yang baik harus valid dan reliabel. Namun demikian
validitas lebih penting dibandingkan dengan reliabilitas. Reliabilitas merupakan penyokong
validitas. Sebuah alat ukur yang valid selalu reliabel. Akan tetapi alat ukur yang reliabel
belum tentu valid, seperti digambarkan pada ilustrasi di atas. Seperti halnya validitas,
reliabilitas juga merupakan tingkatan. Tingkat atau kadar reliabilitas dinyatakan dengan
koefisien reliabilitas. Berikut ini akan dibahas macam-macam metode mencari besarnya
koefisien reliabilitas.

Metode Mencari Koefisien Reliabilitas

1) Metode Tes Ulang (Test Retest Method)

       Metode ini diterapkan untuk menghindari adanya penyusunan dua seri tes. Teknisnya
adalah sebuah tes yang sama diberikan dua kali kepada responden yang sama dengan jarak
waktu tertentu. Jika hasil tes pertama mempunyai kesejajaran dengan hasil tes yang kedua
maka tes tersbut dikatakan reliable. Oleh karena pengujian ini dilakukan terhadap sebuah tes
yang diujicobakan dua kali maka sering disebut pula sebagai single-test-double-trial-method.
Kelemahan metode ini adalah jika jeda waktu tes terlalu singkat sedangkan soal tes banyak
mengungkapkan aspek pengetahuan maka responden cenderung masih mengingat materi yang
diteskan, sehingga ada kemungkinan hasil tes yang kedua lebih baik daripada hasil tes
pertama. Sebaliknya jika jeda waktu tes pertama dengan kedua terlalu lama dikhawatirkan
banyak faktor serta situasi dan kondisi sudah banyak berubah dan mempengaruhi hasil tes
yang kedua.

   Adapun langkah-langkah yang ditempuh pada uji reabilitas ini adalah sebagai berikut :

  1.   Menyusun sebuah tes yang akan diukur reabilitasnya
  2.   Mengajukan tes yang sudah disusun tersebut (tahap I)
  3.   Mennghitung skor hasil tes ( tahap I)
  4.   Mengjukan ulang tes yang tersusun tersebut ( tahap II)
5. Menghitung reabilitas tes tersebut dengan jalan mengkorelasikan skor tes I dengan skor
     tes II dengan rumus korelasi produk moment person

2) Metode Tes Sejajar (Equivalent)

        Metode ini mengharuskan adanya dua buah seri soal yang mempunyai kesamaan
tujuan, bobot soal, tingkat kesukaran, susunan soal, tetpai butir –butir soalnya berbeda.
Dengan kata lain, dua buah tes yang digunakan harus sejajar (paralel, equivalen). Koefisien
relibiabilitas diperoleh dengan me ngkorelasikan hasil tes pertama dengan hasil tes kedua.
Oleh karena metode ini menggunakan dua buah tes yang berbeda dan diteskan pada siswa
yang sama maka disebut juga doublé test – double – trial – method. Sudah tentu metode ini
akan menambah kerepotan. Inilah kelemahan metode ini. Kelebihan dari metode ini adalah
dapat memperbaiki kelemahan pada metode pertama yaitu terhindarnya dari kondisi “siswa
masih mengingat materi tes pertama”. Aspek ingatan dan hafalan pada pengerjaan tes pertama
tidak terbawa pada saat mengerjakan tes yang kedua.

Adapun langkah yang ditempuh adalah :
   1) Menyusun dua buah tes yang equivalent
   2) Mengajukan kedua buah tes tersebut atau dalam waktu yang brsamaan atau beriringan.
   3) Memberikan skor hasil tes yang telah diujikan, disusun dengan memisahkan antara tes
      A dan tes B.
   4) Mencari koofesien stabilitas kedua tes ( A dan B ) dengan jalan mencari korelasinya
      melalui rumus korelasi product moment.


3) Metode Tes Tunggal (Single Test – Single Trial)

         Metode tes tunggal dilihat dari kepraktisannya lebih praktis dari pada dua metode
sebelumnya. Metode ini hanya melakukan sekali tes kepada sekelompok subjek. Dengan
demikian tidak perlu menunggu waktu maupun harus mempunyai data dari tes sejenis untuk
dapat menentukan reliabilitasnya. Koefisien reliabilitas dapat diperoleh dengan cara
membelah instrumen menjadi dua, tiga, empat, atau bahkan sebanyak butir yang dimiliki oleh
instrumen tersebut. Teknik perhitungannya tergantung pada banyaknya belahan, bentuk, serta
sifat alat ukurnya.

Adapun langkah-langkah secara umum yang ditempuh untuk mencari reliabilitas tes ini
adalah sebagai berikut :
   1) Menyusun sebuah tes sebaiknya jumlah nomornya genap, sehingga bila dibelah sama.
   2) Mengajukan tes tersebut pada sebuah sampel
   3) Menghitung skor masing-masing peserta didik dalam dua kelompok skor, dapat
       dikelompokkan skor ganjil dan genap, dapat pula dikelompokkan skor belahan atas
       dan skor belahan bawah
   4) Mencari reliabilitas setengan tes, dengan jalan mengkorelasikan kedua skor tersebut
       dengan rumus produck moment
   5) Mencari reliabilitas satu tes penuh dengan menggunakan rumus spearman Brown atau
       rumus lainnya.

Beberapa teknik yang sering digunakan untuk menentukan koefisien reliabilitas dengan
metode tes tunggal ini antara lain:
a) Formula Kuder Richardson (KR20)

       Formula KR20 dapat diterapkan pada instrumen yang yang mempunyai data skor
dikotomi dari tes yang seolah -olah dibagi-bagi menjadi belahan sebanyak butir yang dimiliki.
Hasil perhitungan dengan rumus KR20 lebih teliti, tetapi perhitungan lebih rumit.
Rumus:




b) Formula Kuder Richardson (KR21)

         Formula KR21 lebih sederhana dalam perhitungannya. Kelemahannya adalah kurang
teliti dibandingkan dengan KR20. Rumusnya adalah sebagai berikut:




Keterangan:
r11 = koefisien reliabilitas
n = banyaknya butir soal
1 = bilangan konstan
Mt = mean total (rata-rata hitung dari skor total)
St2 = varian total


c) Formula Spearman-Brown

       Formula Spearman-Brown hanya dapat diterapkan pada soal yang mempunyai jumlah
butir genap. Formula ini menggunakan teknik belah dua ( split half method), yaitu soal
dibelah menjadi 2 bagian (belahan ganjil dan belahan genap atau belahan kiri dengan belahan
kanan). Kedua belahan tersebut sejajar.
Formulanya adalah sebagai berikut:
Keterangan:
r11 = koefisien reliabilitas
rhh = koefisien korelasi product moment antara skor belahan satu
dengan skor belahan yang lain
1 & 2 = bilangan konstan

d) Formula Rulon

        Formula Rulon ini juga dapat diterapkan dengan belah dua ( split half method) seperti
halnya pada formula Spearman -Brown. Hanya saja cara pandannya terhadap reliabilitas be
rbeda dengan Spearman-Brown. Menurut Rulon reliabilitas dapat dipandang dari adanya
selisih skor yang diperoleh oleh responden pada belahan pertama dengan belahan kedua.
Selisih tersebut yang menjadi sumber variasi error sehingga bila dibandingkan dengan v ariasi
skor akan dapat menjadi dasar untuk melakukan estimasi reliabilitas tes. Formula Rulon
adalah sebagai berikut.




Keterangan:
r11 = koefisien reliabilitas
Sd2 = varians perbedaan skor belahan
St2 = varians skor total
1 = bilangan konstan



e) Formula Alpha

        Formula-formula di atas (Spearman-Brown, KR, Rulon) hanya berlaku untuk soal
objektif yang mempunyai kemungkinan jawaban benar dan salah. Sedangkan untuk soal yang
mempunyai gradualitas skor jawaban misalnya pada soal uraian ataupun pada angket ( tes
sikap) formula yang paling pas adalah dengan menggunakan Formula Alpha. Hal ini
dimungkinkan karena Formula Alpha mengakomodasi adanya variasi skor dalam setiap butir
soal. Rumus yang digunakan adalah sebagai berikut.
Keterangan:
r11 = koefisien reliabilitas
Si2 = varians skor tiap-tiap butir soal
St2 = varians skor total
1 = bilangan konstan

f) Formula C. Hoyt

       Berbeda dengan formula-formula yang lain, C. Hoyt memandang bahwa sebuah tes
dapat dipandang sebagai sebuah interaksi faktorial di mana skor-skor tes dianggap sebagai
hasil eksperimen. Dalam hal ini, berlaku sebagai faktor Ia dalah subjek (responden)
sedangkan faktor II adalah butir soal. Dengan demikian masing-masing sel terdiri atas satu
subjek, untuk selanjutnya dapat dicari interaksi antara subjek dengan butir soal. Kelebihan
formula ini adalah dapat diterapkan baik pada soal yang mempunyai skor dikotomi 1 dan 0
maupun pada soal yang mempunyai variasi skor pada butirnya (tes sikap maupun tes uraian).
Rumus yang digunakan adalah sebagai berikut.




Keterangan:
r11 = koefisien reliabilitas
MKe = mean kuadrat interaksi antara subjek dengan butir soal
MKs = mean kuadrat antarsubjek
1 = bilangan konstan

g) Formula Flanagan

       Reliabilitas pada formula Flanagan tidak didasarkan pada ada tidaknya korelasi antara
belahan I dengan belahan II. Dasar dari formula Flanagan adalah jumlah kuadrat deviasi
(varians) pada tes belahan I, jumlah kuadrat (varians) deviasi pada tes belahan II, dan jumlah
kuadrat deviasi (varians) skor total. Formula yang digunakan adalah sebagai berikut:




Keterangan:
r11 = koefisien reliabilitas
S12 = varians skor belahan 1
S22 = varians skor belahan 2
St2 = varians skor total
2 & 1 = bilangan konstan
Faktor-faktor yang mempengaruhi reliabilitas
1. Jumlah butir tes

         Umumnya semakin besar jumlah butir soal tes samakin tinggi pula reliabilitasnya. Hal
ini terjadi karena semakin panjang tes (semakin banyak butir soal) sehingga semakin banyak
perilaku yang terukur dengan lebih tepat. Skor skor yang diperoleh tepat dan kemungkinan
sedikit mengalami penyimpangan (distorsi) oleh adanya faktor -faktor yang sudah biasa
dikenal dengan sebuah tes yang diberikan atau kurangnya pemahaman terhadap apa yang
diharapkan pada sebuah tes yang diberikan.

2. Penyebaran skor

         Sebagai catatan awal, koefisien reliabilitas secara langsung dipengaruhi oleh
penyebaran skor dalam kelompok yang diukur. Hal-hal lain menjadi sama, semakin besar
penyebaran skor maka semakin besar pula indeks reliabilitas yang diperoleh. Karena semakin
besar indeks reliabilitas yang dihasilkan ketika individu-individu berada pada posisi yang
relatif sama dalam sebuah kelompok sebuah asesmen dengan asesmen yang lain, hal ini
secara alami mengikuti bahwa segala sesuatu yang mengurangi kemungkinan bergeser nya
posisi dalam kelompok juga turut andil dalam memperbesar koefisien reliabilitas. Dalam
kasus ini, semakin besar perbedaan skor individu mengurangi kemungkinan pergeseran
pososi. Dengan kata lain kesalahan dalam pengukuran kurang berpengaruh terhadap posisi
relatif individu ketika perbedaan -perbedaan di antara anggota - anggota kelompok yang
besar. Hal ini terjadi ketika skornya tersebar luas.

3. Objektivitas

         Objektivitas sebuah alat ukur menyatakan derajad untuk pemberi skor kompeten yang
sama mendapatkan ha sil yang sama. Sebagian besar tes bakat dan tes prestasi standar
mempunyai objektivitas yang tinggi. Butir-butir skor tes objektif seperti pilihan ganda dan
skor yang dihasilkan tidak dipengaruhi oleh keputusan dan pendapat pemberi skor. Semakin
tinggi tin gkat objektivitas tes semakin tinggi pula tingkat reliabilitasnya.

4. Metode estimasi reliabilitas

         Saat menguji koefisien reliabilitas tes standar, memutuskan metode yang digunakan
untuk menentukan besarnya koefisien reliabilitas merupakan hal yang penting. Secara umum,
besarnya koefisien reliabilitas berkaitan erat dengan metode yang digunakan untuk estimasi
reliabilitas.
   a. Metode tes ulang (Test Retest Method) : mungkin hasilnya lebih besar dibandingkan
       dengan metode belah dua jika interval waktunya pendek. Koefisien reliabilitas yang
       dihasilkan menjadi lebih kecil jika interval waktu tesnya ditingkatkan
   b. Tes sejajar (Equivalent Test) tanpa waktu interval : Koefisien reliabilitas cenderung
       lebih rendah dibandingkan dengan metode belah dua atau tes ulang yang menggunakan
       interval waktu singkat.
   c. Tes Sejajar dengan interval waktu : koefisien menjadi lebih kecil seiring dengan
       peningkatan interval waktu tes.
   d. Metode belah dua (Split-half Method ): Metode ini menyediakan sebuah indikasi
       konsistensi internal tes.
Tugas Terstruktur

Pak Umar Bakri ingin mengetahui a pakah soal ulangan Biologi yang dibuatnya sudah valid
dan reliabel untuk mengukur hasil belajar materi sistem pernapasan. Untuk keperluan ini, Pak
Umar Bakri melakukan uji coba pada sejumlah siswa.Hasil uji coba tersebut adalah sebagai
berikut.




Pertanyaan:
a. Butir soal nomor berapakah yang mempunyai koefisien validitas paling
rendah?
b. Butir soal nomor berapakah yang mempunyai koefisien validitas paling
tinggi?
c. Berapakah koefisien reliabilitas tes tersebut jika dihitung dengan formula
Sperman-Brown?



HUBUNGAN ANTARA VALIDITAS DAN RELIABITAS TES

        Hubungan Antara Validitas dengan Reliabilitas Umumnya orang berpendapat bahwa
validitas mempunyai hubungan proporsional dengan reliabilitas. Orang menduga bahwa
semakin valid suatu tes, semakin reliabel dan sebaliknya. Dugaan itu tidak sepenuhnya salah,
tetapi juga tidak sepenuhnya betul (Noeng Muhadjir, 1984:56). Ada kemungkinan hubungan
antara validitas reliabilitas itu bersifat independent, bebas satu sama lain dan dapat pula
bersifat detrimental. Bila tes itu heterogen, mungkin mempunyai reliabilitas keajegan internal
rendah, tetapi mempunyai validitas prediktif yang tinggi. Bila suatu tes bersifat homogen
mungkin sekali mempertinggi reliabilitas tanpa mempengaruhi validitas, misalnya dengan
menambah item tanpa menambah varians menambah varians dalam faktor umum yang tidak
bersangkutan dengan kriteria.
        Tujuan validitas dan reliabilitas seringkali bersilangan. Bila kita ingin mempunyai
suatu tes reliabel sekaligus valid dengan koefisien tinggi, sering kita mengerjakan pekerjaan
yang mempunyai tujuan bersilangan. Reliabilitas maksimal membutuhkan interkorelasi tinggi
antar item, sedangkan validitas prediktif yang maksimal memerlukan interkorelasi antar item
rendah. Reliabilitas maksimal membutuhkan item dengan tingkat kesukaran sama, sedangkan
validitas prediktif maksimal menuntut tes memiliki taraf kesukaran berbeda, sehingga perlu
kompromi. Bila kita ingin mempertinggi reliabilitas suatu tes dan sekaligus mempertinggi
validitas, cara yang dapat ditempuh adalah menambah varians faktor umum (Noeng Muhadjir,
1984:56-57). Namun jika langkah ini kita ambil, sebaiknya diperhitungkan apakah
penambahan faktor umum ini dapat terjangkau oleh peserta didik. Oleh karena itu perlu dalam
penentuan perencanaan, terutama dalam penyusunan kisi-kisi tes, faktor umum yang akan
diperbanyak itu diperhitungkan juga jangan terlalu keluar dari program dan proses pendidikan
sebelumnya.
CARA MENINGKATKAN RELIABITITAS TES

  1. Mengonsep satu variabel dengan jelas.
  2. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah
     variabel harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain.
  3. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat suatu
     level pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi
     yang dimiliki semakin mendetail. Prinsip dasarnya adalah cobalah melakukan
     pengukuran pada level paling tepat yang mungkin diperoleh.
  4. Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indikator yang
     spesifik, peneliti dapat melakukan pengukuran dari range yang lebih luas terhadap
     konten definisi konseptual.
  5. Gunakan Tes Pilot, yakni dengan membuat satu atau lebih draft atau dalam sebuah
     pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan Pilot
     Studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh
     peneliti terdahulu dari literatur-literatur yang berkaitan. Selanjutnya , pengukuran
     terdahulu dapat dipergunakan sebagai patokan dari pengukuran yang dilakukan
     peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai cara sejauh
     definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.

Contenu connexe

Tendances

Validitas, Reliabilitas, Daya Beda, dan Tingkat Kesukaran
Validitas, Reliabilitas, Daya Beda, dan Tingkat KesukaranValiditas, Reliabilitas, Daya Beda, dan Tingkat Kesukaran
Validitas, Reliabilitas, Daya Beda, dan Tingkat Kesukaranrevidiahayuindriyati
 
Norm Reference Test and Criterion Referenced Test
Norm Reference Test and Criterion Referenced TestNorm Reference Test and Criterion Referenced Test
Norm Reference Test and Criterion Referenced TestDina Azmi Imada
 
TES, PENGUKURAN, PENILAIAN DAN EVALUASI (DINI&ORNELA)
TES, PENGUKURAN, PENILAIAN DAN EVALUASI (DINI&ORNELA)TES, PENGUKURAN, PENILAIAN DAN EVALUASI (DINI&ORNELA)
TES, PENGUKURAN, PENILAIAN DAN EVALUASI (DINI&ORNELA)vina serevina
 
Ukuran variasi atau dispersi (penyebaran)
Ukuran variasi atau dispersi (penyebaran)Ukuran variasi atau dispersi (penyebaran)
Ukuran variasi atau dispersi (penyebaran)eyepaste
 
Laporan Observasi Sekolah Dasar
Laporan Observasi Sekolah DasarLaporan Observasi Sekolah Dasar
Laporan Observasi Sekolah Dasaraudiasls
 
PSIKOLOGI EKSPERIMEN Power point kelompok VI kelas a 08
PSIKOLOGI EKSPERIMEN Power point kelompok VI kelas a 08PSIKOLOGI EKSPERIMEN Power point kelompok VI kelas a 08
PSIKOLOGI EKSPERIMEN Power point kelompok VI kelas a 08Yelfy Yazid
 
Definisi kognitif
Definisi kognitifDefinisi kognitif
Definisi kognitifsujiadisss
 
ANALISIS JURNAL PTK BY LILIA - PPT
ANALISIS JURNAL PTK BY LILIA - PPTANALISIS JURNAL PTK BY LILIA - PPT
ANALISIS JURNAL PTK BY LILIA - PPTLilia Ismarti
 
Contoh Analisis Data Statistika Menggunakan SPSS 16.0 (Mulai Entri Data samp...
 Contoh Analisis Data Statistika Menggunakan SPSS 16.0 (Mulai Entri Data samp... Contoh Analisis Data Statistika Menggunakan SPSS 16.0 (Mulai Entri Data samp...
Contoh Analisis Data Statistika Menggunakan SPSS 16.0 (Mulai Entri Data samp...Yogyakarta State University
 
Subjek dan sasaran evaluasi pendidikan
Subjek dan sasaran evaluasi pendidikanSubjek dan sasaran evaluasi pendidikan
Subjek dan sasaran evaluasi pendidikaneryeryey
 
Uji validitas dan_reliabilitas
Uji validitas dan_reliabilitasUji validitas dan_reliabilitas
Uji validitas dan_reliabilitasIcal Azmy
 
Kuliah 9 populasi & sampel
Kuliah 9 populasi & sampelKuliah 9 populasi & sampel
Kuliah 9 populasi & sampelDerima Febrike
 
Validitas dan reliabilitas
Validitas dan reliabilitasValiditas dan reliabilitas
Validitas dan reliabilitaskhoir riyah
 
Langkah-langkah Penelitian Pengembangan
Langkah-langkah Penelitian PengembanganLangkah-langkah Penelitian Pengembangan
Langkah-langkah Penelitian PengembanganYamanto Isa
 

Tendances (20)

Validitas, Reliabilitas, Daya Beda, dan Tingkat Kesukaran
Validitas, Reliabilitas, Daya Beda, dan Tingkat KesukaranValiditas, Reliabilitas, Daya Beda, dan Tingkat Kesukaran
Validitas, Reliabilitas, Daya Beda, dan Tingkat Kesukaran
 
Makalah Korelasi
Makalah KorelasiMakalah Korelasi
Makalah Korelasi
 
Norm Reference Test and Criterion Referenced Test
Norm Reference Test and Criterion Referenced TestNorm Reference Test and Criterion Referenced Test
Norm Reference Test and Criterion Referenced Test
 
TES, PENGUKURAN, PENILAIAN DAN EVALUASI (DINI&ORNELA)
TES, PENGUKURAN, PENILAIAN DAN EVALUASI (DINI&ORNELA)TES, PENGUKURAN, PENILAIAN DAN EVALUASI (DINI&ORNELA)
TES, PENGUKURAN, PENILAIAN DAN EVALUASI (DINI&ORNELA)
 
Teknik konversi-skor-mentah-hasil-tes
Teknik konversi-skor-mentah-hasil-tesTeknik konversi-skor-mentah-hasil-tes
Teknik konversi-skor-mentah-hasil-tes
 
Ukuran variasi atau dispersi (penyebaran)
Ukuran variasi atau dispersi (penyebaran)Ukuran variasi atau dispersi (penyebaran)
Ukuran variasi atau dispersi (penyebaran)
 
Laporan Observasi Sekolah Dasar
Laporan Observasi Sekolah DasarLaporan Observasi Sekolah Dasar
Laporan Observasi Sekolah Dasar
 
Jenis penelitian
Jenis penelitianJenis penelitian
Jenis penelitian
 
PSIKOLOGI EKSPERIMEN Power point kelompok VI kelas a 08
PSIKOLOGI EKSPERIMEN Power point kelompok VI kelas a 08PSIKOLOGI EKSPERIMEN Power point kelompok VI kelas a 08
PSIKOLOGI EKSPERIMEN Power point kelompok VI kelas a 08
 
Statistika inferensial 1
Statistika inferensial 1Statistika inferensial 1
Statistika inferensial 1
 
VALIDITAS DAN RELIABILITA INSTRUMEN
VALIDITAS DAN RELIABILITA INSTRUMENVALIDITAS DAN RELIABILITA INSTRUMEN
VALIDITAS DAN RELIABILITA INSTRUMEN
 
pengujian hipotesis
pengujian hipotesispengujian hipotesis
pengujian hipotesis
 
Definisi kognitif
Definisi kognitifDefinisi kognitif
Definisi kognitif
 
ANALISIS JURNAL PTK BY LILIA - PPT
ANALISIS JURNAL PTK BY LILIA - PPTANALISIS JURNAL PTK BY LILIA - PPT
ANALISIS JURNAL PTK BY LILIA - PPT
 
Contoh Analisis Data Statistika Menggunakan SPSS 16.0 (Mulai Entri Data samp...
 Contoh Analisis Data Statistika Menggunakan SPSS 16.0 (Mulai Entri Data samp... Contoh Analisis Data Statistika Menggunakan SPSS 16.0 (Mulai Entri Data samp...
Contoh Analisis Data Statistika Menggunakan SPSS 16.0 (Mulai Entri Data samp...
 
Subjek dan sasaran evaluasi pendidikan
Subjek dan sasaran evaluasi pendidikanSubjek dan sasaran evaluasi pendidikan
Subjek dan sasaran evaluasi pendidikan
 
Uji validitas dan_reliabilitas
Uji validitas dan_reliabilitasUji validitas dan_reliabilitas
Uji validitas dan_reliabilitas
 
Kuliah 9 populasi & sampel
Kuliah 9 populasi & sampelKuliah 9 populasi & sampel
Kuliah 9 populasi & sampel
 
Validitas dan reliabilitas
Validitas dan reliabilitasValiditas dan reliabilitas
Validitas dan reliabilitas
 
Langkah-langkah Penelitian Pengembangan
Langkah-langkah Penelitian PengembanganLangkah-langkah Penelitian Pengembangan
Langkah-langkah Penelitian Pengembangan
 

Similaire à Mkalah evaluasi

PRINSIP DAN TEKNIK EVALUASI (LARAS&NUR ASIAH)
PRINSIP DAN TEKNIK EVALUASI (LARAS&NUR ASIAH)PRINSIP DAN TEKNIK EVALUASI (LARAS&NUR ASIAH)
PRINSIP DAN TEKNIK EVALUASI (LARAS&NUR ASIAH)vina serevina
 
Reliabilitas validitas-edit
Reliabilitas validitas-editReliabilitas validitas-edit
Reliabilitas validitas-editFrihapma Semita
 
PERTEMUAN 2 - materi 10 OK.pptx
PERTEMUAN 2 - materi 10 OK.pptxPERTEMUAN 2 - materi 10 OK.pptx
PERTEMUAN 2 - materi 10 OK.pptxdidinFt
 
Validitas dan reliabilitas suatu instrumen penelitian
Validitas dan reliabilitas suatu instrumen penelitianValiditas dan reliabilitas suatu instrumen penelitian
Validitas dan reliabilitas suatu instrumen penelitianVivii Charmeiliaa
 
3. Uji Validitas dan Reliabilitas.pptx
3. Uji Validitas dan Reliabilitas.pptx3. Uji Validitas dan Reliabilitas.pptx
3. Uji Validitas dan Reliabilitas.pptxIndriyaniLubis
 
Validitas dan reliabilitas tes
Validitas dan reliabilitas tesValiditas dan reliabilitas tes
Validitas dan reliabilitas tesStevie Principe
 
Validitas & Reliabilitas Instrumen Evaluasi Pembelajaran.pdf
Validitas & Reliabilitas Instrumen Evaluasi Pembelajaran.pdfValiditas & Reliabilitas Instrumen Evaluasi Pembelajaran.pdf
Validitas & Reliabilitas Instrumen Evaluasi Pembelajaran.pdfAPRILIANYUNTIARI
 
Validitas dan Reliabilitas.pptx
Validitas dan Reliabilitas.pptxValiditas dan Reliabilitas.pptx
Validitas dan Reliabilitas.pptxpaksobat
 
Ppt kelompok 3 AKS-C7 .pdf
Ppt kelompok 3 AKS-C7 .pdfPpt kelompok 3 AKS-C7 .pdf
Ppt kelompok 3 AKS-C7 .pdfMuhamadAldi12
 
P. KUANTITATIF Kel 3 (1).pptx
P. KUANTITATIF Kel 3 (1).pptxP. KUANTITATIF Kel 3 (1).pptx
P. KUANTITATIF Kel 3 (1).pptxNana Citra
 
Reliabilitias dan validitas
Reliabilitias dan validitasReliabilitias dan validitas
Reliabilitias dan validitasIrha Magfirahh
 
VALIDITAS DAN RELIABILITAS PENELITIN KUANTITATIF
VALIDITAS DAN RELIABILITAS PENELITIN KUANTITATIFVALIDITAS DAN RELIABILITAS PENELITIN KUANTITATIF
VALIDITAS DAN RELIABILITAS PENELITIN KUANTITATIFMandiri Sekuritas
 
metediologi marsel fajar m-1.pptx
metediologi marsel fajar m-1.pptxmetediologi marsel fajar m-1.pptx
metediologi marsel fajar m-1.pptxWisnuDwiseptian
 

Similaire à Mkalah evaluasi (20)

PRINSIP DAN TEKNIK EVALUASI (LARAS&NUR ASIAH)
PRINSIP DAN TEKNIK EVALUASI (LARAS&NUR ASIAH)PRINSIP DAN TEKNIK EVALUASI (LARAS&NUR ASIAH)
PRINSIP DAN TEKNIK EVALUASI (LARAS&NUR ASIAH)
 
Reliabilitas validitas-edit
Reliabilitas validitas-editReliabilitas validitas-edit
Reliabilitas validitas-edit
 
PERTEMUAN 2 - materi 10 OK.pptx
PERTEMUAN 2 - materi 10 OK.pptxPERTEMUAN 2 - materi 10 OK.pptx
PERTEMUAN 2 - materi 10 OK.pptx
 
Validitas dan reliabilitas suatu instrumen penelitian
Validitas dan reliabilitas suatu instrumen penelitianValiditas dan reliabilitas suatu instrumen penelitian
Validitas dan reliabilitas suatu instrumen penelitian
 
3. Uji Validitas dan Reliabilitas.pptx
3. Uji Validitas dan Reliabilitas.pptx3. Uji Validitas dan Reliabilitas.pptx
3. Uji Validitas dan Reliabilitas.pptx
 
Validitas dan reliabilitas tes
Validitas dan reliabilitas tesValiditas dan reliabilitas tes
Validitas dan reliabilitas tes
 
Pengertian validitas
Pengertian validitasPengertian validitas
Pengertian validitas
 
Pengertian validitas
Pengertian validitasPengertian validitas
Pengertian validitas
 
Validitas & Reliabilitas Instrumen Evaluasi Pembelajaran.pdf
Validitas & Reliabilitas Instrumen Evaluasi Pembelajaran.pdfValiditas & Reliabilitas Instrumen Evaluasi Pembelajaran.pdf
Validitas & Reliabilitas Instrumen Evaluasi Pembelajaran.pdf
 
Validitas tes
Validitas tesValiditas tes
Validitas tes
 
Validitas dan Reliabilitas.pptx
Validitas dan Reliabilitas.pptxValiditas dan Reliabilitas.pptx
Validitas dan Reliabilitas.pptx
 
Ppt kelompok 3 AKS-C7 .pdf
Ppt kelompok 3 AKS-C7 .pdfPpt kelompok 3 AKS-C7 .pdf
Ppt kelompok 3 AKS-C7 .pdf
 
P. KUANTITATIF Kel 3 (1).pptx
P. KUANTITATIF Kel 3 (1).pptxP. KUANTITATIF Kel 3 (1).pptx
P. KUANTITATIF Kel 3 (1).pptx
 
Reliabilitias dan validitas
Reliabilitias dan validitasReliabilitias dan validitas
Reliabilitias dan validitas
 
Validitas dan reabilitas
Validitas dan reabilitasValiditas dan reabilitas
Validitas dan reabilitas
 
validitas
validitasvaliditas
validitas
 
VALIDITAS DAN RELIABILITAS PENELITIN KUANTITATIF
VALIDITAS DAN RELIABILITAS PENELITIN KUANTITATIFVALIDITAS DAN RELIABILITAS PENELITIN KUANTITATIF
VALIDITAS DAN RELIABILITAS PENELITIN KUANTITATIF
 
metediologi marsel fajar m-1.pptx
metediologi marsel fajar m-1.pptxmetediologi marsel fajar m-1.pptx
metediologi marsel fajar m-1.pptx
 
Resume 5 ok
Resume 5 okResume 5 ok
Resume 5 ok
 
Inisiasi 7
Inisiasi 7Inisiasi 7
Inisiasi 7
 

Mkalah evaluasi

  • 1. VALIDITAS Validitas berasal dari bahasa Inggris dari kata validity yang berarti keabsahan atau kebenaran. Dalam konteks alat ukur atau instrumen asesmen, validitas berarti sejauh mana kecermatan atau ketepatan alat ukur dalam melakukan fungsi ukurnya. Sebuah instrumen yang valid akan menghasilkan data yang tepat seperti yang diinginkan. Sebagai contoh, jika kita ingin mengetahui berat maka alat ukur yang tepat adalah timbangan atau neraca bukan meteran, termometer, atau alat yang lain. Dengan kata lain, sifat valid memberikan pengertian bahwa alat ukur yang digunakan mampu memberikan nilai yang sesungguhnya dari apa yang diinginkan. Contoh di atas barang kali terlalu sederhana dan mudah untuk mengecek dan mengendalikannya. Berbeda halnya jika kita akan melakukan pengukuran dalam dunia pembelajaran atau dunia pendidikan, tidak sesederhana seperti pada pengukuran berat ataupun panjang. Untuk mengetahui alat ukur prestasi belajar apakah valid atau tidak maka perlu dipelajari dengan hati -hati. Validitas sangat berkaitan dengan tujuan pengukuran. Validitas tidak berlaku secara umum bagi semua pengukuran. Suatu tes mempunyai hasil ukuran yang baik (valid) untuk suatu tujuan tertentu yang sepesifik tetapi tidak valid untuk tujuan yang lain atau bahkan untuk tujuan yang sama pada kelompok yang lain. Validitas secara umum menunjukkan ukuran yang mengukur apa yang akan diukur (Anonim: 2006: 1). Validitas mengacu pada keberartian, kebenaran, kemanfaatan, dan keseuaian skor tes (Jafar Ahiri: 1). Validitas adalah suatu konsep yang berkaitan dengan sejauh mana tes telah mengukur apa yang seharusnya diukur (Sumarna Supranata: 2004: 50). Dalam buku “ Encyclopedia of Educational Evaluation (Suharsimi A: 1987: 60) dikatakan, bahwa sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Validitas tes perlu ditentukan untuk mengetahui kualitas tes dalam kaitannya dengan mengukur hal yang seharusnya diukur (Sumarna Supranata: 2004: 50). Menurut Nunnaly (1972) dalam Sumarna Supranata (2004: 50), menyatakan, bahwa pengertian validitas senantiasa dikaitkan dengan penelitian empiris dan pembuktian-pembuktiannya bergantung kepada macam validitas yang digunakan. Kemudian, menurut Anastasi (1988) dalam Sumarna Supranata (2004: 50), menyatakan, bahwa validitas adalah suatu tingkatan yang menyatakan bahwa suatu alat ukur telah sesuai dengan apa yang diukur. Sedangkan Gronlund (1985) dalam Sumarna Supranata (2004: 50), menyatakan bahwa validitas berkaitan dengan hasil suatu alat ukur, menunjukkan tingkatan, dan bersifat khusus sesuai dengan tujuan pengukuran yang akan dilakukan. Suatu tes dapat dikatakan mempunyai validitas tinggi apabila tes tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur sesuai dengan makna dan tujuan diadakannya tes tersebut. Linn & Gronlund (2000) mengemukakan hakikat validitas tes dan asesmen sebagai berikut : 1. Validitas menyatakan ketepatan interpretasi hasil bukan pada prosedurnya. 2. Validitas merupakan persoalan yang berkaitan dengan derajat (tingkatan), sebagai konsekuensinya kita harus menghindari pemikiran hasil asesmen sebagai valid atau tidak valid. Oleh karena validitas adalah persoalan derajad maka sebuah instrumen dapat dikategorikan mempunyai derajad validitas tinggi, sedang, dan rendah.
  • 2. 3. Validitas selalu bersifat khusus untuk penggunaan atau interpretasi tertentu. Tidak ada asesmen yang valid untuk semua tujuan. Sebagai contoh, hasil tes aritmatika mungkin mempunyai tingkat validitas yang tinggi untuk kemampuan hitung, validitas yang rendah untuk alasan-alasan aritmatika, dan mempunyai derajat validitas sedang untuk memprediksi kesuksesan prestasi matematika yang akan datang. 4. Validitas merupakan kesatuan konsep. Hakikat konsep validitas dipandang sebagai sebuah kesatuan konsep berdasark an berbagai macam bagian dari fakta. 5. Validitas melibatkan sebuah keputusan evaluatif yang menyeluruh. A. Macam-macam Validitas Validitas dapat dibedakan menjadi 3 macam yaitu validitas isi ( content validity), validitas konstruksi (construct validity), dan validitas berdasar kriteria (criterion related validity). Validitas berdasar kriteria dapat dibedakan menjadi dua macam yaitu, validitas konkuren (validitas ada sekarang, concurent validity) dan validitas prediktif (predictive validity). 1) Validitas Isi (Content Validity) Validitas isi disebut juga validitas kurikuler. Oleh karena itu, validitas ini erat kaitannya dengan materi yang akan diukur dalam tes. Tentu saja materi yang dimaksud adalah materi yang terdapat dalam kurikulum. Validitas isi mencerminkan sejauh mana butir-butir dalam tes mencerminkan materi yang disajikan dalam kurikulum. Sebuah tes dikatakan memiliki validitas isi jika butir - butir tes bersifat representatif terhadap isi materi dalam kurikulum tersebut. Pengujian validitas isi tidak melalui prosedur pengujian secara statistik, melainkan melalui analisis secara rasional. Pengetahuan terhadap kurikulum menjadi dasar berpijak yang penting untuk dapat melakukan analisis validitas isi. Cara yang praktis untuk melakukan analisis validitas isi adalah dengan melihat apakah butir-butir tes telah disusun sesuai dengan blue-print (kisi-kisi) yang sudah dirancang sebelumnya. Blue print menjadi acuan dalam menuangkan domain atau ranah dan indikator yang akan diukur dalam tes. 2) Validitas Konstruk (Construct Validity) Validitas konstruk adalah validitas yang menyangkut bangunan teoretik variabel yang akan diukur. Sebuah tes dikatakan mempunyai validitas konstruk apabila butir-butir soal yang disusun dalam tes mengukur setiap aspek berpikir dari sebuah variabel yang akan diukur melalui tes tersebut. Seperti halnya validitas isi, untuk mempertinggi validitas konstruk dapat dilakukan dengan cara memerinci dan memasangkan setiap butir soal dengan setiap aspek. Pengujian validitas konstruk diperlukan an alisis statistik yang kompleks seperti prosedur analisis faktor. Salah satu prosedur pengujian validitas konstruk yang tidak terlalu kompleks dapat dilakukan dengan pendekatan multi-trait multi-method. Dua atau lebih trait yang diukur melalui dua atau lebih metode dapat diuji secara serentak dengan pendekatan ini, sehingga akan diperoleh adanya bukti adanya validitas diskriminan dan validitas konvergen. Validitas diskriminan ditunjukkan oleh rendahnya korelasi antara faktor skala atau tes yang mengukur trai t yang berbeda terutama bila digunakan metode yang sama. Validitas konvergen ditunjukkan oleh tingginya korelasi skor tes –tes yang mengukur trait yang sama dengan menggunakan metode yang berbeda.
  • 3. 3) Validitas Berdasarkan Kriteria Sesuai dengan namanya, validitas ini didasarkan pada kriteria tertentu. Dengan demikian bukti adanya validitas ditunjukkan adanya hubungan korelasional skor pada tes yang bersangkutan dengan skor suatu kriteria. Pengujian validitas ini bersifat empirik, artinya pengujian hanya dapat dilakukan setelah mendapatkan data di lapangan. Apabila berdasarkan hasil analisis yang dilakukan terhadap data hasil pengamatan di lapangan terbukti bahwa tes hasil belajar dapat mengukur hasil belajar yang seharusnya diungkap secara tepat maka berarti alat tes tersebut mempunyai validitas empirik. Untuk keperluan pengujian jenis validitas ini dapat dilakukan dengan dua cara yaitu dari segi kemampuannya dalam melakukan ramalan ( predictive validity) serta daya ketepatan bandingannya (concurent validity). Perbedaan utama antara validitas ramalan dengan validitas bandingan adalah ketersediaan pembanding (kriterium). Pada validitas ramalan , kriterium diperoleh pada waktu yang akan datang setelah dilakukan tes yang akan diukur validitasnya tersebut. Sedangkan pada validitas bandingan, kriterium sudah ada atau dapat diperoleh pada saat yang sama dengan waktu untuk memperoleh data tentang tes yang akan diukur validitasnya tersebut tanpa harus menunggu masa yang akan datang. B. Pengujian Validitas Tes Secara Empirik Validitas empirik adalah kerapatan mengukur yang didasarkan pada hasil analisis yang bersifat empirik. Dengan kata lain validitas empirik adalah validitas yang bersumber pada atau diperoleh atas dasar pengamatan di lapangan. Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas empirik ataukah belum, dapat dilakukan penelusuran dari dua segi : a) Validitas ramalan (predictive validity) Sebagai ilustrasi adalah adanya tes masuk Perguruan Tinggi Negeri. Setelah melalui serangkaian tes maka hanya calon mahasiswa yang mempunyai skor tinggi yang diterima oleh panitia seleksi mahasiswa baru. Sesungguhnya keputusan panitia seleksi yang hanya menerima mahasiswa yang mempunyai skor tinggi saja berarti sudah memprediksikan bahwa calon mahasiswa dengan skor tinggi tersebut kelak yang akan lebih berhasil dalam studinya. Sedangkan para calon mahasiswa yang mempunyai skor sedang apalagi rendah diprediksikan akan banyak menemui kendala dalam studinya. Oleh karena itu tes yang digunakan dalam seleksi calon mahasiwa baru tersebut akan mempunyai tingkat validitas prediktif yang tinggi apabila secara empirik terbukti bahwa prestasi belajar mereka juga baik. Dengan demikian antara skor tes masuk dengan prestasi belajar harus mempunyai korelasi yang positif. Pada kasus di atas, yang dipermasalahkan validitasnya adalah tes masuk. Oleh karena itu hasil belajar pada masa perkuliahan digunakan sebagai tolok ukur (kriterium). Adanya kesejajaran, kesesuaian, kesamaan arah antara tes seleksi masuk dengan hasil belajar mempunyai korelasi yang positif. Berdasarkan pada uraian di atas, dapatlah dipahami bahwa untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas ramalan ataukah belum, dapat ditempuh dengan cara mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalan itu dapat dinyatakan sebagai tes hasil belajar yang telah memiliki daya ramalan yang tepat.
  • 4. Contoh : Nilai hasil tes seleksi bahasa arab di Fakultas Nilai (Variabel y) yang berhasil dicapai oleh 5 orang. No X Y 1. 58 65 2. 50 57 “ tidak terdapat korelasi fositif yang signifikan, antara variable 3. 53 60 X dengan variable Y” 4. 49 56 5. 58 65 a) Menyiapkan Peta Korelasi No X Y Y 2 Y2 .Y 1. 58 65 4 4 16 16 16 2. 50 57 -4 -4 16 16 16 3. 53 60 -1 -1 1 -1 1 4. 49 56 -5 2 -10 25 4 5. 58 65 4 4 16 16 16 b) Menghitung mean x dan y c) Menghitung Standard deviasi X dan Y d) Angka Indeks korelasi X Y b) Validitas bandingan (Concurent Validity) Validitas ini sering pula disebut sebagai validitas ada sekarang, validitas sama saat, validitas pengalaman, dan validitas empiris. Disebut sebagai validitas ada sekarang karena pengujiannya berdasarkan pengalaman yang saat ini sudah ada di tangan. Disebut sebagai validitas sama saat karena validitas ini segera dapat kita peroleh informasinya pada saat yang sama dengan waktu diperolehnya data hasil tes yang diukur validitasnya tersebut. Disebut validitas pengalaman (empiris) karena validitas ini dikaitkan dengan pengalaman yang sudah ada. Dalam hal ini pengalaman digunakan sebagai kriterium. Guna menentukan validitas bandingan ini tidak perlu menunggu waktu untuk membuktikannya. Seperti disebutkan pada alenia di atas bahwa yang berfungsi sebagai kriterium adalah data hasil pengalaman. Apabila data dari tes yang ada sekarang mempunyai hubungan yang searah dengan data hasil pengalaman maka dikatakan telah mempunyai validitas bandingan. Contoh : Bagaimana cara pengujian validitas bandingan. Misalnya pada tanggal 1 Agustus 1994 sebanyak 24 orang siswa. Dua minggu kemudian, yaitu pada tanggal 15 Agustus 1994, tanpa pemberitahuan terlebih dahulu, 20 orang siswa diatas dihadapkan pada tes formatif kedua dengan mata pelajaran yang sama dengan menggunakan butir soal yang sama dengan butir-butir soal yang telah dikeluarkan pada tes formatif pertama.
  • 5. Tekhnik pengujian validitas item tes hasil belajar a. Pengertian validitas item Dimaksud dengan validitas item dari sebuah tes adalah ketepatan mengukur yang dimiliki oleh sebutir item ( yang merupakan bagian yang tak terpisahkan dari tes bagian suatu totalitas ), dalam negukur apa yang seharusnya diukur lewat butir item tersebut. b. Tehknik Pengujian Validitas Item Tes Hasil Belajar Memilih dan menentukan jenis tekhnik dalam rangka menguji validitas item itu. Seperti yang diketahui pada tes objektif maka hanya ada dua kemungkinan yaitu betul atau salah. Rumus : PB 1 = √ B. Faktor-faktor yang mempengaruhi validitas Banyak faktor yang menyebabkan hasil asesmen tidak valid. Beberapa di antaranya tampak jelas dan mudah untuk menghindarinya. Tidak ada guru yang akan berpikir untuk mengukur pengetahuan biologi dengan asesmen matematika. Demikian pula juga tidak ada guru yang akan mengukur kemampuan memecahkan masalah (problem solving) biologi kelas 7 SMP dengan menggunakan asesmen yang didesain untuk kelas 12 SMA. Dalam dua contoh tersebut sudah sangat jelas hasil asesmen akan menjadi tidak valid. Faktor yang mempengaruhi validitas tes antara lain: 1. Faktor dari dalam tes itu sendiri Pengujian terhadap butir tes secara hati-hati akan menunjukkan apakah tes yang digunakan untuk mengukur isi materi atau fungsi - fungsi mental yang akan diakses oleh guru. Bagaimanapun juga, beberapa fak tor berikut dapat menjaga butir tes dari fungsi yang dikehendaki dan dengan demikian juga terj aga dari rendahnya validitas hasil asesmen. Lima faktor yang pertama dapat diterapkan sejajar dengan asesmen penampilan siswa secara luas ser ta tes-tes tradisional. Lima faktor yang terakhir lebih diterapkan secara langsung terhadap tes pilihan dan tes dengan jawaban singkat dengan jawaban benar atau salah. a. Petunjuk yang tidak jelas . Petunjuk yang tidak jelas menyebabkan siswa kehilangan waktu untuk sekedar memahami petunjuk pengerjaan atau bahkan tidak dapat melakukan apa yang seharusnya dilakukan. b. Penggunaan kosa kata dan struktur kalimat yang sulit. Penggunaan kosa kata atau struktur kalimat yang sulit dapat menyebabkan siswa terjebak untuk pemahaman terhadap pemahaman maksud dari sebuah pertanyaan bukan untuk menyelesaikan pertanyaan itu sendiri. c. Ambiguitas. Ambiguitas yaitu adanya kemungkinan multi tafsir juga menyebabkan menurunnya validitas sebuah tes. d. Alokasi waktu yang tidak cukup. Seyogyanya sebuah tes disediakan waktu yang cukup untuk mengerjakan seluruh butir tes yang ada. Kekurangan waktu dalam menyelesaikan sebuah tes bisa jadi bukan karena siswa tidak mampu untuk menyelesaikan tesnya tetapi karena keterbatasan kesempatan untuk mengerjakannya.
  • 6. e. Penekanan yang berlebihan terhadap aspek tertentu, sehingga terlalu mudah ditebak kecenderungan dari jawaban soal akan menyebabkan menurunnya tingkat validitas soal. f. Kualitas butir tes yang tidak memadai untuk mengukur hasil belajar . Kualitas yang tidak memadai misalnya tes dimaksudkan untuk megukur kemampuan berpikir tingkat tinggi (higher order thinking) jelas tidak cukup hanya digunakan tes yang bersifat untuk mengungkap pengetahuan faktual saja. g. Susunan tes yang jelek. h. Tes terlalu pendek. i. Penyusunan butir tes yang tidak runtut . j. Pola jawaban yang mudah ditebak, misalnya pada soal pilihan ganda jawabannya adalah A semua, atau B semua atau menunjukkan pola tertentu misalnya D, C, B, A, D, C, B, A, dan sebagainya. 2. Faktor berfungsinya tes dan prosedur mengajar 3. Faktor administrasi dan penskoran Pemberian skor terhadap jawaban siswa (testee) harus dilakukan secara hati-hati jangan sampai salah tulis atau meremehkan selisih angka walaupun hanya sedikit. Hal ini akan menyebabkan hasil pengujian terhadap validitas akan memberikan makna yang berbeda. 4. Faktor tanggapan siswa Tanggapan siswa yang tidak serius bias anya dijumpai pada saat siswa diminta untuk mengisi sebuah angket. Hal ini akan menyebabkan siswa mengisi angket secara sembarangan karena merasa tidak penting maupun alasan -alasan yang lain. Oleh karena itu berikan angket pada waktu dan kondisi yang tepat . 5. Hakikat kelompok dan kriteria Seperti sudah dijelaskan di atas bahwa validitas bersifat spesifik. Sebuah asesmen atau instrumen alat ukur mungkin hanya valid untuk kelompok tertentu saja dan tidak valid untuk kelompok yang lain. Sebagai contoh misalnya sebuah tes diujicobakan pada sekelompok siswa pada sebuah sekolah dengan kualitas biasa –biasa saja tentu akan berbeda hasilnya jika tes yang sama diberikan pada sekelompok siswa pada sekolah yang favorit. RELIABILITAS Pada bagian di atas telah dibahas mengenai validitas. Validitas adalah sebuah evaluasi terhadap ketepatan interpretasi dan penggunaan hasil asesmen. Validitas mempunyai arti sejauh mana ketepatan dan kecermatan alat ukur mampu melakukan fungsi ukurnya. Selain validitas, alat ukur yang baik juga harus reliabel. Oleh karena itu, alat ukur yang baik adalah alat ukur yang valid dan reliabel. Hubungan antara validitas dengan reliabilitas dapat digambarkansebagaimana tembakan yang selalu tepat mengenai sasaran yang diinginkan, seperti ilustrasi pada gambar di bawah ini.
  • 7. Reliabilitas diterjemahkan dari kata reliability yang berarti hal yang dapat dipercaya (tahan uji). Sebuah tes dikatakan mempunyai reliabilitas yang tinggi jika tes terebut memberikan data hasil yang ajeg (tetap) walaupun diberikan pada waktu yang berbeda kepada responden yang sama. Hasil tes yang tetap atau seandainya berubah maka perubahan i tu tidak signifikan maka tes tersebut dikatakan reliabel. Oleh karena itu reliabilitas sering disebut dengan keterpercayaan, keterandalan, keajegan, konsistensi, kestabilan, dan sebagainya. Seperti diuraikan di atas sebuah alat ukur yang baik harus valid dan reliabel. Namun demikian validitas lebih penting dibandingkan dengan reliabilitas. Reliabilitas merupakan penyokong validitas. Sebuah alat ukur yang valid selalu reliabel. Akan tetapi alat ukur yang reliabel belum tentu valid, seperti digambarkan pada ilustrasi di atas. Seperti halnya validitas, reliabilitas juga merupakan tingkatan. Tingkat atau kadar reliabilitas dinyatakan dengan koefisien reliabilitas. Berikut ini akan dibahas macam-macam metode mencari besarnya koefisien reliabilitas. Metode Mencari Koefisien Reliabilitas 1) Metode Tes Ulang (Test Retest Method) Metode ini diterapkan untuk menghindari adanya penyusunan dua seri tes. Teknisnya adalah sebuah tes yang sama diberikan dua kali kepada responden yang sama dengan jarak waktu tertentu. Jika hasil tes pertama mempunyai kesejajaran dengan hasil tes yang kedua maka tes tersbut dikatakan reliable. Oleh karena pengujian ini dilakukan terhadap sebuah tes yang diujicobakan dua kali maka sering disebut pula sebagai single-test-double-trial-method. Kelemahan metode ini adalah jika jeda waktu tes terlalu singkat sedangkan soal tes banyak mengungkapkan aspek pengetahuan maka responden cenderung masih mengingat materi yang diteskan, sehingga ada kemungkinan hasil tes yang kedua lebih baik daripada hasil tes pertama. Sebaliknya jika jeda waktu tes pertama dengan kedua terlalu lama dikhawatirkan banyak faktor serta situasi dan kondisi sudah banyak berubah dan mempengaruhi hasil tes yang kedua. Adapun langkah-langkah yang ditempuh pada uji reabilitas ini adalah sebagai berikut : 1. Menyusun sebuah tes yang akan diukur reabilitasnya 2. Mengajukan tes yang sudah disusun tersebut (tahap I) 3. Mennghitung skor hasil tes ( tahap I) 4. Mengjukan ulang tes yang tersusun tersebut ( tahap II)
  • 8. 5. Menghitung reabilitas tes tersebut dengan jalan mengkorelasikan skor tes I dengan skor tes II dengan rumus korelasi produk moment person 2) Metode Tes Sejajar (Equivalent) Metode ini mengharuskan adanya dua buah seri soal yang mempunyai kesamaan tujuan, bobot soal, tingkat kesukaran, susunan soal, tetpai butir –butir soalnya berbeda. Dengan kata lain, dua buah tes yang digunakan harus sejajar (paralel, equivalen). Koefisien relibiabilitas diperoleh dengan me ngkorelasikan hasil tes pertama dengan hasil tes kedua. Oleh karena metode ini menggunakan dua buah tes yang berbeda dan diteskan pada siswa yang sama maka disebut juga doublé test – double – trial – method. Sudah tentu metode ini akan menambah kerepotan. Inilah kelemahan metode ini. Kelebihan dari metode ini adalah dapat memperbaiki kelemahan pada metode pertama yaitu terhindarnya dari kondisi “siswa masih mengingat materi tes pertama”. Aspek ingatan dan hafalan pada pengerjaan tes pertama tidak terbawa pada saat mengerjakan tes yang kedua. Adapun langkah yang ditempuh adalah : 1) Menyusun dua buah tes yang equivalent 2) Mengajukan kedua buah tes tersebut atau dalam waktu yang brsamaan atau beriringan. 3) Memberikan skor hasil tes yang telah diujikan, disusun dengan memisahkan antara tes A dan tes B. 4) Mencari koofesien stabilitas kedua tes ( A dan B ) dengan jalan mencari korelasinya melalui rumus korelasi product moment. 3) Metode Tes Tunggal (Single Test – Single Trial) Metode tes tunggal dilihat dari kepraktisannya lebih praktis dari pada dua metode sebelumnya. Metode ini hanya melakukan sekali tes kepada sekelompok subjek. Dengan demikian tidak perlu menunggu waktu maupun harus mempunyai data dari tes sejenis untuk dapat menentukan reliabilitasnya. Koefisien reliabilitas dapat diperoleh dengan cara membelah instrumen menjadi dua, tiga, empat, atau bahkan sebanyak butir yang dimiliki oleh instrumen tersebut. Teknik perhitungannya tergantung pada banyaknya belahan, bentuk, serta sifat alat ukurnya. Adapun langkah-langkah secara umum yang ditempuh untuk mencari reliabilitas tes ini adalah sebagai berikut : 1) Menyusun sebuah tes sebaiknya jumlah nomornya genap, sehingga bila dibelah sama. 2) Mengajukan tes tersebut pada sebuah sampel 3) Menghitung skor masing-masing peserta didik dalam dua kelompok skor, dapat dikelompokkan skor ganjil dan genap, dapat pula dikelompokkan skor belahan atas dan skor belahan bawah 4) Mencari reliabilitas setengan tes, dengan jalan mengkorelasikan kedua skor tersebut dengan rumus produck moment 5) Mencari reliabilitas satu tes penuh dengan menggunakan rumus spearman Brown atau rumus lainnya. Beberapa teknik yang sering digunakan untuk menentukan koefisien reliabilitas dengan metode tes tunggal ini antara lain:
  • 9. a) Formula Kuder Richardson (KR20) Formula KR20 dapat diterapkan pada instrumen yang yang mempunyai data skor dikotomi dari tes yang seolah -olah dibagi-bagi menjadi belahan sebanyak butir yang dimiliki. Hasil perhitungan dengan rumus KR20 lebih teliti, tetapi perhitungan lebih rumit. Rumus: b) Formula Kuder Richardson (KR21) Formula KR21 lebih sederhana dalam perhitungannya. Kelemahannya adalah kurang teliti dibandingkan dengan KR20. Rumusnya adalah sebagai berikut: Keterangan: r11 = koefisien reliabilitas n = banyaknya butir soal 1 = bilangan konstan Mt = mean total (rata-rata hitung dari skor total) St2 = varian total c) Formula Spearman-Brown Formula Spearman-Brown hanya dapat diterapkan pada soal yang mempunyai jumlah butir genap. Formula ini menggunakan teknik belah dua ( split half method), yaitu soal dibelah menjadi 2 bagian (belahan ganjil dan belahan genap atau belahan kiri dengan belahan kanan). Kedua belahan tersebut sejajar. Formulanya adalah sebagai berikut:
  • 10. Keterangan: r11 = koefisien reliabilitas rhh = koefisien korelasi product moment antara skor belahan satu dengan skor belahan yang lain 1 & 2 = bilangan konstan d) Formula Rulon Formula Rulon ini juga dapat diterapkan dengan belah dua ( split half method) seperti halnya pada formula Spearman -Brown. Hanya saja cara pandannya terhadap reliabilitas be rbeda dengan Spearman-Brown. Menurut Rulon reliabilitas dapat dipandang dari adanya selisih skor yang diperoleh oleh responden pada belahan pertama dengan belahan kedua. Selisih tersebut yang menjadi sumber variasi error sehingga bila dibandingkan dengan v ariasi skor akan dapat menjadi dasar untuk melakukan estimasi reliabilitas tes. Formula Rulon adalah sebagai berikut. Keterangan: r11 = koefisien reliabilitas Sd2 = varians perbedaan skor belahan St2 = varians skor total 1 = bilangan konstan e) Formula Alpha Formula-formula di atas (Spearman-Brown, KR, Rulon) hanya berlaku untuk soal objektif yang mempunyai kemungkinan jawaban benar dan salah. Sedangkan untuk soal yang mempunyai gradualitas skor jawaban misalnya pada soal uraian ataupun pada angket ( tes sikap) formula yang paling pas adalah dengan menggunakan Formula Alpha. Hal ini dimungkinkan karena Formula Alpha mengakomodasi adanya variasi skor dalam setiap butir soal. Rumus yang digunakan adalah sebagai berikut.
  • 11. Keterangan: r11 = koefisien reliabilitas Si2 = varians skor tiap-tiap butir soal St2 = varians skor total 1 = bilangan konstan f) Formula C. Hoyt Berbeda dengan formula-formula yang lain, C. Hoyt memandang bahwa sebuah tes dapat dipandang sebagai sebuah interaksi faktorial di mana skor-skor tes dianggap sebagai hasil eksperimen. Dalam hal ini, berlaku sebagai faktor Ia dalah subjek (responden) sedangkan faktor II adalah butir soal. Dengan demikian masing-masing sel terdiri atas satu subjek, untuk selanjutnya dapat dicari interaksi antara subjek dengan butir soal. Kelebihan formula ini adalah dapat diterapkan baik pada soal yang mempunyai skor dikotomi 1 dan 0 maupun pada soal yang mempunyai variasi skor pada butirnya (tes sikap maupun tes uraian). Rumus yang digunakan adalah sebagai berikut. Keterangan: r11 = koefisien reliabilitas MKe = mean kuadrat interaksi antara subjek dengan butir soal MKs = mean kuadrat antarsubjek 1 = bilangan konstan g) Formula Flanagan Reliabilitas pada formula Flanagan tidak didasarkan pada ada tidaknya korelasi antara belahan I dengan belahan II. Dasar dari formula Flanagan adalah jumlah kuadrat deviasi (varians) pada tes belahan I, jumlah kuadrat (varians) deviasi pada tes belahan II, dan jumlah kuadrat deviasi (varians) skor total. Formula yang digunakan adalah sebagai berikut: Keterangan: r11 = koefisien reliabilitas S12 = varians skor belahan 1 S22 = varians skor belahan 2 St2 = varians skor total 2 & 1 = bilangan konstan
  • 12. Faktor-faktor yang mempengaruhi reliabilitas 1. Jumlah butir tes Umumnya semakin besar jumlah butir soal tes samakin tinggi pula reliabilitasnya. Hal ini terjadi karena semakin panjang tes (semakin banyak butir soal) sehingga semakin banyak perilaku yang terukur dengan lebih tepat. Skor skor yang diperoleh tepat dan kemungkinan sedikit mengalami penyimpangan (distorsi) oleh adanya faktor -faktor yang sudah biasa dikenal dengan sebuah tes yang diberikan atau kurangnya pemahaman terhadap apa yang diharapkan pada sebuah tes yang diberikan. 2. Penyebaran skor Sebagai catatan awal, koefisien reliabilitas secara langsung dipengaruhi oleh penyebaran skor dalam kelompok yang diukur. Hal-hal lain menjadi sama, semakin besar penyebaran skor maka semakin besar pula indeks reliabilitas yang diperoleh. Karena semakin besar indeks reliabilitas yang dihasilkan ketika individu-individu berada pada posisi yang relatif sama dalam sebuah kelompok sebuah asesmen dengan asesmen yang lain, hal ini secara alami mengikuti bahwa segala sesuatu yang mengurangi kemungkinan bergeser nya posisi dalam kelompok juga turut andil dalam memperbesar koefisien reliabilitas. Dalam kasus ini, semakin besar perbedaan skor individu mengurangi kemungkinan pergeseran pososi. Dengan kata lain kesalahan dalam pengukuran kurang berpengaruh terhadap posisi relatif individu ketika perbedaan -perbedaan di antara anggota - anggota kelompok yang besar. Hal ini terjadi ketika skornya tersebar luas. 3. Objektivitas Objektivitas sebuah alat ukur menyatakan derajad untuk pemberi skor kompeten yang sama mendapatkan ha sil yang sama. Sebagian besar tes bakat dan tes prestasi standar mempunyai objektivitas yang tinggi. Butir-butir skor tes objektif seperti pilihan ganda dan skor yang dihasilkan tidak dipengaruhi oleh keputusan dan pendapat pemberi skor. Semakin tinggi tin gkat objektivitas tes semakin tinggi pula tingkat reliabilitasnya. 4. Metode estimasi reliabilitas Saat menguji koefisien reliabilitas tes standar, memutuskan metode yang digunakan untuk menentukan besarnya koefisien reliabilitas merupakan hal yang penting. Secara umum, besarnya koefisien reliabilitas berkaitan erat dengan metode yang digunakan untuk estimasi reliabilitas. a. Metode tes ulang (Test Retest Method) : mungkin hasilnya lebih besar dibandingkan dengan metode belah dua jika interval waktunya pendek. Koefisien reliabilitas yang dihasilkan menjadi lebih kecil jika interval waktu tesnya ditingkatkan b. Tes sejajar (Equivalent Test) tanpa waktu interval : Koefisien reliabilitas cenderung lebih rendah dibandingkan dengan metode belah dua atau tes ulang yang menggunakan interval waktu singkat. c. Tes Sejajar dengan interval waktu : koefisien menjadi lebih kecil seiring dengan peningkatan interval waktu tes. d. Metode belah dua (Split-half Method ): Metode ini menyediakan sebuah indikasi konsistensi internal tes.
  • 13. Tugas Terstruktur Pak Umar Bakri ingin mengetahui a pakah soal ulangan Biologi yang dibuatnya sudah valid dan reliabel untuk mengukur hasil belajar materi sistem pernapasan. Untuk keperluan ini, Pak Umar Bakri melakukan uji coba pada sejumlah siswa.Hasil uji coba tersebut adalah sebagai berikut. Pertanyaan: a. Butir soal nomor berapakah yang mempunyai koefisien validitas paling rendah? b. Butir soal nomor berapakah yang mempunyai koefisien validitas paling tinggi? c. Berapakah koefisien reliabilitas tes tersebut jika dihitung dengan formula Sperman-Brown? HUBUNGAN ANTARA VALIDITAS DAN RELIABITAS TES Hubungan Antara Validitas dengan Reliabilitas Umumnya orang berpendapat bahwa validitas mempunyai hubungan proporsional dengan reliabilitas. Orang menduga bahwa semakin valid suatu tes, semakin reliabel dan sebaliknya. Dugaan itu tidak sepenuhnya salah, tetapi juga tidak sepenuhnya betul (Noeng Muhadjir, 1984:56). Ada kemungkinan hubungan antara validitas reliabilitas itu bersifat independent, bebas satu sama lain dan dapat pula bersifat detrimental. Bila tes itu heterogen, mungkin mempunyai reliabilitas keajegan internal rendah, tetapi mempunyai validitas prediktif yang tinggi. Bila suatu tes bersifat homogen mungkin sekali mempertinggi reliabilitas tanpa mempengaruhi validitas, misalnya dengan menambah item tanpa menambah varians menambah varians dalam faktor umum yang tidak bersangkutan dengan kriteria. Tujuan validitas dan reliabilitas seringkali bersilangan. Bila kita ingin mempunyai suatu tes reliabel sekaligus valid dengan koefisien tinggi, sering kita mengerjakan pekerjaan yang mempunyai tujuan bersilangan. Reliabilitas maksimal membutuhkan interkorelasi tinggi antar item, sedangkan validitas prediktif yang maksimal memerlukan interkorelasi antar item rendah. Reliabilitas maksimal membutuhkan item dengan tingkat kesukaran sama, sedangkan validitas prediktif maksimal menuntut tes memiliki taraf kesukaran berbeda, sehingga perlu kompromi. Bila kita ingin mempertinggi reliabilitas suatu tes dan sekaligus mempertinggi validitas, cara yang dapat ditempuh adalah menambah varians faktor umum (Noeng Muhadjir, 1984:56-57). Namun jika langkah ini kita ambil, sebaiknya diperhitungkan apakah penambahan faktor umum ini dapat terjangkau oleh peserta didik. Oleh karena itu perlu dalam penentuan perencanaan, terutama dalam penyusunan kisi-kisi tes, faktor umum yang akan diperbanyak itu diperhitungkan juga jangan terlalu keluar dari program dan proses pendidikan sebelumnya.
  • 14. CARA MENINGKATKAN RELIABITITAS TES 1. Mengonsep satu variabel dengan jelas. 2. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah variabel harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain. 3. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat suatu level pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang dimiliki semakin mendetail. Prinsip dasarnya adalah cobalah melakukan pengukuran pada level paling tepat yang mungkin diperoleh. 4. Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indikator yang spesifik, peneliti dapat melakukan pengukuran dari range yang lebih luas terhadap konten definisi konseptual. 5. Gunakan Tes Pilot, yakni dengan membuat satu atau lebih draft atau dalam sebuah pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan Pilot Studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari literatur-literatur yang berkaitan. Selanjutnya , pengukuran terdahulu dapat dipergunakan sebagai patokan dari pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.