Konsep Terkini Mengenai Validitas dan Reliabilitas

Validitas dan Reliabilitas
Saat ini telah terjadi perubahan konsep mengenai reliabilitas dan validitas. Reliabilitas tetap merupakan hal penting dalam menilai utilitas suatu instrumen, namun reliabilitas dijadikan bagian dari validitas.1 Reliabilitas merupakan bagian dari struktur internal validitas.

Validitas dipandang sebagai argumen terstruktur pengumpulan bukti dari berbagai sumber guna mendukung atau menolak interpretasi yang diusulkan skor instrumen.2 Validitas terbaik dilihat sebagai hipotesis atau “argumen interpretatif” yang memerlukan pengumpulan bukti guna mendukung kesimpulan.3,4

Pemikiran kontemporer menunjukkan bahwa semua validitas harus dikonseptualisasikan dalam satu kerangka kerja yang menyeluruh yaitu construct validity.5 Pendekatan ini menegaskan bahwa nilai suatu instrumen hanya berguna bila mencerminkan konstruksi dan bukti yang harus dikumpulkan untuk mendukung hubungan ini. Konsep-konsep lainnya dijadikan sebagai sumber bukti validitas dalam rubrik construct validity.

Ada lima sumber bukti untuk mendukung validitas konstruk yaitu: isi/konten (content), proses respon (response process), struktur internal (internal structure), hubungan dengan variabel lain (relations to other variables), dan konsekuensi (consequences).4 Sumber bukti tersebut bukan klasifikasi validitas, melainkan adalah kategori bukti yang harus dikumpulkan untuk mendukung construct validity dari kesimpulan yang dibuat dari nilai instrumen.

Bukti harus dicari dari beberapa sumber yang berbeda untuk mendukung penafsiran yang diberikan. Bukti yang kuat dari satu sumber tidak menghilangkan kebutuhan untuk mencari bukti dari sumber lain. Saat mengumpulkan bukti,  kita harus mempertimbangkan dua “ancaman” terhadap validitas yaitu pengambilan sampel yang tidak memadai (rendahnya representasi konstruksi) dan faktor yang mengerahkan pengaruh pada nilai nonrandom (bias atau varian konstruk yang tidak relevan).4

– Content

Konten harus mewakili kebenaran (konstruksi), seluruh konstruksi, dan hanya konstruksi.6 Perencanaan konten ditujukan untuk mengembangkan dan memilih butir (pertanyaan-pertanyaan individu, petunjuk, atau kasus yang meliputi instrumen), kata-kata dari masing-masing butir, serta kualifikasi penulis butir dan peninjau.

– Response process

Penilai sebaiknya adalah orang yang telah dilatih dengan benar, sehingga jika suatu instrumen membutuhkan seseorang lainnya untuk menilai kinerja penilai tersebut, maka hal itu akan menjadi bukti yang mendukung proses respon. Selain itu, keamanan data, metode penilaian, dan pelaporan hasil juga merupakan bukti untuk kategori ini.1

– Internal structure

Skor yang dimaksudkan untuk mengukur suatu konstruksi tunggal harus memberikan hasil yang homogen. Bila skor dimaksudkan untuk mengukur banyak konstruksi, maka harus menunjukkan respon heterogen dengan pola yang telah diprediksi oleh konstruksi. Dengan demikian, variasi respon terhadap suatu butir antara subkelompok yang diharapkan memberikan nilai yang sama (disebut “differential item functioning“) berarti menunjukkan kekurangan dalam struktur internal.5

– Relations to other variables

Korelasi nilai instrumen dengan hasil yang akan diharapkan, dan kurangnya korelasi dengan yang tidak diharapkan, akan mendukung kesesuaian interpretasi dengan konstruksi yang mendasarinya.6

– Consequences

Evaluasi konsekuensi yang diinginkan atau tidak diinginkan dari sebuah penilaian dapat mengungkapkan sumber-sumber yang sebelumnya tak ketahuan ketidaksahihannya.

Fungsi Reliabilitas

Saat ini, para pakar menjadikan reliabilitas sebagai komponen validitas.1 Reliabilitas tetap diperlukan, namun hanya merupakan salah satu sumber bukti. Reliabilitas dan faktor analisis data dianggap sebagai bukti dari struktur internal.1

Reliabilitas mengacu pada reproduksibilitas atau konsistensi skor dari satu penilaian yang lain. Suatu instrumen yang tidak menghasilkan skor yang dapat diandalkan tidak memungkinkan interpretasi yang valid.

Hubungan Validitas dengan Reliabilitas

Sebelum adanya konsep baru, validitas digunakan untuk menilai suatu instrumen dapat digunakan atau tidak (utilitas). Validitas merupakan salah satu komponen dari utilitas, begitu juga dengan reliabilitas. Suatu instrumen akan diuji validitas dan reliabilitasnya, serta komponen utilitas lainnya.

Berbeda dengan yang dulu, saat ini terjadi pergeseran pengertian validitas. Istilah validitas bukan digunakan untuk menilai instrumen, namun merupakan penilaian terhadap hasil dari instrumen. Reliabilitas hanya salah satu komponen agar suatu instrumen dapat dinilai validitasnya. Agar dapat digunakan, instrumen yang baru dikembangkan cukup memiliki nilai reliabilitas yang baik, tidak ada uji validitas. Nilai yang baik tersebut akan memberikan hasil yang valid.

Istilah validitas tidak digunakan lagi untuk mengatakan suatu instrumen apakah dapat digunakan atau tidak. Validitas digunakan untuk menilai hasil dari instrumen  (hasil penelitian) dengan mengidentifikasi isi/konten, proses respon, struktur internal (termasuk di dalamnya reliabilitas), hubungan dengan variabel lain, dan konsekuensi.

Validitas bukan merupakan penilaian dikotomi (ya atau tidak), namun merupakan penilaian berbentuk suatu derajat pengukuran. Suatu hasil instrumen akan dinilai dari kelima komponen validitas, sehingga bisa saja suatu hasil instrumen memiliki validitas pada empat komponen, namun dapat mengalami kekurangan pada komponen yang lain.

Untuk mendapatkan nilai validitas sempurna berarti suatu hasil instrumen mesti memenuhi kelima komponen validitas. Suatu hasil intrumen dikatakan memiliki validitas yang lebih tinggi apabila semakin banyak komponen yang penilaiannya baik. Begitu juga sebaliknya, apabila hasil yang didapatkan dari instrumen tersebut memiliki komponen dengan sedikit penilaian baiknya, maka hasil penelitian tersebut dikatakan kurang valid (memiliki tingkat validitas rendah).

Referensi

  1. Downing SM. Validity (on the meaningful interpretation of assessment data). Medical Education 2003;37:830–7.
  2. Cook DA, Beckman TJ. Current concepts in validity and reliability for psychometric instruments: Theory and application . The American Journal of Medicine 2006;119(2):166.e7-16.
  3. Kane MT. An argument-based approach to validity. Psychological Bulletin 1992;112:527-35.
  4. Messick S. Validation of inferences from persons’ responses and performances as scientific inquiry into score meaning. American Psychologist 1995;50:741-9.
  5. American Educational Research Association, American Psychological Association, National Council on Measurement in Education. Standards for educational and psychological testing. Washington, DC: American Educational Research Association; 1999.
  6. Foster SL, Cone JD. Validity issues in clinical assessment. Psychological Assessment. 1995;7:248–60.

Leave a Reply

Your email address will not be published. Required fields are marked *