Validitas β
Menilai Hal
yang Tepat.
Validitas adalah kualitas terpenting dalam setiap penilaian. Tanpanya, semua hasil penilaian β sehebat apa pun instrumennya β tidak bisa diandalkan untuk keputusan apa pun.
Apa Itu Validitas?
Validitas adalah sejauh mana sebuah penilaian mengukur apa yang dimaksudkan untuk diukur β tidak kurang, tidak lebih, tidak bergeser.
Validitas adalah tingkat keakuratan interpretasi yang dibuat berdasarkan hasil penilaian untuk tujuan penggunaan yang spesifik.
Tidak Ada "Tes yang Valid."
Ini bukan main-main. Popham sangat tegas: validitas tidak melekat pada tes β ia melekat pada interpretasi dari hasil tes tersebut untuk tujuan yang spesifik.
"Tes ini valid untuk semua keperluan."
Tes yang sama bisa valid untuk satu tujuan dan tidak valid untuk tujuan lain."Interpretasi dari tes ini valid untuk menilai kemampuan membaca siswa kelas 4."
Validitas selalu terikat pada: interpretasi tertentu + tujuan penggunaan tertentu.Sebuah tes membaca dibacakan keras-keras kepada siswa tunanetra. Siswa mendapat nilai bagus. Apakah ini membuktikan siswa bisa membaca?
Tidak. Ini hanya membuktikan bahwa siswa memahami materi yang didengarkan. Ini interpretasi yang berbeda β dan bisa valid untuk tujuan lain, tapi tidak untuk "kemampuan membaca."
Validitas = Fitness for Purpose
Gray menegaskan bahwa validitas selalu harus dilihat dalam konteks tujuan. Gunakan tiga penggaris ini sebagai ilustrasi hubungan validitas dan reliabilitas:
Tidak Reliabel β Tidak Valid
Penggaris dari bahan yang mengembang saat panas β hasilnya berubah-ubah tergantung cuaca. Tidak konsisten = tidak bisa dipercaya = tidak valid.
Reliabel dan Valid β
Penggaris kayu yang stabil dengan tanda ukur akurat. Setiap pengukuran memberikan hasil yang sama dan benar. Ini yang kita inginkan.
Reliabel tapi Tidak Valid β οΈ
Penggaris kayu yang stabil β tapi tanda ukurnya salah cetak. Hasilnya selalu sama, tapi selalu salah. Konsistensi tidak menjamin keakuratan!
3 Cara Validitas Bisa Hilang
Popham mengidentifikasi dua ancaman teknis utama, sementara Gray mengingatkan bahwa validitas bisa hilang di titik mana pun selama proses perancangan penilaian.
Content Underrepresentation
Tes tidak mencakup aspek-aspek penting dari kurikulum yang seharusnya diukur β sehingga hasilnya hanya gambaran sebagian dari kemampuan sesungguhnya.
Construct-Irrelevant Variance
Nilai siswa dipengaruhi oleh faktor yang tidak relevan dengan apa yang sebenarnya ingin diukur β sehingga hasilnya "terkontaminasi."
Validitas Bisa Hilang Kapan Saja
Gray mengingatkan: validitas tidak hanya dibangun di awal β ia bisa hilang di setiap tahap proses penilaian.
4 Jenis Bukti Validitas
Popham (mengacu pada 2014 Standards) mengidentifikasi empat sumber bukti untuk menilai apakah interpretasi dari sebuah tes bisa dianggap valid. Dua yang pertama paling relevan untuk guru kelas.
1. Bukti Konten Tes
Sejauh mana tes mewakili konten kurikulum yang ingin diukur. Apakah soal-soalnya benar-benar sampling yang representatif dari tujuan pembelajaran?
4. Relasi ke Variabel Lain
Apakah hasil penilaian berkorelasi secara prediktif dengan ukuran lain yang relevan? Atau tidak berkorelasi dengan hal-hal yang seharusnya tidak terkait?
2. Proses Respons
Apakah proses kognitif yang digunakan siswa saat mengerjakan tes sesuai dengan yang dimaksudkan? Contoh: apakah siswa memang berpikir kritis atau hanya menghafal?
3. Struktur Internal
Apakah organisasi internal tes (hubungan antar butir soal) mencerminkan konstruk yang ingin diukur dengan akurat?
Apa Masalah Validitasnya?
Setiap skenario berikut mengandung masalah validitas. Identifikasi jenis ancamannya, lalu klik untuk melihat analisis.
Seorang guru Fisika membuat ujian akhir yang seluruh soalnya berupa soal cerita panjang. Siswa yang lemah dalam membaca membutuhkan waktu jauh lebih lama dan sering tidak sempat menjawab semua soal β bukan karena mereka tidak memahami fisikanya.
Ujian IPA semester mencakup 20 soal β semuanya tentang topik "Sistem Pernapasan." Padahal kurikulum semester itu mencakup 5 topik besar: sistem pernapasan, pencernaan, peredaran darah, ekskresi, dan reproduksi.
Guru Seni menilai kreativitas siswa dengan rubrik yang salah satu kriterianya adalah "kerapian dan kebersihan karya." Siswa yang karyanya kreatif tapi berantakan mendapat nilai rendah, sementara siswa yang karyanya kurang kreatif tapi rapi mendapat nilai tinggi.
Guru Matematika menggunakan hasil ujian akhir kelas 7 untuk menentukan siswa mana yang siap masuk kelas Matematika Akselerasi. Soal-soal ujian dirancang khusus untuk mencakup semua topik yang diajarkan selama kelas 7 dan hasilnya konsisten.
Bagaimana Membangun Penilaian yang Valid?
Mulai dari Tujuan yang Sangat Jelas
Tanyakan: "Apa sebenarnya yang ingin saya ketahui tentang kemampuan siswa?" Jawaban yang spesifik adalah fondasi validitas. Jika tujuannya kabur, apapun yang kamu buat tidak akan valid.
Identifikasi Bukti yang Dibutuhkan
Begitu tujuan jelas, tanyakan: "Seperti apa bukti bahwa siswa sudah menguasai hal itu?" Jika ingin tahu apakah siswa bisa membuat omelette dengan aman β lihat langsung. Jangan minta mereka menulis tentang cara membuat omelette.
Sampling yang Representatif
Tidak mungkin menguji semua hal. Tapi pastikan soal-soalmu adalah sampel yang representatif dari keseluruhan tujuan pembelajaran β bukan hanya bagian yang mudah dibuat soalnya.
Minimalkan Faktor Tidak Relevan
Tanya: "Apakah ada hal selain kemampuan yang ingin saya ukur yang bisa mempengaruhi nilai siswa?" Jika ada β itu construct-irrelevant variance. Hilangkan, atau akui keterbatasannya.
Gunakan Hanya untuk Tujuan yang Sesuai
Validitas terikat pada tujuan. Jangan gunakan hasil penilaian untuk tujuan yang berbeda dari yang dirancang. Ujian yang valid untuk menilai kemampuan menulis bisa tidak valid jika dipakai untuk menilai pengetahuan sejarah.
"Validity is, therefore, the most fundamental consideration in developing and evaluating tests."β AERA Standards for Educational and Psychological Testing (2014), dikutip dalam Popham (2025)
4 Hal yang Harus Kamu Bawa
Validitas = Akurasi Interpretasi
Bukan tentang "tes yang valid" β tapi tentang apakah interpretasi yang kamu buat dari hasil tes itu akurat untuk tujuan spesifik yang kamu miliki.
Dua Ancaman Utama
Content Underrepresentation (cakupan terlalu sempit) dan Construct-Irrelevant Variance (hal tak relevan ikut mempengaruhi nilai) β kenali dan hindari keduanya.
Mulai dari Tujuan, Selalu
Validitas dibangun dari awal dengan tujuan yang jelas. Validitas bisa hilang di setiap tahap β dari desain, pelaksanaan, penilaian, hingga cara hasil digunakan.
Reliabel β Valid
Penilaian bisa sangat konsisten (reliabel) tapi tetap tidak mengukur hal yang benar (tidak valid). Reliabilitas perlu, tapi tidak cukup untuk validitas.