BAGIAN 2 Β· BAHAN-BAHAN BERKUALITAS MODUL 2–1

Validitas β€”
Menilai Hal
yang Tepat.

Validitas adalah kualitas terpenting dalam setiap penilaian. Tanpanya, semua hasil penilaian β€” sehebat apa pun instrumennya β€” tidak bisa diandalkan untuk keputusan apa pun.

πŸ“— Gray & Wiseman-Orr (2026) Bab 2 πŸ“˜ Popham (2025) Bab 4
Β§ 1 Β· Definisi

Apa Itu Validitas?

Gray & Wiseman-Orr

Validitas adalah sejauh mana sebuah penilaian mengukur apa yang dimaksudkan untuk diukur β€” tidak kurang, tidak lebih, tidak bergeser.

πŸ“ Seperti meteran yang mengukur lebar ruangan: ia valid karena mengukur tepat apa yang kita butuhkan β€” bukan berat, bukan waktu, hanya lebar.
Popham

Validitas adalah tingkat keakuratan interpretasi yang dibuat berdasarkan hasil penilaian untuk tujuan penggunaan yang spesifik.

🎯 Validitas bukan milik tes-nya β€” melainkan milik tafsiran yang kita buat dari hasil tes tersebut.
⚑
Intinya sama: penilaian yang valid memberikan informasi yang bisa kamu percaya β€” tentang hal yang benar-benar ingin kamu ketahui β€” untuk keputusan yang akan kamu buat.
⚠️ Konsep yang Sering Disalahpahami

Tidak Ada "Tes yang Valid."

Ini bukan main-main. Popham sangat tegas: validitas tidak melekat pada tes β€” ia melekat pada interpretasi dari hasil tes tersebut untuk tujuan yang spesifik.

❌ KELIRU

"Tes ini valid untuk semua keperluan."

Tes yang sama bisa valid untuk satu tujuan dan tidak valid untuk tujuan lain.
βœ“ TEPAT

"Interpretasi dari tes ini valid untuk menilai kemampuan membaca siswa kelas 4."

Validitas selalu terikat pada: interpretasi tertentu + tujuan penggunaan tertentu.
πŸ“Œ Ilustrasi Popham

Sebuah tes membaca dibacakan keras-keras kepada siswa tunanetra. Siswa mendapat nilai bagus. Apakah ini membuktikan siswa bisa membaca?

Tidak. Ini hanya membuktikan bahwa siswa memahami materi yang didengarkan. Ini interpretasi yang berbeda β€” dan bisa valid untuk tujuan lain, tapi tidak untuk "kemampuan membaca."

Β§ 2 Β· Validitas & Tujuan

Validitas = Fitness for Purpose

Gray menegaskan bahwa validitas selalu harus dilihat dalam konteks tujuan. Gunakan tiga penggaris ini sebagai ilustrasi hubungan validitas dan reliabilitas:

Penggaris 1
mengembang saat panas

Tidak Reliabel β†’ Tidak Valid

Penggaris dari bahan yang mengembang saat panas β€” hasilnya berubah-ubah tergantung cuaca. Tidak konsisten = tidak bisa dipercaya = tidak valid.

Reliabilitas rendah β†’ Validitas rendah
Penggaris 2
stabil di semua kondisi

Reliabel dan Valid βœ“

Penggaris kayu yang stabil dengan tanda ukur akurat. Setiap pengukuran memberikan hasil yang sama dan benar. Ini yang kita inginkan.

Reliabilitas tinggi β†’ Validitas tinggi βœ“
Penggaris 3
tanda ukur keliru

Reliabel tapi Tidak Valid ⚠️

Penggaris kayu yang stabil β€” tapi tanda ukurnya salah cetak. Hasilnya selalu sama, tapi selalu salah. Konsistensi tidak menjamin keakuratan!

Reliabilitas tinggi β‰  Validitas tinggi
!
Pelajaran kunci: Reliabilitas adalah syarat perlu untuk validitas β€” tapi bukan syarat cukup. Kamu bisa punya penilaian yang sangat konsisten tapi sama sekali tidak mengukur hal yang benar.
Β§ 3 Β· Ancaman Validitas

3 Cara Validitas Bisa Hilang

Popham mengidentifikasi dua ancaman teknis utama, sementara Gray mengingatkan bahwa validitas bisa hilang di titik mana pun selama proses perancangan penilaian.

01
πŸ“¦

Content Underrepresentation

Tes tidak mencakup aspek-aspek penting dari kurikulum yang seharusnya diukur β€” sehingga hasilnya hanya gambaran sebagian dari kemampuan sesungguhnya.

Contoh
Ujian Matematika Semester yang hanya mencakup soal aljabar β€” padahal kurikulum semester itu juga mencakup geometri dan statistika. Nilai siswa tidak mencerminkan kemampuan matematika penuh mereka.
02
πŸ“‘

Construct-Irrelevant Variance

Nilai siswa dipengaruhi oleh faktor yang tidak relevan dengan apa yang sebenarnya ingin diukur β€” sehingga hasilnya "terkontaminasi."

Ingin mengukur:
Kemampuan Matematika
πŸ’₯ Noise: soal penuh teks panjang
⚠️ Ikut terukur: kemampuan membaca
Ingin mengukur:
Kreativitas Siswa
πŸ’₯ Noise: kriteria mencakup kerapian
⚠️ Ikut terukur: kerapian tulisan
Ingin mengukur:
Keterampilan Sains Praktis
πŸ’₯ Noise: dinilai via tes tertulis
⚠️ Ikut terukur: kemampuan menulis esai
Ingin mengukur:
Kemampuan Analisis Siswa Introvert
πŸ’₯ Noise: harus presentasi lisan
⚠️ Ikut terukur: kepercayaan diri berbicara
03
⏱️

Validitas Bisa Hilang Kapan Saja

Gray mengingatkan: validitas tidak hanya dibangun di awal β€” ia bisa hilang di setiap tahap proses penilaian.

Tujuan Tujuan tidak jelas β†’ salah fokus
↓
Desain Soal mengukur hal lain β†’ kontaminasi
↓
Pelaksanaan Kondisi tidak merata β†’ bias
↓
Penilaian Penilaian tidak konsisten β†’ noise
↓
Penggunaan Digunakan untuk tujuan berbeda β†’ tidak valid lagi
Β§ 4 Β· Bukti Validitas

4 Jenis Bukti Validitas

Popham (mengacu pada 2014 Standards) mengidentifikasi empat sumber bukti untuk menilai apakah interpretasi dari sebuah tes bisa dianggap valid. Dua yang pertama paling relevan untuk guru kelas.

⭐ Utama untuk Guru Kelas
πŸ“‹

1. Bukti Konten Tes

Sejauh mana tes mewakili konten kurikulum yang ingin diukur. Apakah soal-soalnya benar-benar sampling yang representatif dari tujuan pembelajaran?

Pertanyaan kunci:
"Apakah soal-soal dalam tes ini benar-benar mencakup hal-hal penting yang saya ajarkan β€” dan hanya itu?"
⭐ Utama untuk Guru Kelas
πŸ”—

4. Relasi ke Variabel Lain

Apakah hasil penilaian berkorelasi secara prediktif dengan ukuran lain yang relevan? Atau tidak berkorelasi dengan hal-hal yang seharusnya tidak terkait?

Pertanyaan kunci:
"Apakah siswa yang nilainya tinggi di sini memang benar-benar lebih kompeten di kemampuan yang saya ukur?"
Jarang diperlukan guru kelas
🧠

2. Proses Respons

Apakah proses kognitif yang digunakan siswa saat mengerjakan tes sesuai dengan yang dimaksudkan? Contoh: apakah siswa memang berpikir kritis atau hanya menghafal?

Jarang diperlukan guru kelas
πŸ—οΈ

3. Struktur Internal

Apakah organisasi internal tes (hubungan antar butir soal) mencerminkan konstruk yang ingin diukur dengan akurat?

πŸ”¬ Aktivitas β€” Diagnosa Validitas

Apa Masalah Validitasnya?

Setiap skenario berikut mengandung masalah validitas. Identifikasi jenis ancamannya, lalu klik untuk melihat analisis.

Kasus A

Seorang guru Fisika membuat ujian akhir yang seluruh soalnya berupa soal cerita panjang. Siswa yang lemah dalam membaca membutuhkan waktu jauh lebih lama dan sering tidak sempat menjawab semua soal β€” bukan karena mereka tidak memahami fisikanya.

Kasus B

Ujian IPA semester mencakup 20 soal β€” semuanya tentang topik "Sistem Pernapasan." Padahal kurikulum semester itu mencakup 5 topik besar: sistem pernapasan, pencernaan, peredaran darah, ekskresi, dan reproduksi.

Kasus C

Guru Seni menilai kreativitas siswa dengan rubrik yang salah satu kriterianya adalah "kerapian dan kebersihan karya." Siswa yang karyanya kreatif tapi berantakan mendapat nilai rendah, sementara siswa yang karyanya kurang kreatif tapi rapi mendapat nilai tinggi.

Kasus D

Guru Matematika menggunakan hasil ujian akhir kelas 7 untuk menentukan siswa mana yang siap masuk kelas Matematika Akselerasi. Soal-soal ujian dirancang khusus untuk mencakup semua topik yang diajarkan selama kelas 7 dan hasilnya konsisten.

Jawab semua kasus untuk melihat skormu
Β§ 5 Β· Cara Kerja

Bagaimana Membangun Penilaian yang Valid?

1

Mulai dari Tujuan yang Sangat Jelas

Tanyakan: "Apa sebenarnya yang ingin saya ketahui tentang kemampuan siswa?" Jawaban yang spesifik adalah fondasi validitas. Jika tujuannya kabur, apapun yang kamu buat tidak akan valid.

πŸ’‘ Gray: "The starting point for creating valid assessment is to be very clear about exactly what it is you want to know."
2

Identifikasi Bukti yang Dibutuhkan

Begitu tujuan jelas, tanyakan: "Seperti apa bukti bahwa siswa sudah menguasai hal itu?" Jika ingin tahu apakah siswa bisa membuat omelette dengan aman β€” lihat langsung. Jangan minta mereka menulis tentang cara membuat omelette.

πŸ’‘ Tujuan yang jelas secara alami mengarah ke jenis bukti yang tepat.
3

Sampling yang Representatif

Tidak mungkin menguji semua hal. Tapi pastikan soal-soalmu adalah sampel yang representatif dari keseluruhan tujuan pembelajaran β€” bukan hanya bagian yang mudah dibuat soalnya.

πŸ’‘ Popham: Bayangkan kurikulum sebagai kotak besar. Soal-soalmu harus tersebar merata, bukan hanya mengambil dari satu sudut.
4

Minimalkan Faktor Tidak Relevan

Tanya: "Apakah ada hal selain kemampuan yang ingin saya ukur yang bisa mempengaruhi nilai siswa?" Jika ada β€” itu construct-irrelevant variance. Hilangkan, atau akui keterbatasannya.

πŸ’‘ Contoh: soal matematika yang terlalu banyak teks β†’ kurangi beban membaca yang tidak perlu.
5

Gunakan Hanya untuk Tujuan yang Sesuai

Validitas terikat pada tujuan. Jangan gunakan hasil penilaian untuk tujuan yang berbeda dari yang dirancang. Ujian yang valid untuk menilai kemampuan menulis bisa tidak valid jika dipakai untuk menilai pengetahuan sejarah.

πŸ’‘ Popham: "For the very same test, evidence might reveal that for Use X interpretations are valid, but for Use Y they are not."
"Validity is, therefore, the most fundamental consideration in developing and evaluating tests."
β€” AERA Standards for Educational and Psychological Testing (2014), dikutip dalam Popham (2025)
Satu hal yang disepakati semua ahli asesmen: tanpa validitas, semua kualitas lain penilaian menjadi tidak berarti.
Sebelum ke Modul 2-2

4 Hal yang Harus Kamu Bawa

🎯

Validitas = Akurasi Interpretasi

Bukan tentang "tes yang valid" β€” tapi tentang apakah interpretasi yang kamu buat dari hasil tes itu akurat untuk tujuan spesifik yang kamu miliki.

πŸ”

Dua Ancaman Utama

Content Underrepresentation (cakupan terlalu sempit) dan Construct-Irrelevant Variance (hal tak relevan ikut mempengaruhi nilai) β€” kenali dan hindari keduanya.

🧱

Mulai dari Tujuan, Selalu

Validitas dibangun dari awal dengan tujuan yang jelas. Validitas bisa hilang di setiap tahap β€” dari desain, pelaksanaan, penilaian, hingga cara hasil digunakan.

πŸ“

Reliabel β‰  Valid

Penilaian bisa sangat konsisten (reliabel) tapi tetap tidak mengukur hal yang benar (tidak valid). Reliabilitas perlu, tapi tidak cukup untuk validitas.