BAGIAN 2 Β· BAHAN-BAHAN BERKUALITAS MODUL 2–2

Reliabilitas β€”
Konsistensi
Hasil Penilaian.

Penilaian yang baik harus memberikan hasil yang stabil. Jika kemampuan siswa sama, tes yang dilakukan hari ini, besok, atau lusa seharusnya memberikan kesimpulan skor yang serupa.

πŸ“— Gray & Wiseman-Orr (2026) Bab 2 πŸ“˜ Popham (2025) Bab 4
Β§ 1 Β· Definisi

Apa itu Reliabilitas?

Gray & Wiseman-Orr

Reliabilitas mengukur sejauh mana suatu penilaian bebas dari kesalahan acak (error), sehingga hasil yang diperoleh bersifat stabil dan dapat direplikasi dalam kondisi serupa.

βš–οΈ Ibarat timbangan digital: jika Anda menimbang benda berat 1 kg sebanyak tiga kali berturut-turut, timbangan yang reliabel akan selalu memunculkan angka 1.0 kg.
Popham

Reliabilitas mengacu pada konsistensi hasil yang ditunjukkan oleh instrumen penilaian terhadap sekelompok siswa dalam beberapa kali pengujian.

🎯 Fokus utama Popham adalah konsistensi statistik skor. Reliabilitas membuktikan bahwa skor bukan sekadar faktor keberuntungan sesaat.
Β§ 2 Β· Faktor Gangguan

3 Sumber Utama Gangguan (Noise)

Skor akhir siswa sering kali mengalami fluktuasi karena adanya gangguan luar. Gray & Popham membaginya ke dalam tiga kategori utama:

πŸ‘€

1. Di Dalam Diri Siswa (Internal)

Kondisi fisik dan emosional siswa yang berubah-ubah saat mengerjakan ujian.

β€’ Rasa lelah atau kurang tidur
β€’ Kecemasan berlebih (test anxiety)
β€’ Keberuntungan menebak jawaban acak
πŸ“

2. Pelaksanaan & Instrumen (Eksternal)

Faktor situasi lingkungan tempat ujian dilangsungkan serta kualitas fisik soal itu sendiri.

β€’ Ruang kelas yang bising atau gerah
β€’ Instruksi soal yang ambigu/membingungkan
β€’ Batas waktu pengerjaan yang terlalu ketat
πŸ‘¨β€πŸ«

3. Variabilitas Pemeriksa (Scoring)

Subjektivitas guru yang memeriksa lembar jawaban, terutama pada format esai atau proyek.

β€’ Suasana hati (mood) penilai berubah
β€’ Perbedaan standar antar dua guru penilai
β€’ Efek halo (menilai subjektif karena kedekatan)
Β§ 3 Β· Pengukuran Statistikal

3 Metode Mengukur Reliabilitas

Popham merinci tiga jenis koefisien reliabilitas utama untuk membuktikan bukti konsistensi secara formal:

STABILITAS

Test-Retest Reliability

Satu tes yang sama diujikan sebanyak dua kali kepada kelompok siswa yang sama dalam jeda waktu tertentu (misal berjarak dua minggu).

🎯 Fokus: Mengukur stabilitas hasil melintasi waktu.
EKUIVALENSI

Alternate-Forms Reliability

Membuat dua versi tes yang setara (paralel) dari segi tingkat kesulitan dan materi, lalu diujikan ke siswa yang sama dalam waktu berdekatan.

🎯 Fokus: Mengukur ekuivalensi antar-instrumen soal.
HOMOGENITAS

Internal Consistency

Ujian diberikan hanya satu kali, lalu konsistensi hubungan antarbutir soal dihitung menggunakan rumus statistik (seperti Alpha Cronbach atau Kuder-Richardson).

🎯 Fokus: Mengukur homogenitas butir soal internal.
Β§ 4 Β· Implementasi Praktis

Bagaimana Cara Meningkatkan Reliabilitas?

Saran taktis dari Gray & Popham bagi guru kelas untuk meminimalkan tingkat kesalahan (error variance):

1

Tambah Jumlah Butir Soal yang Berkualitas

Tes dengan 5 soal sangat rentan terhadap faktor keberuntungan tebakan siswa. Menambah jumlah soal hingga 20-25 butir akan memperkecil persentase error secara drastis.

2

Tulis Instruksi Soal Secara Jelas

Pastikan setiap kalimat perintah tidak bermakna ganda. Kalimat instruksi yang membingungkan memaksa siswa berspekulasi, yang berakibat pada penurunan reliabilitas.

3

Gunakan Rubrik Penilaian yang Terstandar

Saat menilai tugas esai atau portofolio, buatlah rubrik skor yang detail. Hal ini meminimalkan pergeseran subjektivitas guru saat memeriksa lembar jawaban nomor awal hingga nomor akhir.

Ringkasan Modul

Garis Besar Reliabilitas

πŸ”„

Konsistensi adalah Kunci

Reliabilitas berfokus pada kestabilan hasil skor, memastikan bahwa instrumen penilaian bebas dari gangguan kesalahan acak.

πŸ“’

Kendalikan Kebisingan

Kurangi noise dari faktor internal diri siswa, standardisasi lingkungan ujian, dan gunakan rubrik yang ketat untuk mengunci variabilitas nilai.

🚧

Bukan Jaminan Validitas

Ingat analogi penggaris salah cetak: tes yang sangat konsisten (reliabel) bisa saja tetap salah sasaran (tidak valid).