RESEP PENILAIAN KELAS
Bagian 4 Β· Menyajikan & Memanfaatkan Hasil
4-3
FINAL MODULE

Pelaporan Nilai &
Ujian Berskala Besar

Praktik pemberian nilai yang baik, cara mengomunikasikan hasil kepada orang tua, dan memahami apa yang sebenarnya diukur oleh ujian nasional.

ReferensiButler ch.11,12 Β· Popham ch.13,16
Bagian2 Tema Utama
StatusModul Terakhir Bagian 4
TEMA A βš–οΈ Praktik Pemberian Nilai
↔
TEMA B πŸ“Š Ujian Berskala Besar
Β§ 1 Β· Butler ch.11 β€” Mengapa Praktik Pemberian Nilai Penting

Sejarah Pemberian Nilai:
Lebih Bermasalah dari yang Kamu Kira

Studi Starch & Elliott (1912) yang legendaris meminta 142 guru menilai esai Bahasa Inggris yang sama. Hasilnya: nilai berkisar dari 50 hingga 98 β€” rentang 48 poin! Studi lanjutan untuk esai geometri: nilai 28 hingga 92.

Butler: sistem penilaian yang kita asumsikan "objektif" sebenarnya sangat rentan terhadap inkonsistensi. Reformasi praktik pemberian nilai bukan tentang memudahkan siswa β€” tapi tentang membuat nilai benar-benar bermakna dan valid.

48
poin
Rentang nilai untuk esai yang sama dari 142 guru berbeda (Starch & Elliott, 1912)
⚠️ Butler ch.11 β€” 5 Praktik Pemberian Nilai yang MERUGIKAN

Berhenti Melakukan Ini

Butler mengidentifikasi lima praktik yang masih umum dilakukan guru padahal terbukti merusak validitas nilai dan motivasi belajar siswa.

01
πŸ“

Skala Penilaian yang Berbeda-Beda

Guru yang berbeda menetapkan standar yang berbeda untuk nilai yang sama. "A" di kelas Pak Budi β‰  "A" di kelas Bu Sari. Nilai tidak bisa dibandingkan antar kelas.

Dampak
Nilai kehilangan makna sebagai komunikasi standar yang sama kepada semua pihak
02
πŸ“Š

Rata-Rata yang Memasukkan Nol

Satu nilai nol dari tugas yang tidak dikumpulkan bisa merusak rata-rata semester siswa secara tidak proporsional β€” bahkan jika siswa menguasai materi.

Contoh
Siswa dengan 9 nilai 80 dan 1 nilai 0 β†’ rata-rata 72, padahal ia benar-benar menguasai materi
03
πŸ”„

Rata-Rata Semua Nilai

Merata-rata semua nilai sepanjang semester mengaburkan kemajuan β€” nilai awal yang buruk (saat baru belajar) menurunkan rata-rata nilai akhir yang sebenarnya mencerminkan penguasaan.

Masalah
Nilai mencerminkan waktu belajar, bukan level penguasaan saat ini
04
⏱️

Menguji Sebelum Mengajar

Memberikan tes pada awal unit sebelum materi diajarkan untuk "membuktikan" bahwa siswa belum tahu. Ini merusak motivasi dan menciptakan catatan yang menyesatkan.

Dampak
Nilai awal yang tidak valid ikut dihitung dalam grade akhir siswa
05
🎭

Instruksi Tidak Siapkan Siswa untuk Jenis Penilaian

Mengajar dengan diskusi dan proyek, tapi menilai dengan tes pilihan ganda. Atau sebaliknya. Format yang tidak selaras mengukur adaptasi bukan penguasaan.

Masalah
Siswa yang menguasai materi gagal karena tidak familiar dengan format tes, bukan karena tidak kompeten
βœ“ Butler ch.11 β€” 5 Praktik Pemberian Nilai yang PRODUKTIF

Lakukan Ini Sebagai Gantinya

🎯
βœ“

Nilai Berbasis Pencapaian Standar

Nilai harus mencerminkan sejauh mana siswa menguasai standar/tujuan pembelajaran yang ditetapkan β€” bukan usaha, kehadiran, atau perilaku. Pisahkan laporan akademik dari laporan non-akademik.

πŸ“‹
βœ“

Nilai dari Penilaian Sumatif

Nilai akhir harus berasal dari penilaian sumatif yang valid β€” bukan rata-rata semua aktivitas kelas. Formatif adalah untuk belajar, sumatif adalah untuk mencatat pencapaian.

πŸ“ˆ
βœ“

Cerminkan Level Pencapaian Terkini

Pertimbangkan pola dan tren dalam performa, bukan hanya rata-rata matematika. Jika siswa menunjukkan pertumbuhan konsisten, nilai akhir harus mencerminkan pencapaian saat ini.

πŸ’¬
βœ“

Bagikan Kebijakan dengan Siswa & Orang Tua

Transparansi adalah kewajiban etis. Siswa dan orang tua berhak tahu bagaimana nilai dihitung, apa yang dinilai, dan apa yang dibutuhkan untuk mencapai setiap level nilai.

βš–οΈ
βœ“

Kebijakan Grading yang Standar & Konsisten

Standardisasi kebijakan antar guru di satu sekolah meningkatkan keadilan dan memastikan nilai A dari satu kelas memiliki makna yang sama dengan nilai A dari kelas lain.

Β§ 2 Β· Mengomunikasikan Hasil kepada Orang Tua

Orang Tua Berhak Mengerti,
Bukan Hanya Menerima Angka

Butler: banyak orang tua tidak memahami arti angka yang tertulis di rapor anaknya. Tugas guru bukan hanya memberi nilai β€” tapi memastikan nilai itu dikomunikasikan dengan cara yang bermakna dan bisa ditindaklanjuti.

βœ“ LAKUKAN
Jelaskan apa yang nilai itu wakili β€” bukan sekadar angka, tapi "level penguasaan standar ini"
βœ“ LAKUKAN
Berikan konteks: "Nilai 75 di kelas ini berarti siswa menguasai 3 dari 4 standar semester"
βœ“ LAKUKAN
Tunjukkan tren dan pola, bukan hanya angka akhir: "Nilai Budi membaik dari 55 ke 78 selama semester ini"
βœ— HINDARI
Membandingkan nilai satu siswa dengan siswa lain di depan orang tuanya
βœ— HINDARI
Membiarkan orang tua menginterpretasi nilai sendiri tanpa panduan tentang skala dan konteks
πŸ“– Contoh Popham: "Superboy" β€” Membaca Skor

Popham menggunakan karakter "Superboy" untuk menjelaskan bahwa skor yang sama bisa bermakna sangat berbeda tergantung cara dilaporkan:

Jenis skor yang berbeda: raw score, persentase, persentile rank, grade equivalent SKOR SUPERBOY β€” LEAPING TALL BUILDINGS Raw Score 16 dari 20 soal benar 16 Persentase 16/20 Γ— 100 = 80% 80% Persentile Rank Lebih tinggi dari 98% peserta tes Persen-98 Grade Equivalent Performa setara rata-rata kelas 11 bulan ke-2 11.2 ⚠ 80% β‰  Persentile 80 β€” Ini kesalahan paling umum orang tua!

Kesalahan Popham: orang tua sering salah mengartikan "persentile 80" sebagai "mendapat 80%." Padahal persentile 80 berarti lebih tinggi dari 80% peserta tes β€” bahkan jika nilainya hanya 55%.

Β§ 3 Β· Popham ch.13 & Butler ch.12 β€” Ujian Berskala Besar

Apa yang Sebenarnya Diukur
Ujian Nasional?

Popham dan Butler sama-sama mengingatkan: ujian berskala besar punya keterbatasan fundamental yang harus dipahami guru. Memahami ini bukan untuk menolaknya β€” tapi untuk menggunakannya secara tepat.

Dua jenis standarisasi tes: norm-referenced dan criterion-referenced Norm-Referenced Membandingkan siswa MEAN 50% di bawah median = SENGAJA dirancang Criterion-Referenced Mengukur vs standar STANDAR Semua bisa lulus jika kuasai standar
Kritik Utama terhadap Large-Scale Testing (Butler ch.12)
πŸ“‰
Norm-referenced sengaja membuat 50% di bawah rata-rata

Ini bukan karena sekolah gagal β€” ini karena definisi matematika dari median. Selalu 50% di bawah median. Hasil buruk pada norm-referenced test mungkin tidak bermakna apa pun tentang instruksi.

🎭
Tes cenderung menghindari konten "terlalu penting"

Item yang hampir semua siswa jawab benar tidak berguna untuk norm-referenced (tidak mendiskriminasi). Sehingga ujian nasional cenderung menghindari materi terpenting yang diajarkan guru.

🏫
Nilai sekolah dipengaruhi faktor sosio-ekonomi, bukan hanya kualitas pengajaran

Membandingkan nilai tes antar sekolah tanpa memperhitungkan konteks sosio-ekonomi menghasilkan kesimpulan yang menyesatkan tentang kualitas instruksi.

⚠️
Peningkatan nilai tes β‰  peningkatan belajar

Latihan soal tes meningkatkan nilai tanpa meningkatkan kompetensi nyata. Popham: jangan evaluasi kualitas instruksi berdasarkan skor tes standar yang tidak dirancang untuk tujuan itu.

Β§ 4 Β· Butler ch.12 β€” Penilaian Kelas vs Ujian Berskala Besar

Dua Alat untuk Dua Tujuan yang Berbeda

Butler: jangan harapkan ujian nasional melakukan apa yang penilaian kelas lakukan, dan sebaliknya. Keduanya punya kekuatan berbeda yang saling melengkapi.

Dimensi Penilaian Kelas Ujian Berskala Besar
Tujuan utama Memandu pembelajaran dan instruksi harian Akuntabilitas, seleksi, sertifikasi
Skala Satu kelas / satu sekolah Regional / nasional / internasional
Kedekatan dengan kurikulum Langsung terhubung ke apa yang diajarkan Kurikulum yang "diasumsikan" β€” mungkin tidak selaras
Umpan balik untuk guru Real-time, spesifik, actionable Terlambat, terlalu umum, sulit ditindaklanjuti
Nilai instruksional Tinggi β€” langsung mempengaruhi instruksi Rendah β€” sering tidak memberi informasi yang cukup untuk tindakan kelas
Standardisasi Bervariasi β€” rentan subjektivitas Tinggi β€” prosedur seragam, dapat dibandingkan
Kesesuaian untuk evaluasi guru Lebih tepat β€” mengukur instruksi spesifik Tidak tepat β€” terlalu banyak faktor luar di luar kendali guru
πŸ’‘
Butler & Popham sepakat: gunakan kedua jenis penilaian untuk gambaran yang lengkap tentang pencapaian siswa. Tapi jangan gunakan satu untuk tujuan yang hanya bisa dipenuhi oleh yang lain.
πŸ”¬ Grade Auditor β€” Aktivitas Terakhir

Audit Praktik Pemberian Nilai

Baca setiap skenario. Nilai: apakah praktik ini Produktif (mendukung validitas nilai) atau Bermasalah (merusak validitas nilai)?

Skenario I

Bu Rina memasukkan nilai nol untuk setiap PR yang tidak dikumpulkan Dito. Di akhir semester, Dito mendapat nilai 55 walaupun semua ulangan hariannya di atas 80. Bu Rina berkata: "Ini konsekuensi dari tidak mengerjakan PR."

Skenario II

Pak Dani memberi nilai akhir berdasarkan tren perkembangan: nilai awal semester (ketika siswa baru belajar materi) tidak dimasukkan ke perhitungan akhir. Yang digunakan: 3 penilaian sumatif terakhir yang mencerminkan penguasaan saat ini.

Skenario III

Kepala sekolah meminta guru menggunakan hasil ujian nasional sebagai satu-satunya indikator untuk mengevaluasi efektivitas mengajar mereka. Guru yang nilai ujian siswanya tinggi mendapat bonus; yang nilainya rendah mendapat teguran.

Skenario IV

Bu Cinta memberi tahu siswa dan orang tua di awal semester: "Nilai akhir dihitung dari 3 ulangan harian (30%), 2 proyek (40%), dan ujian akhir (30%). Tidak ada nilai minus untuk keterlambatan mengumpulkan β€” hanya ada nilai nol jika tidak dikumpulkan sama sekali."

Selesaikan semua skenario untuk melihat skormu
PENUTUP MODUL 4-3 & BAGIAN 4

Pelaporan Nilai yang Baik adalah
Komunikasi, Bukan Sekadar Angka

01

Nilai harus mencerminkan penguasaan standar, bukan rata-rata aritmatika semua aktivitas

Nilai yang valid adalah yang memberitahu orang tua dan siswa seberapa jauh siswa menguasai apa yang perlu dikuasai β€” bukan seberapa banyak tugas yang dikerjakan.

02

Persentile β‰  Persentase β€” dan itu penting untuk dipahami guru

Guru harus bisa menjelaskan perbedaan jenis skor kepada orang tua. Kebingungan umum ini menyebabkan kesalahpahaman tentang kemampuan anak yang bisa berdampak besar.

03

Ujian nasional punya keterbatasan yang harus dipahami β€” bukan dihindari

Gunakan ujian berskala besar untuk tujuan yang dirancangnya: gambaran komparatif berskala luas. Jangan gunakan untuk tujuan yang lebih tepat dipenuhi oleh penilaian kelas.

04

Transparansi dalam pelaporan adalah bagian dari etika penilaian

Dari Modul 1-3 hingga 4-3, satu benang merah konsisten: siswa dan orang tua berhak tahu bagaimana penilaian bekerja, apa yang dinilai, dan bagaimana hasilnya diinterpretasikan.

Selamat! Kamu sudah menyelesaikan seluruh Bagian 4.

Dari penilaian formatif (4-1), analisis data (4-2), hingga pelaporan dan ujian nasional (4-3) β€” kamu sekarang memiliki fondasi lengkap untuk menjadi guru yang menilai dengan bijak, adil, dan bermakna.

Lanjut ke Review Bagian 4 β†’