BAGIAN 3 ยท MEMASAK PENILAIAN MODUL 3โ€“2 Butler ch.4 ยท Popham ch.8,9

BERAGAM METODE
PENGUMPULAN BUKTI

Panduan Lengkap Memilih, Merancang, dan Menggunakan Lima Metode Penilaian untuk Guru Kelas
EDISI KHUSUS Satu metode tidak cukup untuk semua tujuan. Guru yang hebat tahu cara memilih metode yang tepat untuk bukti yang dibutuhkan.
LAPORAN UTAMA

Mengapa Guru Harus Menguasai Beragam Metode?

Setiap metode penilaian punya kekuatan dan keterbatasan tersendiri. Memilih metode yang salah berarti mendapatkan bukti yang salah โ€” dan keputusan yang salah.

Butler & McMunn menegaskan bahwa tidak ada satu metode penilaian yang cocok untuk semua jenis target belajar. Guru yang hanya mengandalkan tes pilihan ganda atau hanya esai akan selalu kehilangan sebagian bukti penting tentang kemampuan siswanya.

Popham memperkuat: penilaian kinerja dan portofolio sering lebih autentik โ€” lebih mencerminkan kemampuan nyata yang dibutuhkan dalam kehidupan โ€” dibanding tes tertulis konvensional. Tapi keduanya membutuhkan lebih banyak waktu dan keterampilan merancang.

Solusinya bukan memilih satu metode terbaik. Solusinya adalah menguasai kelima metode utama dan mengetahui kapan masing-masing paling efektif.

Jika kamu ingin menilai kemampuan membuat omelette โ€” lihat omelette-nya dibuat. Bukan minta siswa menulis tentang cara membuatnya.
โ€” Gray (2026)
ISI EDISI INI
01 Observasi Guru
02 Pertanyaan & Diskusi
03 Penilaian Kinerja
04 Portofolio
05 Proyek & Produk
๐ŸŽฎ Method Matcher
LIMA METODE UTAMA
01
METODE PERTAMA

Observasi Guru

Penilaian yang terjadi secara alami selama proses belajar berlangsung โ€” tanpa perlu tugas khusus.

Observasi adalah bentuk penilaian tertua dan paling alami. Guru mengamati proses siswa bekerja โ€” cara mereka berpikir, berinteraksi, dan memecahkan masalah โ€” bukan hanya hasilnya.

Menurut Butler, observasi sangat efektif untuk target keterampilan yang harus didemonstrasikan secara langsung, dan untuk disposisi โ€” sikap dan perilaku siswa yang sulit diukur dengan tes tertulis.

KELEBIHAN
โœ“ Bukti langsung dari performa nyata
โœ“ Tidak mengganggu proses belajar
โœ“ Ideal untuk formatif harian
PERHATIAN
โš  Perlu instrumen pencatatan yang sistematis
โš  Sulit digunakan untuk penilaian sumatif tanpa rekaman
โš  Rentan terhadap halo effect
ALAT BANTU
ChecklistAnecdotal NotesRating ScaleRunning Record
๐Ÿ‘
02
METODE KEDUA

Pertanyaan & Diskusi

Cara tercepat untuk mengakses pemikiran siswa secara langsung โ€” dan yang paling sering dilakukan tanpa disadari.

Questioning adalah metode paling efisien untuk menilai pengetahuan dan penalaran. Guru bisa menggali lebih dalam dengan follow-up questions โ€” sesuatu yang tidak bisa dilakukan oleh lembar tes.

Butler menyebutnya "student-teacher dialogue" โ€” bisa berbentuk tanya-jawab kelas, diskusi terarah, wawancara satu-satu, atau penilaian via jurnal. Semua memungkinkan guru mendengar bagaimana siswa berpikir, bukan hanya apa yang mereka jawab.

COCOK UNTUK
โœ“ Pengetahuan & pemahaman konseptual
โœ“ Penalaran (minta siswa "think out loud")
โœ“ Kecakapan berbahasa
๐Ÿ’ฌ "Jika kamu ingin tahu apa yang seseorang ketahui โ€” tanyakan saja padanya!"
โš  Masalah pencatatan: Dialog yang tidak direkam atau dicatat tidak bisa digunakan secara sumatif. Rencanakan sistem pencatatan sebelum menggunakan metode ini secara formal.
๐Ÿ’ฌ
PENILAIAN KINERJA
03
LAPORAN MENDALAM

Penilaian Kinerja:
Autentik tapi Menuntut

Penilaian kinerja meminta siswa mendemonstrasikan kompetensi yang sesungguhnya โ€” bukan hanya mengenali atau mengingat jawaban.

Menurut Popham, penilaian kinerja berbeda dari tes konvensional terutama dalam satu hal: tingkat kesesuaian antara tugas dan keterampilan yang ingin diukur. Semakin langsung buktinya, semakin valid penilainnya.

Siswa diminta melakukan sesuatu โ€” presentasi, eksperimen, demonstrasi, simulasi โ€” dan performanya diamati serta dinilai menggunakan rubrik.

TIGA JENIS RUBRIK โ€” MANA YANG TERBAIK?
โŒ HINDARI
Task-Specific

Kriteria terikat pada satu tugas spesifik. Tidak bisa digunakan untuk tugas lain. Tidak membantu guru merancang instruksi.

"Essay harus dimulai dengan merekap alasan kepala dinas, lalu deskripsi 6 elemen, lalu statistik dari kunjungan..."
โŒ HINDARI
Hypergeneral

Kriteria terlalu umum hingga tidak memberikan panduan instruksional yang berarti. Semuanya terasa seperti "bagus/cukup/buruk."

"Essay superior adalah yang isinya disusun dengan sangat baik; essay inferior adalah yang memiliki organisasi tidak memadai."
โœ“ GUNAKAN INI
Skill-Focused

Kriteria berfokus pada keterampilan yang bisa digeneralisasikan โ€” bukan hanya satu tugas. Membantu guru merancang instruksi yang lebih baik.

"Organisasi: essay harus memiliki struktur pembuka-isi-penutup yang jelas, dengan urutan logis/kronologis/kepentingan."
๐Ÿšจ WASPADA: BIAS DALAM PENILAIAN
Popham mengidentifikasi 4 bias umum saat guru menilai kinerja siswa
Generosity Error
Memberi nilai lebih tinggi dari yang seharusnya karena ingin bersikap baik. "Semua anak berusaha keras."
Severity Error
Memberi nilai lebih rendah dari yang seharusnya. Selalu melihat kekurangan, bukan kelebihan.
Central Tendency Error
Selalu memberi nilai tengah-tengah. Menghindari nilai sangat tinggi atau sangat rendah karena "tidak enak."
Halo Effect
Kesan umum tentang siswa mempengaruhi penilaian per kriteria. Siswa "favorit" dapat nilai tinggi di semua kriteria meski tidak layak.
CARA MEMINIMALKAN
โ†’ Nilai satu kriteria untuk semua siswa sebelum lanjut ke kriteria berikutnya
โ†’ Nilai secara anonim jika memungkinkan
โ†’ Sesekali balik urutan skala (rendahโ€“tinggi menjadi tinggiโ€“rendah)
5 ATURAN RUBRIK SKILL-FOCUSED (POPHAM)
1 Pastikan keterampilan yang dinilai benar-benar penting dan berdampak
2 Semua kriteria harus bisa diajarkan secara instruksional
3 Gunakan sesedikit mungkin kriteria (3โ€“4 adalah ideal)
4 Beri label singkat yang mudah diingat untuk tiap kriteria
5 Sesuaikan panjang rubrik dengan toleransi guru terhadap detail
PORTOFOLIO
04
METODE KEEMPAT

Portofolio

Koleksi sistematis karya siswa yang menggambarkan perkembangan, pencapaian, atau profisiensi dari waktu ke waktu.

5 JENIS PORTOFOLIO (BUTLER)
A
Best-Work
Karya terbaik siswa sebagai bukti penguasaan. Cocok untuk showcase ke orang tua atau rekrutmen.
๐Ÿ“Œ Showcase Night
B
Memorabilia
Koleksi momen berkesan. Berguna untuk menilai disposisi, minat, dan motivasi siswa.
๐Ÿ“Œ Seni & Bahasa
C
Growth
Fokus pada perubahan dari waktu ke waktu. Setiap entri diberi tanggal dan refleksi diri siswa.
๐Ÿ“Œ Writing Development
D
Skills
Dokumentasi penguasaan keterampilan spesifik. Mirip CV โ€” siswa membuktikan kapabilitasnya.
๐Ÿ“Œ Sertifikasi Guru
E
Assessment / Proficiency
Untuk keputusan penting seperti promosi kelas. Harus berisi bukti berkualitas tinggi dan reliabel.
๐Ÿ“Œ Kenaikan Kelas
7 LANGKAH PORTOFOLIO KELAS (POPHAM)
1Bangun rasa kepemilikan siswa
โ†’
2Tentukan sampel karya yang dikumpulkan
โ†’
3Kumpulkan & nilai sampel karya
โ†’
4Pilih kriteria evaluasi
โ†’
5Wajibkan self-evaluation berkelanjutan
โ†’
6Jadwalkan konferensi portofolio
โ†’
7Libatkan orang tua
โฐ Peringatan Waktu: Popham mengingatkan โ€” portofolio sangat menarik dan seringkali seduktif, tapi membutuhkan waktu signifikan dari guru dan siswa. Pilih dengan bijak berapa banyak portofolio yang akan dikelola sekaligus.
๐Ÿ“
05
METODE KELIMA

Proyek & Produk Tertulis

Siswa menghasilkan karya nyata โ€” bukan sekadar menjawab pertanyaan. Ini bukti paling langsung dari kemampuan produktif.

Butler membedakan proyek sejati dari aktivitas kelas biasa: Proyek penilaian yang baik harus selaras langsung dengan target kurikulum. Kegiatan yang menyenangkan tapi tidak terhubung ke standar bukan merupakan penilaian โ€” itu hanya aktivitas.

CONTOH PROYEK YANG VALID
โœ“ Laporan investigasi dengan pertanyaan riset jelas
โœ“ Rencana bisnis untuk startup yang akan dipresentasikan
โœ“ Data log pemantauan polusi sungai selama 4 minggu
โœ“ Prototipe benda sesuai spesifikasi teknis
โš—๏ธ Guru kimia yang membuat permen praline "Partial Degradation of a Six Carbon Sugar" โ€” kedengarannya saintifik, tapi tidak ada kaitannya dengan kurikulum. Itu bukan penilaian.
KETERBATASAN
โš  Membandingkan proyek yang berbeda = "apel dan jeruk"
โš  Sulit memastikan reliabilitas antar-penilai
โš  Beberapa siswa merasa selalu "di bawah sorotan"
๐Ÿ“‹
AKTIVITAS INTERAKTIF
๐ŸŽฎ METHOD MATCHER

Metode Mana yang Paling Tepat?

Baca setiap skenario berikut, pilih metode yang paling sesuai menurut Butler's Target-Method Matrix, lalu klik untuk melihat penjelasan.

SKENARIO I

"Guru Sains ingin menilai apakah siswanya bisa mengoperasikan mikroskop dengan prosedur yang benar, termasuk cara menempatkan dan memfokuskan spesimen."

SKENARIO II

"Guru Bahasa ingin melihat bagaimana kemampuan menulis siswa berkembang dari awal semester hingga akhir โ€” termasuk kemampuan siswa mengevaluasi karya mereka sendiri."

SKENARIO III

"Guru ingin memastikan seluruh siswa memahami perbedaan antara osmosis dan difusi sebelum pelajaran berakhir โ€” hasilnya langsung dipakai untuk memutuskan apakah perlu mengulang penjelasan."

SKENARIO IV

"Guru ingin menilai kemampuan siswa dalam meyakinkan audiens melalui presentasi lisan โ€” termasuk konten, organisasi, bahasa, dan cara penyampaiannya."

Jawab semua skenario untuk melihat skormu
PANDUAN CEPAT
REFERENSI CEPAT โ€” Dari Butler's Target-Method Matrix

Metode Mana untuk Target Apa?

Target Belajar Selected Response Constructed Response Dialog/Pertanyaan Observasi Portofolio
Pengetahuan โ˜…โ˜…โ˜… โ˜…โ˜…โ˜… โ˜…โ˜…โ˜… โ˜…โ˜… โ˜…โ˜…
Penalaran โ˜…โ˜… โ˜…โ˜…โ˜… โ˜…โ˜… โ˜… โ˜…โ˜…โ˜…
Keterampilan โ˜… โ˜…โ˜… โ˜… โ˜…โ˜…โ˜… โ˜…
Produk โ˜… โ˜…โ˜…โ˜… โ˜… โ˜…โ˜… โ˜…โ˜…โ˜…
Disposisi โ˜…โ˜…โ˜… โ˜…โ˜…โ˜… โ˜…โ˜…โ˜… โ˜…โ˜… โ˜…โ˜…โ˜…
โ˜…โ˜…โ˜… = Kuat  |  โ˜…โ˜… = Moderat  |  โ˜… = Lemah
EDITORIAL

Kesimpulan: Jangan Setia pada Satu Metode

T

idak ada metode tunggal yang cukup. Guru yang hanya mengandalkan tes pilihan ganda tidak tahu apakah siswanya bisa menerapkan pengetahuan dalam situasi nyata. Guru yang hanya menggunakan portofolio tidak bisa membandingkan capaian antar-siswa secara efisien.

Rahasianya adalah memahami kekuatan dan keterbatasan setiap metode, lalu memilih yang paling cocok untuk tujuan yang sedang dicapai โ€” bukan karena kebiasaan atau kemudahan.

Popham mengingatkan: penilaian kinerja sangat seduktif karena terasa autentik. Tapi jangan tergoda untuk menggunakannya di mana-mana โ€” ia membutuhkan waktu yang banyak. Pilih dengan bijak dan fokus pada keterampilan yang benar-benar penting.

Dan selalu ingat: apapun metode yang dipilih, kembali ke pertanyaan Gray โ€” "Bukti apa yang paling langsung membuktikan kemampuan siswa terhadap target yang ingin saya nilai?"

4 POIN KUNCI
โ†’ Pilih metode berdasarkan bukti yang dibutuhkan
โ†’ Gunakan skill-focused rubrics untuk penilaian kinerja
โ†’ Waspadai 4 bias personal dalam penilaian
โ†’ Portofolio: pilih tipe yang sesuai tujuan