You are on page 1of 18

Abstrak:

Makalah ini berpendapat bahwa assesment dapat berfungsi sebagai pengaruh positif pada
pencapaian tujuan pembelajaran abad ke-21. Bagian I berfokus pada tantangan pendidikan abad ke-
21 dan jenis assesment yang diperlukan untuk mendukung pencapaian tujuan pembelajaran yang
relevan dengan masyarakat global. Bagian II dan III membahas tujuan dan konteks assesment
pendidikan dan tiga kerangka kerja konseptual yang penting: (a)assesment sebagai proses penalaran
dari bukti, (b) assesment didorong oleh model pembelajaran yang ditunjukan sebagai proses
pembelajaran, dan (c) penggunaan proses desain yang berpusat pada bukti untuk mengembangkan
dan menafsirkan penilaian. Bagian IV mempertimbangkan implikasi untuk desain ruang kelas dan
penilaian skala besar. Bagian V dan VI mempertimbangkan unsur-unsur sistem penilaian yang
seimbang dan indikator kualitas utama kita harus tetap berada di garis depan saat kita berupaya
menerapkan sistem penilaian yang koheren sebagai bagian dari proses transformasi pendidikan di
abad ke-21.

Penilaian sering dilihat oleh individu di kedua bidang pendidikan praktik dan komunitas riset
sebagai pengaruh negatif terhadap mengajar dan belajar, terutama ketika taruhan tinggi melekat
hasil nilai tes (Kaestle, 2013; Linn, 2013). Kertas ini berpendapat bahwa ketika penilaian dipahami,
dirancang, dan Diimplementasikan itu dapat berfungsi sebagai pengaruh positif pada pencapaian
tujuan pembelajaran yang kami miliki untuk siswa di abad ke-21. Untuk membuat Argumen saya
mengacu pada laporan yang dikeluarkan oleh Riset Nasional A.S.Council (NRC) berjudul “Knowing
What Students Know: The Sciencedan Desain Penilaian Pendidikan ”(Pellegrino, Chudowsky, &
Glaser, 2001), serta beberapa laporan terbaru yang menguraikan poin yang dibuat dalam laporan
NRC 2001. Laporan terbaru ini berfokus pada masalah desain dan penggunaan penilaian pendidikan
mengingat saat ini konteks perubahan besar dalam standar pembelajaran disiplin di Amerika Serikat
(mis., Darling-Hammond et al., 2013; Gordon Komisi, 2013a, 2013b; Pellegrino, Wilson, Koenig, &
Beatty, 2014). Sementara banyak argumen saya diilustrasikan dengan menarik konteks pendidikan
A.S. saat ini, mereka berlaku untuk apa pun sistem pendidikan di mana penggunaan penilaian
berkisar di seluruh tingkatan mulai dari ruang kelas hingga distrik, negara bagian, nasional atau
internasional konteks.

Di Bagian I, fokusnya adalah pada tantangan yang lebih luas di abad ke-21 pendidikan dan
jenis penilaian yang perlu kita dukung pencapaian tujuan pembelajaran yang relevan dengan
masyarakat global. Bagian ini diakhiri dengan diskusi singkat tentang lima elemen sistem penilaian
yang dapat mendukung evaluasi tersebut lebih dalam belajar. Bagian II memperkenalkan tujuan dan
konteks penilaian pendidikan dan kemudian Bagian III membahas tiga terkait kerangka kerja
konseptual: (a) penilaian sebagai proses penalaran dari bukti, (b) penilaian didorong oleh model
pembelajaran dinyatakan sebagai perkembangan pembelajaran, dan (c) penggunaan bukti yang
dipusatkan proses desain untuk mengembangkan dan menafsirkan penilaian. Bagian IV beralih ke
implikasi materi dalam Bagian III untuk penilaian kelas dan penilaian skala besar. Bagian V kemudian
mempertimbangkan elemen sistem penilaian yang seimbang dan Bagian VI kembali ke lima elemen
sistem penilaian dibahas dalam Bagian I dan ditutup dengan menjelaskan secara singkat indikator-
indikator utama kualitas yang harus kita pertahankan saat kita berupaya menerapkan sistem
penilaian yang koheren sebagai bagian dari proses transformasi pendidikan di abad ke-21
I. Tantangan Pendidikan Sebelum Kita

Sifat pekerjaan dan masyarakat yang berubah berarti premium di dunia saat ini tidak hanya
pada informasi yang diperoleh siswa, tetapi pada kemampuan mereka untuk menganalisis,
mensintesis, dan menerapkan apa yang mereka miliki belajar untuk mengatasi masalah baru,
merancang solusi, berkolaborasi secara efektif, dan berkomunikasi secara persuasif (lihat mis.,
Bereiter & Scardamalia, 2013; Pellegrino & Hilton, 2012). Di Amerika Serikat, pembuat kebijakan di
hampir setiap negara bagian telah mengadopsi standar baru dimaksudkan untuk memastikan bahwa
semua siswa lulus dari sekolah menengah siap untuk kuliah dan karier. Untuk mencapai tujuan itu
diperlukan a transformasi dalam pengajaran, pembelajaran, dan penilaian sehingga semuanya siswa
mengembangkan kompetensi belajar yang lebih dalam diperlukan untuk keberhasilan
postsecondary. Transformasi ini akan membutuhkan perbaikan dalam kurikulum dan sistem
penilaian untuk mendukung kompetensi belajar yang lebih dalam. Kementerian pendidikan sekitar
dunia telah mendesain ulang kurikulum dan sistem penilaian untuk menekankan keterampilan ini.
Misalnya, saat Singapura bersiap untuk memperbaiki sistem asesmennya, kemudian Menteri
Pendidikan, TharmanShanmugaratnam, mencatat (Ng, 2008):

[Kita perlu] lebih sedikit ketergantungan pada hafalan, tes berulang dan tipe 'satu ukuran
cocok untuk semua', dan lebih banyak lagi tentang pembelajaran yang melibatkan, penemuan
melalui pengalaman, pengajaran yang berbeda, pembelajaran keterampilan seumur hidup, dan
pembangunan karakter, sehingga siswa dapat ... kembangkan atribut, pola pikir, karakter, dan nilai-
nilai untuk masa depan keberhasilan.

Reformasi di Singapura, seperti di Selandia Baru, Hong Kong, a jumlah negara bagian
Australia dan provinsi Kanada, dan pencapaian tinggi lainnya yurisdiksi telah diperkenalkan semakin
ambisius penilaian kinerja yang mengharuskan siswa untuk menemukan, mengevaluasi, dan
menggunakan informasi daripada hanya mengingat fakta. Selain itu, ini penilaian - yang meminta
siswa untuk merancang dan melakukan investigasi, menganalisis data, menarik kesimpulan yang
valid, dan melaporkan temuan - sering meminta siswa untuk menunjukkan apa yang mereka miliki
tahu dalam investigasi yang menghasilkan tulisan canggih, lisan, produk matematika, fisik, dan
multimedia (DarlingHammond & Adamson (2010) (Lihat Lampiran untuk contoh). Ini penilaian,
bersama dengan investasi lain dalam kurikulum yang bijaksana, pengajaran berkualitas tinggi, dan
sekolah yang didanai secara adil, misalnya, tampaknya berkontribusi pada prestasi tinggi mereka
(Darling-Hammond,2010).

Amerika Serikat siap untuk mengambil langkah besar ke arah kurikulum dan penilaian untuk
jenis pembelajaran yang lebih mendalam dengan adopsi Standar Negara Inti Umum yang baru
(CCSSI, 2010a, 2010b) dan Standar Sains Generasi Selanjutnya (Achieve, 2013). Ini standar
dimaksudkan untuk menjadi "lebih sedikit, lebih tinggi, dan lebih dalam" daripada iterasi standar
sebelumnya, yang telah dikritik karena "satu mil lebar dan satu inci dalam". Mereka bertujuan untuk
memastikan bahwa siswa siap untuk kuliah dan karier dengan pengetahuan yang lebih dalam dan
banyak lagi keterampilan yang dapat ditransfer dalam disiplin ilmu ini, termasuk kemampuan
membaca dan dengarkan secara kritis untuk memahami, menulis dan berbicara dengan jelas dan
persuasif, dengan mengacu pada bukti, dan untuk menghitung dan berkomunikasi secara
matematis, alasan secara kuantitatif dan secara ilmiah, dan desain solusi untuk masalah kompleks.
Standar Inti Umum dalam seni bahasa Inggris dan matematika, dan Standar Sains Generasi
Selanjutnya akan membutuhkan pendekatan yang lebih terintegrasi untuk menyampaikan instruksi
konten semua bidang studi (Pellegrino & Hilton, 2012). Inti Bersama standar dalam seni bahasa
Inggris ditulis untuk memasukkan pengembangan membaca kritis, menulis, berbicara, dan
mendengarkan keterampilan dalam sejarah, sains, matematika, dan seni serta dalam Kelas bahasa
Inggris. Standar Inti Umum dalam matematika adalah ditulis untuk memasukkan penggunaan
keterampilan dan konsep matematika dalam Bahasa Indonesia bidang-bidang seperti sains,
teknologi, dan teknik. Standar-standar ini menekankan cara dimana siswa harus menggunakan
melek huruf dan keterampilan berhitung di seluruh kurikulum dan dalam kehidupan. Sebagai negara
berusaha untuk menerapkan standar-standar ini, mereka juga harus memeriksa bagaimana mereka
penilaian mendukung dan mengevaluasi keterampilan ini dan menciptakan insentif bagi mereka
untuk diajarkan dengan baik.

Di Amerika Serikat, dua konsorsium negara bagian - Kemitraan untuk Penilaian Kesiapan
untuk Perguruan Tinggi dan Karier (PARCC) dan Konsorsium Penilaian Seimbang yang Lebih Cerdas
(SBAC) – telah dibentuk untuk mengembangkan penilaian generasi berikutnya dari standar-standar
ini. Ini adalah bagian dari berbagai inisiatif untuk memikirkan kembali penilaian itu menemani
reformasi pendidikan yang didorong oleh standar disiplin. Dengan demikian, sudah saatnya
mempertimbangkan fitur apa saja yang berkualitas tinggi sistem penilaian yang memenuhi tujuan
baru ini harus mencakup. Itu Laporan Komisi Gordon 2013, ditulis oleh banyak pemimpin ahli dalam
kurikulum, pengajaran, dan penilaian, paling banyak dijelaskan tujuan kritis dengan cara ini:

Untuk membantu dalam mencapai tujuan pembelajaran yang ditetapkan dalam Inti umum,
penilaian harus sepenuhnya mewakili kompetensi bahwa tuntutan dunia yang semakin kompleks
dan terus berubah. Itu penilaian terbaik dapat mempercepat perolehan kompetensi ini jika mereka
membimbing tindakan guru dan memungkinkan siswa untuk mengukur kemajuan mereka. Untuk
melakukannya, tugas dan kegiatan dalam penilaian harus menjadi model yang layak mendapat
perhatian dan energi dari guru dan siswa. Komisi meminta pembuat kebijakan di semua tingkatan
untuk secara aktif mempromosikan transformasi yang sangat dibutuhkan ini saat ini praktik penilaian
... Sistem penilaian [harus] kuat cukup untuk mendorong perubahan instruksional yang diperlukan
untuk memenuhi standar ... dan memberikan bukti bahwa pembelajaran siswa bermanfaat bagi
guru.

Penilaian baru harus memajukan kompetensi yang cocok ke era di mana kita hidup. Siswa
kontemporer harus mampu mengevaluasi validitas dan relevansi informasi yang berbeda dan
menarik kesimpulan dari mereka. Mereka perlu menggunakan apa yang mereka ketahui untuk
membuat dugaan dan mencari bukti untuk mengujinya, datang dengan ide-ide baru, dan
berkontribusi secara produktif ke jaringan mereka, apakah di tempat kerja atau di komunitas
mereka. Seiring dunia tumbuh semakin kompleks dan saling berhubungan, orang harus bisa
mengenali pola, membuat perbandingan, menyelesaikan kontradiksi, dan memahami sebab dan
akibat. Mereka perlu belajar untuk merasa nyaman dengannya ambiguitas dan mengakui bahwa
perspektif membentuk informasi dan makna yang kita tarik darinya. Pada tingkat paling umum, the
Penekanan dalam sistem pendidikan kita perlu pada membantu individu masuk akal dari dunia dan
bagaimana cara beroperasi efektif di dalamnya. Akhirnya, penting juga untuk melakukan penilaian
lebih dari mendokumentasikan kemampuan siswa dan apa yang mereka miliki tahu. Agar
bermanfaat, penilaian harus memberikan petunjuk mengapa siswa memikirkan cara mereka
melakukan dan bagaimana mereka belajar serta alasan untuk kesalahpahaman (Komisi Gordon,
2013b).

Tidak ada penilaian tunggal yang dapat mengevaluasi semua jenis pembelajaran yang kita
nilai bagi siswa; instrumen tunggal tidak dapat memenuhi semua tujuan dipegang oleh orang tua,
praktisi, dan pembuat kebijakan. Seperti yang diperdebatkan di bawah, itu Penting untuk
membayangkan sistem penilaian terkoordinasi, di Indonesia alat yang berbeda digunakan untuk
tujuan yang berbeda - misalnya, pelaporan formatif dan sumatif, diagnostik vs skala besar. Namun,
dalam sistem seperti itu, semua penilaian harus dilakukan dengan setia mewakili Standar, dan
semua harus memodelkan pengajaran yang baik dan praktik belajar. (5) Penilaian yang Valid, Andal,
dan Adil: Agar bisa benar-benar valid untuk beragam pelajar, penilaian harus diukur baik apa yang
mereka maksudkan untuk diukur, akurat dalam mengevaluasi kemampuan siswa dan melakukannya
dengan andal di seluruh konteks pengujian dan pencetak gol. Mereka juga harus tidak bias dan
dapat diakses dan digunakan di

cara yang mendukung hasil positif bagi siswa dan pengajaran

kualitas.

Satu tantangan besar adalah menentukan jalan ke depan

kita dapat membuat sistem penilaian yang memenuhi tujuan yang kita miliki

untuk sistem pendidikan dan yang sesuai dengan kriteria

diuraikan di atas. Dalam apa yang berikut, kami mempertimbangkan konteks

penilaian pendidikan, dasar-dasar konseptual dari

penilaian, dan proses desain yang berprinsip

dasar untuk mencapai sistem penilaian yang memenuhi

kriteria yang diuraikan di atas. Ini termasuk penilaian yang dirancang untuk

mendukung pengajaran dan pembelajaran di kelas serta yang dirancang

untuk memantau kemajuan dalam sistem pendidikan.

II Penilaian Pendidikan dalam Konteks

Tujuan dan Konteks Penilaian

Dari kuis guru, ujian tengah semester, atau ujian akhir hingga

tes standar yang dikelola secara nasional dan internasional,

penilaian pengetahuan dan keterampilan siswa telah menjadi

bagian mana-mana dari lanskap pendidikan. Penilaian sekolah

belajar memberikan informasi untuk membantu pendidik, administrator,


pembuat kebijakan, siswa, orang tua, dan peneliti menilai keadaan

siswa belajar dan membuat keputusan tentang implikasi dan tindakan.

Tujuan khusus untuk mana penilaian akan digunakan adalah

pertimbangan penting dalam semua fase desainnya. Sebagai contoh,

penilaian digunakan oleh instruktur di ruang kelas untuk membantu atau memantau

belajar biasanya perlu memberikan informasi lebih rinci daripada

penilaian yang hasilnya akan digunakan oleh pembuat kebijakan atau

lembaga akreditasi. Salah satu poin utama dari Knowing What

Laporan Siswa Tahu adalah bahwa penilaian dikembangkan untuk

tujuan khusus dan sifat desainnya sangat banyak

dibatasi oleh penggunaan interpretif yang dimaksudkan.

Penilaian untuk membantu pembelajaran. Dalam konteks kelas,

instruktur menggunakan berbagai bentuk penilaian untuk menginformasikan sehari-hari

dan keputusan bulan ke bulan tentang langkah selanjutnya untuk instruksi, untuk

beri siswa umpan balik tentang kemajuan mereka, dan untuk memotivasi

siswa. Salah satu jenis penilaian kelas yang akrab adalah buatan guru

kuis, tetapi penilaian juga mencakup lebih banyak metode informal untuk

menentukan bagaimana siswa mengalami kemajuan dalam pembelajaran mereka, seperti

proyek kelas, umpan balik dari instruksi yang dibantu komputer,

observasi kelas, pekerjaan tertulis, pekerjaan rumah, dan percakapan

dengan dan di antara siswa - semua ditafsirkan oleh guru dalam terang

informasi tambahan tentang siswa, konteks sekolah,

dan konten yang dipelajari. merumuskan penilaian tentang kualitas dan efektivitas

program dan lembaga pendidikan. Evaluasi instruksional dapat

dianggap formatif di alam ketika digunakan untuk meningkatkan

efektivitas pengajaran. Penggunaan penilaian sumatif untuk

evaluasi semakin digabungkan dalam membuat taruhan besar


keputusan tidak hanya tentang individu, tetapi juga tentang program dan

institusi (mis., Linn, 2013). Misalnya, pelaporan publik negara

hasil penilaian oleh sekolah dan kabupaten / kota dapat mempengaruhi penilaian

orang tua dan pembayar pajak tentang kualitas dan kemanjuran mereka

sekolah dan memengaruhi keputusan tentang alokasi sumber daya. Sama seperti dengan

individu, kualitas ukuran sangat penting dalam

validitas keputusan ini

Pertimbangan Lebih Lanjut tentang Tujuan, Level, dan Skala Waktu

Seperti disebutkan di atas, penilaian terjadi dalam berbagai konteks, memiliki a

berbagai penggunaan formal dan informal, dan dilakukan untuk memenuhi

tujuan yang berbeda. Tujuan dari suatu penilaian menentukan

prioritas, dan konteks penggunaan menimbulkan kendala pada desain.

Karena itu, penting untuk mengetahui bahwa satu jenis penilaian tidak

cocok untuk semua tujuan atau konteks penggunaan. Secara umum, semakin banyak tujuan a

penilaian tunggal bertujuan untuk melayani, semakin banyak tujuan masing-masing

dikompromikan dan produk keseluruhan akan mewakili sub-optimal

desain untuk setiap penggunaan yang dimaksudkan. Kesalahan yang terus-menerus adalah
menganggapnya

penilaian sesuai dan dapat ditafsirkan untuk hal tertentu

konteks penggunaan tanpa menentukan apakah ada bukti mengenai

validitas asumsi semacam itu dalam konteks itu. Satu ukuran cocok untuk semua

kekeliruan sangat sering dan bermasalah sejak itu menghasilkan

pilihan penilaian yang tidak tepat untuk pengajaran atau penelitian

tujuan yang pada gilirannya dapat menyebabkan kesimpulan yang salah tentang

orang, program, dan / atau lembaga.

Meskipun penilaian saat ini digunakan untuk berbagai keperluan di

sistem pendidikan, premis dari Knowing What Students

Tahu laporan adalah bahwa keefektifan dan kegunaan mereka pada akhirnya harus
dinilai oleh sejauh mana mereka mempromosikan pembelajaran siswa. Itu

Tujuan penilaian harus “untuk mendidik dan meningkatkan siswa

kinerja, bukan hanya untuk mengauditnya ”(Wiggins, 1998, p.7). Karena

penilaian dikembangkan untuk tujuan khusus, sifatnya

desain sangat dibatasi oleh tujuan penggunaannya. Meskipun mungkin

tampaknya masuk akal untuk mendikotomi antara kelas internal

penilaian, dikelola oleh instruktur, dan tes eksternal,

dikelola oleh distrik, negara bagian, atau negara atau lembaga lain, seperti

dikotomi adalah penyederhanaan berlebihan dari sebuah kontinum yang mencerminkan

kedekatan penilaian dengan diberlakukannya pembelajaran khusus

dan kegiatan belajar. Ruiz-Primo, Shavelson, Hamilton, & Klein

(2002) mendefinisikan lima titik diskrit pada rangkaian penilaian

jarak: langsung (mis., pengamatan atau artefak dari

berlakunya aktivitas instruksional tertentu), tutup (mis., disematkan

penilaian dan kuis belajar semiformal dari satu atau lebih

kegiatan), proksimal (mis., ujian kelas formal belajar dari a

kurikulum spesifik), distal (mis., pencapaian yang dirujuk kriteria)

tes seperti yang disyaratkan oleh undang-undang federal No Child Left Behind),

dan jarak jauh (hasil yang lebih luas diukur dari waktu ke waktu, termasuk norma yang
direferensikan

tes prestasi dan beberapa nasional dan internasional

ukuran pencapaian). Penilaian yang berbeda harus dipahami

sebagai titik berbeda pada kontinum ini jika mereka ingin efektif

selaras satu sama lain dan dengan kurikulum dan instruksi. Di

Intinya, penilaian adalah ujian transfer dan bisa dekat atau jauh

transfer tergantung di mana penilaian berada di sepanjang

kontinum yang disebutkan di atas.

Tingkat di mana penilaian dimaksudkan untuk berfungsi, yang


melibatkan jarak yang bervariasi dalam "ruang dan waktu" dari berlakunya

pengajaran dan pembelajaran, memiliki implikasi untuk bagaimana dan seberapa baik itu

dapat memenuhi berbagai fungsi penilaian, baik itu formatif,

sumatif, atau evaluasi program (NRC, 2003). Seperti yang diperdebatkan di tempat lain

(Hickey & Pellegrino, 2005; Pellegrino & Hickey, 2006), juga merupakan

jika tingkat dan fungsi penilaian yang berbeda dapat miliki

berbagai tingkat kecocokan dengan sikap teoretis tentang alam

mengetahui dan belajar.

Meskipun penilaian digunakan dalam berbagai konteks, untuk perbedaan

tujuan, dan pada rentang waktu yang berbeda sering terlihat sangat berbeda, mereka

berbagi prinsip umum tertentu. Salah satu prinsip tersebut adalah itu

penilaian selalu merupakan proses penalaran dari bukti. Dengan itu

bahkan sifatnya, penilaiannya tidak tepat sampai batas tertentu.

Hasil penilaian hanya perkiraan dari apa yang diketahui dan diketahui seseorang

bisa lakukan. Kami menguraikan kedua masalah ini dalam dua berikut

bagian.

AKU AKU AKU. Kerangka Kerja Konseptual

Penilaian sebagai Proses Penalaran Evidentiary: Penilaian

Segi tiga

Pendidik menilai siswa untuk belajar tentang apa yang mereka ketahui dan dapat mereka lakukan

lakukan, tetapi penilaian tidak menawarkan jalur pipa langsung ke siswa

pikiran. Menilai hasil pendidikan tidak semudah seperti

mengukur tinggi atau berat; atribut yang diukur adalah

representasi mental dan proses yang tidak terlihat secara lahiriah.

Dengan demikian, penilaian adalah alat yang dirancang untuk mengamati perilaku siswa

dan menghasilkan data yang dapat digunakan untuk menarik kesimpulan yang masuk akal

tentang apa yang siswa ketahui. Memutuskan apa yang akan dinilai dan bagaimana melakukannya
jadi tidak sesederhana yang mungkin muncul.

Proses pengumpulan bukti untuk mendukung kesimpulan tentang

apa yang siswa ketahui merupakan rantai penalaran dari bukti

tentang pembelajaran siswa yang menjadi ciri semua penilaian, dari

kuis kelas dan tes prestasi standar, untuk

program bimbingan terkomputerisasi, untuk percakapan yang dilakukan siswa

dengan gurunya saat mereka bekerja melalui masalah matematika atau mendiskusikan

arti suatu teks. Orang beralasan dari bukti setiap hari tentang apa pun

sejumlah keputusan, kecil dan besar. Ketika meninggalkan rumah di

pagi, misalnya, seseorang tidak tahu dengan pasti bahwa itu benar

akan hujan, tetapi mungkin memutuskan untuk mengambil payung di

dasar bukti seperti laporan cuaca pagi dan

awan yang mengancam di langit.

Pertanyaan pertama dalam proses penalaran penilaian adalah “bukti

tentang apa? ”Data menjadi bukti hanya dalam masalah analitik

ketika seseorang telah menetapkan relevansinya dengan suatu dugaan

dipertimbangkan (Schum, 1987, hlm. 16). Data tidak menyediakan sendiri

berarti; nilai mereka sebagai bukti hanya dapat muncul melalui beberapa

kerangka kerja interpretasi. Apa yang dirasakan seseorang secara visual

misalnya, tidak hanya bergantung pada data yang diterimanya sebagai foton

Cahaya menyentakkan retina-retinanya, tetapi juga pada apa yang menurutnya akan dilihatnya.

Dalam konteks saat ini, penilaian pendidikan menyediakan data seperti

esai tertulis, tanda pada lembar jawaban, presentasi proyek, atau

penjelasan siswa tentang solusi masalah mereka. Data ini menjadi

bukti hanya berkenaan dengan dugaan tentang bagaimana siswa

memperoleh pengetahuan dan keterampilan.

elemen harus sinkron. Segitiga penilaian menyediakan a


kerangka kerja yang berguna untuk menganalisis dasar-dasar saat ini

penilaian untuk menentukan seberapa baik mereka mencapai tujuan kita

ada dalam pikiran, serta untuk merancang penilaian masa depan dan

menetapkan validitas (mis., lihat Marion & Pellegrino, 2006).

Sudut kognisi segitiga mengacu pada teori, data, dan a

seperangkat asumsi tentang bagaimana siswa mewakili pengetahuan dan

mengembangkan kompetensi dalam domain materi pelajaran (mis., pecahan,

Hukum Newton, termodinamika). Dalam penilaian tertentu

aplikasi, teori belajar dalam domain diperlukan untuk mengidentifikasi

seperangkat pengetahuan dan keterampilan yang penting untuk diukur untuk

konteks penggunaan yang dimaksudkan, apakah itu untuk menandai

kompetensi yang telah diperoleh siswa pada suatu saat untuk dibuat

penilaian sumatif, atau membuat penilaian formatif untuk membimbing

instruksi selanjutnya untuk memaksimalkan pembelajaran. Premis sentral

adalah bahwa teori kognitif harus mewakili yang paling ilmiah

pemahaman kredibel tentang cara-cara khas yang diwakili peserta didik

pengetahuan dan mengembangkan keahlian dalam suatu domain.

Setiap penilaian juga didasarkan pada serangkaian asumsi dan

prinsip tentang jenis tugas atau situasi yang akan ditanyakan

siswa mengatakan, melakukan, atau menciptakan sesuatu yang menunjukkan penting

pengetahuan dan kemampuan. Tugas-tugas yang diminta siswa

menanggapi penilaian tidak sewenang-wenang. Mereka harus hati-hati

dirancang untuk memberikan bukti yang terkait dengan model kognitif

belajar dan mendukung jenis kesimpulan dan keputusan itu

akan dibuat berdasarkan hasil penilaian. Pengamatan

simpul dari segitiga penilaian mewakili deskripsi atau set

spesifikasi untuk tugas penilaian yang akan menghasilkan penerangan


tanggapan dari siswa. Dalam penilaian, seseorang memiliki kesempatan untuk

susun beberapa sudut kecil dunia untuk melakukan pengamatan. Itu

desainer penilaian dapat menggunakan kemampuan ini untuk memaksimalkan nilai

data dikumpulkan, seperti yang terlihat melalui lensa yang mendasarinya

asumsi tentang bagaimana siswa belajar di domain.

Setiap penilaian juga didasarkan pada asumsi dan

model untuk menafsirkan bukti yang dikumpulkan dari pengamatan.

Vertex interpretasi segitiga mencakup semua

metode dan alat yang digunakan untuk alasan dari pengamatan yang salah. Saya t

mengungkapkan bagaimana pengamatan berasal dari serangkaian penilaian

tugas merupakan bukti tentang pengetahuan dan keterampilan yang ada

dinilai. Dalam konteks penilaian skala besar, interpretasi

Metode biasanya model statistik, yang merupakan karakterisasi atau

ringkasan pola-pola yang akan dilihat seseorang dalam data yang diberikan

berbagai tingkat kompetensi siswa. Dalam konteks ruang kelas

penilaian, interpretasi sering dibuat kurang formal oleh

guru, dan seringkali didasarkan pada model intuitif atau kualitatif

daripada statistik formal. Bahkan secara informal guru membuat

penilaian terkoordinasi tentang aspek apa dari siswa '

Pemahaman dan pembelajaran itu relevan, bagaimana seorang siswa

melakukan satu atau lebih tugas, dan apa arti pertunjukan

tentang pengetahuan dan pemahaman siswa.

Poin penting adalah bahwa masing-masing dari ketiga elemen penilaian

segitiga tidak hanya harus masuk akal sendiri, tetapi juga harus terhubung

untuk masing-masing dari dua elemen lainnya dengan cara yang bermakna untuk mengarah pada

penilaian yang efektif dan kesimpulan yang baik. Jadi, untuk memiliki yang efektif

penilaian, ketiga simpul segitiga harus bekerja sama dalam


sinkroni. Inti dari keseluruhan proses ini adalah teori dan

data tentang bagaimana siswa belajar dan apa yang siswa ketahui saat mereka kembangkan

kompetensi untuk aspek-aspek penting dari kurikulum.

Pembelajaran Khusus Domain: Konsep Kemajuan Pembelajaran

Sebagaimana dikemukakan di atas, target inferensi untuk setiap penilaian yang diberikan

harus banyak ditentukan oleh model kognisi dan pembelajaran

yang menggambarkan bagaimana orang mewakili pengetahuan dan berkembang

kompetensi dalam bidang minat (unsur kognisi dari

segitiga penilaian) dan apa saja elemen penting dari hal tersebut

kompetensi seperti bagaimana pengetahuan diorganisasikan, dll. Dimulai dengan

model pembelajaran adalah salah satu fitur utama yang membedakan

pendekatan yang diusulkan untuk desain penilaian dari arus khas

pendekatan. Model ini menyarankan aspek terpenting dari

prestasi siswa tentang yang mana yang ingin digambar

kesimpulan, dan memberikan petunjuk tentang jenis tugas penilaian

yang akan memperoleh bukti untuk mendukung kesimpulan tersebut (lihat juga

Pellegrino et al., 2001; Pellegrino, Baxter, & Glaser, 1999).

Konsisten dengan ide-ide ini, ada dorongan baru-baru ini

minat pada topik "kemajuan belajar" (lihat Duschl,

Schweingruber, & Shouse, 2007; Dewan Penelitian Nasional, 2012;

Wilson & Bertenthal, 2006). Berbagai definisi pembelajaran

perkembangan (juga disebut lintasan pembelajaran) sekarang ada di Internet

literatur, dengan perbedaan substansial dalam fokus dan niat (lihat mis.,

Alonzo & Gotwals, 2012; Corcoran, Mosher, & Rogat, 2009; Daro,

Mosher, Corcoran, Barrett, & Konsorsium untuk Penelitian Kebijakan di Indonesia

Pendidikan, 2011; Duncan & Hmelo-Silver, 2009). Belajar

perkembangan adalah hipotesis empiris dan dapat diuji


tentang bagaimana pemahaman siswa, dan kemampuan untuk menggunakan, inti

konsep dan penjelasan serta praktik disiplin terkait tumbuh

dan menjadi lebih canggih dari waktu ke waktu, dengan tepat

instruksi (Duschl et al., 2007). Hipotesis ini menggambarkan

jalur yang cenderung diikuti oleh siswa saat mereka menguasai konsep inti.

Lintasan pembelajaran yang dihipotesiskan diuji secara empiris

memastikan validitas konstruk mereka (Apakah urutan hipotesis

menggambarkan sebuah jalan yang benar-benar dialami oleh para siswa yang diberikan

instruksi?) dan pada akhirnya untuk menilai validitas konsekuensial mereka

(Apakah pengajaran berdasarkan perkembangan pembelajaran menghasilkan lebih baik

hasil untuk sebagian besar siswa?). Ketergantungan pada bukti empiris

membedakan lintasan pembelajaran dari lingkup topikal tradisional dan

spesifikasi urutan. Lingkup topik dan deskripsi urutannya adalah

biasanya hanya didasarkan pada analisis logis dari disiplin saat ini

pengetahuan dan pengalaman pribadi dalam mengajar.

penilaian, karena penilaian yang efektif harus diselaraskan

model kognitif beralasan secara empiris. Model pembelajaran

perkembangan harus mengandung setidaknya unsur-unsur berikut:

(1) Targetkan pertunjukan atau tujuan pembelajaran yang merupakan tujuan

poin dari perkembangan pembelajaran dan didefinisikan oleh masyarakat

harapan, analisis disiplin, dan / atau persyaratan untuk

masuk ke tingkat pendidikan berikutnya.

(2) Variabel kemajuan yang merupakan dimensi pemahaman,

aplikasi, dan praktik yang sedang dikembangkan dan dilacak

waktu. Ini mungkin konsep inti dalam disiplin atau praktik

pusat karya sastra, ilmiah atau matematika.

(3) Tingkat pencapaian yang merupakan langkah menengah dalam


jalur perkembangan yang dilacak oleh perkembangan pembelajaran. Level-level ini mungkin
mencerminkan level integrasi atau tahapan umum itu

mencirikan perkembangan pemikiran siswa. Mungkin disana

langkah-langkah antara yang non-kanonik tetapi merupakan batu loncatan

ide kanonik:

(4) Pertunjukan belajar yang merupakan jenis tugas siswa di

tingkat pencapaian tertentu akan mampu melakukan.

Mereka memberikan spesifikasi untuk pengembangan penilaian oleh

siswa mana yang akan menunjukkan pengetahuan mereka dan

pemahaman; dan

(5) Penilaian, yang merupakan langkah spesifik yang digunakan untuk melacak

perkembangan siswa di sepanjang perkembangan yang dihipotesiskan. Belajar

perkembangan mencakup pendekatan untuk penilaian, seperti penilaian

integral untuk pengembangan, validasi, dan penggunaannya.

Penelitian tentang kognisi dan pembelajaran telah menghasilkan serangkaian

deskripsi pembelajaran dan kinerja khusus domain yang dapat

berfungsi untuk memandu desain penilaian, khususnya untuk bidang tertentu di Indonesia

membaca, matematika, dan sains (mis., American Association for

Kemajuan Ilmu Pengetahuan, 2001; Bransford, Brown, cocking,

Donovan, & Pellegrino, 2000; Duschl et al, 2007; Kilpatrick, Swafford,

& Findell, 2001; Snow, Burns, & Griifin, 1998; Wilson & Bertenthal,

2006). Yang mengatakan, ada banyak yang harus dilakukan dalam memetakan pembelajaran

perkembangan berbagai bidang kurikulum dengan cara yang bisa

secara efektif memandu desain instruksi dan penilaian.

Meskipun demikian, ada sedikit yang diketahui tentang kognisi dan siswa

belajar bahwa kita dapat memanfaatkan sekarang untuk memandu bagaimana kita merancang

sistem penilaian, terutama yang berusaha untuk menutupi

kemajuan pembelajaran di dalam dan di seluruh kelas. Makalah karya Deane


dan Song (2014) dalam masalah ini memberikan contoh yang sangat baik dari

penerapan kerangka perkembangan pembelajaran, serta

proses desain yang berpusat pada bukti dibahas pada bagian selanjutnya, seperti

bagian dari pengembangan program penilaian CBAL di bidang

Seni berbahasa Inggris.

Pengembangan Penilaian: Desain Berpusat Bukti

Meskipun sangat berguna untuk mengonseptualisasikan penilaian sebagai a

proses penalaran dari bukti, desain yang sebenarnya

penilaian adalah upaya yang menantang yang perlu dipandu

teori dan penelitian tentang kognisi serta resep praktis

mengenai proses yang mengarah pada produktif dan berpotensi

penilaian yang valid untuk konteks penggunaan tertentu. Seperti dalam desain apa pun

aktivitas, pengetahuan ilmiah memberikan arahan dan kendala

mengatur kemungkinan, tetapi tidak menentukan sifat yang tepat dari

desain, juga tidak menghalangi kecerdikan untuk mencapai produk akhir.

Desain selalu merupakan proses kompleks yang menerapkan teori dan penelitian

untuk mencapai solusi yang hampir optimal di bawah serangkaian beberapa

kendala, beberapa di antaranya berada di luar bidang sains. Dalam

Dalam hal penilaian pendidikan, desain sangat dipengaruhi

cara oleh variabel seperti tujuannya (mis., untuk membantu pembelajaran, untuk

mengukur pencapaian individu, atau untuk mengevaluasi suatu program), the

konteks di mana ia akan digunakan (ruang kelas atau skala besar), dan

kendala praktis (mis., sumber daya dan waktu).

Kecenderungan dalam desain penilaian adalah untuk bekerja dari yang agak

Deskripsi “longgar” tentang apa yang seharusnya diketahui oleh siswa

dan dapat melakukan (mis., standar atau kerangka kerja kurikulum) terhadap

pengembangan tugas atau masalah yang harus mereka jawab. Mengingat


kompleksitas proses desain penilaian, kecil kemungkinannya

proses yang longgar semacam itu dapat menghasilkan generasi penilaian kualitas

tanpa banyak kesenian, keberuntungan, dan coba-coba. Sebagai

akibatnya, banyak penilaian tidak cukup pada sejumlah

dimensi termasuk representasi dari konstruksi kognitif dan

konten yang akan dibahas dan ketidakpastian tentang ruang lingkup

kesimpulan yang dapat ditarik dari kinerja tugas.

Menyadari bahwa penilaian adalah proses penalaran pembuktian,

telah terbukti bermanfaat untuk lebih sistematis dalam membingkai proses

desain penilaian sebagai proses Desain yang Berpusat pada Bukti (mis., Mislevy & Haertel, 2006;
Mislevy & Riconscente, 2006). Untuk sebuah

diskusi luas tentang logika dan beberapa komponen ECD sebagai

diterapkan untuk pengembangan tes, pembaca disebut kertas oleh

Zieky (2014) dalam masalah ini. Untuk tujuan saat ini, Gambar 2 sudah cukup untuk

menangkap tiga komponen penting dari keseluruhan proses. Seperti yang ditunjukkan

pada gambar, proses dimulai dengan mendefinisikan setepat mungkin

klaim bahwa seseorang ingin dapat membuat tentang siswa

pengetahuan dan cara-cara yang seharusnya diketahui siswa

dan memahami beberapa aspek tertentu dari domain konten.

Contohnya mungkin termasuk aspek pemikiran aljabar, rasio dan

proporsi, gaya dan gerak, panas dan suhu dll. Paling banyak

aspek kritis dalam mendefinisikan klaim yang ingin dibuat untuk tujuan

penilaian harus setepat mungkin tentang unsur-unsur itu

penting dan ungkapkan ini dalam bentuk kata kerja kognisi

jauh lebih tepat dan kurang kabur daripada kognitif tingkat tinggi

kata kerja superordinat seperti tahu dan mengerti. Contoh kata kerja

mungkin termasuk membandingkan, menjelaskan, menganalisis, menghitung, menguraikan,

menjelaskan, memperkirakan, membenarkan, dll. Memandu proses ini menentukan


klaim adalah teori dan penelitian tentang sifat domain-spesifik

mengetahui dan belajar.

Figure 2

Sementara klaim yang ingin dibuat atau diverifikasi adalah tentang

siswa, mereka terkait dengan bentuk-bentuk bukti yang akan memberikan

dukungan untuk klaim tersebut - waran mendukung setiap klaim. Itu

bukti bukti yang terkait dengan serangkaian klaim yang diberikan

fitur produk kerja atau pertunjukan yang akan memberi substansi

untuk klaim. Ini termasuk fitur yang harus ada dan

bagaimana mereka ditimbang dalam skema pembuktian apa pun - yaitu, yang penting

paling dan yang paling penting atau tidak sama sekali. Misalnya kalau buktinya

untuk mendukung klaim tentang pengetahuan siswa tentang undang-undang

Geraknya adalah bahwa siswa dapat menganalisis situasi fisik dalam istilah

dari kekuatan yang bekerja pada semua tubuh, maka buktinya mungkin a

diagram benda bebas yang digambar dengan semua gaya berlabel termasuk

besarnya dan arah mereka.

Ketepatan yang datang dari penjabaran klaim dan

pernyataan bukti yang terkait dengan domain pengetahuan dan

keterampilan terbayar ketika seseorang beralih ke desain tugas atau situasi itu

dapat memberikan bukti yang diperlukan. Intinya, tugas tidak dirancang

atau dipilih sampai jelas bentuk bukti apa yang diperlukan

mendukung berbagai klaim yang terkait dengan penilaian yang diberikan

situasi. Tugas perlu memberikan semua bukti yang diperlukan dan

mereka harus memungkinkan siswa untuk "menunjukkan apa yang mereka ketahui" dengan cara itu

adalah sebagai ambigu mungkin sehubungan dengan apa tugasnya

kinerja menyiratkan tentang pengetahuan dan keterampilan siswa - yaitu,

kesimpulan tentang kognisi siswa yang diizinkan dan


berkelanjutan dari serangkaian tugas atau item penilaian yang diberikan. Menarik

aplikasi pendekatan ECD dapat ditemukan dalam konsorsium besar berskala besar dari negara-
negara yang mengembangkan penilaian yang selaras dengan yang baru

Standar Inti Negara Umum dalam matematika dan bahasa Inggris

seni di Amerika Serikat (lihat PARCC, 2014; SBAC, 2014).

Ini di luar cakupan makalah ini untuk juga mempertimbangkan masalah

pengukuran dan inferensi statistik berkenaan dengan siswa

kinerja pada penilaian yang diberikan. Meskipun demikian, penting untuk melakukannya

perhatikan bahwa komponen interpretasi Segitiga Penilaian,

serta penerapan kerangka kerja ECD untuk desain penilaian,

sering bergantung pada penerapan model pengukuran formal. SEBUAH

berbagai model tersebut tersedia untuk digunakan dalam konteks mulai dari

penilaian kelas untuk tes standar tipe besar-besaran

digunakan dalam program penilaian nasional dan internasional (lihat mis.,

Pellegrino et al. 2001; Pellegrino, DiBello, & Brophy, 2014). Kertas

oleh de la Torre dan Minchen (2014) dalam masalah ini memberikan yang terbaik

diskusi tentang manfaat kelas tertentu dari model tersebut, diketahui

sebagai Model Klasifikasi Diagnostik, ketika tujuan penilaian

desain adalah untuk memperoleh informasi interpretatif terkait erat dengan detail

model kognitif pengetahuan dan keterampilan siswa. Dalam kasus seperti itu,

ada kaitan erat antara unsur-unsur penilaian

segitiga yang dimanifestasikan dalam rincian desain penilaian itu

termasuk aturan untuk membuat kesimpulan dari bukti yang diperoleh

melintasi serangkaian tugas yang dirancang dengan cermat. Seringkali, tujuan memperoleh

informasi diagnostik terperinci semacam itu digunakan sebagai bagian dari ruang kelas

proses penilaian formatif.