Antis Assesment

Abstrak:
Makalah ini berpendapat bahwa assesment dapat berfungsi sebagai pengaruh positif pada
pencapaian tujuan pembelajaran abad ke-21. Bagian I berfokus pada tantangan pendidikan abad ke-
21 dan jenis assesment yang diperlukan untuk mendukung pencapaian tujuan pembelajaran yang
relevan dengan masyarakat global. Bagian II dan III membahas tujuan dan konteks assesment
pendidikan dan tiga kerangka kerja konseptual yang penting: (a)assesment sebagai proses penalaran
dari bukti, (b) assesment didorong oleh model pembelajaran yang ditunjukan sebagai proses
pembelajaran, dan (c) penggunaan proses desain yang berpusat pada bukti untuk mengembangkan
dan menafsirkan penilaian. Bagian IV mempertimbangkan implikasi untuk desain ruang kelas dan
penilaian skala besar. Bagian V dan VI mempertimbangkan unsur-unsur sistem penilaian yang
seimbang dan indikator kualitas utama kita harus tetap berada di garis depan saat kita berupaya
menerapkan sistem penilaian yang koheren sebagai bagian dari proses transformasi pendidikan di
abad ke-21.
Penilaian sering dilihat oleh individu di kedua bidang pendidikan praktik dan komunitas riset
sebagai pengaruh negatif terhadap mengajar dan belajar, terutama ketika taruhan tinggi melekat
hasil nilai tes (Kaestle, 2013; Linn, 2013). Kertas ini berpendapat bahwa ketika penilaian dipahami,
dirancang, dan Diimplementasikan itu dapat berfungsi sebagai pengaruh positif pada pencapaian
tujuan pembelajaran yang kami miliki untuk siswa di abad ke-21. Untuk membuat Argumen saya
mengacu pada laporan yang dikeluarkan oleh Riset Nasional A.S.Council (NRC) berjudul “Knowing
What Students Know: The Sciencedan Desain Penilaian Pendidikan ”(Pellegrino, Chudowsky, &
Glaser, 2001), serta beberapa laporan terbaru yang menguraikan poin yang dibuat dalam laporan
NRC 2001. Laporan terbaru ini berfokus pada masalah desain dan penggunaan penilaian pendidikan
mengingat saat ini konteks perubahan besar dalam standar pembelajaran disiplin di Amerika Serikat
(mis., Darling-Hammond et al., 2013; Gordon Komisi, 2013a, 2013b; Pellegrino, Wilson, Koenig, &
Beatty, 2014). Sementara banyak argumen saya diilustrasikan dengan menarik konteks pendidikan
A.S. saat ini, mereka berlaku untuk apa pun sistem pendidikan di mana penggunaan penilaian
berkisar di seluruh tingkatan mulai dari ruang kelas hingga distrik, negara bagian, nasional atau
internasional konteks.
Di Bagian I, fokusnya adalah pada tantangan yang lebih luas di abad ke-21 pendidikan dan
jenis penilaian yang perlu kita dukung pencapaian tujuan pembelajaran yang relevan dengan
masyarakat global. Bagian ini diakhiri dengan diskusi singkat tentang lima elemen sistem penilaian
yang dapat mendukung evaluasi tersebut lebih dalam belajar. Bagian II memperkenalkan tujuan dan
konteks penilaian pendidikan dan kemudian Bagian III membahas tiga terkait kerangka kerja
konseptual: (a) penilaian sebagai proses penalaran dari bukti, (b) penilaian didorong oleh model
pembelajaran dinyatakan sebagai perkembangan pembelajaran, dan (c) penggunaan bukti yang
dipusatkan proses desain untuk mengembangkan dan menafsirkan penilaian. Bagian IV beralih ke
implikasi materi dalam Bagian III untuk penilaian kelas dan penilaian skala besar. Bagian V kemudian
mempertimbangkan elemen sistem penilaian yang seimbang dan Bagian VI kembali ke lima elemen
sistem penilaian dibahas dalam Bagian I dan ditutup dengan menjelaskan secara singkat indikator-
indikator utama kualitas yang harus kita pertahankan saat kita berupaya menerapkan sistem
penilaian yang koheren sebagai bagian dari proses transformasi pendidikan di abad ke-21
I. Tantangan Pendidikan Sebelum Kita
Sifat pekerjaan dan masyarakat yang berubah berarti premium di dunia saat ini tidak hanya
pada informasi yang diperoleh siswa, tetapi pada kemampuan mereka untuk menganalisis,
mensintesis, dan menerapkan apa yang mereka miliki belajar untuk mengatasi masalah baru,
merancang solusi, berkolaborasi secara efektif, dan berkomunikasi secara persuasif (lihat mis.,
Bereiter & Scardamalia, 2013; Pellegrino & Hilton, 2012). Di Amerika Serikat, pembuat kebijakan di
hampir setiap negara bagian telah mengadopsi standar baru dimaksudkan untuk memastikan bahwa
semua siswa lulus dari sekolah menengah siap untuk kuliah dan karier. Untuk mencapai tujuan itu
diperlukan a transformasi dalam pengajaran, pembelajaran, dan penilaian sehingga semuanya siswa
mengembangkan kompetensi belajar yang lebih dalam diperlukan untuk keberhasilan
postsecondary. Transformasi ini akan membutuhkan perbaikan dalam kurikulum dan sistem
penilaian untuk mendukung kompetensi belajar yang lebih dalam. Kementerian pendidikan sekitar
dunia telah mendesain ulang kurikulum dan sistem penilaian untuk menekankan keterampilan ini.
Misalnya, saat Singapura bersiap untuk memperbaiki sistem asesmennya, kemudian Menteri
Pendidikan, TharmanShanmugaratnam, mencatat (Ng, 2008):
[Kita perlu] lebih sedikit ketergantungan pada hafalan, tes berulang dan tipe 'satu ukuran
cocok untuk semua', dan lebih banyak lagi tentang pembelajaran yang melibatkan, penemuan
melalui pengalaman, pengajaran yang berbeda, pembelajaran keterampilan seumur hidup, dan
pembangunan karakter, sehingga siswa dapat ... kembangkan atribut, pola pikir, karakter, dan nilai-
nilai untuk masa depan keberhasilan.
Reformasi di Singapura, seperti di Selandia Baru, Hong Kong, a jumlah negara bagian
Australia dan provinsi Kanada, dan pencapaian tinggi lainnya yurisdiksi telah diperkenalkan semakin
ambisius penilaian kinerja yang mengharuskan siswa untuk menemukan, mengevaluasi, dan
menggunakan informasi daripada hanya mengingat fakta. Selain itu, ini penilaian - yang meminta
siswa untuk merancang dan melakukan investigasi, menganalisis data, menarik kesimpulan yang
valid, dan melaporkan temuan - sering meminta siswa untuk menunjukkan apa yang mereka miliki
tahu dalam investigasi yang menghasilkan tulisan canggih, lisan, produk matematika, fisik, dan
multimedia (DarlingHammond & Adamson (2010) (Lihat Lampiran untuk contoh). Ini penilaian,
bersama dengan investasi lain dalam kurikulum yang bijaksana, pengajaran berkualitas tinggi, dan
sekolah yang didanai secara adil, misalnya, tampaknya berkontribusi pada prestasi tinggi mereka
(Darling-Hammond,2010).
Amerika Serikat siap untuk mengambil langkah besar ke arah kurikulum dan penilaian untuk
jenis pembelajaran yang lebih mendalam dengan adopsi Standar Negara Inti Umum yang baru
(CCSSI, 2010a, 2010b) dan Standar Sains Generasi Selanjutnya (Achieve, 2013). Ini standar
dimaksudkan untuk menjadi "lebih sedikit, lebih tinggi, dan lebih dalam" daripada iterasi standar
sebelumnya, yang telah dikritik karena "satu mil lebar dan satu inci dalam". Mereka bertujuan untuk
memastikan bahwa siswa siap untuk kuliah dan karier dengan pengetahuan yang lebih dalam dan
banyak lagi keterampilan yang dapat ditransfer dalam disiplin ilmu ini, termasuk kemampuan
membaca dan dengarkan secara kritis untuk memahami, menulis dan berbicara dengan jelas dan
persuasif, dengan mengacu pada bukti, dan untuk menghitung dan berkomunikasi secara
matematis, alasan secara kuantitatif dan secara ilmiah, dan desain solusi untuk masalah kompleks.
Standar Inti Umum dalam seni bahasa Inggris dan matematika, dan Standar Sains Generasi
Selanjutnya akan membutuhkan pendekatan yang lebih terintegrasi untuk menyampaikan instruksi
konten semua bidang studi (Pellegrino & Hilton, 2012). Inti Bersama standar dalam seni bahasa
Inggris ditulis untuk memasukkan pengembangan membaca kritis, menulis, berbicara, dan
mendengarkan keterampilan dalam sejarah, sains, matematika, dan seni serta dalam Kelas bahasa
Inggris. Standar Inti Umum dalam matematika adalah ditulis untuk memasukkan penggunaan
keterampilan dan konsep matematika dalam Bahasa Indonesia bidang-bidang seperti sains,
teknologi, dan teknik. Standar-standar ini menekankan cara dimana siswa harus menggunakan
melek huruf dan keterampilan berhitung di seluruh kurikulum dan dalam kehidupan. Sebagai negara
berusaha untuk menerapkan standar-standar ini, mereka juga harus memeriksa bagaimana mereka
penilaian mendukung dan mengevaluasi keterampilan ini dan menciptakan insentif bagi mereka
untuk diajarkan dengan baik.
Di Amerika Serikat, dua konsorsium negara bagian - Kemitraan untuk Penilaian Kesiapan
untuk Perguruan Tinggi dan Karier (PARCC) dan Konsorsium Penilaian Seimbang yang Lebih Cerdas
(SBAC) – telah dibentuk untuk mengembangkan penilaian generasi berikutnya dari standar-standar
ini. Ini adalah bagian dari berbagai inisiatif untuk memikirkan kembali penilaian itu menemani
reformasi pendidikan yang didorong oleh standar disiplin. Dengan demikian, sudah saatnya
mempertimbangkan fitur apa saja yang berkualitas tinggi sistem penilaian yang memenuhi tujuan
baru ini harus mencakup. Itu Laporan Komisi Gordon 2013, ditulis oleh banyak pemimpin ahli dalam
kurikulum, pengajaran, dan penilaian, paling banyak dijelaskan tujuan kritis dengan cara ini:
Untuk membantu dalam mencapai tujuan pembelajaran yang ditetapkan dalam Inti umum,
penilaian harus sepenuhnya mewakili kompetensi bahwa tuntutan dunia yang semakin kompleks
dan terus berubah. Itu penilaian terbaik dapat mempercepat perolehan kompetensi ini jika mereka
membimbing tindakan guru dan memungkinkan siswa untuk mengukur kemajuan mereka. Untuk
melakukannya, tugas dan kegiatan dalam penilaian harus menjadi model yang layak mendapat
perhatian dan energi dari guru dan siswa. Komisi meminta pembuat kebijakan di semua tingkatan
untuk secara aktif mempromosikan transformasi yang sangat dibutuhkan ini saat ini praktik penilaian
... Sistem penilaian [harus] kuat cukup untuk mendorong perubahan instruksional yang diperlukan
untuk memenuhi standar ... dan memberikan bukti bahwa pembelajaran siswa bermanfaat bagi
guru.
Penilaian baru harus memajukan kompetensi yang cocok ke era di mana kita hidup. Siswa
kontemporer harus mampu mengevaluasi validitas dan relevansi informasi yang berbeda dan
menarik kesimpulan dari mereka. Mereka perlu menggunakan apa yang mereka ketahui untuk
membuat dugaan dan mencari bukti untuk mengujinya, datang dengan ide-ide baru, dan
berkontribusi secara produktif ke jaringan mereka, apakah di tempat kerja atau di komunitas
mereka. Seiring dunia tumbuh semakin kompleks dan saling berhubungan, orang harus bisa
mengenali pola, membuat perbandingan, menyelesaikan kontradiksi, dan memahami sebab dan
akibat. Mereka perlu belajar untuk merasa nyaman dengannya ambiguitas dan mengakui bahwa
perspektif membentuk informasi dan makna yang kita tarik darinya. Pada tingkat paling umum, the
Penekanan dalam sistem pendidikan kita perlu pada membantu individu masuk akal dari dunia dan
bagaimana cara beroperasi efektif di dalamnya. Akhirnya, penting juga untuk melakukan penilaian
lebih dari mendokumentasikan kemampuan siswa dan apa yang mereka miliki tahu. Agar
bermanfaat, penilaian harus memberikan petunjuk mengapa siswa memikirkan cara mereka
melakukan dan bagaimana mereka belajar serta alasan untuk kesalahpahaman (Komisi Gordon,
2013b).
Tidak ada penilaian tunggal yang dapat mengevaluasi semua jenis pembelajaran yang kita
nilai bagi siswa; instrumen tunggal tidak dapat memenuhi semua tujuan dipegang oleh orang tua,
praktisi, dan pembuat kebijakan. Seperti yang diperdebatkan di bawah, itu Penting untuk
membayangkan sistem penilaian terkoordinasi, di Indonesia alat yang berbeda digunakan untuk
tujuan yang berbeda - misalnya, pelaporan formatif dan sumatif, diagnostik vs skala besar. Namun,
dalam sistem seperti itu, semua penilaian harus dilakukan dengan setia mewakili Standar, dan
semua harus memodelkan pengajaran yang baik dan praktik belajar. (5) Penilaian yang Valid, Andal,
dan Adil: Agar bisa benar-benar valid untuk beragam pelajar, penilaian harus diukur baik apa yang
mereka maksudkan untuk diukur, akurat dalam mengevaluasi kemampuan siswa dan melakukannya
dengan andal di seluruh konteks pengujian dan pencetak gol. Mereka juga harus tidak bias dan
dapat diakses dan digunakan di
cara yang mendukung hasil positif bagi siswa dan pengajaran
kualitas.
Satu tantangan besar adalah menentukan jalan ke depan
kita dapat membuat sistem penilaian yang memenuhi tujuan yang kita miliki
untuk sistem pendidikan dan yang sesuai dengan kriteria
diuraikan di atas. Dalam apa yang berikut, kami mempertimbangkan konteks
penilaian pendidikan, dasar-dasar konseptual dari
penilaian, dan proses desain yang berprinsip
dasar untuk mencapai sistem penilaian yang memenuhi
kriteria yang diuraikan di atas. Ini termasuk penilaian yang dirancang untuk
mendukung pengajaran dan pembelajaran di kelas serta yang dirancang
untuk memantau kemajuan dalam sistem pendidikan.
II Penilaian Pendidikan dalam Konteks
Tujuan dan Konteks Penilaian
Dari kuis guru, ujian tengah semester, atau ujian akhir hingga
tes standar yang dikelola secara nasional dan internasional,
penilaian pengetahuan dan keterampilan siswa telah menjadi
bagian mana-mana dari lanskap pendidikan. Penilaian sekolah
belajar memberikan informasi untuk membantu pendidik, administrator,

pembuat kebijakan, siswa, orang tua, dan peneliti menilai keadaan
siswa belajar dan membuat keputusan tentang implikasi dan tindakan.
Tujuan khusus untuk mana penilaian akan digunakan adalah
pertimbangan penting dalam semua fase desainnya. Sebagai contoh,
penilaian digunakan oleh instruktur di ruang kelas untuk membantu atau memantau
belajar biasanya perlu memberikan informasi lebih rinci daripada
penilaian yang hasilnya akan digunakan oleh pembuat kebijakan atau
lembaga akreditasi. Salah satu poin utama dari Knowing What
Laporan Siswa Tahu adalah bahwa penilaian dikembangkan untuk
tujuan khusus dan sifat desainnya sangat banyak
dibatasi oleh penggunaan interpretif yang dimaksudkan.
Penilaian untuk membantu pembelajaran. Dalam konteks kelas,
instruktur menggunakan berbagai bentuk penilaian untuk menginformasikan sehari-hari
dan keputusan bulan ke bulan tentang langkah selanjutnya untuk instruksi, untuk
beri siswa umpan balik tentang kemajuan mereka, dan untuk memotivasi
siswa. Salah satu jenis penilaian kelas yang akrab adalah buatan guru
kuis, tetapi penilaian juga mencakup lebih banyak metode informal untuk
menentukan bagaimana siswa mengalami kemajuan dalam pembelajaran mereka, seperti
proyek kelas, umpan balik dari instruksi yang dibantu komputer,
observasi kelas, pekerjaan tertulis, pekerjaan rumah, dan percakapan
dengan dan di antara siswa - semua ditafsirkan oleh guru dalam terang
informasi tambahan tentang siswa, konteks sekolah,
dan konten yang dipelajari. merumuskan penilaian tentang kualitas dan efektivitas
program dan lembaga pendidikan. Evaluasi instruksional dapat
dianggap formatif di alam ketika digunakan untuk meningkatkan
efektivitas pengajaran. Penggunaan penilaian sumatif untuk
evaluasi semakin digabungkan dalam membuat taruhan besar

keputusan tidak hanya tentang individu, tetapi juga tentang program dan
institusi (mis., Linn, 2013). Misalnya, pelaporan publik negara
hasil penilaian oleh sekolah dan kabupaten / kota dapat mempengaruhi penilaian
orang tua dan pembayar pajak tentang kualitas dan kemanjuran mereka
sekolah dan memengaruhi keputusan tentang alokasi sumber daya. Sama seperti dengan
individu, kualitas ukuran sangat penting dalam
validitas keputusan ini
Pertimbangan Lebih Lanjut tentang Tujuan, Level, dan Skala Waktu
Seperti disebutkan di atas, penilaian terjadi dalam berbagai konteks, memiliki a
berbagai penggunaan formal dan informal, dan dilakukan untuk memenuhi
tujuan yang berbeda. Tujuan dari suatu penilaian menentukan
prioritas, dan konteks penggunaan menimbulkan kendala pada desain.
Karena itu, penting untuk mengetahui bahwa satu jenis penilaian tidak
cocok untuk semua tujuan atau konteks penggunaan. Secara umum, semakin banyak tujuan a
penilaian tunggal bertujuan untuk melayani, semakin banyak tujuan masing-masing
dikompromikan dan produk keseluruhan akan mewakili sub-optimal
desain untuk setiap penggunaan yang dimaksudkan. Kesalahan yang terus-menerus adalah
menganggapnya
penilaian sesuai dan dapat ditafsirkan untuk hal tertentu
konteks penggunaan tanpa menentukan apakah ada bukti mengenai
validitas asumsi semacam itu dalam konteks itu. Satu ukuran cocok untuk semua
kekeliruan sangat sering dan bermasalah sejak itu menghasilkan
pilihan penilaian yang tidak tepat untuk pengajaran atau penelitian
tujuan yang pada gilirannya dapat menyebabkan kesimpulan yang salah tentang
orang, program, dan / atau lembaga.
Meskipun penilaian saat ini digunakan untuk berbagai keperluan di
sistem pendidikan, premis dari Knowing What Students
Tahu laporan adalah bahwa keefektifan dan kegunaan mereka pada akhirnya harus
dinilai oleh sejauh mana mereka mempromosikan pembelajaran siswa. Itu
Tujuan penilaian harus “untuk mendidik dan meningkatkan siswa
kinerja, bukan hanya untuk mengauditnya ”(Wiggins, 1998, p.7). Karena
penilaian dikembangkan untuk tujuan khusus, sifatnya
desain sangat dibatasi oleh tujuan penggunaannya. Meskipun mungkin
tampaknya masuk akal untuk mendikotomi antara kelas internal
penilaian, dikelola oleh instruktur, dan tes eksternal,
dikelola oleh distrik, negara bagian, atau negara atau lembaga lain, seperti
dikotomi adalah penyederhanaan berlebihan dari sebuah kontinum yang mencerminkan
kedekatan penilaian dengan diberlakukannya pembelajaran khusus
dan kegiatan belajar. Ruiz-Primo, Shavelson, Hamilton, & Klein
(2002) mendefinisikan lima titik diskrit pada rangkaian penilaian
jarak: langsung (mis., pengamatan atau artefak dari
berlakunya aktivitas instruksional tertentu), tutup (mis., disematkan
penilaian dan kuis belajar semiformal dari satu atau lebih
kegiatan), proksimal (mis., ujian kelas formal belajar dari a
kurikulum spesifik), distal (mis., pencapaian yang dirujuk kriteria)
tes seperti yang disyaratkan oleh undang-undang federal No Child Left Behind),
dan jarak jauh (hasil yang lebih luas diukur dari waktu ke waktu, termasuk norma yang
direferensikan
tes prestasi dan beberapa nasional dan internasional
ukuran pencapaian). Penilaian yang berbeda harus dipahami
sebagai titik berbeda pada kontinum ini jika mereka ingin efektif
selaras satu sama lain dan dengan kurikulum dan instruksi. Di
Intinya, penilaian adalah ujian transfer dan bisa dekat atau jauh
transfer tergantung di mana penilaian berada di sepanjang
kontinum yang disebutkan di atas.
Tingkat di mana penilaian dimaksudkan untuk berfungsi, yang

melibatkan jarak yang bervariasi dalam "ruang dan waktu" dari berlakunya
pengajaran dan pembelajaran, memiliki implikasi untuk bagaimana dan seberapa baik itu
dapat memenuhi berbagai fungsi penilaian, baik itu formatif,
sumatif, atau evaluasi program (NRC, 2003). Seperti yang diperdebatkan di tempat lain
(Hickey & Pellegrino, 2005; Pellegrino & Hickey, 2006), juga merupakan
jika tingkat dan fungsi penilaian yang berbeda dapat miliki
berbagai tingkat kecocokan dengan sikap teoretis tentang alam
mengetahui dan belajar.
Meskipun penilaian digunakan dalam berbagai konteks, untuk perbedaan
tujuan, dan pada rentang waktu yang berbeda sering terlihat sangat berbeda, mereka
berbagi prinsip umum tertentu. Salah satu prinsip tersebut adalah itu
penilaian selalu merupakan proses penalaran dari bukti. Dengan itu
bahkan sifatnya, penilaiannya tidak tepat sampai batas tertentu.
Hasil penilaian hanya perkiraan dari apa yang diketahui dan diketahui seseorang
bisa lakukan. Kami menguraikan kedua masalah ini dalam dua berikut
bagian.
AKU AKU AKU. Kerangka Kerja Konseptual
Penilaian sebagai Proses Penalaran Evidentiary: Penilaian
Segi tiga
Pendidik menilai siswa untuk belajar tentang apa yang mereka ketahui dan dapat mereka lakukan
lakukan, tetapi penilaian tidak menawarkan jalur pipa langsung ke siswa
pikiran. Menilai hasil pendidikan tidak semudah seperti
mengukur tinggi atau berat; atribut yang diukur adalah
representasi mental dan proses yang tidak terlihat secara lahiriah.
Dengan demikian, penilaian adalah alat yang dirancang untuk mengamati perilaku siswa
dan menghasilkan data yang dapat digunakan untuk menarik kesimpulan yang masuk akal
tentang apa yang siswa ketahui. Memutuskan apa yang akan dinilai dan bagaimana melakukannya
jadi tidak sesederhana yang mungkin muncul.
Proses pengumpulan bukti untuk mendukung kesimpulan tentang
apa yang siswa ketahui merupakan rantai penalaran dari bukti
tentang pembelajaran siswa yang menjadi ciri semua penilaian, dari
kuis kelas dan tes prestasi standar, untuk
program bimbingan terkomputerisasi, untuk percakapan yang dilakukan siswa
dengan gurunya saat mereka bekerja melalui masalah matematika atau mendiskusikan
arti suatu teks. Orang beralasan dari bukti setiap hari tentang apa pun
sejumlah keputusan, kecil dan besar. Ketika meninggalkan rumah di
pagi, misalnya, seseorang tidak tahu dengan pasti bahwa itu benar
akan hujan, tetapi mungkin memutuskan untuk mengambil payung di
dasar bukti seperti laporan cuaca pagi dan
awan yang mengancam di langit.
Pertanyaan pertama dalam proses penalaran penilaian adalah “bukti
tentang apa? ”Data menjadi bukti hanya dalam masalah analitik
ketika seseorang telah menetapkan relevansinya dengan suatu dugaan
dipertimbangkan (Schum, 1987, hlm. 16). Data tidak menyediakan sendiri
berarti; nilai mereka sebagai bukti hanya dapat muncul melalui beberapa
kerangka kerja interpretasi. Apa yang dirasakan seseorang secara visual
misalnya, tidak hanya bergantung pada data yang diterimanya sebagai foton
Cahaya menyentakkan retina-retinanya, tetapi juga pada apa yang menurutnya akan dilihatnya.
Dalam konteks saat ini, penilaian pendidikan menyediakan data seperti
esai tertulis, tanda pada lembar jawaban, presentasi proyek, atau
penjelasan siswa tentang solusi masalah mereka. Data ini menjadi
bukti hanya berkenaan dengan dugaan tentang bagaimana siswa
memperoleh pengetahuan dan keterampilan.
elemen harus sinkron. Segitiga penilaian menyediakan a

kerangka kerja yang berguna untuk menganalisis dasar-dasar saat ini
penilaian untuk menentukan seberapa baik mereka mencapai tujuan kita
ada dalam pikiran, serta untuk merancang penilaian masa depan dan
menetapkan validitas (mis., lihat Marion & Pellegrino, 2006).
Sudut kognisi segitiga mengacu pada teori, data, dan a
seperangkat asumsi tentang bagaimana siswa mewakili pengetahuan dan
mengembangkan kompetensi dalam domain materi pelajaran (mis., pecahan,
Hukum Newton, termodinamika). Dalam penilaian tertentu
aplikasi, teori belajar dalam domain diperlukan untuk mengidentifikasi
seperangkat pengetahuan dan keterampilan yang penting untuk diukur untuk
konteks penggunaan yang dimaksudkan, apakah itu untuk menandai
kompetensi yang telah diperoleh siswa pada suatu saat untuk dibuat
penilaian sumatif, atau membuat penilaian formatif untuk membimbing
instruksi selanjutnya untuk memaksimalkan pembelajaran. Premis sentral
adalah bahwa teori kognitif harus mewakili yang paling ilmiah
pemahaman kredibel tentang cara-cara khas yang diwakili peserta didik
pengetahuan dan mengembangkan keahlian dalam suatu domain.
Setiap penilaian juga didasarkan pada serangkaian asumsi dan
prinsip tentang jenis tugas atau situasi yang akan ditanyakan
siswa mengatakan, melakukan, atau menciptakan sesuatu yang menunjukkan penting
pengetahuan dan kemampuan. Tugas-tugas yang diminta siswa
menanggapi penilaian tidak sewenang-wenang. Mereka harus hati-hati
dirancang untuk memberikan bukti yang terkait dengan model kognitif
belajar dan mendukung jenis kesimpulan dan keputusan itu
akan dibuat berdasarkan hasil penilaian. Pengamatan
simpul dari segitiga penilaian mewakili deskripsi atau set
spesifikasi untuk tugas penilaian yang akan menghasilkan penerangan

tanggapan dari siswa. Dalam penilaian, seseorang memiliki kesempatan untuk
susun beberapa sudut kecil dunia untuk melakukan pengamatan. Itu
desainer penilaian dapat menggunakan kemampuan ini untuk memaksimalkan nilai
data dikumpulkan, seperti yang terlihat melalui lensa yang mendasarinya
asumsi tentang bagaimana siswa belajar di domain.
Setiap penilaian juga didasarkan pada asumsi dan
model untuk menafsirkan bukti yang dikumpulkan dari pengamatan.
Vertex interpretasi segitiga mencakup semua
metode dan alat yang digunakan untuk alasan dari pengamatan yang salah. Saya t
mengungkapkan bagaimana pengamatan berasal dari serangkaian penilaian
tugas merupakan bukti tentang pengetahuan dan keterampilan yang ada
dinilai. Dalam konteks penilaian skala besar, interpretasi
Metode biasanya model statistik, yang merupakan karakterisasi atau
ringkasan pola-pola yang akan dilihat seseorang dalam data yang diberikan
berbagai tingkat kompetensi siswa. Dalam konteks ruang kelas
penilaian, interpretasi sering dibuat kurang formal oleh
guru, dan seringkali didasarkan pada model intuitif atau kualitatif
daripada statistik formal. Bahkan secara informal guru membuat
penilaian terkoordinasi tentang aspek apa dari siswa '
Pemahaman dan pembelajaran itu relevan, bagaimana seorang siswa
melakukan satu atau lebih tugas, dan apa arti pertunjukan
tentang pengetahuan dan pemahaman siswa.
Poin penting adalah bahwa masing-masing dari ketiga elemen penilaian
segitiga tidak hanya harus masuk akal sendiri, tetapi juga harus terhubung
untuk masing-masing dari dua elemen lainnya dengan cara yang bermakna untuk mengarah pada
penilaian yang efektif dan kesimpulan yang baik. Jadi, untuk memiliki yang efektif
penilaian, ketiga simpul segitiga harus bekerja sama dalam

sinkroni. Inti dari keseluruhan proses ini adalah teori dan
data tentang bagaimana siswa belajar dan apa yang siswa ketahui saat mereka kembangkan
kompetensi untuk aspek-aspek penting dari kurikulum.
Pembelajaran Khusus Domain: Konsep Kemajuan Pembelajaran
Sebagaimana dikemukakan di atas, target inferensi untuk setiap penilaian yang diberikan
harus banyak ditentukan oleh model kognisi dan pembelajaran
yang menggambarkan bagaimana orang mewakili pengetahuan dan berkembang
kompetensi dalam bidang minat (unsur kognisi dari
segitiga penilaian) dan apa saja elemen penting dari hal tersebut
kompetensi seperti bagaimana pengetahuan diorganisasikan, dll. Dimulai dengan
model pembelajaran adalah salah satu fitur utama yang membedakan
pendekatan yang diusulkan untuk desain penilaian dari arus khas
pendekatan. Model ini menyarankan aspek terpenting dari
prestasi siswa tentang yang mana yang ingin digambar
kesimpulan, dan memberikan petunjuk tentang jenis tugas penilaian
yang akan memperoleh bukti untuk mendukung kesimpulan tersebut (lihat juga
Pellegrino et al., 2001; Pellegrino, Baxter, & Glaser, 1999).
Konsisten dengan ide-ide ini, ada dorongan baru-baru ini
minat pada topik "kemajuan belajar" (lihat Duschl,
Schweingruber, & Shouse, 2007; Dewan Penelitian Nasional, 2012;
Wilson & Bertenthal, 2006). Berbagai definisi pembelajaran
perkembangan (juga disebut lintasan pembelajaran) sekarang ada di Internet
literatur, dengan perbedaan substansial dalam fokus dan niat (lihat mis.,
Alonzo & Gotwals, 2012; Corcoran, Mosher, & Rogat, 2009; Daro,
Mosher, Corcoran, Barrett, & Konsorsium untuk Penelitian Kebijakan di Indonesia
Pendidikan, 2011; Duncan & Hmelo-Silver, 2009). Belajar
perkembangan adalah hipotesis empiris dan dapat diuji

tentang bagaimana pemahaman siswa, dan kemampuan untuk menggunakan, inti
konsep dan penjelasan serta praktik disiplin terkait tumbuh
dan menjadi lebih canggih dari waktu ke waktu, dengan tepat
instruksi (Duschl et al., 2007). Hipotesis ini menggambarkan
jalur yang cenderung diikuti oleh siswa saat mereka menguasai konsep inti.
Lintasan pembelajaran yang dihipotesiskan diuji secara empiris
memastikan validitas konstruk mereka (Apakah urutan hipotesis
menggambarkan sebuah jalan yang benar-benar dialami oleh para siswa yang diberikan
instruksi?) dan pada akhirnya untuk menilai validitas konsekuensial mereka
(Apakah pengajaran berdasarkan perkembangan pembelajaran menghasilkan lebih baik
hasil untuk sebagian besar siswa?). Ketergantungan pada bukti empiris
membedakan lintasan pembelajaran dari lingkup topikal tradisional dan
spesifikasi urutan. Lingkup topik dan deskripsi urutannya adalah
biasanya hanya didasarkan pada analisis logis dari disiplin saat ini
pengetahuan dan pengalaman pribadi dalam mengajar.
penilaian, karena penilaian yang efektif harus diselaraskan
model kognitif beralasan secara empiris. Model pembelajaran
perkembangan harus mengandung setidaknya unsur-unsur berikut:
(1) Targetkan pertunjukan atau tujuan pembelajaran yang merupakan tujuan
poin dari perkembangan pembelajaran dan didefinisikan oleh masyarakat
harapan, analisis disiplin, dan / atau persyaratan untuk
masuk ke tingkat pendidikan berikutnya.
(2) Variabel kemajuan yang merupakan dimensi pemahaman,
aplikasi, dan praktik yang sedang dikembangkan dan dilacak
waktu. Ini mungkin konsep inti dalam disiplin atau praktik
pusat karya sastra, ilmiah atau matematika.
(3) Tingkat pencapaian yang merupakan langkah menengah dalam

jalur perkembangan yang dilacak oleh perkembangan pembelajaran. Level-level ini mungkin
mencerminkan level integrasi atau tahapan umum itu
mencirikan perkembangan pemikiran siswa. Mungkin disana
langkah-langkah antara yang non-kanonik tetapi merupakan batu loncatan
ide kanonik:
(4) Pertunjukan belajar yang merupakan jenis tugas siswa di
tingkat pencapaian tertentu akan mampu melakukan.
Mereka memberikan spesifikasi untuk pengembangan penilaian oleh
siswa mana yang akan menunjukkan pengetahuan mereka dan
pemahaman; dan
(5) Penilaian, yang merupakan langkah spesifik yang digunakan untuk melacak
perkembangan siswa di sepanjang perkembangan yang dihipotesiskan. Belajar
perkembangan mencakup pendekatan untuk penilaian, seperti penilaian
integral untuk pengembangan, validasi, dan penggunaannya.
Penelitian tentang kognisi dan pembelajaran telah menghasilkan serangkaian
deskripsi pembelajaran dan kinerja khusus domain yang dapat
berfungsi untuk memandu desain penilaian, khususnya untuk bidang tertentu di Indonesia
membaca, matematika, dan sains (mis., American Association for
Kemajuan Ilmu Pengetahuan, 2001; Bransford, Brown, cocking,
Donovan, & Pellegrino, 2000; Duschl et al, 2007; Kilpatrick, Swafford,
& Findell, 2001; Snow, Burns, & Griifin, 1998; Wilson & Bertenthal,
2006). Yang mengatakan, ada banyak yang harus dilakukan dalam memetakan pembelajaran
perkembangan berbagai bidang kurikulum dengan cara yang bisa
secara efektif memandu desain instruksi dan penilaian.
Meskipun demikian, ada sedikit yang diketahui tentang kognisi dan siswa
belajar bahwa kita dapat memanfaatkan sekarang untuk memandu bagaimana kita merancang
sistem penilaian, terutama yang berusaha untuk menutupi
kemajuan pembelajaran di dalam dan di seluruh kelas. Makalah karya Deane

dan Song (2014) dalam masalah ini memberikan contoh yang sangat baik dari
penerapan kerangka perkembangan pembelajaran, serta
proses desain yang berpusat pada bukti dibahas pada bagian selanjutnya, seperti
bagian dari pengembangan program penilaian CBAL di bidang
Seni berbahasa Inggris.
Pengembangan Penilaian: Desain Berpusat Bukti
Meskipun sangat berguna untuk mengonseptualisasikan penilaian sebagai a
proses penalaran dari bukti, desain yang sebenarnya
penilaian adalah upaya yang menantang yang perlu dipandu
teori dan penelitian tentang kognisi serta resep praktis
mengenai proses yang mengarah pada produktif dan berpotensi
penilaian yang valid untuk konteks penggunaan tertentu. Seperti dalam desain apa pun
aktivitas, pengetahuan ilmiah memberikan arahan dan kendala
mengatur kemungkinan, tetapi tidak menentukan sifat yang tepat dari
desain, juga tidak menghalangi kecerdikan untuk mencapai produk akhir.
Desain selalu merupakan proses kompleks yang menerapkan teori dan penelitian
untuk mencapai solusi yang hampir optimal di bawah serangkaian beberapa
kendala, beberapa di antaranya berada di luar bidang sains. Dalam
Dalam hal penilaian pendidikan, desain sangat dipengaruhi
cara oleh variabel seperti tujuannya (mis., untuk membantu pembelajaran, untuk
mengukur pencapaian individu, atau untuk mengevaluasi suatu program), the
konteks di mana ia akan digunakan (ruang kelas atau skala besar), dan
kendala praktis (mis., sumber daya dan waktu).
Kecenderungan dalam desain penilaian adalah untuk bekerja dari yang agak
Deskripsi “longgar” tentang apa yang seharusnya diketahui oleh siswa
dan dapat melakukan (mis., standar atau kerangka kerja kurikulum) terhadap
pengembangan tugas atau masalah yang harus mereka jawab. Mengingat

kompleksitas proses desain penilaian, kecil kemungkinannya
proses yang longgar semacam itu dapat menghasilkan generasi penilaian kualitas
tanpa banyak kesenian, keberuntungan, dan coba-coba. Sebagai
akibatnya, banyak penilaian tidak cukup pada sejumlah
dimensi termasuk representasi dari konstruksi kognitif dan
konten yang akan dibahas dan ketidakpastian tentang ruang lingkup
kesimpulan yang dapat ditarik dari kinerja tugas.
Menyadari bahwa penilaian adalah proses penalaran pembuktian,
telah terbukti bermanfaat untuk lebih sistematis dalam membingkai proses
desain penilaian sebagai proses Desain yang Berpusat pada Bukti (mis., Mislevy & Haertel, 2006;
Mislevy & Riconscente, 2006). Untuk sebuah
diskusi luas tentang logika dan beberapa komponen ECD sebagai
diterapkan untuk pengembangan tes, pembaca disebut kertas oleh
Zieky (2014) dalam masalah ini. Untuk tujuan saat ini, Gambar 2 sudah cukup untuk
menangkap tiga komponen penting dari keseluruhan proses. Seperti yang ditunjukkan
pada gambar, proses dimulai dengan mendefinisikan setepat mungkin
klaim bahwa seseorang ingin dapat membuat tentang siswa
pengetahuan dan cara-cara yang seharusnya diketahui siswa
dan memahami beberapa aspek tertentu dari domain konten.
Contohnya mungkin termasuk aspek pemikiran aljabar, rasio dan
proporsi, gaya dan gerak, panas dan suhu dll. Paling banyak
aspek kritis dalam mendefinisikan klaim yang ingin dibuat untuk tujuan
penilaian harus setepat mungkin tentang unsur-unsur itu
penting dan ungkapkan ini dalam bentuk kata kerja kognisi
jauh lebih tepat dan kurang kabur daripada kognitif tingkat tinggi
kata kerja superordinat seperti tahu dan mengerti. Contoh kata kerja
mungkin termasuk membandingkan, menjelaskan, menganalisis, menghitung, menguraikan,
menjelaskan, memperkirakan, membenarkan, dll. Memandu proses ini menentukan

klaim adalah teori dan penelitian tentang sifat domain-spesifik
mengetahui dan belajar.
Figure 2
Sementara klaim yang ingin dibuat atau diverifikasi adalah tentang
siswa, mereka terkait dengan bentuk-bentuk bukti yang akan memberikan
dukungan untuk klaim tersebut - waran mendukung setiap klaim. Itu
bukti bukti yang terkait dengan serangkaian klaim yang diberikan
fitur produk kerja atau pertunjukan yang akan memberi substansi
untuk klaim. Ini termasuk fitur yang harus ada dan
bagaimana mereka ditimbang dalam skema pembuktian apa pun - yaitu, yang penting
paling dan yang paling penting atau tidak sama sekali. Misalnya kalau buktinya
untuk mendukung klaim tentang pengetahuan siswa tentang undang-undang
Geraknya adalah bahwa siswa dapat menganalisis situasi fisik dalam istilah
dari kekuatan yang bekerja pada semua tubuh, maka buktinya mungkin a
diagram benda bebas yang digambar dengan semua gaya berlabel termasuk
besarnya dan arah mereka.
Ketepatan yang datang dari penjabaran klaim dan
pernyataan bukti yang terkait dengan domain pengetahuan dan
keterampilan terbayar ketika seseorang beralih ke desain tugas atau situasi itu
dapat memberikan bukti yang diperlukan. Intinya, tugas tidak dirancang
atau dipilih sampai jelas bentuk bukti apa yang diperlukan
mendukung berbagai klaim yang terkait dengan penilaian yang diberikan
situasi. Tugas perlu memberikan semua bukti yang diperlukan dan
mereka harus memungkinkan siswa untuk "menunjukkan apa yang mereka ketahui" dengan cara itu
adalah sebagai ambigu mungkin sehubungan dengan apa tugasnya
kinerja menyiratkan tentang pengetahuan dan keterampilan siswa - yaitu,
kesimpulan tentang kognisi siswa yang diizinkan dan

berkelanjutan dari serangkaian tugas atau item penilaian yang diberikan. Menarik
aplikasi pendekatan ECD dapat ditemukan dalam konsorsium besar berskala besar dari negara-
negara yang mengembangkan penilaian yang selaras dengan yang baru
Standar Inti Negara Umum dalam matematika dan bahasa Inggris
seni di Amerika Serikat (lihat PARCC, 2014; SBAC, 2014).
Ini di luar cakupan makalah ini untuk juga mempertimbangkan masalah
pengukuran dan inferensi statistik berkenaan dengan siswa
kinerja pada penilaian yang diberikan. Meskipun demikian, penting untuk melakukannya
perhatikan bahwa komponen interpretasi Segitiga Penilaian,
serta penerapan kerangka kerja ECD untuk desain penilaian,
sering bergantung pada penerapan model pengukuran formal. SEBUAH
berbagai model tersebut tersedia untuk digunakan dalam konteks mulai dari
penilaian kelas untuk tes standar tipe besar-besaran
digunakan dalam program penilaian nasional dan internasional (lihat mis.,
Pellegrino et al. 2001; Pellegrino, DiBello, & Brophy, 2014). Kertas
oleh de la Torre dan Minchen (2014) dalam masalah ini memberikan yang terbaik
diskusi tentang manfaat kelas tertentu dari model tersebut, diketahui
sebagai Model Klasifikasi Diagnostik, ketika tujuan penilaian
desain adalah untuk memperoleh informasi interpretatif terkait erat dengan detail
model kognitif pengetahuan dan keterampilan siswa. Dalam kasus seperti itu,
ada kaitan erat antara unsur-unsur penilaian
segitiga yang dimanifestasikan dalam rincian desain penilaian itu
termasuk aturan untuk membuat kesimpulan dari bukti yang diperoleh
melintasi serangkaian tugas yang dirancang dengan cermat. Seringkali, tujuan memperoleh
informasi diagnostik terperinci semacam itu digunakan sebagai bagian dari ruang kelas
proses penilaian formatif.

Antis Assesment

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Antis Assesment

Uploaded by

Copyright:

Available Formats

Abstrak:

cara yang mendukung hasil positif bagi siswa dan pengajaran

Satu tantangan besar adalah menentukan jalan ke depan

untuk sistem pendidikan dan yang sesuai dengan kriteria

diuraikan di atas. Dalam apa yang berikut, kami mempertimbangkan konteks

penilaian pendidikan, dasar-dasar konseptual dari

penilaian, dan proses desain yang berprinsip

dasar untuk mencapai sistem penilaian yang memenuhi

mendukung pengajaran dan pembelajaran di kelas serta yang dirancang

untuk memantau kemajuan dalam sistem pendidikan.

II Penilaian Pendidikan dalam Konteks

Tujuan dan Konteks Penilaian

tes standar yang dikelola secara nasional dan internasional,

penilaian pengetahuan dan keterampilan siswa telah menjadi

bagian mana-mana dari lanskap pendidikan. Penilaian sekolah

belajar memberikan informasi untuk membantu pendidik, administrator,

siswa belajar dan membuat keputusan tentang implikasi dan tindakan.

Tujuan khusus untuk mana penilaian akan digunakan adalah

pertimbangan penting dalam semua fase desainnya. Sebagai contoh,

belajar biasanya perlu memberikan informasi lebih rinci daripada

penilaian yang hasilnya akan digunakan oleh pembuat kebijakan atau

lembaga akreditasi. Salah satu poin utama dari Knowing What

Laporan Siswa Tahu adalah bahwa penilaian dikembangkan untuk

tujuan khusus dan sifat desainnya sangat banyak

dibatasi oleh penggunaan interpretif yang dimaksudkan.

Penilaian untuk membantu pembelajaran. Dalam konteks kelas,

instruktur menggunakan berbagai bentuk penilaian untuk menginformasikan sehari-hari

menentukan bagaimana siswa mengalami kemajuan dalam pembelajaran mereka, seperti

proyek kelas, umpan balik dari instruksi yang dibantu komputer,

observasi kelas, pekerjaan tertulis, pekerjaan rumah, dan percakapan

informasi tambahan tentang siswa, konteks sekolah,

program dan lembaga pendidikan. Evaluasi instruksional dapat

dianggap formatif di alam ketika digunakan untuk meningkatkan

efektivitas pengajaran. Penggunaan penilaian sumatif untuk

evaluasi semakin digabungkan dalam membuat taruhan besar

institusi (mis., Linn, 2013). Misalnya, pelaporan publik negara

individu, kualitas ukuran sangat penting dalam

validitas keputusan ini

Pertimbangan Lebih Lanjut tentang Tujuan, Level, dan Skala Waktu

Seperti disebutkan di atas, penilaian terjadi dalam berbagai konteks, memiliki a

berbagai penggunaan formal dan informal, dan dilakukan untuk memenuhi

tujuan yang berbeda. Tujuan dari suatu penilaian menentukan

prioritas, dan konteks penggunaan menimbulkan kendala pada desain.

penilaian tunggal bertujuan untuk melayani, semakin banyak tujuan masing-masing

dikompromikan dan produk keseluruhan akan mewakili sub-optimal

penilaian sesuai dan dapat ditafsirkan untuk hal tertentu

konteks penggunaan tanpa menentukan apakah ada bukti mengenai

kekeliruan sangat sering dan bermasalah sejak itu menghasilkan

pilihan penilaian yang tidak tepat untuk pengajaran atau penelitian

orang, program, dan / atau lembaga.

Meskipun penilaian saat ini digunakan untuk berbagai keperluan di

sistem pendidikan, premis dari Knowing What Students

Tujuan penilaian harus “untuk mendidik dan meningkatkan siswa

kinerja, bukan hanya untuk mengauditnya ”(Wiggins, 1998, p.7). Karena

penilaian dikembangkan untuk tujuan khusus, sifatnya

desain sangat dibatasi oleh tujuan penggunaannya. Meskipun mungkin

tampaknya masuk akal untuk mendikotomi antara kelas internal

penilaian, dikelola oleh instruktur, dan tes eksternal,

dikotomi adalah penyederhanaan berlebihan dari sebuah kontinum yang mencerminkan

kedekatan penilaian dengan diberlakukannya pembelajaran khusus

dan kegiatan belajar. Ruiz-Primo, Shavelson, Hamilton, & Klein

(2002) mendefinisikan lima titik diskrit pada rangkaian penilaian

jarak: langsung (mis., pengamatan atau artefak dari

berlakunya aktivitas instruksional tertentu), tutup (mis., disematkan