You are on page 1of 6

Nama: Yatin Dwi Rahayu NIM.

1006578 Tugas Evaluasi Pembelajaran Rangkuman Buku: Analisis, Validitas, Reliabilitas dan Interpretasi Hasil Tes Implementasi Kurikulum 2004. Pengarang Dr. Sumarna Surapranata Penilaian Hasil Proses Belajar Mengajar. Pengarang Dr. Nana Sudjana

1. Analisis Soal Analisis soal dilakukan untuk mengetahui berfungsi tidaknya sebuah soal. Analisis pada umumnya dilakukan melalui dua cara, yaitu analisis kualitatif (qualitatif control) dan analisis kuantitatif (quantitatif control). a. Analisis Kualitatif Analisis kualitatif sering disebut juga validitas logis (logical validity) yaitu berupa penlaahan yang dimaksudkan untuk menganalisis soal ditinjau dari segi teknis, isi dan editorial. Analisis secara teknis dimaksudkan sebagai penelaahan soal berdasarkan prinsip-prinsip pengukuran dan format penulisan soal. Analisis secara isi dimaksudkan sebagai penelaahan khusus berkaitan dengan kelayakan pengetahuan ditanyakan. Analisis secara editorial dimaksudkan sebagai penelaahan yang khususnya berkaitan dengan

keseluruhan format dan keaajegan editorial dari soal yang satu ke soal yang lainnya.

b. Analisis Kuantitatif Analisis soal secara kuantitatif menekankan pada analisis karakteristik internal tes melalui data yang diperoleh secara empiris. Karakteristik internal secara kuantitatif meliputi parameter soal tingkat kesukaran, daya pembeda, dan reliabilitas. (a) Tingkat Kesukaran

Yatin Dwi Rahayu

Sangatlah penting untuk melihat tingkat kesukaran soal dalam rangka menyediakan berbagai macam alat diagnostik kesulitan belajar peserta didik. Tingkat kesukaran soal bisa saja ditentukan oleh kedalaman soal, kompleksitas, atau hal-hal lain yang berkaitan dengan kemampuan yang diukur oleh soal. Persamaan yang digunakan untuk menentukan tingkat kesukaran soal dengan proporsi jawaban benar adalah: p = proporsi jawaban yang benar atau tingakt kesukaran

banyaknya peserta yang menjawab benar

Sm= skor maksimum N= Jumlah peserta

Tabel 1. Kategori Tingkat Kesukaran Nilai p p < 0.3 0.3 < p > 0.7 p > 0.7 (b) Daya Pembeda Salah satu tujuan analisis kuantitatif soal adalh untuk menentukan dapat tidaknya suatu soal membedakan kelompok dalam aspek yang diukur sesuai dengan perbedaan yang ada dalam kelompok itu. Indeks yang digunakan dalam membedakan antara peserta tes yang Kategori Sukar Sedang Mudah

berkemampuan rendah adalah indeks daya pembeda. Indeks daya pembeda soal-soal yang ditetapkan dari selisih proporsi yang menjawab dari masing-masing kelompok. Indeks ini menunjukan kesesuaian antara fungsi soal dengan fungsi tes secara keseluruhan. Dengan demikian validitas soal ini sama dengan daya pemebeda soal yaitu daya dalam membedakan antara peserta tes yang berkemampuan tinggi dengan peserta tes yang berkemampuan rendah.

Yatin Dwi Rahayu

Daya pembeda menurut indeks daya pembeda ini dapat dicari dengan menggunakan persamaan:

D = daya pembeda (validitas) JKa = jumlah peserta tes yang menajwab benar pada kelompok atas JKb = jumlah peserta tes yang menajwab benar pada kelompok bawah nKa = jumlah peserta tes pada kelompok atas nKb = jumlah peserta tes pada kelompok bawah Metode menghitung D dapat digunakan formula sebagai berikut: D = Indeks daya pembeda A = jumlah peserta tes yang menajwab benar pada kelompok atas B = jumlah peserta tes yang menajwab benar pada kelompok bawah nA = jumlah peserta tes pada kelompok atas nB = jumlah peserta tes pada kelompok bawah

c. Soal Yang Bias Soal yang bias atau Differential item functioning (DIF) adalah soal yang membedakan kelompok. DIF muncul ketika dua kelompok seperti kelompok jenis kelamin, suku, atau kelompok usia memiliki peluang yang berbeda menjawab soal. DIF terkadang merusak hasil penilaian dan sangat tidak adil membedakan kelompok berdasarkan hasil atau nilai yang diperoleh peserta tes.

d. Kriteria Pemilihan Soal Menurut nitko (1983) kriteria pemilihan soal bergantung kepada tujuan penggunaan tes yaitu untuk tujuan umum atau tujuan khusus. Bila tujuan tes

Yatin Dwi Rahayu

adalah untuk ketepatan membuat peringkat peserta tes dalam bidang tertentu, maka besarnya tingkat kesukaran dan validitas soal tidak dapat ditentukan angkanya. Tetapi apabila hal yang diukur adalah satu aspek kemampuan, maka tingkat kesukaran sebaiknya berkisar antara 0.16-0.84. apabila akan diukur adalah sekumpulan aspek kemampuan, maka sebaiknya tingkat kesukaran berkisar antara 0.3-0.7 dan validitas soal yang disarankan lebih besar daripada 0.3. Tabel 2. Kriteria Pemilihan Soal Pilihan Ganda Kriteria Tingkat kesukaran Koefisien 0.30-0.70 0.10-0.29 atau 0.70-0.90 <0.10 dan >0.90 >0.3 0.10-0.29 <0.10 >0.05 Keputusan Diterima Direvisi Ditolak Diterima Direvisi Ditolak

Daya Pembeda

Proporsi Jawaban 2. Validitas

Validitas berkenaan dengan ketepatan alat penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai. Ada empat jenis validitas yang sering digunakan diantaranya: a. Validitas isi Validitas isi berkenaan dengan kesanggupan alat penilaian dalam mengukur isi yang seharusnya. Artinya, tes tersebut mampu mengungkapkan isi suatu konsep atau variabel yang hendak diukur. Misalnya tes hasil belajar bidang studi IPS harus bisa mengungkapkan isi bidang studi tersebut. Hal ini bisa dilakukan dengan cara menyusun tes yang bersumber dari kurikulum bidang studi yang hendak diukur. Di samping kurikulum dapat juga diperkaya dengan melihat atau mengkaji buku sumber. Validitas isi tidak memerlukan uji coba dan analisis statistik atau dinyatakan dalam bentuk angka-angka. Ketepatan suatu istrumen ditinjau dari segi materi yang diujikan (untuk tes) atau ditinjau dari segi dimensi dan indikator yang ditanyakan (untuk angket).

Yatin Dwi Rahayu

b. Validitas Bangun Pengertian (Contruct Validity) Contruct Validity berkenaan dengan kesanggupan alat penilaian untuk mengukur pengertian-pengertian yang terkandung dalm materi yang diukurnya. Contoh: konsep mengenai hubungan sosial, dilihat dari pengalaman, indikator empirisnya adalah: Bisa bergaul dengan orang lain Banyak teman Tidak memaksakan pendapat Menerima pendapat orang lain, dll

c. Validitas Ramalan (Predictive Validity) Dalam validitas ini yang diutamakan bukan isi tes, melainkan kriterianya, apakah alat penilaian tersebut dapat digunakan untuk meramalkan suatu ciri, perilaku tertentu, atau kriteria tertentu yang diinginkan.

d. Validitas Kesamaan (Councurrent Validity) Councurrent Validity artinya membuat tes yang memilki persamaan dengan tes sejenis yang telah ada atau yang telah dibakukan. Kesamaan tes terlingkupnya abilitas yang diukurnya, sasaran atau objek yang diukurnya, serta waktu yang diperlukan.

3. Reliabilitas Reliabilitas alat penilaian adalah ketetapan atau keajegan alat tersebut dalam menilai apa yang dinilainya. Artinya, kapan pun alat peneilaian tersebut digunakan akan memberikan hasil yang relative sama. Tes hasil belajar dikatakan tetap apabila hasil pengukuran saat ini menunjukkan kesamaan hasil pada saat yang berlainan waktunya terhadap siswa yang sama. Jenis reliabilitas harus dipilih, mana yang paling tepat digunakan. Pemilihanya mempertimbangkan sifat variable yang diukur, jenis tes, jumlah subjek, serta hasil-hasil yang diharapkan sesuai dengan tujuan pengajaran. a. Reliabilitas Tes Ulang

Yatin Dwi Rahayu

Tes ulang adalah penggunaan alat penilaian terhadap subjek yang sama, dilakukan dua kali dalam waktu yang berbeda. Jarak antara tes pertama dengan tes kedua sebaiknya tidak terlalu dekat dan juga tidak terlalu jauh karena bisa terjadi adanya perubahan pengetahuan dan pengalaman siswa sehingga mempengaruhi koefisien reliabilitas.

b. Reliabilitas Pecahan Setara Mengukur reliabilitas pecahan setara menggunakan hasil dari bentuk tes yang sebanding dan setara yang diberikan kepada subjek yang sama pada waktu yang sama pula.

c. Reliabilitas Belah Dua Reliabilitas belah dua hampir sama dengan pecahan setara terutama dalm waktu pelaksanaanya. Dalam proses ini tes diberikan kepada kelompok subjek cukup satu kali. Pembedaan soal biasanya dibedakan dari ganjil atau genapnya. Setiap bagian soal diperiksa hasilnya, kemudian skor dari kedua bagian tersebut dikorelasikan untuk dicari koefisien korelasinya. Koefisien korelasi yang diperolehnya tidak untuk seluruh soal, tetapi hanya untuk separuhnya. Rumus ramalan Sepearmen Brown:

rxx= Koefisien reliabilitas keseluruhan = korelasi (r) dari belah dua d. Kesamaan Rasional Prosedur ini dilakukan dengan menghubungkan setiap butir dalam satu tes dengan butir-butir lainnya dalam tes itu sendiri secara keseluruhan.

rxx = Koefisien reliabilitas keseluruhan K = Jumlah butir soal dalam tes = variasi skor = skor rata-rata

Yatin Dwi Rahayu

You might also like