Evaluasi

BAB I
PENDAHULUAN
A. Latar Belakang
Tidak ada usaha guru yang lebih baik selain usaha untuk selalu meningkatkan mutu tes yang
disusunnya. Namun, hal ini tidak dilaksanakan karena kecenderungan seseorang untuk
beranggapan bahwa hasil karyanya adalah yang terbaik atau setidak-tidaknya sudah cukup baik.
Guru yang sudah berpengalaman, mengajar dan menyusun soal-soal tes, juga masih sukar
menyadari bahwa tesnya masih belum sempurna. Oleh karena itu, cara yang paling baik adalah
secara jujur melihat hasil yang diperoleh oleh siswa (Arikunto, 2010).
Menunurut Aiken (1994) dalam Suprananto (2012), kegiatan analisis butir soal merupakan
kegiatan penting dalam penyusunan soal agar diperoleh butir soal yang bermutu.Tujuan kegiatan
ini adalah mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum
digunakan, meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif,
serta mengetahui informasi diagnostik pada siswa apakah mereka telah memahami materi yang
telah diajarkan. Soal yang bermutu adalah soal dapat memberikan informasi setepat-tepatnya
tentang siswa mana yang telah menguasai meteri dan siswa yang belum menguasai materi.
Menurut Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal dapat
dilakukan secara kualitatif (berkenaan dengan isi dan bentuknya), dan kuantitatif (berkaitan
dengan ciri-ciri statistiknya). Analisis kualitatif mencakup pertimbangan validitas isi dan
konstruksi, sedangkan analisis kuantitatif mencakup pengukuran validilitas dan reliabilitas butir
soal, kesulitan butir soal, serta diskriminasi soal. Oleh karena itu, teknik terbaik adalah
menggunakan atau memadukan keduanya. Dalam makalah ini, akan dijelaskan secara rinci
mengenai analisis butir soal secara lengkap.
B. Rumusan Masalah
Berdasarkan latar belakang masalah di atas, dapat dirumuskan sebagai beikut:
1. Apakah pengertian dari menelaah butir soal?
2. Apa saja manfaat menelaah butir soal?
3. Apa Macam-macam tes obyektif?
3. Bagaimana cara menelaah soal secara kualitatif?
4. Bagaimana cara menelaah soal secara kuantitatif?
[Type text] Page 1

BAB II
PEMBAHASAN
A. Pengertian Menelaah Butir Soal
Aiken dalam Suprananto (2012) berpendapat bahwa kegiatan analisis dan menelaah butir
soal merupakan kegiatan penting dalam penyusunan soal agar diperoleh butir soal yang bermutu.
Tujuan kegiatan ini adalah:
1. Mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum
digunakan
2. Meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif
3. Mengetahui informasi diagnostik pada siswa apakah mereka telah memahami materi yang
telah diajarkan.
Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya tentang
siswa mana yang telah menguasai materi dan siswa mana yang belum menguasai materi.
Selanjutnya menurut Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal
dapat dilakukan secara kualitatif (berkaitan dengan isi dan bentuknya) dan kuantitatif (berkaitan
dengan ciri-ciri statistiknya). Analisis kualitatif mencakup pertimbangan validitas isi dan
konstruksi, sedangkan analisis kuantitatif mencakup pengukuran validitas dan reliabilitas butir
soal, kesulitan butir soal serta diskriminasi soal. Kedua teknik ini masing-masing memiliki
keunggulan dan kelemahan, oleh karena itu teknik terbaik adalah menggunakan atau memadukan
keduanya.
B. Manfaat Menelaah Butir Soal

Berdasarkan pendapat yang diungkapkan oleh Anastasia dan Urbina (1997) dalam
Suprananto (2012), analisis butir soal memiliki banyak manfaat, diantaranya yakni:
1. Membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan.
2. Relevan bagi penyusunan tes informal seperti tes yang disiapkan guru untuk siswa dikelas.
3. Mendukung penulisan butir soal yang efektif.
4. Secara materi dapat memperbaiki tes di kelas.
5. Meningkatkan validitas soal dan reliabilitas.
Linn dan Gronlund (1995) dalam Suprananto (2012: 163), menambahkan bahwa pelaksanaan
kegiatan analisis butir soal, biasanya didesain untuk menjawab pertanyaan-pertanyaan berikut:
[Type text] Page 2

1. Apakah fungsi soal sudah tepat?
2. Apakah soal telah memiliki tingkat kesukaran yang tepat?
3. Apakah soal bebas dari hal-hal yang tidak relevan?
4. Apakah pilihan jawabannya efektif?
Selain itu, data hasil analisis butir soal juga sangat bermanfaat sebagai dasar untuk:
1. Diskusi tentang efisien hasil tes.
2. Kerja remedial.
3. Peningkatan secara umum pembelajaran di kelas.
4. Peningkatan keterampilan pada kontruksi tes.
Berdasarkan uraian di atas menunjukkan bahwa analisis butir soal memberikan manfaat:
1. Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik.
2. Meningkatkan butir soal melalui tiga komponen analisis yaitu, tingkat kesukaran, daya
pembeda dan pengecoh soal.
3. Merevisi soal yang tidak relevan degan materi yang diajarkan, ditandai dengan banyaknya
anak yang tidak dapat menjawab butir soal tertentu.
C. Macam-Macam Tes Obyektif
1) Pilihan Ganda
Tes bentuk ini terdiri dari dua bagian. Bagian pertama di sebut dengan stem, yaitu:
pertanyaan atau pernyataan yang menampilkan masalah tertentu. Pertanyaan itu dapat
berupa pertanyaan yang lengkap atau dapat pula berupa pertanyaan/pernyataan yang belum
selesai
2) Benar-Salah
Tes tipe ini, kadang disebut juga dangan Alternative-Response item, dapat digunakan
untuk menguji kemampuan menidentifikasi kebenaran pernyataan suatu fakta, definisi
istilah, maupun pernyataan prinsip. Pada umumnya ditunjukkan untuk mengukur
kemampuan belajar tingkat rendah, terutama berhubungan dengan pengenalan atau
mengingat fakta/pengetahuan, kemampuan membedakan fakta dari pendapat, atau untuk
mengenal relasi sebab akibat.
3) Menjodohkan
Bentuk soal ini seringkali lebih efisien apabila digunakan untuk mengetahui tentang
fakta, seperti tanggal kejadian, hubungan pengarang dengan buku-buku, hubungan simbol
[Type text] Page 3

kimia dengan campuran kimia, hubungan tahun kejadian dengan tempat kejadian dan
sebagainya. Tes tipe ini terdiri dari dua bagian yaitu pokok persoalan dan kemungkinan
jawaban. Biasanya kedua bagian ini ditempatkan sejajar, pokok persoalan di sebelah kanan
dan bagian jawaban di sebelah kiri. Dengan demikian, orang yang dites dapat melihat kedua
bagian sekaligus.
Seperti juga dalam soal pilihan jamak, maka dalam soal menjodohkan ini juga perlu
diperhatikan faktor keseragaman, sehingga dapat mengurangi faktor terkait. Di samping itu,
kemungkinan jawaban yang disediakan hendaknya lebih banyak dari pada jumlah persoalan
yang dikemukakan.
D. Menelaah Soal secara Kualitatif

1) Teknik analisis secara kualitatif
Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara kualitatif,
yakni teknik moderator dan panel. Teknik moderator merupakan teknik berdiskusi yang
didalamnya terdapat satu orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal
didiskusikan secara bersama dengan beberapa ahli, seperti guru yang mengajarkan materi, ahli
materi, penyusun atau pengembang kurikulum, ahli penilaian, ahli bahasa dan orang yang
memiliki latar belakang psikologi. Teknik ini sangat baik, karena didiskusikan dan ditelaah
secara bersama-sama, namun teknik tersebut memiliki kelemahan karena memerlukan waktu
lama untuk mendiskusikan setiap satu butir soal.
Teknik berikutnya adalah teknik panel. Teknik panel merupakan suatu teknik yang menelaah
butir soal berdasarkan kaidah penulisan butir soal. Kaidah itu diantaranya materi, kontruksi,
bahasa atau budaya, kebenaran kunci jawaban atau pedoman penskoran. Caranya beberapa
penelaah diberikan butir-butir soal yang akan ditelaah, format penelaahan dan pedoman penilaian
atau penelaahan. Tahap awal, semua orang yang terlibat dalam kegiatan penelaahan disamakan
persepsinya, kemudian mereka bekerja sendiri-sendiri di tempat berbeda. Para penelaah
dipersilahkan memperbaiki langsung pada teks soal dan memberikan nilai pada setiap butir soal
dengan kriteria soal baik, perlu diperbaiki atau diganti (Suprananto, 2012).
2) Prosedur menganalisa secara kualitatif

a) Format Penelaahan Soal Bentuk Pilihan Ganda
[Type text] Page 4

FORMAT PENELAAHAN BUTIR SOAL BENTUK PILIHAN GANDA
Mata Pelajaran : .................................

Kelas/semester : .................................
Penelaah : .................................
Nomor Soal
No. Aspek yang ditelaah 1 2 3 4 5 …
A. Materi
1 Soal sesuai dengan indikator (menuntut tes tertulis untuk
bentuk pilihan ganda
2. Materi yang ditanyakan sesuai dengan kompetensi
(urgensi, relevasi, kontinyuitas, keterpakaian sehari- hari
tinggi)
3. Pilihan jawaban homogen dan logis
4. Hanya ada satu kunci jawaban
B. Konstruksi
5. Pokok soal dirumuskan dengan singkat, jelas, dan tegas
6. Rumusan pokok soal dan pilihan jawaban merupakan
pernyataan yang diperlukan saja
7. Pokok soal tidak memberi petunjuk kunci jawaban Pokok
8 soal bebas dan pernyataan yang bersifat negatif ganda
Pilihan jawaban homogen dan logis ditinjau dari segi
9. materi
Gambar, grafik, tabel, diagram, atau sejenisnya
10. jelas dan berfungsi
Panjang pilihan jawaban relatif sama
11. Pilihan jawaban tidak menggunakan pernyataan "semua
12. jawaban di atas salah/benar" dan sejenisnya Pilihan
jawaban yang berbentuk angka/waktu disusun berdasarkan
13. urutan besar kecilnya angka atau kronologisnya
Butir soal tidak bergantung pada jawaban soal sebelumnya
[Type text] Page 5

Nomor Soal
No. Aspek yang ditelaah 1 2 3 4 5 …
C. Bahasa/Budaya
14. Menggunakan bahasa yang sesuai dengan kaidah bahasa
Indonesia
15. Menggunakan bahasa yang komunikatif
16. Tidak menggunakan bahasa yang berlaku setempat/tabu
18. Pilihan jawaban tidak mengulang kata/kelompok kata yang
sama, kecuali
Keterangan: Berilah t a n d amerupakan
( V ) bila satu
tidakkesatuan pengertian
sesuai dengan aspek yang ditelaah!
b) Format Penelaahan Butir Soal Bentuk Uraian
FORMAT PENELAAHAN BUTIR SOAL BENTUK URAIAN
Mata Pelajaran : .................................

Kelas/semester : .................................
Penelaah : .................................
Nomor Soal
No. Aspek yang ditelaah 1 2 3 4 5 6 7 8 9 …
A. Materi
1 Soal sesuai dengan indikator (menuntut tes
tertulis untuk bentuk Uraian) Batasan
2 pertanyaan dan jawaban yang diharapkan
sudah sesuai
3 Materi yang ditanyakan sesuai dengan
kompetensi (urgensi, relevasi, kontinyuitas,
keterpakaian sehari- hari tinggi)
Isi materi yang ditanyakan sesuai dengan
4 jenjang jenis sekolah atau tingkat kelas
Konstruksi
Menggunakan kata tanya atau perintah yang
B menuntut jawaban uraian
5 Ada petunjuk yang jelas tentang cara
mengerjakan soal
6 Ada pedoman penskorannya
Tabel, gambar, grafik, peta, atau
[Type text] Page 6

Nomor Soal
No. Aspek yang ditelaah 1 2 3 4 5 6 7 8 9 …
7 yang sejenisnya disajikan dengan jelas dan

terbaca
C. Bahasa/Budaya
8 Rumusan kalimat coal komunikatif
9 Butir soal menggunakan bahasa
Indonesia yang baku
10 Tidak menggunakan kata/ungkapan yang
menimbulkan penafsiran ganda atau salah
pengertian
11 Tidak menggunakan bahasa yang berlaku
setempat/tabu
12 Rumusan soal tidak mengandung
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!
E. Menelaah Soal Secara Kuantitatif

Penelaahan soal secara kuantitatif adalah penelaahan butir soal berdasarkan pada data
empirik. Data empirik ini diperoleh dari soal yang telah diujikan. Ada dua pendekatan dalam
analisis secara kuantitatif, yaitu pendekatan secara klasik dan modern. Analisis butir soal
secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban peserta tes
guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori klasik.
Kelebihan dari analisis ini yakni, murah, sederhana, familiar, dapat dilaksanakan sehari-hari
dengan cepat menggunakan komputer dapat menggunakan data dari beberapa peserta tes atau
sampel kecil. Hal tersebut telah dikemukakan oleh Millman dan Greene (1993) dalam
Suprananto, (2012). Selanjutnya analisis butir soal secara modern adalah penelaahan butir
soal dengan menggunakan teori respon butir atau Item Response Theory (IRT). Teori ini
merupakan suatu teori yang menggunakan fungsi matematika untuk menghubungkan antara
peluang menjawab benar suatu butir dengan kemampuan siswa.Teori ini muncul karena
adanya beberapa keterbatasan pada analisis secara klasik, yaitu:
1. Tingkat kemampuan dalam teori klasik adalah true score. Artinya jika suatu tes sulit
maka tingkat kemampuan peserta tes akan rendah, sebaliknya jika suatu tes mudah, maka
tingkat kemampuan peserta tes tinggi.
2. Tingkat kesukaran butir soal didefinisikan sebagai proporsi peserta tes yang menjawab
benar. Mudah atau sulitnya butir soal tergantung pada kemampuan peserta tes.
[Type text] Page 7

3. Daya pembeda, reliabilitas dan validitas tes tergantung pada kondsi peserta didik.
Teknik menelaah soal secara kuantitatif pada butir soal dapat dibagi menjadi 2, yaitu;
1) Tingkat Kesukaran Soal (Difficulty Index)
Menurut Arifin (2009) perhitungan tingkat kesukaran soal adalah pengukuran seberapa
besar derajat kesukaran suau soal. Jika suatu soal memiliki tingkat seimbang (proposional),
maka dapat dikatakan bahwa soal tersebut baik. Suatu soal tes hendaknya tidak terlalu sukar
dan tidak pula terlalu mudah.
a) Menghitung Tingkat Kesukaran Soal Bentuk Objektif
Untuk menghitung tingkat kesukaran soal bentuk obyektif dapat digunakan dengan cara,
yaitu: menggunakan rumus tingkat kesukaran (TK):
TK = (WL + WH )x 100 %
(nL + nH )
atau
𝒋𝒖𝒎𝒍𝒂𝒉 𝒔𝒊𝒔𝒘𝒂 𝒚𝒂𝒈 𝒎𝒆𝒏𝒋𝒂𝒘𝒂𝒃 𝒃𝒆𝒏𝒂𝒓 𝒃𝒖𝒕𝒊𝒓 𝒔𝒐𝒂𝒍
𝐓𝐢𝐧𝐠𝐤𝐚𝐭 𝐊𝐞𝐬𝐮𝐤𝐚𝐫𝐚𝐧 (𝐓𝐊) =
𝒋𝒖𝒎𝒍𝒂𝒉 𝒔𝒊𝒔𝒘𝒂 𝒚𝒂𝒏𝒈 𝒎𝒆𝒏𝒈𝒊𝒌𝒖𝒕𝒊 𝒕𝒆𝒔
Keterangan:
WL = jumlah peserta didik yang menjawab salah dari kelompok bawah
WH = jumlah peserta didik yang menjawab salah dari kelompok atas
nL = jumlah kelompok bawah
nH = jumlah kelompok atas
Sebelum menggunakan rumus di atas, harus diitempuh terlebih dahulu langkah-langkah
sebagai berikut:
a) Menyusun lembar jawaban peserta didik dari skor tertinggi sampai dengan skor terendah.
b) Mengambil 27% lembar jawaban dari atas yang selanjutnya disebut kelompok atas
(higher group), dan 27% lembar jawaban dari bawah yang selanjutnya disebut kelompok
bawah (lower group). Sisa sebanyak 46% disisihkan.
c) Membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap peserta didik,
baik untuk kelompok atas maupun kelopok bawah. Jika jawaban peserta didik benar
diberi tanda plus (+), sebaliknya jika jawaban peserta didik salah maka diberi simbol
minus (-).
Contoh:
[Type text] Page 8

18 peserta didik SMA Negeri 1 Cilacap kelas XII IPA akan mengikuti ujian tengah
semester dalam mata pelajaran kimia. Berdasarkan hasil ujian tersebut kemudian disusun
lembar jawaban peserta didik dari yang mendapat skor tertinggi sampai dengan skor
terendah. Selanjutnya diambil 27% dari kelompok atas sebanyak 5 anak, begitu pula 27%
dari kelompok bawah sebanyak 5 anak. Setelah diketahui jumlah sampel kelompok atas dan
bawah, kemudian membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap
peserta didik dalam kelompok tersebut.
Tabel 1. Jawaban Benar-Salah Dari Kelompok Atas

No. Peserta Didik
Soal 1 2 3 4 5
1 + + + + -
2 + - + + +
3 - + + + +
4 + + + - +
5 + - - - -
Tabel 2. Jawaban Benar-Salah Dari Kelompok Bawah

No. Peserta Didik
Soal 1 2 3 4 5
1 + + + + -
2 + - + + -
3 - + - + -
4 + - + - +
5 + - - - -
Berdasarkan kedua tabel di atas dapat dibuat tabel sebagai berikut:

Tabel 3. Perhitungan WL+WH dan WL-WH
No. Soal WL WH WL+WH WL-WH
1 1 1 2 0
2 2 1 3 1
3 3 1 4 2
4 2 1 3 1
[Type text] Page 9

5 4 4 8 0
Jadi, tingkat kesukaran tiap soal adalah sebagai berikut:
TK = (1 + 1 )x 100 % = 20%
1) untuk soal nomor 1, (5 + 5)
TK = (2 + 1 )x 100 % = 30%
2) untuk soal nomor 2, (5 + 5 )
TK = (3 + 1 )x 100 % = 40%
TK = (2 + 1 )x 100 % = 30%
TK = (4 + 4 )x 100 % = 80%
Adapun kriteria penafsiran tingkat kesukaran soal adalah:

1) jika jumlah presentase 0%-7% = mudah
2) jika jumlah presetase 28%-72% = sedang
3) jika jumlah presentase 73%-100% = sukar
Berdasarkan kriteria di atas, maka hasil perhitungan tingkat kesukaran soal dapat ditafsirkan
seperti berikut:
Tabel 4. Penafsiran Hasil Perhitungan Tingkat Kesukaran Soal
Nomor Presentase Tingkat Penafsiran
Soal Kesukaran Soal
1 20% Mudah
2 30% Sedang
3 40% Sedang
4 30% Sedang
5 80% Sukar
Tabel 5. Klasifikasi Soal Berdasarkan Proporsi Tingkat Kesukarannya

Tingkat Kesukaran Soal Nomor Soal Jumlah
Mudah 1 1
[Type text] Page 10

P 27%
Sedang 2,3,4 3
P 28%-72%
Sukar 5 1
P 73%
Untuk memperoleh prestasi belajar yang baik, sebaiknya proporsi antara tingkat kesukaran
soal tersebar secara normal. Perhitungan proporsi tersebut dapat diatur sebagai berikut:
a) soal sukar 25%, soal sedang 50%, soal mudah 25%;
b) soal sukar 20%, soal sedang 60%, soal mudah 20%;
c) soal sukar 15%, soal sedang 70%, soal mudah 15%.
b) Menghitung Tingkat Kesukaran Untuk Soal Bentuk Uraian

Cara menghitung tingkat kesukaran untuk soal bentuk uraian adalah menghitung berapa
persen peserta didik yang gagal menjawab benar atau di bawah batas lulus (passing grade)
untuk tiap-tiap soal. Untuk menafsirkan tingkat kesukaran soalnya dapat digunakan kriteria
sebagai berikut:
a) Jika jumlah peserta didik yang gagal mencapai 27%, termasuk mudah;
b) jika jumlah peserta didik yang gagal antara 28%-72%, termasuk sedang;
c) jika jumlah peserta didik yang gagal 73% ke atas, termasuk sukar.
Untuk menghitung kesukaran soal uraian digunakan rumus berikut:
𝒎𝒆𝒂𝒏
𝐓𝐢𝐧𝐠𝐤𝐚𝐭 𝐊𝐞𝐬𝐮𝐤𝐚𝐚𝐧 (𝐓𝐊) =
𝑺𝒌𝒐𝒓 𝒎𝒂𝒌𝒔𝒊𝒎𝒖𝒎 𝒚𝒂𝒏𝒈 𝒅𝒊𝒕𝒆𝒕𝒂𝒑𝒌𝒂𝒏
Contoh:
33 orang peserta didik dites dengan lima soal bentuk uraian. Skor maksimum
ditentukan 10 dan skor minimum 0. Jumlah peserta didik yang memperoleh 0-5 = 10 orang
(berarti gagal), nilai 6 = 12 orang dan nilai 7-10 = 11 orang.
Tingkat kesukaran 30,3 % berada diantara 28%-72%, berarti soal tersebut termasuk sedang.
catatan batas lulus ideal = 6 (skala 0-10) (Arifin, 2009: 273).
Contoh Analisis Soal
[Type text] Page 11

Misal 100 orang murid dites dengan tes pilihan ganda yang berjumlah 95 soal.Hasil tes
menunjukkan skor tertinggi 85 dan terendah 14.25 orang (25%) dari hasil tes tersebut kita
ambil yang tergolong upper group, dan 25 orang yang tergolong lower group. Cara
mengambil kelompok upper group dan lower group adalah sebagai berikut: mula-mula kita
susun lembaran hasil tes itu dari lembaran yang memiliki skor tertinggi (85) berturut-turut
sampai kepada lembaran yang memiliki skor terendah (14). Selanjutnya, kita ambil 25 lembar
dari atas, inilah kelompok upper group; dan 25 lembar dari bawah, yang disebut kelompok
lower group. Misalkan dari kelompok lower group yang kita ambil terdapat skor dari 59 s.d
85, dan dari kelompok lower group terdapat skor 14 s.d 34. Kelompok sedang berjumlah 50
lembar (50%) kita biarkan.
Jawaban-jawaban dari kedua kelompok upper group dan lower group itulah yang
kemudian kita tabulasikan dan kita analisis. Berikut beberapa contoh:
Soal no.1 hasilnya sebagai berikut:
1. Penyebar agama Islam yang pertama di Jawa Barat adalah ….
Jawaban Upper Lowwer

a. Sultan Hasanuddin 0 2
b. Fatahillah 25 20
c. Untung Suropati 0 2
d. Sunan Kalijaga 0 1
Dikosongkan 0 0
Interpretasi:
Soal ini mudah karena semua (25) orang dari kelompok upper group dan 20 orang dari
lower group dapat menjawab soal ini dengan benar. Soal ini termasuk baik karena dapat
membedakan arah yang diinginkan: ternyata jawaban-jawaban yang salah terdapat pada
kelompok lower group. Dua atau tiga soal semacam ini baik digunakan sebagai permulaan
suatu tes (Purwanto, 2010).
Contoh 2
Dalam Sudijono, (1996) diberikan contoh sebagai berikut
Misalkan sebanyak 10 orang testee mengikuti tes hasil belajar tahap akhir dalam mata
pelajaran Aqidah-Akhlaq yang dituangkan dalam bentuk soal tes obyektif dengan menyajikan
[Type text] Page 12

10 butir item (soal), dengan soal yang dapat dijawab benar diberi bobot 1 dan untuk jawaban
salah diberi bobot 0. Setelah tes selesai, dilakukan koreksi dan diberikan skor yang
menghasilkan pola penyebarab jawaban sebagai berikut
Tabel Penyebaran Skor Jawaban 10 Testee Terhadap 10 Butir Item Dalam Tes Hasil Belajar
Mata Pelajaran Aqidah-Akhlaq
Skor Pada Soal Nomor
Testee
1 2 3 4 5 6 7 8 9 10
A 0 1 1 0 1 0 1 1 1 0
B 1 0 1 1 1 1 0 0 0 1
C 1 0 0 0 0 0 1 1 1 0
D 0 0 1 1 1 0 1 0 1 1
E 1 0 1 0 1 1 1 0 1 0
F 0 0 1 1 0 0 1 1 1 1
G 1 0 1 0 0 0 0 0 0 1
H 0 0 1 1 0 0 1 0 1 1
I 1 0 0 0 1 0 1 0 1 1
J 1 1 1 1 1 0 1 0 1 1
Jumlah
jawaban 6 2 8 5 6 2 8 3 8 7
benar
Tabel Perhitungan Indeks Kesukaran Item Hasil Jawaban 10 Testee Terhadap 10 Butir Item
Dalam Tes Hasil Belajar Mata Pelajaran Aqidah-Akhlaq
No
Indeks Kesukaran Item Interpretasi
Soal
1 𝐵 6 Sedang
P= = 10 0,60
𝐽𝑆
2 𝐵 2 Terlalu sukar
P = 𝐽𝑆 = 100,20
3 𝐵 8 Terlalu mudah
P= = 10 0,80
𝐽𝑆
4 𝐵 5 Sedang
P= = 10 0,50
𝐽𝑆
5 𝐵 6 Sedang
P= = 10 0,60
𝐽𝑆
[Type text] Page 13

6 𝐵 2 Terlalu sukar
P= = 10 0,20
𝐽𝑆
P= = 10 0,80
𝐽𝑆
8 𝐵 3 Sedang
P= = 10 0,30
𝐽𝑆
P= = 0,80
𝐽𝑆 10
10 𝐵 7 Sedang
P= = 10 0,70
𝐽𝑆
Keterangan Rumus :
P = Proporsi = Angka Indeks Kesukaran Item
B = banyaknya testee yang dapat menjawab dengan benar
JS = jumlah testee yang mengikuti tes
Lebih lanjut menurut Sudijono, (1996) dari hasil analisis yang dilakukan terhadap 10
butir item tes hasil belajar tersebut dapat diketahui terdapat 5 soal dalam kategori baik
(sedang atau tidak terlalu sukar), 2 soal dalam kategori terlalu sukar, dan 3 soal dalam
kategori terlalu mudah. Dengan hasil analisis tersebut, maka tindak lanjut yang dapat
dilakukan oleh tester adalah
a. Untuk butir soal yang termasuk dalam kategori baik segera dicatat dan disimpan dalam
bank soal dan dapat digunakan kembali sewaktu-waktu untuk tes berikutnya.
b. Untuk butir soal yang dalam kategori terlalu sukar ada kemungkinan 3 hal yang bias
dilakukan yakni butir soal tersebut dibuang (tidak akan dikeluarkan lagi saat tes
selanjutnya), diteliti ulang dan ditelusuri factor yang menyebabkan soal tersebut sukar
dikerjakan oleh testee dan setelah dilakukan perbaikan dapat dikeluarkan lagi pada tes
selanjutnya, dapat digunakan dalam tes-tes yang membutuhkan seleksi ketat.
c. Untuk butir soal yang dalam kategori terlalu mudah ada kemungkinan 3 hal yang bias
dilakukan yakni butir soal tersebut dibuang (tidak akan dikeluarkan lagi saat tes
selanjutnya), diteliti ulang dan ditelusuri factor yang menyebabkan soal tersebut sukar
dikerjakan oleh testee dan setelah dilakukan perbaikan dapat dikeluarkan lagi pada tes
selanjutnya, dapat digunakan dalam tes-tes yang membutuhkan seleksi yang lebih
longgar.
[Type text] Page 14

2. Analisis Daya Pembeda
Daya pembeda item menurut Sudijono (1996), adalah kemampuan suatu butir item tes
hasil belajar untuk dapat membedakan antara testee yang berkemampuan tinggi (pandai)
dengan testee yang berkemampuan rendah (kurang pandai), sedemikian rupa sehingga
sebagian besar testee yang memiliki kemampuan tinggi untuk menjawab butir soal tersebut
lebih banyak dapat menjawab dengan benar, sementara testee yang berkemampuan rendah
untuk menjawab butir soal tersebut sebagian besar tidak dapat menjawab dengan benar.
Tujuan mengetahui daya pembeda adalah agar butir-butir soal tersebut mampu memberikan
hasil yang mencerminkan adanya perbedaan-perbedaan kemampuan yang ada pada kalangan
testee, karena pada dasarnya kemampuan antara satu testee dengan testee yang lain adalah
berbeda-beda.
Lebih lanjut menurut Sudijono (1996), daya pembeda dapat diketahui melalui angka
indeks diskriminasi item. Angka indeks diskriminasi (diberi lambang d besar = D) adalah
sebuah angka atau bilangan yang menunjukkan besar kecilnya daya pembeda (discrimination
power) yang dimiliki oleh sebutir item.
Seperti halnya indeks kesukaran item, maka indeks diskriminasi item besarnya berkisar
antara 0 (nol) sampai dengan 1 (satu). Namun di antara keduanya terdapat perbedaan yang
mendasar yaitu angka indeks kesukaran item tidak mungkin mengenal tanda negatif (-)
sedangkan pada daya pembeda dapat bertanda negatif (-). Apabila sebutir item memiliki
tanda positif (+), maka butir item tersebut memiliki daya pembeda yang berarti testee yang
termasuk kategori pandai lebih banyak dapat menjawab dengan benar butir soal yang
bersangkutan, sedangkan testee yang termasuk kategori kurang pandai lebih banyak
menjawab salah. Apabila sebutir item memiliki angka indeks diskriminasi = 0,00 (nihil),
maka hal ini menunjukkan bahwa butir item yang bersangkutan tidak memiliki daya pembeda
sama sekali, yang berarti bahwa jumlah testee kelompok atas yang menjawab benar (atau
salah) sama dengan jumlah testee kelompok atas yang menjawab dengan benar. Jadi di antara
kedua kelompok testee tersebut tidak ada perbedaannya sama sekali atau perbedaannya = 0.
Apabila angka indeks diskriminasi item dan sebutir item bertanda negatif (-), maka butir item
lebih banyak dijawab benar oleh testee kelompok bawah dari pada oleh kelompok atas, atau
testee yang sebenarnya termasuk dalam kategori pandai lebih banyak menjawab salah
sedangkan testee yang sebenarnya dalam kategori kurang panda lebih banyak yang menjawab
dengan benar.
Dengan demikian, menurut Arikunto (2006) terdapat tiga titik pada daya pembeda yaitu
[Type text] Page 15

1,00 0,00 -1,00
daya pembeda negatif tidak ada daya pembeda daya pembeda positif
Untuk mengetahui indeks manakah yang dapat menyatakan bahwa sebutir soal dapat
dikatakan sebagai butir soal yang memiliki daya pembeda yang baik, menurut Sudijono
(1996) dapat digunakan patokan sebagai berikut
Indeks Diskriminasi Item Klasifikasi Interpretasi

(D)
< 0,20 Poor Butir soal memiliki daya
pembeda lemah (tidak
memiliki daya pembeda
yang baik)
0,20 – 0,40 Satisfactory Butir soal memiliki daya
pembeda cukup (sedang)
0,40 – 0,70 Good Butir soal memiliki daya
pembeda yang baik
0,70 – 1,00 Excellent Butir soal memiliki daya
pembeda sangat baik
Bertanda negatif (-) - Buti soal tidak memiliki
daya pembeda
Dalam Arikunto (2006) disebutkan bahwa seluruh pengikut tes (testee) dikelompikkan
menjadi 2 kelompok, yaitu kelompok pandai atau kelompok atas (upper group) dan
kelompok kurang pandai atau kelompok bawah (lower group).
Cara menentukan daya pembeda (D) dapat dilakukan dengan 2 cara yakni perlu
dibedakan antara kelompok kecil (<100) dan kelompok besar (>100).
a. Untuk kelompok kecil
Seluruh kelompok testee dibagi 2 sama besar, 50% kelompok atas dan 50% kelompok bawah.
Contoh:
Siswa Skor
A 9
B 8
kelompok atas (JA)
[Type text] Page 16

C 7
D 7
E 6
F 5
kelompok bawah (JB)
G 5
H 4
I 4
J 3
Seluruh testee dideretkan mulai dari skor teratas sampai terbawah, lalu dibagi menjadi dua.
b. Untuk kelompok besar
Mengingat biaya dan waktu menganalisis, maka untuk kelompok besar biasanya hanya
diambil kedua kutubnya saja yaitu 27% skor teratas (JA) dan 27% sebagai kelompok bawah
(JB).
Contoh:
Siswa Skor
A 9
B 9
C 8
D 8
27 %kelompok atas (Ja)
E 8
-
-
-
-
X 2
X 1
[Type text] Page 17

X 1
27 % kelompok bawah (Jb)
X 1
27 % kelompok bawah
X 0
(Jb)
Rumus Mencari D (Descrimination Power)

𝐵𝐴 𝐵𝐵
𝐷= − 𝐽𝐵 = PA-PB
𝐽𝐴
Dimana
J = jumlah peserta tes
JA = Banyak peserta kelompok atas
JB = Banyak peserta kelompok bawah
BA = Banyak kelompok atas yang menjawab benar
BB = Banyak kelompok bawah yang menjawab benar
PA = Proporsi kelompok atas yang menjawab benar (P = indeks kesukaran)
PB = Proporsi kelompok bawah yang menjawab benar
(Arikunto, 2006).
1) Contoh soal pembeda daya untuk soal objektif.

Dalam Sudijono, (1996) diberikan contoh sebagai berikut
Misalkan 10 orang testee mengikuti tes hasil belajar dalam bidang studi Bahasa Arab
dalam bentuk multiple choice item., dengan soal yang dapat dijawab benar diberi bobot 1 dan
untuk jawaban salah diberi bobot 0.
Langkah-langkah yang dikerjakan adalah sebagai berikut
a. Mengelompokkan testee menjadi 2 kelompok yaitu kelompok atas (pandai) dan
kelompok bawah kurang pandai
Skor Pada Soal Nomor Tota
Testee
1 2 3 4 5 6 7 8 9 10 l
A 0 1 0 1 0 1 0 1 0 1 5
B 1 1 1 1 1 1 1 1 1 1 10
C 1 1 0 0 0 1 1 1 1 1 7
D 1 1 0 1 0 0 0 0 0 0 3
[Type text] Page 18

E 0 1 1 1 1 1 0 1 1 0 7
F 0 1 0 1 1 0 1 0 0 0 4
G 0 1 0 1 0 1 1 1 1 1 7
H 1 1 0 1 1 1 1 1 1 1 9
I 0 1 0 0 1 1 0 0 1 0 4
J 1 0 0 1 1 1 0 0 0 1 5
N =
5 9 2 8 6 8 5 6 6 6 61
10
Mengelompokkan dalam kelas atas dan bawah

Tabel kelompok Atas
Testee Skor
B 10
H 9
C 7
G 7
E 7
JA = 5 -
Tabel kelompok Bawah

Testee Skor
A 5
I 5
J 4
F 4
D 3
JB = 5 -
b. Menuliskan atau memberi kode-kode terhadap hasil pengelompokan testee

Skor Pada Soal Nomor Kelom
Testee Total
1 2 3 4 5 6 7 8 9 10 p-ok
A 0 1 0 1 0 1 0 1 0 1 5 Bawah
B 1 1 1 1 1 1 1 1 1 1 10 Atas
[Type text] Page 19

C 1 1 0 0 0 1 1 1 1 1 7 Atas
D 1 1 0 1 0 0 0 0 0 0 3 Bawah
E 0 1 1 1 1 1 0 1 1 0 7 Atas
F 0 1 0 1 1 0 1 0 0 0 4 Bawah
G 0 1 0 1 0 1 1 1 1 1 7 Atas
H 1 1 0 1 1 1 1 1 1 1 9 Atas
I 0 1 0 0 1 1 0 0 1 0 4 Bawah
J 1 0 0 1 1 1 0 0 0 1 5 Bawah
N =
5 9 2 8 6 8 5 6 6 6 61
10
c. Menghitung BA, BB, PA, PB, dan D untuk 10 butir soal

Nomor BA BB JA JB PA = PB = D = PA -
PB
Soal
1 3 2 5 5 0,60 0,40 0,20
2 5 4 5 5 1,00 0,80 0,20
3 2 0 5 5 0,40 0,00 0,40
4 4 4 5 5 0,80 0,80 0,00
5 3 3 5 5 0,60 0,60 0,00
6 5 3 5 5 1,00 0,60 0,40
7 4 1 5 5 0,80 0,20 0,60
8 5 1 5 5 1,00 0,20 0,80
9 5 1 5 5 1,00 0,20 0,80
10 4 2 5 5 0,80 0,40 0,40
d. Memberikan Penafsiran (Interpretasi) Mengenai Kulitas Daya Pembeda Item Yang

Dimiliki Oleh 10 Soal
Nomor Butir Soal Besar D Klasifikasi Interpretasi
8 dan 9 0,80 Excellent Daya pembeda
sangat baik
7 0,60 Good Daya pembda baik
3,6 dan 10 0,40 Satisfactory Daya pembeda
cukup
[Type text] Page 20

1 dan 2 0,20 Poor Daya pembeda
lemah
4 dan 5 0,00 - Tidak memiliki
daya pembeda
Dari hasil analisis tersebut maka dapat disimpulkan bahwa 60% (6 butir) dari 10 butir
soal bahasa arab yang diajukan dalam tes tersebut sudah memiliki daya pembeda yang baik,
sedangkan 40% (4 butir) masih tergolong belum memiliki daya pembeda seperti yang
diharapkan.
2) Contoh soal pembeda daya untuk soal uraian singkat:

Untuk menghitung daya pembeda soal bentuk uraian dapat menggunakan rumus berikut:
𝒎𝒆𝒂𝒏 𝒌𝒆𝒍𝒐𝒎𝒑𝒐𝒌 𝒔𝒌𝒐𝒓 𝒂𝒕𝒂𝒔 − 𝒎𝒆𝒂𝒏 𝒌𝒆𝒍𝒎𝒑𝒐𝒌 𝒃𝒂𝒘𝒂𝒉

𝐃𝐏 =
𝑺𝒌𝒐𝒓 𝒎𝒂𝒌𝒔𝒊𝒎𝒖𝒎 𝒔𝒐𝒂𝒍
Setelah dilakukan tes pada 10 orang maka didapat hasil sebagai berikut :
No Nama Peserta Nomor Soal Skor
1 2 3 4 5 Total
1 Dewi Yuniasari 2 2,5 1 1 0 6,5
2 Nur Pra Utami 2 2,5 1 1 0 6,5
3 Rahmadina Dwi Febriani 1 2,5 0 1 0 4,5
4 Rahmadhanti 2 3 1 1 0 7
5 Sri Purwanti 2 3 0,5 1 0 6,5
6 Ummi Kalsum 2 2,5 1 1 0 6,5
7 Intan Buana 2 1,5 1 1 0 5,5
8 Juli Yani 2 2,5 1 1 0 6,5
9 Dwithia Can Yo Putri 2 3 1 1 0 7
10 Oktarina A 2 2,5 1 1 0 6,5
Untuk memudahkan perhitungan skor yang terdapat pada tabel di urutkan dari peserta tes
yang memperoleh skor yang tinggi menuju peserta yang memperoleh sekor yang rendah.
[Type text] Page 21

No Nama Peserta Nomor Soal Skor
1 2 3 4 5 Total
1 Rahmadhanti 2 3 1 1 0 7
2 Dwithia Can Yo Putri 2 3 1 1 0 7
3 Dewi Yuniasari 2 2,5 1 1 0 6,5
4 Nur Pra Utami 2 2,5 1 1 0 6,5
5 Sri Purwanti 2 3 0,5 1 0 6,5
6 Ummi Kalsum 2 2,5 1 1 0 6,5
7 Juli Yani 2 2,5 1 1 0 6,5
8 Oktarina A 2 2,5 1 1 0 6,5
9 Intan Buana 2 1,5 1 1 0 5,5
10 Rahmadina Dwi Febriani 1 2,5 0 1 0 4,5
Jumlah Jawaban 9 25,5 8,5 10 0
Jumlah Peserta 10 10 10 10 10
Keterangan :
Skor Siswa kelompok atas 6 – 10
Skor Siswa kelompok bawah 5 - 1
Jadi jumlah siswa kelompok atas ada 8 orang dan jumlah siswa kelompok bawah adalah 2
orang.
Daftar Daya Pembeda Butir Soal
No BA JA PA BB JB PB PA - PB S Kriteria
soal
1 16 8 2 3 2 1,5 0,50 2 0,25 Sedang
2 21,5 8 2,69 4 2 2 0,69 3 0,23 Sedang
3 7,5 8 0,94 1 2 0,5 0,44 1 0,44 Baik
4 8 8 1 2 2 1 0,00 2 0,00 Rendah
5 0 8 0 0 2 0 0,00 2 0,00 Rendah
Keterangan :
DP = Daya Pembeda
J = Jumlah Peserta Tes
JA = banyaknya peserta kelompok atas
[Type text] Page 22

JB = banyaknya peserta kelompok bawah
BA = Jumlah skor peserta kelompok atas yang menjawab benar
BB = jumlah skor peserta kelompok bawah yang menjawab benar
PA = Proporsi peserta kelompok atas yang menjawab benar
PB = Proporsi peserta kelompok bawah yang menjawab benar
Kriteria :
0,70 - 1,00 soal baik sekali (sangat baik)
0,40 - 0,69 soal baik(tinggi)
0,20 - 0,39 soal cukup (sedang)
0,19 - 0,00 soal rendah (kurang)
Kesimpulan:
Dari tabel dapat dilihat bahwa soal no 4 dan 5 tidak menunjukkan perbedaan antar
kelompok. Tidak adanya perbedaan tingkat kesukaran soal no 4 dan 5 juga menunjukkan
tidak ada perbedaan antar kelompok. Sedangkan Soal no 1, 2, dan 3 mempunyai indeks daya
pembeda yang baik. Setelah dianalisis, baik dari variable, reliabilitas, tingkat kesukaran dan
daya pembeda maka butir soal 1, 2, dan 3 dapat digunakan.
3) Fungsi pengecoh (distracter function)

Pada saat membicarakan tes objektif bentuk multiple choice item tersebut untuk
setiap butir item yang dikeluarkan dalam tes hasil belajar telah dilengkapi dengan beberapa
kemungkinan jawab, atau yang sering dikenal dengan istilah option atau alternatif. Option
atau alternatif itu jumlahnya berkisar antara 3 sampai dengan 5 buah, dan dari kemungkinan-
kemungkinan jawaban yang terpasang pada setiap butir item itu, salah satu diantaranya
adalah merupakan jawaban betul (kunci jawaban), sedangkan sisanya adalah merupakan
jawaban salah. Jawaban-jawaban salah itulah yang biasa dikenal dengan istilah distractor
(pengecoh).
Fungsi pengecoh dimaksudkan untuk mengetahui seberapa besar peserta yang tidak
memiliki kunci jawaban (option) pada bentuk soal pilihan ganda. Untuk soal pilihan ganda,
alternatif jawaban menurut kaidah harus homogen dan logis sehingga setiap pilihan jawaban
(opition) dapat berfungsi atau ada yang memilih. Setiap pengecoh dapat dikatakan berfungsi
apabila ada yang memilih. Setiap pengecoh dapat dikatakan berfungsi apabila terpilih
[Type text] Page 23

minimal sebanyak 5% dari jumlah peserta.untuk menghitungnya dapat digunakan rumus
sebagai berikut:
𝑱𝒖𝒎𝒍𝒂𝒉 𝒔𝒊𝒔𝒘𝒂 𝒚𝒂𝒏𝒈 𝒎𝒆𝒎𝒊𝒍𝒊𝒉 𝒐𝒑𝒕𝒊𝒐𝒏 𝒔𝒂𝒍𝒂𝒉

𝑿𝟏𝟎𝟎%
𝑱𝒖𝒎𝒍𝒂𝒉 𝒔𝒆𝒍𝒖𝒓𝒖𝒉 𝒑𝒆𝒔𝒆𝒓𝒕𝒂 𝒕𝒆𝒔
Menganalisis fungsi distraktor sering dikenal dengan istilah lain, yaitu : menganalisis
pola penyebaran jawaban item. Adapun yang dimaksud dengan pola penyebaran jawaban item
adalah suatu pola yang dapat menggambarkan bagaimana testee menentukan
pilihan jawabnya terhadap kemungkinan-kemungkinan jawab yang telah dipasangkan pada
setiap butir item. Suatu kemungkinan dapat terjadi, yaitu bahwa dari keseluruhan alternatif
yang dipasang pada butir item tertentu, sama sekali tidak dipilih oleh testee. Dengan kata
lain, testee menyatakan ―blangko. Pernyataan blangko ini sering dikenal dengan istilah
omit dan biasa diberi lambang dengan huruf O. Sebagai tindak lanjut atas hasil penganalisaan
terhadap fungsi distraktor tersebut maka distraktor yang sudah dapat menjalankan fungsinya
dengan baik dapat dipakai lagi pada tes-tes yang akan datang, sedangkan distraktor yang
belum dapat berfungsi dengan baik sebaiknya diperbaiki atau diganti dengan distraktor yang
lain (Anas, 2011:408).
Contoh perhitungan:
Dari analisis sebuah item, polamya diketahui sebagai berikut:
Pilihan Jawaban A B C* D O Jumlah
Kelompok Atas 5 7 15 3 0 30
Kelompok Bawah 8 8 6 5 3 30
Jumlah 13 0 21 8 3 60
C diberi tanda (*) adalah kunci jawaban. Dari pola jawaban soal ini dapat dicari:
1) P = 21/60 = 0,35
2) D = PA– PB = 15/30 - 6/30 = 9/30 = 0,30
3) Distraktor : semua distraktornya sudah berfungsi dengan baik karena sudah dipilih oleh
lebih dari 5% pengikut tes.
4) Dilihat dari segi omit (kolom paling kanan) adalah baik. Sebuah item dikatakan baik jika
omitnya tidak lebih dari 10% pengikut tes.
[Type text] Page 24

(5% dari pengikut tes = 5% x 60 orang = 3 orang)
(10% dari pengikut tes = 10% x 60 orang = 6 orang)
Sebenarnya ketentuan ini hanya berlaku untuk tes pilihan ganda dengan 5 alternatif dan P =
0,80. Tetapi demi praktisnya diberlakukan semua.
[Type text] Page 25

BAB III
PENUTUP
Kesimpulan
Kegiatan analisis butir soal merupakan kegiatan penting dalam penyusunan soal agar
diperoleh butir soal yang bermutu. Analisis butir soal bertujuan untuk memperoleh kualitas
soal yang baik sehingga dapat memperoleh gambaran tentang prestasi siswa yang sebenarnya.
Macam-macam analisis butir soal yaitu analisis kualitatif dan analisis kuantitatif. Ada
beberapa cara melakukan analisis butir soal, yakni analisis tingkat kesukaran dan analisis
daya pembeda. Analisis tingkat kesukaran soal bertujuan untuk dapat membedakan soal-soal
katehori mudah, sedang, dan sukar. Sedangkan analisis daya pembeda mengkaji apakah soal
tersebut punya kemampuan dalam membedakan siswa yang termasuk ke dalam kategori yang
memiliki kemampuan tinggi dan kemampuan rendah. Manfaat kegiatan analisis butir soal
antara lain membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan,relevan
bagi penyusunan tes informal seperti tes yang disiapkan guru untuk siswa di
kelas,mendukung penulisan butir soal yang efektif,secara materi dapat memperbaiki tes di
kelas,meningkatkan validitas soal dan reliabilitas.
Dengan demikian, soal yang memiliki daya pembeda, jika diberikan kepada siswa
berkemampuan tinggi, hasilnya menunjukkan lebih tinggi daripada jika diberikan kepada
siswa yang berkemampuan rendah.
[Type text] Page 26

DAFTAR PUSTAKA
Kusaeri, 2014. Penilaian Proses dan Hasil Belajar Kurikulum 2013. Surabaya: AR-RUZZ
MEDIA
Yusuf, Muri.2015.Asesmen dan Evaluasi Pendidikan.Jakarta: Pranadamedia group.
Arifin, Zaenal. 2009. Evaluasi Pembelajaran. Bandung: PT. Remaja Rosda Karya.
Arikunto, Suharsimi.2006. Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi). Jakarta: Bumi

Aksara.
Purwanto, Ngalim. 2010. Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung: PT

Remaja Rosda Karya.
Sudijono, Anas. 1996. Pengantar Evaluasi Pendidikan. Jakarta: PT Raja Gravindo Persada.
Suprananto, Kusaen. 2012. Pengukuran dan Penilaian Pendidikan. Yogyakarta: Graha Ilmu.
[Type text] Page 27

Evaluasi

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Evaluasi

Uploaded by

Copyright:

Available Formats

BAB I

[Type text] Page 1

B. Manfaat Menelaah Butir Soal

[Type text] Page 2

[Type text] Page 3

D. Menelaah Soal secara Kualitatif

2) Prosedur menganalisa secara kualitatif

[Type text] Page 4

Mata Pelajaran : .................................

[Type text] Page 5

b) Format Penelaahan Butir Soal Bentuk Uraian

FORMAT PENELAAHAN BUTIR SOAL BENTUK URAIAN

Mata Pelajaran : .................................

[Type text] Page 6

7 yang sejenisnya disajikan dengan jelas dan

E. Menelaah Soal Secara Kuantitatif

[Type text] Page 7

[Type text] Page 8

Tabel 1. Jawaban Benar-Salah Dari Kelompok Atas

Tabel 2. Jawaban Benar-Salah Dari Kelompok Bawah

Berdasarkan kedua tabel di atas dapat dibuat tabel sebagai berikut:

[Type text] Page 9

Jadi, tingkat kesukaran tiap soal adalah sebagai berikut:

Adapun kriteria penafsiran tingkat kesukaran soal adalah:

Tabel 5. Klasifikasi Soal Berdasarkan Proporsi Tingkat Kesukarannya

[Type text] Page 10

b) Menghitung Tingkat Kesukaran Untuk Soal Bentuk Uraian

Contoh Analisis Soal

[Type text] Page 11

Jawaban Upper Lowwer

[Type text] Page 12

[Type text] Page 13

[Type text] Page 14

[Type text] Page 15

Indeks Diskriminasi Item Klasifikasi Interpretasi

[Type text] Page 16

[Type text] Page 17

Rumus Mencari D (Descrimination Power)

1) Contoh soal pembeda daya untuk soal objektif.

[Type text] Page 18

Mengelompokkan dalam kelas atas dan bawah

Tabel kelompok Bawah

b. Menuliskan atau memberi kode-kode terhadap hasil pengelompokan testee

[Type text] Page 19

c. Menghitung BA, BB, PA, PB, dan D untuk 10 butir soal

d. Memberikan Penafsiran (Interpretasi) Mengenai Kulitas Daya Pembeda Item Yang

[Type text] Page 20

2) Contoh soal pembeda daya untuk soal uraian singkat:

𝒎𝒆𝒂𝒏 𝒌𝒆𝒍𝒐𝒎𝒑𝒐𝒌 𝒔𝒌𝒐𝒓 𝒂𝒕𝒂𝒔 − 𝒎𝒆𝒂𝒏 𝒌𝒆𝒍𝒎𝒑𝒐𝒌 𝒃𝒂𝒘𝒂𝒉

[Type text] Page 21

[Type text] Page 22

3) Fungsi pengecoh (distracter function)

[Type text] Page 23

𝑱𝒖𝒎𝒍𝒂𝒉 𝒔𝒊𝒔𝒘𝒂 𝒚𝒂𝒏𝒈 𝒎𝒆𝒎𝒊𝒍𝒊𝒉 𝒐𝒑𝒕𝒊𝒐𝒏 𝒔𝒂𝒍𝒂𝒉

[Type text] Page 24

[Type text] Page 25

[Type text] Page 26

Yusuf, Muri.2015.Asesmen dan Evaluasi Pendidikan.Jakarta: Pranadamedia group.

Arikunto, Suharsimi.2006. Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi). Jakarta: Bumi

Purwanto, Ngalim. 2010. Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung: PT

[Type text] Page 27

You might also like