Professional Documents
Culture Documents
PENDAHULUAN
A. Latar Belakang
Tidak ada usaha guru yang lebih baik selain usaha untuk selalu meningkatkan mutu tes yang
disusunnya. Namun, hal ini tidak dilaksanakan karena kecenderungan seseorang untuk
beranggapan bahwa hasil karyanya adalah yang terbaik atau setidak-tidaknya sudah cukup baik.
Guru yang sudah berpengalaman, mengajar dan menyusun soal-soal tes, juga masih sukar
menyadari bahwa tesnya masih belum sempurna. Oleh karena itu, cara yang paling baik adalah
secara jujur melihat hasil yang diperoleh oleh siswa (Arikunto, 2010).
Menunurut Aiken (1994) dalam Suprananto (2012), kegiatan analisis butir soal merupakan
kegiatan penting dalam penyusunan soal agar diperoleh butir soal yang bermutu.Tujuan kegiatan
ini adalah mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum
digunakan, meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif,
serta mengetahui informasi diagnostik pada siswa apakah mereka telah memahami materi yang
telah diajarkan. Soal yang bermutu adalah soal dapat memberikan informasi setepat-tepatnya
tentang siswa mana yang telah menguasai meteri dan siswa yang belum menguasai materi.
Menurut Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal dapat
dilakukan secara kualitatif (berkenaan dengan isi dan bentuknya), dan kuantitatif (berkaitan
dengan ciri-ciri statistiknya). Analisis kualitatif mencakup pertimbangan validitas isi dan
konstruksi, sedangkan analisis kuantitatif mencakup pengukuran validilitas dan reliabilitas butir
soal, kesulitan butir soal, serta diskriminasi soal. Oleh karena itu, teknik terbaik adalah
menggunakan atau memadukan keduanya. Dalam makalah ini, akan dijelaskan secara rinci
mengenai analisis butir soal secara lengkap.
B. Rumusan Masalah
Berdasarkan latar belakang masalah di atas, dapat dirumuskan sebagai beikut:
1. Apakah pengertian dari menelaah butir soal?
2. Apa saja manfaat menelaah butir soal?
3. Apa Macam-macam tes obyektif?
3. Bagaimana cara menelaah soal secara kualitatif?
4. Bagaimana cara menelaah soal secara kuantitatif?
Nomor Soal
No. Aspek yang ditelaah 1 2 3 4 5 …
A. Materi
1 Soal sesuai dengan indikator (menuntut tes tertulis untuk
bentuk pilihan ganda
2. Materi yang ditanyakan sesuai dengan kompetensi
(urgensi, relevasi, kontinyuitas, keterpakaian sehari- hari
tinggi)
3. Pilihan jawaban homogen dan logis
4. Hanya ada satu kunci jawaban
B. Konstruksi
5. Pokok soal dirumuskan dengan singkat, jelas, dan tegas
6. Rumusan pokok soal dan pilihan jawaban merupakan
pernyataan yang diperlukan saja
7. Pokok soal tidak memberi petunjuk kunci jawaban Pokok
8 soal bebas dan pernyataan yang bersifat negatif ganda
Pilihan jawaban homogen dan logis ditinjau dari segi
9. materi
Gambar, grafik, tabel, diagram, atau sejenisnya
10. jelas dan berfungsi
Panjang pilihan jawaban relatif sama
11. Pilihan jawaban tidak menggunakan pernyataan "semua
12. jawaban di atas salah/benar" dan sejenisnya Pilihan
jawaban yang berbentuk angka/waktu disusun berdasarkan
13. urutan besar kecilnya angka atau kronologisnya
Butir soal tidak bergantung pada jawaban soal sebelumnya
C. Bahasa/Budaya
14. Menggunakan bahasa yang sesuai dengan kaidah bahasa
Indonesia
15. Menggunakan bahasa yang komunikatif
16. Tidak menggunakan bahasa yang berlaku setempat/tabu
18. Pilihan jawaban tidak mengulang kata/kelompok kata yang
sama, kecuali
Keterangan: Berilah t a n d amerupakan
( V ) bila satu
tidakkesatuan pengertian
sesuai dengan aspek yang ditelaah!
Nomor Soal
No. Aspek yang ditelaah 1 2 3 4 5 6 7 8 9 …
A. Materi
1 Soal sesuai dengan indikator (menuntut tes
tertulis untuk bentuk Uraian) Batasan
2 pertanyaan dan jawaban yang diharapkan
sudah sesuai
3 Materi yang ditanyakan sesuai dengan
kompetensi (urgensi, relevasi, kontinyuitas,
keterpakaian sehari- hari tinggi)
Isi materi yang ditanyakan sesuai dengan
4 jenjang jenis sekolah atau tingkat kelas
Konstruksi
Menggunakan kata tanya atau perintah yang
B menuntut jawaban uraian
5 Ada petunjuk yang jelas tentang cara
mengerjakan soal
6 Ada pedoman penskorannya
Tabel, gambar, grafik, peta, atau
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!
Teknik menelaah soal secara kuantitatif pada butir soal dapat dibagi menjadi 2, yaitu;
1) Tingkat Kesukaran Soal (Difficulty Index)
Menurut Arifin (2009) perhitungan tingkat kesukaran soal adalah pengukuran seberapa
besar derajat kesukaran suau soal. Jika suatu soal memiliki tingkat seimbang (proposional),
maka dapat dikatakan bahwa soal tersebut baik. Suatu soal tes hendaknya tidak terlalu sukar
dan tidak pula terlalu mudah.
a) Menghitung Tingkat Kesukaran Soal Bentuk Objektif
Untuk menghitung tingkat kesukaran soal bentuk obyektif dapat digunakan dengan cara,
yaitu: menggunakan rumus tingkat kesukaran (TK):
TK = (WL + WH )x 100 %
(nL + nH )
atau
𝒋𝒖𝒎𝒍𝒂𝒉 𝒔𝒊𝒔𝒘𝒂 𝒚𝒂𝒈 𝒎𝒆𝒏𝒋𝒂𝒘𝒂𝒃 𝒃𝒆𝒏𝒂𝒓 𝒃𝒖𝒕𝒊𝒓 𝒔𝒐𝒂𝒍
𝐓𝐢𝐧𝐠𝐤𝐚𝐭 𝐊𝐞𝐬𝐮𝐤𝐚𝐫𝐚𝐧 (𝐓𝐊) =
𝒋𝒖𝒎𝒍𝒂𝒉 𝒔𝒊𝒔𝒘𝒂 𝒚𝒂𝒏𝒈 𝒎𝒆𝒏𝒈𝒊𝒌𝒖𝒕𝒊 𝒕𝒆𝒔
Keterangan:
WL = jumlah peserta didik yang menjawab salah dari kelompok bawah
WH = jumlah peserta didik yang menjawab salah dari kelompok atas
nL = jumlah kelompok bawah
nH = jumlah kelompok atas
Sebelum menggunakan rumus di atas, harus diitempuh terlebih dahulu langkah-langkah
sebagai berikut:
a) Menyusun lembar jawaban peserta didik dari skor tertinggi sampai dengan skor terendah.
b) Mengambil 27% lembar jawaban dari atas yang selanjutnya disebut kelompok atas
(higher group), dan 27% lembar jawaban dari bawah yang selanjutnya disebut kelompok
bawah (lower group). Sisa sebanyak 46% disisihkan.
c) Membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap peserta didik,
baik untuk kelompok atas maupun kelopok bawah. Jika jawaban peserta didik benar
diberi tanda plus (+), sebaliknya jika jawaban peserta didik salah maka diberi simbol
minus (-).
Contoh:
TK = (1 + 1 )x 100 % = 20%
1) untuk soal nomor 1, (5 + 5)
TK = (2 + 1 )x 100 % = 30%
2) untuk soal nomor 2, (5 + 5 )
TK = (3 + 1 )x 100 % = 40%
3) untuk soal nomor 3, (5 + 5 )
TK = (2 + 1 )x 100 % = 30%
4) untuk soal nomor 4, (5 + 5 )
TK = (4 + 4 )x 100 % = 80%
5) untuk soal nomor 5, (5 + 5 )
Untuk memperoleh prestasi belajar yang baik, sebaiknya proporsi antara tingkat kesukaran
soal tersebar secara normal. Perhitungan proporsi tersebut dapat diatur sebagai berikut:
a) soal sukar 25%, soal sedang 50%, soal mudah 25%;
b) soal sukar 20%, soal sedang 60%, soal mudah 20%;
c) soal sukar 15%, soal sedang 70%, soal mudah 15%.
𝒎𝒆𝒂𝒏
𝐓𝐢𝐧𝐠𝐤𝐚𝐭 𝐊𝐞𝐬𝐮𝐤𝐚𝐚𝐧 (𝐓𝐊) =
𝑺𝒌𝒐𝒓 𝒎𝒂𝒌𝒔𝒊𝒎𝒖𝒎 𝒚𝒂𝒏𝒈 𝒅𝒊𝒕𝒆𝒕𝒂𝒑𝒌𝒂𝒏
Contoh:
33 orang peserta didik dites dengan lima soal bentuk uraian. Skor maksimum
ditentukan 10 dan skor minimum 0. Jumlah peserta didik yang memperoleh 0-5 = 10 orang
(berarti gagal), nilai 6 = 12 orang dan nilai 7-10 = 11 orang.
Tingkat kesukaran 30,3 % berada diantara 28%-72%, berarti soal tersebut termasuk sedang.
catatan batas lulus ideal = 6 (skala 0-10) (Arifin, 2009: 273).
Interpretasi:
Soal ini mudah karena semua (25) orang dari kelompok upper group dan 20 orang dari
lower group dapat menjawab soal ini dengan benar. Soal ini termasuk baik karena dapat
membedakan arah yang diinginkan: ternyata jawaban-jawaban yang salah terdapat pada
kelompok lower group. Dua atau tiga soal semacam ini baik digunakan sebagai permulaan
suatu tes (Purwanto, 2010).
Contoh 2
Dalam Sudijono, (1996) diberikan contoh sebagai berikut
Misalkan sebanyak 10 orang testee mengikuti tes hasil belajar tahap akhir dalam mata
pelajaran Aqidah-Akhlaq yang dituangkan dalam bentuk soal tes obyektif dengan menyajikan
Tabel Penyebaran Skor Jawaban 10 Testee Terhadap 10 Butir Item Dalam Tes Hasil Belajar
Mata Pelajaran Aqidah-Akhlaq
Skor Pada Soal Nomor
Testee
1 2 3 4 5 6 7 8 9 10
A 0 1 1 0 1 0 1 1 1 0
B 1 0 1 1 1 1 0 0 0 1
C 1 0 0 0 0 0 1 1 1 0
D 0 0 1 1 1 0 1 0 1 1
E 1 0 1 0 1 1 1 0 1 0
F 0 0 1 1 0 0 1 1 1 1
G 1 0 1 0 0 0 0 0 0 1
H 0 0 1 1 0 0 1 0 1 1
I 1 0 0 0 1 0 1 0 1 1
J 1 1 1 1 1 0 1 0 1 1
Jumlah
jawaban 6 2 8 5 6 2 8 3 8 7
benar
Tabel Perhitungan Indeks Kesukaran Item Hasil Jawaban 10 Testee Terhadap 10 Butir Item
Dalam Tes Hasil Belajar Mata Pelajaran Aqidah-Akhlaq
No
Indeks Kesukaran Item Interpretasi
Soal
1 𝐵 6 Sedang
P= = 10 0,60
𝐽𝑆
2 𝐵 2 Terlalu sukar
P = 𝐽𝑆 = 100,20
3 𝐵 8 Terlalu mudah
P= = 10 0,80
𝐽𝑆
4 𝐵 5 Sedang
P= = 10 0,50
𝐽𝑆
5 𝐵 6 Sedang
P= = 10 0,60
𝐽𝑆
7 𝐵 8 Terlalu mudah
P= = 10 0,80
𝐽𝑆
8 𝐵 3 Sedang
P= = 10 0,30
𝐽𝑆
9 𝐵 8 Terlalu mudah
P= = 0,80
𝐽𝑆 10
10 𝐵 7 Sedang
P= = 10 0,70
𝐽𝑆
Keterangan Rumus :
P = Proporsi = Angka Indeks Kesukaran Item
B = banyaknya testee yang dapat menjawab dengan benar
JS = jumlah testee yang mengikuti tes
Lebih lanjut menurut Sudijono, (1996) dari hasil analisis yang dilakukan terhadap 10
butir item tes hasil belajar tersebut dapat diketahui terdapat 5 soal dalam kategori baik
(sedang atau tidak terlalu sukar), 2 soal dalam kategori terlalu sukar, dan 3 soal dalam
kategori terlalu mudah. Dengan hasil analisis tersebut, maka tindak lanjut yang dapat
dilakukan oleh tester adalah
a. Untuk butir soal yang termasuk dalam kategori baik segera dicatat dan disimpan dalam
bank soal dan dapat digunakan kembali sewaktu-waktu untuk tes berikutnya.
b. Untuk butir soal yang dalam kategori terlalu sukar ada kemungkinan 3 hal yang bias
dilakukan yakni butir soal tersebut dibuang (tidak akan dikeluarkan lagi saat tes
selanjutnya), diteliti ulang dan ditelusuri factor yang menyebabkan soal tersebut sukar
dikerjakan oleh testee dan setelah dilakukan perbaikan dapat dikeluarkan lagi pada tes
selanjutnya, dapat digunakan dalam tes-tes yang membutuhkan seleksi ketat.
c. Untuk butir soal yang dalam kategori terlalu mudah ada kemungkinan 3 hal yang bias
dilakukan yakni butir soal tersebut dibuang (tidak akan dikeluarkan lagi saat tes
selanjutnya), diteliti ulang dan ditelusuri factor yang menyebabkan soal tersebut sukar
dikerjakan oleh testee dan setelah dilakukan perbaikan dapat dikeluarkan lagi pada tes
selanjutnya, dapat digunakan dalam tes-tes yang membutuhkan seleksi yang lebih
longgar.
Untuk mengetahui indeks manakah yang dapat menyatakan bahwa sebutir soal dapat
dikatakan sebagai butir soal yang memiliki daya pembeda yang baik, menurut Sudijono
(1996) dapat digunakan patokan sebagai berikut
Dalam Arikunto (2006) disebutkan bahwa seluruh pengikut tes (testee) dikelompikkan
menjadi 2 kelompok, yaitu kelompok pandai atau kelompok atas (upper group) dan
kelompok kurang pandai atau kelompok bawah (lower group).
Cara menentukan daya pembeda (D) dapat dilakukan dengan 2 cara yakni perlu
dibedakan antara kelompok kecil (<100) dan kelompok besar (>100).
a. Untuk kelompok kecil
Seluruh kelompok testee dibagi 2 sama besar, 50% kelompok atas dan 50% kelompok bawah.
Contoh:
Siswa Skor
A 9
B 8
kelompok atas (JA)
F 5
kelompok bawah (JB)
G 5
H 4
I 4
J 3
Seluruh testee dideretkan mulai dari skor teratas sampai terbawah, lalu dibagi menjadi dua.
b. Untuk kelompok besar
Mengingat biaya dan waktu menganalisis, maka untuk kelompok besar biasanya hanya
diambil kedua kutubnya saja yaitu 27% skor teratas (JA) dan 27% sebagai kelompok bawah
(JB).
Contoh:
Siswa Skor
A 9
B 9
C 8
D 8
27 %kelompok atas (Ja)
E 8
-
-
-
-
X 2
X 1
Dari hasil analisis tersebut maka dapat disimpulkan bahwa 60% (6 butir) dari 10 butir
soal bahasa arab yang diajukan dalam tes tersebut sudah memiliki daya pembeda yang baik,
sedangkan 40% (4 butir) masih tergolong belum memiliki daya pembeda seperti yang
diharapkan.
Setelah dilakukan tes pada 10 orang maka didapat hasil sebagai berikut :
No Nama Peserta Nomor Soal Skor
1 2 3 4 5 Total
1 Dewi Yuniasari 2 2,5 1 1 0 6,5
2 Nur Pra Utami 2 2,5 1 1 0 6,5
3 Rahmadina Dwi Febriani 1 2,5 0 1 0 4,5
4 Rahmadhanti 2 3 1 1 0 7
5 Sri Purwanti 2 3 0,5 1 0 6,5
6 Ummi Kalsum 2 2,5 1 1 0 6,5
7 Intan Buana 2 1,5 1 1 0 5,5
8 Juli Yani 2 2,5 1 1 0 6,5
9 Dwithia Can Yo Putri 2 3 1 1 0 7
10 Oktarina A 2 2,5 1 1 0 6,5
Untuk memudahkan perhitungan skor yang terdapat pada tabel di urutkan dari peserta tes
yang memperoleh skor yang tinggi menuju peserta yang memperoleh sekor yang rendah.
Keterangan :
Skor Siswa kelompok atas 6 – 10
Skor Siswa kelompok bawah 5 - 1
Jadi jumlah siswa kelompok atas ada 8 orang dan jumlah siswa kelompok bawah adalah 2
orang.
Daftar Daya Pembeda Butir Soal
No BA JA PA BB JB PB PA - PB S Kriteria
soal
1 16 8 2 3 2 1,5 0,50 2 0,25 Sedang
2 21,5 8 2,69 4 2 2 0,69 3 0,23 Sedang
3 7,5 8 0,94 1 2 0,5 0,44 1 0,44 Baik
4 8 8 1 2 2 1 0,00 2 0,00 Rendah
5 0 8 0 0 2 0 0,00 2 0,00 Rendah
Keterangan :
DP = Daya Pembeda
J = Jumlah Peserta Tes
JA = banyaknya peserta kelompok atas
Kriteria :
0,70 - 1,00 soal baik sekali (sangat baik)
0,40 - 0,69 soal baik(tinggi)
0,20 - 0,39 soal cukup (sedang)
0,19 - 0,00 soal rendah (kurang)
Kesimpulan:
Dari tabel dapat dilihat bahwa soal no 4 dan 5 tidak menunjukkan perbedaan antar
kelompok. Tidak adanya perbedaan tingkat kesukaran soal no 4 dan 5 juga menunjukkan
tidak ada perbedaan antar kelompok. Sedangkan Soal no 1, 2, dan 3 mempunyai indeks daya
pembeda yang baik. Setelah dianalisis, baik dari variable, reliabilitas, tingkat kesukaran dan
daya pembeda maka butir soal 1, 2, dan 3 dapat digunakan.
Fungsi pengecoh dimaksudkan untuk mengetahui seberapa besar peserta yang tidak
memiliki kunci jawaban (option) pada bentuk soal pilihan ganda. Untuk soal pilihan ganda,
alternatif jawaban menurut kaidah harus homogen dan logis sehingga setiap pilihan jawaban
(opition) dapat berfungsi atau ada yang memilih. Setiap pengecoh dapat dikatakan berfungsi
apabila ada yang memilih. Setiap pengecoh dapat dikatakan berfungsi apabila terpilih
Menganalisis fungsi distraktor sering dikenal dengan istilah lain, yaitu : menganalisis
pola penyebaran jawaban item. Adapun yang dimaksud dengan pola penyebaran jawaban item
adalah suatu pola yang dapat menggambarkan bagaimana testee menentukan
pilihan jawabnya terhadap kemungkinan-kemungkinan jawab yang telah dipasangkan pada
setiap butir item. Suatu kemungkinan dapat terjadi, yaitu bahwa dari keseluruhan alternatif
yang dipasang pada butir item tertentu, sama sekali tidak dipilih oleh testee. Dengan kata
lain, testee menyatakan ―blangko. Pernyataan blangko ini sering dikenal dengan istilah
omit dan biasa diberi lambang dengan huruf O. Sebagai tindak lanjut atas hasil penganalisaan
terhadap fungsi distraktor tersebut maka distraktor yang sudah dapat menjalankan fungsinya
dengan baik dapat dipakai lagi pada tes-tes yang akan datang, sedangkan distraktor yang
belum dapat berfungsi dengan baik sebaiknya diperbaiki atau diganti dengan distraktor yang
lain (Anas, 2011:408).
Contoh perhitungan:
Dari analisis sebuah item, polamya diketahui sebagai berikut:
Pilihan Jawaban A B C* D O Jumlah
Kelompok Atas 5 7 15 3 0 30
Kelompok Bawah 8 8 6 5 3 30
Jumlah 13 0 21 8 3 60
C diberi tanda (*) adalah kunci jawaban. Dari pola jawaban soal ini dapat dicari:
1) P = 21/60 = 0,35
2) D = PA– PB = 15/30 - 6/30 = 9/30 = 0,30
3) Distraktor : semua distraktornya sudah berfungsi dengan baik karena sudah dipilih oleh
lebih dari 5% pengikut tes.
4) Dilihat dari segi omit (kolom paling kanan) adalah baik. Sebuah item dikatakan baik jika
omitnya tidak lebih dari 10% pengikut tes.
Sebenarnya ketentuan ini hanya berlaku untuk tes pilihan ganda dengan 5 alternatif dan P =
0,80. Tetapi demi praktisnya diberlakukan semua.
Arifin, Zaenal. 2009. Evaluasi Pembelajaran. Bandung: PT. Remaja Rosda Karya.
Sudijono, Anas. 1996. Pengantar Evaluasi Pendidikan. Jakarta: PT Raja Gravindo Persada.
Suprananto, Kusaen. 2012. Pengukuran dan Penilaian Pendidikan. Yogyakarta: Graha Ilmu.