You are on page 1of 37

Melanjutkan postingan tentang Kedudukan Evaluasi Pendidikan dalam Pengajaran, pada

kesempatan kali ini, akan dibahas mengenai Evaluasi Pencapaian Belajar Siswa itu sendiri yang meliputi: bagaimana prinsip-prinsip dasar tes hasil belajar, macam-macam penilaian, dan langkah perencanaan apa saja yang diperlukan dalam menyusun suatu tes. Nah, Berikut pemaparannya: a. Prinsip-prinsip Dasar Tes Hasil Belajar Ada beberapa prinsip dasar yang perlu diperhatikan di dalam menyusun tes hasil belajar agar tes tersebut benar-benar dapat mengukur tujuan pelajaran. Ada pun prinsip-prinsip tersebut yaitu: 1. Tes tersebut dapat mengukur secara jelas hasil belajar (learning outcomes) yang telah ditetapkan sesuai denga tujuan instruksional 2. Mengukur sampel yang representatif dari hasil belajar dan bahan pelajaran yang telah diajarkan. 3. Mencakup bermacam-macam bentuk soal yang benar-benar cocok untuk mengukur hasil belajar yang diinginkan sesui dengan tujuan. 4. Di desain sesuai dengan kegunaannya untuk memperoleh hasil yang diinginkan. 5. Dibuat seandal (reliable) mungkin sehingga mudah dinterpretasikan dengan baik. 6. Digunakan untuk memperbaiki cara belajar siswa dan cara mengajar guru. b. Penilaian Formatif dan Penilaian Sumatif Penilaian formatif adalah kegiatan penilaian yang bertujuan untuk mencari umpan balik (feedback), yang selanjutnya hasil penilaian tersebut dapat digunakan untuk memperbaiki proses belajar mengajar yang sedang atau yang sudah dilaksanakan. Jadi, penilaian formatif tidak hanya dilakukan pada tiap akhir pelajaran, tetapi bisa juga ketika pelajaran sedang berlangsung. Penilaian Sumatif adalah penilaian yang dilakukan untuk memperoleh data atau informasi sampai di mana penguasaan atau pencapaian belajar siswa terhadap bahan pelajaran yang telah dipelajarinya selama jangka waktu tetentu. Adapun fungsi dan tujuannya adalah untuk menentukan apakah dengan nilai yang diperoleh, seorang siswa dapat dinyatakan lulus atau tidak lulus. c. Norm-Referenced VS Criterion-Referenced Tests Criterion-referenced tests (CRT) adalah tes yang dirancang untuk mengukur seperangkat tujuan yang eksplisit. Dengan kata lain, CRT adalah sekumpulan soal atau items yang secara langsung mengukur tingkah laku-tingkah laku yang dinyatakan didalam seperangkat tujuan behavioral atau performance objectives. Di dalam hubungannya dengan proses belajar mengajar, Dick dan Carey menyatakan adanya empat jenis CRT, yaitu: a. Entry-behaviors tests, diadakan sebelum suatu program pengajaran dilaksanakan. b. Pretest, diadakan sebelum pengajaran dimulai, dan bertujuan untuk mengetahui sampai dimana pengasaan siswa terhadap bahan pengjaran yang akan diajarkan. c. Post-test, diberikan pada setiap akhir program satuan pengajaran. d. Embedded test, dilaksanakan di sela-sela atau pada waktu-waktu tertentu selama proses pengjaran berlangsung. Penyusunan norm-referenced test (NRT) berbeda degan CRT. Soal-soal pada NRT tidak ditekankan untuk mengukur penampilan yang eksak dari behavioral objectives. Dengan kata lain, soal-soal pada NRT tidak semata didasarkan atas pengajaran yang diterima siswa atau atas keterampilan atau atas tingkah laku yang diidentifikasi sebagai sesuatu yang dianggap relevan

bagi balajar siswa. d. Perencanaan dalam Menyusun Tes (Langkah-langkah dalam menyusun tes) Ada pun langkah-langkahnya yaitu: 1. Menentukan atau merumuskan tujuan tes. 2. Mengidentifikasi hasil-hasil belajar (learning outcomes) yang akan diukur dengan tes itu. 3. Menentukan atau menendai hasil-hasil belajar yang spesifik 4. Merinci mata pelajaran atau bahan pelajaran yang akan diukur dengan tes itu. 5. Menyiapkan tabel spesifikasi (semacam blueprint). 6. Menggunakan tabel spesifikasi tersebut sebagai dasar penyusunan tes. Jadi dari penjabaran di atas, terlihat bahwa tes untuk mengukur hasil belajar siswa, memiliki prinsip-prinsip serta langkah-langkah perencanaan yang sistematis, tidak dapat disusun seenaknya saja tanpa memerhatikan rambu-rambu yang ada. Dengan adanya hal ini, diharapkan suatu tes benar-benar dapat menjadi instrumen yang dapat mengukur apa yang sebenarnya harus diukur. Nah, sekarang muncul suatu pertanyaan, bagaimanakah bentuk-bentuk tes tersebut?? Apakah mereka makhluk halus atau makhluk kasar??:) Untuk menjawab hal tersebut, dapat sobat baca nantinya di sini (Macam Bentuk Tes Hasil Belajar) Source: http://sataaswelputra.blogspot.com/2011/11/prinsip-jenis-penilaian-danprosedur.html#ixzz2KyGpkas3

1. Langkah-langkah Pelaksanaan Evaluasi Pembelajaran a. Menyusun rencana evaluasi hasil belajar Sebelum evaluasi hasil belajar dilaksanakan, harus disusun dulu perencanaannya secara baik dan matang. Perencanaan evaluasi hasil belajar itu umumnya mencakup enam jenis kegiatan, yaitu : Merumuskan tujuan dilaksanakannya evaluasi. Perumusan tujuan evaluasi hasil belajar itu penting sekali, sebab tanpa tujuan yang jelas maka evaluasi hasil belajar akan berjalan tanpa arah dan pada gilirannya dapat mengakibatkan evaluasi menjadi kehilangan arti dan fungsinya. Menetapkan aspek-aspek yang akan dievaluasi,misalnya apakah aspek kognitif,aspek afektif,ataukah aspek psikomotorik. Memilih dan menentukan tekhnik yang akan dipergunakan didalam pelaksanaan evaluasi itu akan dilaksanakan dengan teknik tes atau nontes. Menyusun alat-alat pengukur yang akan dipergunakan dalam pengukuran dan penilaian hasil belajar peserta didik,seperti butir soal tes hasil belajar. Menentukan tolok ukur,norma atau kriteria yang akan dijadikan pegangan atau patokan dalam memberikan interpretasi terhadap data hasil evaluasi. Menentukan frekuensi dari kegiatan evaluasi hasil belajar itu sendiri. b. Menghimpun data Dalam evaluasi hasil belajar, wujud nyata dari kegiatan menghimpun data adalah melaksanakan pengukuran misalnya,dengan menyelenggarakan tes hasil belajar (apabila hasil belajar itu menggunakan teknik tes),atau melakukan pengamatan.wawancara atau angket dengan menggunakan instrumen-instrumen tertentu berupa ranting scale, check list, interview guide atau questionnaire (apabila hasil evaluasi belajar itu menggunakan teknik nontes) c. Melakukan verifikasi data Data yang telah berhasil dihimpun harus disaring lebih dahulu sebelum diolah. Proses penyaringan itu dikenal dengan istilah penelitian data atau verifikasi data. Verifikasi data yang dimaksud untuk dapat memisahkan data yang baik (yaitu data yang akan dapat memperjelas gambaran yang akan diperoleh mengenai diri individu atau sekelompok individu yang sedang dievaluasi) dari dat yang kurang baik (yaitu data yang akan mengaburkan gambaran yang akan diperoleh apabila data itu ikut serta diolah).

d.

Mengolah dan menganalisis data Mengolah dan menganalisis hasil evaluasi dilakukan dengan maksud untuk memberikan makna terhadap data yang berhasil dihimpun dalam kegiatan evaluasi. Untuk keperluan itu maka data hasil evaluasi perlu disusun dan diatur sedemikian rupa sehingga dapat berbicara.

e. Memberi interpretasi dan menarik kesimpulan Penafsiran atau interpretasi terhadap data hasil evaluasi belajar pada hakikatnya adalah merupakan verbalisasi dari makna yang terkandung dalam data yang telah mengalami pengolahan dan penganalisisan itu. Atas dasar evaluasi terhadap data hasil evaluasi itu pada akhirnya dapat dikemukakan kesimpulan-kesimpulan tertentu. Kesimpulan-kesimpulan hasil evaluasi itu sudah barang tentu harus mengacu kepada tujuan dilakukannya evaluasi itu sendiri. f. Tindak lanjut hasil evaluasi Bertitik dari data hasil evaluasi yang telah disusun,diatur,diolah,dianalisis,dan disimpulkan sehingga dapat diketahui apa makna yang terkandung didalamnya maka pada akhirnya evaluator akan dapat mengambil keputusan atau merumuskan kebijakan-kebijakan yang di pandang perlu sebagai tindak lanjut dari kegiatan evaluasi tersebut. 2. Menyusun kisi-kisi soal Tujuan penyusunan kisi-kisi soal adalah merumuskan setepat mungkin ruang lingakup, tekanan, dan bagian-bagian tes sehingga perumusan tersebut dapat menjadi petunjuk yang efektif bagi sipenyusun tes (Sumadi Suryabrata, 1987 :7). Dalam penyusunan kisi-kisi soal disusun dalam tabel analisis ganda, sekurang-kurangnya terdiri dari dua aspek, yaitu : a. b. Aspek isi pengetahuan Aspek tujuan pendidikan, yang dirumuskan dalam TIK yang diformulasikan dari taksonomi Blooms. Analisis dari dua aspek ini diperoleh informasi mengenai rincian tingkat kompetensi, sehingga sebaran soal pada tiap pokok bahasan yang menunjang kompetensi tersebut dapat diperhitungkan secara merata. Dalam kisi-kisi soal ini, dapat dimasukkan dimasukkan pula tingkat kesukaran dan bentuk soal, dengan demikian, dalam satu-satu kisi-kisi tersebut informasi tentang presentase

soal yang memiliki tingkat kesukaran tertentu, variasi penggunaan jenis soal, sesuai dengan kompetensi dan tingkat kesukarannya. Selanjutnya masalah format kisi-kisi soal dapat berkembang sesuai dengan kreasi masing-masing pendidik, namun secara umum prinsip analisis ganda antara isi pengetahuan, aspek psikologik yang diukur dan variasi penggunaan soal baik tingkat kesukarannya maupun bentuk soalnya masih tetap ada. Contoh kisi-kisi soal bidang

a. Memilih tipe-tipe soal Dalam contoh kisi-kisi di atas, disajikan tipe soal khususnya tes objektif. Yang menjadi masalah adalah pertimbangan apakah yang digunakan untuk memilih tipe soal tersebut, untuk itu ada beberapa hal yang perlu diperhatikan yakni: 1. Kesesuaian antara tipe soal dengan tujuan evaluasi 2. Kesesuaian antara tipe soal dengan tujuan evaluasi 3. Kesesuaian antara tipe soal dengan skoring 4. Kesesuaian antara tipe soal dengan pengolahan hasil evaluasi 5. Kesesuaian antara tipe soal dengan pengolahan hasil evaluasi 6. Kesesuaian antara tipe soal dengan administrasi tes yaitu penyelenggaraan dan pelaksanaan tes 7. Kesesuaian antara tipe soal dengan dana dan kepraktisan Tipe sosial harus disesuaikan dengan penyelenggaraan evaluasi, masalah waktu, tempat, sistem penyelenggaraan, banyak sedikitnya peserta, siapa saja yang akan mengolah hasil evaluasi tersebut, masalah dana yang disediakan untuk mencetak soal serta pertimbangan kepraktisan seperti kemungkinan soal akan dipakai berkali-kali atau sekali pakai b. Merencanakan taraf kesukaran Satu hal yang harus diperhitungkan oleh perancang tes adalah mempertimbangkan taraf kesukaran soal. Faktoe yang perlu dipertimbangkan berkaitana dengan tingkat kesukaran butir soal adalah acuan yang digunakan oleh pendidik untuk menentukan keberhasilan belajar/

evaluasi, bila pendidikan mempunyai patokan maka tingkat kesukaran soal hendaknya dibuat dalam radius di sekitar daerah rata-rata.

3. Aspek-aspek yang Dinilai Dari Pembelajaran (Domain Pembelajaran) Kurikulum 2004 merupakan kurikulum berbasis kompetensi yang tidak semata-mata meningkatkan pengetahuan peserta didik, tetapi kompetensi secara utuh yang merefleksikan ketiga domain pengajaran yaitu Kognitif, Afektif dan Psikomotor sesuai dengan karakteristik masing-masing mata pelajaran. Hasil yang diharapkan dari peserta didik sesuai dengan standar kompetensi dan kompetensi dasar yang meliputi ketiga domain tersebut. A. Kognitif Kegiatan kognitif adalah kegiatan yang mencakup mental (otak). Menurut Bunjamin S. blom segala upaya yang menyangkut aktivitas otak adalah termasuk dalam ranah kognitif. Dalam ranah kognitif terdapat enam jenjang proses berpikir, mulai dari jenjang terendah sampai dnegan jenjang yang paling tinggi. Keenam jenjang tersebut adalah: 1. Pengetahuan (Knowledge), yaitu kemampuan seseorang untuk mengingat-ingat kembali (recall) atau mengenali kembali tentang nama, istilah, ide, gejala, rumus-rumus dan sebagainya tanpa mengharapkan kemampuan untuk menggunakannya. Salah satu contoh hasil belajar kognitif pada jenjang pengetahuan adalah peserta didik disuruh menghafal surat-surat pendek dalam Alquran, menterjemahkannya dan menuliskan dengan baik dan benar dalam pembelajaranb agama di sekolah. Kemampuan untuk mengingat ini ada 11 jenis yaitu: (1) mengingat hal-hal yang bersifat khusus seperti informasi, symbol-simbol konkrit, (2) mengingat istilah-istilah baik yang bersifat verbal maupun non verbal, (3) mengingat fakta seperti tempat, nama, tanggal,dan lain-lain (4) mengingat suatu pengertian, batasan, defenisi dan lain-lain (5) mengingat urutan suatu peristiwa atau proses (6) mengingat klasifikasi atau kategori (7) mengingat kriteria suatu fakta (8) mengingat suatu prosedur dan metode tertentu, teknik tertentu dalam memulai sesuatu (9) mengingat klasifikasi atau kategori (10) mengingat suatu prinsip dan generalisasi (11) mengingat teori dan bentuk. Ciri-cirinya: Jenjang belajar terendah Kemampuan mengingat fakta-fakta

Kemampuan menghafalkan rumus, definisi, prinsip, prosedur Dapat mendiskripsiskan 2. Pemahaman (comprehensiona), adalah kemampuan seseorang untuk mengerti atau memahami sesuatu setelah sesuatu itu diketahui dan diingat. Dengan kata lain memahami adalah mengetahui tentang sesuatu dan dapat melihatnya dari berbagai segi. Salah satu contoh hasil belajar kognitif pada jenjang pemahaman ini adalah peserta didik diminta untuk menjelaskan suatu makna mislanya makna "musyawarah", ada tiga tingkat pemahaman yaitu: a. c. Pemahaman terjemah Pemahaman yang ekstrapolasi Ciri-cirinya: Mampu menerjemahkan Mampu menafsirkan,mendiskripsikan secara verbal Pemahaman eksrtapolasi Mampu membuat estimasi 3. Penerapan atau aplikasi (application) kesanggupan seseorang untuk menerapkan atau menggunakan ide-ide umum, tata cara ataupun metode-metode, prinsip-prinsip, rumus-rumus, teori-teori dan sebagainya dalam situsi yang baru dan konkrit, aplikasi atau penerapan ini merupakan proses berpikir setingkat lebih tinggi dari pada pemahaman. Sebagai contoh, peserta didik mampu memikirkan tentang penerapan konsep kedisiplinan kehidupan sehari-hari, baik dalam lingkungan keluarga, sekolah dan masyarakat. Ciri-cirinya: Kemampuan menerapkan materi pelajaran dalam situasi baru Kemampuan menetapkan prinsip atau generalisasi pada situasi baru Dapat menyusun problema-problema sehingga dapat menetapkan generalisasi Dapat mengenali hal-hal yang menyimpang dari prinsip dan generalisasi Dapat mengenali fenomena baru dari prinsip dan generalisasi Dapat meramalkan sesuatu yang akan terjadi berdasarkan prinsip dan generalisasi Dapat menentukan tindakan tertentu berdasarkan prinsip dan generalisasi Dapat menjelaskan alasan penggunaan prinsip dan generalisasi b. Pemahaman penafsiran

4.

Analisis (analysis) adalah kemampuan seseorang untuk merinci atau menguraikan suatu bahan atau keadaan menurut bagian-bagian yang lebih kecil dan mampu memahami hubungan di antara bagian-bagian atau factor-faktor yang satu dengan factor-faktor lainnya. Jenjang analisa adalah setingkat lebih tinggi ketimbang jenjang aplikasi. Contohnya peserta didik dapat merenung dan memikirkan dengan baik tentang wujud nyata dari kedisiplinan seseorang siswa di rumah, di sekolah dan dalam kehidupan sehari-hari, di tengah-tengah masyarakat. Ciri-cirinya:

Dapat memisah-misahkan suatu integritas menjadi unsur-unsur,menghubungkan antar unsur,dan mengorganisasikan prinsip-prinsip Dapat mengklasifikasikan prinsip-prinsip Dapat meramalkan sifat-sifat khusus tertentu Meramalkan kualitas/kondisi Mengetengahkan pola dan prinsip-prinsip organisasi materi yang dihadapi Meramalkan dasar sudut pandangan atau kerangka acuan dari materi 5. Sintesis (syntesis) adalah suatu proses yang memadukan bagian-bagian atau unsure-unsur secara logis, sehingga menjelma menjadi suatu pola yang berstruktur atau membentuk pola baru. Jenjang sintesis kedudukannya lebih tinggi dari analisa. Contohnya yaitu peserta didik dapat menulis karangan tentang pentingnya kedisiplinan sebagaimana telah diajarkan oleh agama. Ciri-cirinya: Menyatukan unsure-unsur,atau bagian bagian menjadi satu keseluruhan Dapat menemukan hubungan yang unik Dapat merencanakan langkah yang konkrit Dapat mengabstraksikan suatu gejala,hipotesa,hasil penelitian,dan sebagainya. 6. Penilaian/ penghargaan/ evaluasi (evaluation) merupakan kemampuan seseorang untuk membuat pertimbangan terhadap sesuatu situasi, nilai atau ide. Penilaian atau evaluasi di sini merupakan kemampuan seseorang untuk membuat pertimbangan terhadap sesuatu situasi, nilai atau ide, misalnya jika seseorang dihadapkan pada beberapa pilihan maka ia akan mampu memilih satu pilihan yang terbaik, sesuai dengan patokan-patokan kriteria yang ada. Seperti peserta didik mampu menimbang-nimbang tentang manfaat yang dapat dipetik oleh seseorang yang berlaku disiplin dan dapat menunjukkan mudharat yang akan menimpa sesoerang yang

bersifat malas atau tidak disiplin sehingga pada akhirnya kedsiplinan merupakan perintah Allah SWT yangw ajib dilaksanakan dalam kehidupan sehari-hari. Untuk lebih jelasnya keenam jenjang berpikir pada kognitif ini dapat dilihat melalui gambar di bawah ini

B. Afektif Ranah afektif adalah ranah yang berkaitan dengan sikap dan nilai. Beberapa pakar mengatakan bahwa sikap seseorang dapat diramalkan perubahannya bila seseorang telah memiliki penguasaan kognitif tingkat tinggi. Menurut Krathwohl (1974) dan kawan-kawan ditaksonomi menjadi lebih rinci lagi ke dalam lima jenjang yaitu: 2. Pengenalan/ Penerimaan (Receiving) Adalah kepekaan seseorang dalam menerima rangsangan (stimulus) dari luar yang dating kepada dirinya dalam bentuk masalah, situasi, gejala dan lain-

lain. Contoh hasil belajar afektif jenjang ini adalah anak menyadari bahwa disiplin wajib ditegakkan, sifat malas harus dibuang jauh-jauh. 3. Pemberian respon (Responding) yaitu kemampuan yang dimiliki oleh seseorang untuk mengikut sertakan dirinya secara aktif dalam fenomena tertentu dan membuat reaksi terhadapnya dengan salah satu cara. Contoh hasil belajar ranah efektif jenjang ini adalah peserta didik tumbuh hasratnya untuk mempelajari lebih jauh ajaran-ajaran islam tentang kedisiplinan. 4. Penghargaan Terhadap Nilai(Valuing), Penghargaan terhadap suatu nilai merupakan perasaan, keyakinan atau anggapan bahwa suatu gagasan, benda atau cara berfikir tertentu mempunyai nilai.dalam hal ini anak secara konsisten berprilaku sesuai dengan suatu nilai meskipun tidak ada pihak lain yang meminta atau yang mengharuska 5. Pengorganisasian (organization). Pengorganisasian menunjukkan saling keterhubungan antara nilai-nilai tertentu dlam suatu system nilai, serta menentukan nilai mana yang mempunyai prioritas lebih tinggi dari pada nilai yang lain. Dalam hal ini diharapkan menjadi commited terhadap suatu sistem nilai. Dalam hal ini peserta didik diharapkan untuk mengorganisasikan berbagai nilai yang dipilihnya kedalam sutu nilai tersebut. Contoh hasil belajar jenjang ini adalah anak telah memiliki pengetauhan tentang pengetahuan secara umum itu penting sekali, tapi ia juga beranggapan pengetahuan tentang IPTEK sangat penting, tetapi tidak lebih penting dari pada pengetahuan tentang kemanusian, sebab seharusnya pengetahuan kemanusiaan akan memberi pedoman dan control terhadap perkembangan IPTEK 6. Pengamalan (characterization). Jenjang ini merupakan keterpaduan semua sistem nilai yang telah dimiliki sesorang yang mempengaruhi pola kepribadian dan tingkah-lakunya. Disini proses internalisasi nilai teleh menempati tempat tertinggi dala suatu hirarki nilai. Nilai itu telah tertanam secara konsisten pada sitemnya dan telah mempengaruhi emasinya. Ini adalah merupakan tingkatan afektif tertinggi karena sikap batin peserta didik telah benar-benar bijaksana ia telah memiliki philosophy of life yang mapan. Jadi pada jenjang ini peserta didik telah memiliki sitem nilai yang mengontrol tingkah lakunya untuk suatu waktu yang cukup lama, sehingga membentuk karakteristik pola hidup tingkah lakunya menetap, konsisten dan dapat diramalkan C. Psikomotor

Ranah ini dikembangkan oleh Harrow 1972 yang mengatkan hasil belajar dalam bentuk ini tampak dalam bentuk ketermpilan (skill) dan kemampuan bertindak individu. Hasil belajar psikomotor ini sebenarnya merupakan kelanjutan dari hasil belajar afektif. Hasil belajar kognitif dan hasil belajar afektif menjadi hasil belajar psikomotor apabila peserta didik menunjukan perilaku atau perbuatan sesuai dengan makna yang terkandung dalam ranah kognitif dan ranah afektif. Pada ranah ini Harrow juga menyususn psikomotor secara hierakhis dalam enam tingkat, mencaakup tingkat meniru sebagai yang paling sederhana dan naturalisasi sebagai yang paling kompleks. Prilaku psikomotor menekankan pada keterampilan 1. Gerakan refleks (reflex movement) Artinya adalah gerkan refleks merupakan dasar semua prilaku bergerak respon terhadap stimulus tanpa disadari yang dimiliki sejak lahir. Kesemuanya berhubungna dengan gerakangeakan yang dikoordinasikan oleh otak dan bahgian sum-sum tulang belakang. Contoh hasil belajar tingkat ini adalah melompat, berjalan, menunduk, menggerakan leher dan kepala, memegang dan lain-lain. 2. Gerakan dasar (basic fundamental movement) Artinya adalah gerkan yang menuntut keterampilan yang sifatnya lebih kompleks dengan kat lain gerkan ini muncul tanpa latihan tapi dapt diperhalus melalui praktek dan gerkan ini terpola dan dapat ditebak. Contoh hasil belajar pada tingkat ini adalah gerakan berpindah seperti merangkak, maju perlahan lahan, bejalan, berlari-lari, melompat-lompat, memanjat. Gerakan manipulasi seperti menyusun balok-balok, menggunting, menggambar dengan krayon, ketrampilan gerak tangan dan jari seperti memainkan bola, menggambar. 3. Gerakan persepsi (perceptual Abilities) Artinya kombinasi dari kemampuan kognitif dan gerkan. Contohnya adalah menangkap bola, melompat dari suatu petak ke petak lain dengna satu kaki dengan menjaga keseimbangan badan, membedakan suara dari berbagai burung bintang dan sebaginya. 4. Gerakan kemampuan fisik (psycal abilites) Artinya adalah kemampuan yang diperlukan unutk mengembnagkan gerkan keterampilan tingkat tinggi, kemapuan untuk melanjutkan aktifitas, termasuk ketahanan otot dan denyut jantung, kempuan utuk menggunakan otot dan mengadakan perlawanan, rentangan gerkan sendi, dan kempuan untk bergerak cepat termasuk kemapuan untuk merubah arah, memulai atau neoro-mascular yaitu keterampilan yang bersangkutan dengan gerakan otot. Keenam tingkat tersebut adalah :

berhenti, mengurangi waktu senggang antara reaksi dan respon dan meningkatkan ketangkasan. Contoh kegiatan belajar seperti berlari jauh, melakukan senam, menari melakukan push up dan lainp-lain. 5. Gerakan teramapil (Skilled movements) Artinya gerkan yang memerlukan belajar, misalnya keterampilan dalam menari, olah raga. Garakan yang dapat mengopntrol berbagi tingkatan gerak, terampil, tangkas, cekatan dalam mel;aukakn gerkan yang sulit dan rumit. Contoh kegiatn dan hasil belajarnya seperti; melakukan gerakan terampil dari berbagai cabang olah raga, bermain piano, mengetik, membuat kerajiana tangan dan sebaginya. 6. Gerakan Indah dan kreatif (Nondiscursive Comunication) Artinya mengkomonikasikan perasaan melalui gerakn, gerak estetis, gerkan-gerkan terampil yang efisien dan indah, gerak kreatif; gerkan-gerkan pada tingkat tertinggi untuk mengkomonikasikan gerakan seperti; kerja senio yang bermutu; membuat patung dan melukis, menari balett, dan bermain drama.

A.KONSEP DASAR EVALUASI PEMBELAJARAN 1.Pengertian Evaluasi Pembelajaran Evaluasi dapat diartikan sebagai suatu kegiatan yang terencana untuk mengetahui keadaan suatu objek dengan menggunakan instrumen dan hasilnya dibandingkan dengan suatu tolak ukur untuk memperoleh suatu kesimpulan. Fungsi utama evaluasi adalah menelaah suatu objek atau keadaan untuk mendapatkan informasi yang tepat sebagai dasar untuk pengambilan keputusan Sesuai pendapat Grondlund dan Linn (1990) mengatakan bahwa evaluasi pembelajaran adalah suatu proses mengumpulkan, menganalisis dan menginterpretasi informasi secaras sistematik untuk menetapkan sejauh mana ketercapaian tujuan pembelajaran. Sehingga dapat disimpulkan bahwa evaluasi adalah proses mendeskripsikan, mengumpulkan dan menyajikan suatu informasi yang bermanfaat untuk pertimbangan dalam pengambilan keputusan. Evaluasi pembelajaran merupakan evaluasi dalam bidang pembelajaran. Untuk memeperoleh informasi yang tepat dalam kegiatan evaluasi dilakukan melalui kegiatan pengukuran. Pengukuran merupakan suatu proses pemberian skor atau angka-angka terhadap suatu keadaan atau gejala berdasarkan atura-aturan tertentu. Dengan demikian terdapat kaitan yang erat antara pengukuran (measurment) dan evaluasi (evaluation). Kegiatan pengukuran merupakan dasar dalam kegiatan evaluasi. 2.Tujuan dan Fungsi Evaluasi Pembelajaran Tujuan utama evaluasi pembelajaran adalah untuk menghimpun informasi yang dijadikan dasar untuk mengetahui taraf kemajuan, taraf perkembangan, atau taraf pencapaian kegiatan belajar siswa. Tujuan khusus evaluasi pembelajaran adalah : 1.Mengetahui kemajuan belajar siswa 2.Mengetahui potensi yang dimiliki siswa 3.Mengetahui hasil belajar siswa 4.Mengadakan seleksi 5.Mengetahui kelemahan atau kesulitan belajar siswa 6.Memberi bantuan dalam pengelompokan siswa 7.Memberikan bantuan dalam pemilihan jurursan 8.Memberikan bantuan dalam kegiatan belajar siswa 9. Memberikan motivasi belajar 10.Mengetahui efektifitas mengajar guru 11.Mengetahui efisiensi mengajar guru 12.Memberikan balikan pada guru 13.Memberikan bukti untuk laporan kepada orang tua atau masyarakat 14.Memberikan data untuk penelitian dan pengembangan pembelajaran Jenis-jenis Evaluasi Pembelajaran

a.Jenis evaluasi berdasarkan tujuan dibedakan atas lima jenis evaluasi : 1.Evaluasi Diagnostik Evaluasi diagnostik adalah evaluasi yang ditujukan untuk menelaah kelemahankelemahan siswa beserta faktor-faktor penyebabnya. 2.Evaluasi Selektif Evaluasi selektif adalah evaluasi yang digunakan untuk memilih siwa yang paling tepat sesuai dengan kriteria program kegiatan tertentu. 3.Evaluasi Penempatan Evaluasi penempatan adalah evaluasi yang digunakan untuk menempatkan siswa dalam program pendidikan tertentu yang sesuai dengan karakteristik siswa. 4.Evaluasi Formatif Evaluasi formatif adalah evaluasi yang dilaksanakan untuk memperbaiki dan meningkatan proses belajar dan mengajar.

5.Evaluasi Sumatif Evaluasi sumatif adalah evaluasi yang dilakukan untuk menentukan hasil dan kemajuan belajar siswa. Jenis evaluasi berdasarkan sasaran : 1.Evaluasi Konteks Evaluasi yang ditujukan untuk mengukur konteks program baik mengenai rasional tujuan, latar belakang program, maupun kebutuhan-kebutuhan yang muncul dalam perencanaan. 2.Evaluasi Input Evaluasi yang diarahkan untuk mengetahui input baik sumber daya maupun strategi yang digunakan untuk mencapai tujuan. 3.Evaluasi Proses Evaluasi yang ditujukan untuk melihat proses pelaksanaan, baik mengenai kalancaran proses, kesesuaian dengan rencana, faktor pendukung dan faktor hambatan yang muncul dalam proses pelaksanaan, dan sejenisnya. 4.Evaluasi Hasil atau Produk Evaluasi yang diarahkan untuk melihat hasil program yang dicapai sebagai dasar untuk menentukan keputusan akhir, diperbaiki, dimodifikasi, ditingkatkan atau dihentikan. 5.Evaluasi Outcom atau Lulusan Evaluasi yang diarahkan untuk melihat hasil belajar siswa lebih lanjut, yakni evaluasi lulusan setelah terjun ke masyarakat. Jenis evalusi berdasarkan lingkup kegiatan pembelajaran : 1.Evaluasi Program Pembelajaran Evaluasi yang mencakup terhadap tujuan pembelajaran, isi program pembelajaran, strategi belajar mengajar, aspe-aspek program pembelajaran yang lain. 2.Evaluasi Proses Pembelajaran Evaluasi yang mencakup kesesuaian antara peoses pembelajaran dengan garisgaris besar program pembelajaran yang di tetapkan, kemampuan guru dalam

melaksanakan proses pembelajaran, kemampuan siswa dalam mengikuti proses pembelajaran.

3.Evaluasi Hasil Pembelajaran Evaluasi hasil belajar mencakup tingkat penguasaan siswa terhadap tujuan pembelajaran yang ditetapkan, baik umum maupun khusus, ditinjau dalam aspek kognitif, afektif, psikomotorik. Jenis evaluasi berdasarkan objek dan subjek evaluasi Berdasarkan objek : 1.Evaluasi Input Evaluasi terhadap siswa mencakup kemampuan kepribadian, sikap, keyakinan. 2.Evaluasi Transformasi Evaluasi terhadap unsur-unsur transformasi proses pembelajaran anatara lain materi, media, metode dan lain-lain. 3.Evaluasi Output Evaluasi terhadap lulusan yang mengacu pada ketercapaian hasil pembelajaran. Berdasarkan subjek : 1.Evaluasi Internal Evaluasi yang dilakukan oleh orang dalam sekolah sebagai evaluator, misalnya guru. 2.Evaluasi Eksternal Evaluasi yang dilakukan oleh orang luar sekolah sebagai evaluator, misalnya orangtua, masyarakat. Evaluasi pembelajaran mencakup kegiatan pengukuran dan penilaian. Proses evaluasi dilakukan melalui tiga tahap yaitu tahap perencanaan, pelaksanaan, pengolahan hasil dan pelaporan. B.TEKNIK PENGUMPULAN DATA Teknik pengumpulan data dalam evaluasi pembelajaran dapat diklasifikasikan menjadi dua, yaitu teknik tes dan non tes. Tes adalah seperangkat pertanyaan atau tugas yang diberikan kepada siswa untuk mengumpulkan informasi tentang kemampuan, penguasaan atau aspek-aspek lain yang sejenis. Tes bisa dibedakan menjadi beberapa macam. Ada beberapa jenis tes ditinjau dari beberapa segi. Jenisjenis tes tersebut dapat diklasifikasi sebaga berikut : 1.Berdasarkan aspek kepribadian yang di ukur, tes dibedakan atas : a.Tes Prestasi (Achievement Test) b.Tes Intelegensi (Intelligence Test) c.Tes Bakat (Aptitude Test) d.Tes Minat (Interset Test) e.Tes Sikap (Attitude Test) f.Tes Fisik (Physico Test) g.Tes Kepribadian (Psyco Test) 2.Berdasarkan scop sasaran yang di ukur, tes dibedakan atas :

a.Tes Performansi Maksimum (Maximum Performance Test) b.Tes Performansi Khusus (Critycal Performance Test) 3.Berdasarkan tujuan evaluasinya, tes dibedakan atas : a.Tes Diagnostik (Diagnostic Test) b.Tes Penempatan (Placement Test) c.Tes Seleksi (Selection Test) d.Tes Formatif (Formative Test) e.Tes Sumatif (Sumative Test) 4.Berdasarkan penekanan aspek yang diukur, tes dibedakan atas : a.Tes Diagnostik (Diagnostic Test) b.Ter Prognostik (Prognostic Test) c.Tes Kecepatan (Speed Test) d.Tes Kekuatan (Power Test) 5.Berdasarkan cara pembuatannya, tes dibedakan atas : a.Ter Terstandar (Standartzed Test) b.Tes Tak Terstandar (Unstandartzed Test) 6.Berdasarkan cara mengerjakannya, tes dibedakan atas : a.Ter Tertulis (Written Test) b.Tes Lisan (Oral Test) c.Tes Perbuatan (Performance Test) 7.Berdasarkan jumlah testee yang mengerjakannya, tes dibedakan atas : a.Tes Individual (Individual Test) b.Tes Kelompok (Claasical Test) 8.Berdasarkan waktu penyelenggaraannya, tes dibedakan atas : a.Tes Terjadwal (Reguler Test) b.Tes Tak Terjadwal (Irreguler Test) 9.Berdasarkan cara interpretasinya, tes dibedakan atas : a.Tes Acuan Patokan (Criterion Referended Test) b.Tes Acuan Kelompok (Norm Referended Test) 10.Berdasarkan bentuknya, tes dibedakan atas : a.Tes Subjektif 1)Tes Essai Bebas (Expended Respond Essay) 2)Tes Essai Terbatas (Restricted Respond Essay) b.Tes objektif 1)Tes Benar Salah (True False Test) 2)Tes Menjodohkan (Matching Test) 3)Tes Pilihan Ganda (Multiple Choice Test) 4)Tes Melengkapi (Completion Test) 5)Tes Jawaban Singkat (Short Answer Test) Teknik non tes adalah teknik pengumpulan data yang menggunakan instrumen non tes sebagai alat pengumpul data. Teknik non tes bisa dibedakan menjadi beberapa macam, antara lain oservasi, wawancara, kuesioner, lembar inventori, sosiometri, anekdotal record dan daftar pribadi.

C.PENGEMBANGAN INSTRUMEN PENGUMPULAN DATA Penyusunan tes dilakukan melalui tiga tahap, yaitu perencanaan tes, penulisan tes dan analisis tes. Perencanaan tes dilakukan dengan langkah-langkah : 1.Menetapkan tujuan tes 2.Menetapkan hasil belajar yang akan diukur 3.Mempersiapkan tabel spesifikasi 4.Menetapkan isi materi tes 5.Menetapkan butir tes 6.Menyiapkan norma aturan 7.Mempersiapkan kunci scoring Penyusunan tes, dilihat dari tiga sisi, yaitu ketetapan isi materi, ketetapan konstruksi tes dan ketetapan penggunaan bahasa. Prinsip ini berlaku baik untuk penyusunan tes objektif maupun subjektif. Tes objektif dibedakan atas tes jawaban singkat, tes melengkapi, tes benar salah, tes menjodohkan, tes pilihan ganda dan interpretative exercises. Tes subjektif dibedakan atas essai jawaban terbatas dan jawaban bebas. Sedangkan penyusunan instrumen non tes dilakukan melalui tahaptahap : 1.Mengembangkan spesifikasi alat ukur 2.Menyusun pernyataan atau pertanyaan 3.Menelaah pernyataan atau pertanyaan 4.Menyusun atau merangkit instrumen 5.Melakukan uji coba dan analisis instrumen 6.Menyeleksi, merevisi dan merakit instrumen 7.Menyusun bentuk akhir instrumen 8.Menyusun skala dan norma (kelengkapan instrumen)

D.ANALISIS INSTRUMEN PENGUMPULAN DATA Untuk memperoleh instrumen yang baik, selain disusun dengan baik, juga perlu diuji coba dan dianalisis secara empirik di lapangan. Secara umum, ada empat persyaratan yang harus dipenuhi suatu tes, yaitu validitas, reabilitas, tingkat kesukaran dan daya beda. Validitas di definisikan sebagai ukuran seberapa cermat suatu instrumen melakukan fungsinya. Ada beberapa macam validitas. Secara umum, validitas instrumen, khususnya tes, dapat diklasifikasikan menjadi 3 yaitu : 1)Validitas Isi (Content Validity) 2)Validitas Konstruk (Construct Validity) 3)Validitas Kriteria (Criterion Related Validity) Selain memenuhi persyaratan validitas, suatu instrumen, khususnya tes yang baik, juga harus memenhuhi persyaratan realibilitas. Suatu tes dapat dikatan reliabel, bila memiliki nilai konsistensi yang tinggi. Ada beberapa teknik/formula perhitungan yang bisa digunakan untuk mengukur reliabilitas. Jenisjenis formula tersebut, antara lain meliputi : 1)Formula Spearman Brown

2)Formula Flanagan 3)Formula Rulon 4)Formula Kriffton 5)Formula Kuder Richardson 6)Formula Hoyt 7)Formula Alpha Cronbach 8)Formula Mosier Dalam melihat baik tidaknya instrumen tes, selain ditinjau dari segi validitas dan reliabilitasnya, dua kriteria penting lainnya yang perlu diuji adalah tingkat kesukaran dan daya beda pada butir soal. Kedua parameter tersebut dihitung secara terpisah, namun keduanya merupakan kesatuan komponen yang menentukan baik tidaknya butir soal. Tingkat kesukaran (difficulty index) berhubungan dengan banyaknya testee (siswa) yang bisa menjawab dengan benar suatu butir soal tes. Selain tingkat kesukaran, aspek lain yang perlu dilihat pada butir soal tes adalah kemampuan daya beda (discriminatory index). Suatu butir soal tes dikatakan baik, bila soal tersebut mampu membedakan siswa yang pandai dan yang kurang. Untuk menguji instrumen tes ada dua pendekatan yang bisa digunakan, yaitu pendekatan teori tes klasik dan teori responbutir. Pendekatan teori tes klasik lebih menekankan pada analisis tes secara keseluruhan. Sedangkan pendekatan teori responbutir lebih menekankan pada karakteristik butir soal.

E.PELAKSANAAN EVALUASI PEMBELAJARAN Dalam melaksanakan evaluasi pembelajaran perlu berpegang pada prinsip-prinsip pelaksanaan evaluasi yang benar. Prinsip utama yang perlu diperhatikan adalah harus sesuai dengan perencanaan yang telah disusun. Selain itu, juga perlu membeprtimbangkan beberapa aturan yang baik, yakni : 1.Dalam mengikuti evaluasi, siswa di usahakan memiliki persiapan baik secara fisik maupun psikis 2.Situasi dan kondisi tempat pelaksanaan evaluasi harus tenang dan mendukung 3.Manajemen pelaksanaan evaluasi harus mendukung, baik dari sisi evaluator maupun administrasinyaan secar objektif, dalam arti baik peserta tes maupun evaluator bisa melaksanakan kejujuran. 4.Dilakukan secara objektif, dalam arti baik peserta tes maupun evaluator bisa melaksanakan kejujuran. F.PENGOLAHAN HASIL EVALUASI Langkah pertama yang perlu dilakukan dalam mengolah hasil evaluasi adalah mengadakan penyekoran terhadap jawaban siswa. Ada beberapa cara yang bisa dilakukan dalam penyekoran hasil tes, sesuai dengan bentuk-bentuk tes yang

digunakan. 1.Pemberian skor untuk tes bentuk objektif Secara sederhana, cara memberikan skor terhadap tes hasil objektif dapat dilakukan dengan memberikan skor 1 untuk jawaban benar dan memberikan skor 0 untuk jawaban salah. Total skor diperoleh dengan menjumlahkan skor yang diperoleh dari semua soal. Beberapa jenis tes bentuk objektif, antara lain tes benar salah (true false), pilihan ganda (multiplechoice), menjodohkan (matching), melengkapi isian (completion), dan jawaban singkat (short answer). Cara pengolahan terhadap masing-masing jenis tersebut memiliki karakteristik tersendiri. 2.Pemberian skor tes bentuk essai. Ada dua cara memberikan hasil skor terhadap hasil tes essai, yaitu cara penyekoran analitik (analitical scoring method) dan cara penyekoran holistic (holistic scoring method). Cara penyekoran analitik adalah cara penyekoran yang mengacu pada elemen-elemen jawaban ideal. Tinggi rendahnya skor jawaban siswa, bergantung pasa lengkap tidaknya elemen yang dituju. Sedanglan cara penyekoran holistic adalah cara penyekoran yang didasarkan pada keluasan rewspon jawaban yang diberikan. Tinggi rendahnya skor jawaban siswa bergantung pada kualitas keseluruhan jawaban siswa. Ada dua tahap yang dilakukan dalam melakukan pengolahan hasil evaluasi, yaitu memberikan skor (scoring) dan memberikan penilaian (grading). Untuk mengolah data hasil evaluasi bisa menggunakan beberapa teknik analisis data. Interpretasi data bisa dilakukan dengan menggunakan pendekatan penilaian acuan patokan (creterion referenced interpretation) atau penilaian acuan kelompok (norm referenced interpretation). Penilaian acuan patokan adalah penilaian yang dalam menginterpretasi hasil pengukuran secara langsung didasarkan pada standar performansi tertentu yang ditetapkan. Untuk analisis data bisa menggunakan analisis presentasi ketercapaian. Sedangkan penilaian acuan kelompok adalah penilaian yang dalam menginterpretasi data hasil pengukuran didasarkan pada prestasi anggota kelompok lainnya. Beberapa teknik analisis yang bisa digunakan untuk mengolah data dengan pendekatan acuan kelompok adalah deviasi standar, mean, standar skor, rank, jenjang persentil dan sejenisnya. Untuk mengolah hasil pengukuran dalam evaluasi pembelajaran, banyak teknis analisis data yang bisa digunakan. Analisis data pada hakikatnya adalah mengolah angka-angka yang diperoleh dari skor mentah menjadi suatu skor yang mudah di baca dan di simpulkan. Beberapa teknis analisis data yang banyak digunakan untuk mengolah data hasil evaluasi pembelajaran adalah sebagai berikut : 1.Tendensi sentral atau ukuran kecenderungan memusat. Ada tiga teknik utama yang digunakan untuk mengukur tendensi sentral, yakni mean, media dan mode. 2.Variabilitas adalah keanekaragaman angka-angka dalam suatu distribusi skor. Variabilitas merupakan variasi sebaran skor dari mean. 3.Skor standar 4.Skor komposit

5.Persentil dan jenjang persentil 6.Penentuan nilai akhir 7.Analisis hubungan 8.Analisis data kualitatif G.PEMBUATAN LAPORAN HASIL EVALUASI Untuk dapat memberikan informasi yang baik, sebagai dasar pengambilan keputusan, maka perlu dibuat laporan hasil evaluasi pembelajaran. Ada beberapa prinsip yang perlu diperhatikan dalam membuat laporan hasil evaluasi. Laporan hasil evaluasi harus : 1.Membuat informasi yang lengkap 2.Mudah difahami 3.Mudah dibuat 4.Dapat dipakai 5.Bersifat objektif Bentuk laporan hasil evaluasi, bisa berupa angka, huruf, gambar atau bahasa. Fungsi laporan, disamping untuk kepentingan kegiatan pembalajaran di sekolah, juga untuk dipergunakan oleh siswa, guru, kepala sekolah, orang tua, masyarakat atau pihak-pihak lain yang membutuhkan informasi. H.PENGGUNAAN KOMPUTER DALAM EVALUASI Komputer merupakan perangkat teknologi yang sangat berguna untuk mendukung kegiatan evaluasi pembelajaran. Komputer bisa digunakan dalam semua tahap proses kegiatan evaluasi, mulai dari perencanaan, pelaksanaan, pengolahan hasil sampai dengan pelaporan. Dengan menggunakan fasilitas komputer kegiatan evaluasi akan bisa dilakukan secara cepat, tepat dan efektif. Disamping program pemrosesan data (word processing) beberapa program (software) komputer yang bisa digunakan untuk mendukung proses kegiatan evaluasi adalah Iteman, Ascal, Rascal, dan Bilog. Program tersebut, terutama untuk menganalisis instrumen evaluasi. Program komputer bisa juga dikembangkan sendiri sesuai dengan kebutuhan. Untuk itu, dibutuhkan kemampuan khusus, terutama dalam hal pemrograman.

TEKNIK EVALUASI Teknik evaluasi digolongkan menjadi 2 yaitu teknik tes dan teknik non Tes 1. teknik non tes meliputi ; skala bertingkat, kuesioner,daftar cocok, wawancara, pengamatan, riwayat hidup. a. Rating scale atau skala bertingkat menggambarkan suatu nilai dalam bentuk angka. Angkaangak diberikan secara bertingkat dari anggak terendah hingga angkat paling tinggi. Angkaangka tersebut kemudian dapat dipergunakan untuk melakukan perbandingan terhadap angka yang lain. b. Kuesioner adalah daftar pertanyaan yang terbagi dalam beberapa kategori. Dari segi yang memberikan jawaban, kuesioner dibagi menjadi kuesioner langsung dan kuesioner tidak langsung. Kuesioner langsung adalah kuesioner yang dijawab langsung oleh orang yang diminta jawabannya. Sedangkan kuesiioner tidak langsung dijawab oleh secara tidak langsung oleh orang yang dekat dan mengetahui si penjawab seperti contoh, apabila yang hendak dimintai jawaban adalah seseorang yang buta huruf maka dapat dibantu oleh anak, tetangga atau anggota keluarganya. Dan bila ditinjau dari segi cara menjawab maka kuesioner terbagi menjadi kuesioner tertutup dan kuesioner terbuka. Kuesioner tertututp adalah daftar pertanyaan yang memiliki dua atau lebih jawaban dan si penjawab hanya memberikan tanda silang (X) atau cek () pada awaban yang ia anggap sesuai. Sedangkan kuesioner terbuka adalah daftar pertanyaan dimana si penjawab diperkenankan memberikan jawaban dan pendapat nya secara terperinci sesuai dengan apa yang ia ketahui. c. Daftar cocok adalah sebuah daftar yang berisikan pernyataan beserta dengan kolom pilihan jawaban. Si penjawab diminta untuk memberikan tanda silang (X) atau cek () pada awaban yang ia anggap sesuai. d. Wawancara, suatu cara yang dilakukan secara lisan yang berisikan pertanyaan-pertanyaan yang sesuai dengan tujuan informsi yang hendak digali. wawancara dibagi dalam 2 kategori, yaitu pertama, wawancara bebas yaitu si penjawab (responden) diperkenankan untuk memberikan jawaban secara bebas sesuai dengan yang ia diketahui tanpa diberikan batasan oleh pewawancara. Kedua adalah wawancara terpimpin dimana pewawancara telah menyusun pertanyaan pertanyaan terlebih dahulu yang bertujuan untuk menggiring penjawab pada informsi-informasi yang diperlukan saja. e. Pengamatan atau observasi, adalah suatu teknik yang dilakuakn dengan mengamati dan mencatat secara sistematik apa yang tampak dan terlihat sebenarnya. Pengamatan atau observasi terdiri dari 3 macam yaitu : (1) observasi partisipan yaitu pengamat terlibat dalam kegiatan kelompok yang diamati. (2) Observasi sistematik, pengamat tidak terlibat dalam kelompok yang diamati. Pengamat telah membuat list faktor faktor yang telah diprediksi sebagai memberikan pengaruh terhadap sistem yang terdapat dalam obejek pengamatan. f. Riwayat hidup, evaluasi ini dilakukan dengan mengumpulkan data dan informasi mengenai objek evaluasi sepanjang riwayat hidup objek evaluasi tersebut. 2. Teknik tes. Dalam evaluasi pendidikan terdapat 3 macam tes yaitu : a. tes diagnostik b. tes formatif

c. tes sumatif Penjelasan mengenai 3 macam tes diatas dapat dibaca pada bagian Teknik Tes PROSEDUR MELAKSANAKAN EVALUASI Dalam melaksanakan evaluasi pendidikan hendaknya dilakukan secara sistematis dan terstruktur. Sebagaimana telah dikemukakan sebelumnya bahwa evaluasi pendidikan secara garis besar melibatkan 3 unsur yaitu input, proses dan out put. Apabila prosesdur yang dilakukan tidak bercermin pada 3 unsur tersebut maka dikhawatirkan hasil yang digambarkan oleh hasil evaluasi tidak mampu menggambarkan gambaran yang sesungguhnya terjadi dalam proses pembelajaran. Langkah-langkah dalam melaksanakan kegiatan evaluasi pendidikan secara umum adalah sebagai berikut : a. perencanaan (mengapa perlu evaluasi, apa saja yang hendak dievaluasi, tujuan evaluasi, teknikapa yang hendak dipakai, siapa yang hendak dievaluasi, kapan, dimana, penyusunan instrument, indikator, data apa saja yang hendak digali, dsb) b. pengumpulan data ( tes, observasi, kuesioner, dan sebagainya sesuai dengan tujuan) c. verifiksi data (uji instrument, uji validitas, uji reliabilitas, dsb) d. pengolahan data ( memaknai data yang terkumpul, kualitatif atau kuantitatif, apakah hendak di olah dengan statistikatau non statistik, apakah dengan parametrik atau non parametrik, apakah dengan manual atau dengan software (misal : SAS, SPSS ) e. penafsiran data, ( ditafsirkan melalui berbagai teknik uji, diakhiri dengan uji hipotesis ditolak atau diterima, jika ditolak mengapa? Jika diterima mengapa? Berapa taraf signifikannya?) interpretasikan data tersebut secara berkesinambungan dengan tujuan evaluasi sehingga akan tampak hubungan sebab akibat. Apabila hubungan sebab akibat tersebut muncul maka akan lahir alternatif yang ditimbulkan oleh evaluasi itu. Sumber: http://id.shvoong.com/social-sciences/education/1956774-prinsip-dan-teknikevaluasi/#ixzz2KyPVT6qU A. Pengertian Tes a. Menurut Riduwan ( 2006: 37) tes sebagai instrumen pengumpulan data adalah serangkaian pertanyaan / latihan yang digunakan untuk mengukur ketrampilan pengetahuan, intelegensi, kemampuan atau bakat yang dimiliki individu / kelompok. b. Menurut Allen Philips (1979: 1-2) A test is commonly difined as a tool or instrument of measurement that is used to obtain data about a specific trait or characteristic of an individual or group.( Test biasanya diartikan sebagai alat atau instrumen dari pengukuran yang digunakan untuk memperoleh data tentang suatu karakteristik atau ciri yang spesifik dari individu atau kelompok.) c. Menurut Rusli Lutan (2000:21) tes adalah sebuah instrument yang dipakai untuk memperoleh informasi tentang seseorang atau obyek.
http://rohadicgbs.wordpress.com/2012/01/08/pengertian-tes-pengukuran-evaluasidan-assessment/

A. PENGERTIAN TES Tes dapat didefinisikan sebagai suatu pernyataan atau tugas atau seperangkat tugas yang direncanakan untuk memperoleh informasi tentang trait (sifat) atau atribut pendidikan atau psikologik yang setiap butir pertanyaan atau tugas tersebut mempunyai jawaban atau ketentuan yang dianggap benar. Tes dapat diklasifikasi berdasarkan : a. Bagaimana ia diadministrasikan (tes individual atau kelompok) b. Bagaimana ia diskor (tes obyektif atau tes subyektif) c. Respon apa yang ditekankan (tes kecepatan atau tes kemampuan) d. Tipe respon yang bagaimana yang harus dikerjakan oleh subyek (tes unjuk kerja atau tes kertas dan pensil) e. Apa yang akan diukur (tes sampel atau tes sign) f. Hakekat dari kelompok yang akan diperbandingkan (tes buatan guru atau tes baku) ETIKA TES Kegiatan pengujian berperan sangat besar dalam system pendidikan dan system persekolahan.karena pentingnya itu maka setiap tindakan pengujian selalu menimbulkan kritik yang tajam dari masyarakat. Kritik tersebutt tidak jarang dating dari para ahli, disamping dating dari orang tua yang secara langsung atau tidak langsung berkepentingan terhadap pengujian. Diantara beberapa kritik tersebut ada beberapa yang harus menjadi perhatian sungguh sunggup oleh para praktisi dan ahli tes, pengukuran dan evaluasi. Kritik tersebut antara lain: a. Tes senantiasa akan mencampuri rahasia pribadi peserta tes. Setiap tes berusaha mengetahui pengetahuan dan kemampuan peserta tes, yang dapat berarti membuka kelemahan dan kekuatan pribadi seseorang. Didalam masyarakat yang sangat melindungi akan hak dan rahasia pribadi,masalah ini seslalu akan menjadi gugatan atau keluhan. b. Tes selalu menimbulkan rasa cemas peserta tes.memang sampai bats tertentu rasa cemas itu dibutuhkan untuk dapat mencapai prestasi terbaik, tetapi tes acapkali menimbulkan rasa cemas yang tidak perlu, yang justru dapat menghambat seseorang mampu mendemonstrasikan kemampuan terbaiknya.

c. Tes acapkali justru menghukum peserta didik yang kreatif.karena tes itu selalu menuntut jawaban yang sudah ditentukan pola dan isinya, maka tentu saja hal itu tidak memberi ruang gerak yang cukup bagi anak yang kreatif. d. tes selalu terikat pad kebudayaan tertentu. Tidak ada tes hasil belajar yang bebas budaya. Karena itu kemampuan peserta tes untuk memberi jawaban terbaik turut ditentukan oleh kebudayaan penyusun tes. e. Tes hanya mengukur hasil belajar yang sederhana dan yang remeh. Hampir tidak pernah ada tes hasil belajar yang mampu mengungkapkan tingkah laku peserta didik secara menyeluruh, yang justru menjadi tujuan utama pendidikan formal apapun. Karena banyak kritik yang tajam dari masyarakat terhadap tes hasil pendidikan, maka para pendidik harus dapat melakukan tes dengan penuh tanggung jawab. Untuk itu perlu ditegakan beberapa etika tes, yang membedakan tes yang etik dan tindakan yang tidak etik dalam pelaksanaan tes secara professional. Praktek tes hasil belajar yang etik terutama mencangkup empat hal utama : a. Kerahasiaan Hasil Tes Setiap pendidik dan pengajar wajib melindungi kerahasiakan hasil tes, baik secara hasil individual maupun secara kelompok. Hasil tes hanya dapat disampaikan kepada orang lain bila : 1) Ada izin dari peserta didik yang bersangkutan atau orang yang bertanggung jawab terhadap peserta didik (bagi peserta didik yang belum dewasa). Jadi dengan demikian praktek menempelkan hasil tes di papan pengumuman dengan identitas jelas peserta tes, merupakan pelanggaran terhadap etika ini. 2) Ada tanda-tanda yang jelas terhadap hasil tes tersebut menunjukan gejala yang membahayakan dirinya atau membahayakan kepentingan orang lain. 3) Bila penyampaian hasil tes tersebut kepada orang lain jelas-jelas menguntungkan peserta tes. b. Keamanan tes Tes merupakan alat pengukur yang hanya dapat digunakan secara professional. Dengan demikian tes tidak dapat digunakan diluar batas-batas yang ditentukan oleh profesionalisme pekerjaan guru. Dengan demikian maka setiap pendidik harus dapat menjamin keamanan tes, baik sebelum maupun sesudah digunakan. c. Interpretasi Hasil Tes

Hal yang paling mengandung kemunkinan penyalahgunaan tes adalah penginterpretasian hasil tes secara salah. Karena itu maka interpretasi hasil tes harus diikuti tanggung jawab professional. Bila hasil tes diinterpretasi secara tidak patut, daalam jangka panjang akan dapat membahayakan kehidupan peserta tes. d. Penggunaan tes Tes hasil belajar haruslah digunakan secara patut. Bila tes hasil belajar tertentu merupakan tes baku, maka tes tersebut harus digunakan di bawah ketentuan yang berlaku bagi pelaksanaan tes baku tersebut harus digunakan dibawah ketentuan yang berlaku bagi pelaksanaan tes baku tersebut. Tak ada tes baku yang boleh digunakan diluar prosedur yang ditapakan oleh tes itu sendiri. Disamping beberapa prinsip seperti yang diuraikan di atas, ada beberapa petunjuk praktis yang hendaknya ditaati oleh pendidik dalam tes: a. Pelaksaan tes hendaknya diberi tahu terlebih dahulu kepada peserta tes. Hanya karena pertimbangan tertentu, yang sangat penting yang dapat membenarkan pendidik tidak memberi tahu terlebih dahulu kepada peserta tes tentang tes yang akan dilaksanakan. Bahkan kisi-kisi tes sebaiknya diberi tahu kepada peserta tes sebelum melaksanakan tes. b. Sebaiknya pendidik menjelaskan cara menjawab yang dituntut dalam suatu tes. Petunjuk menjawab tes bukanlah sesuatu yang harus dirahasiakan. Petunjuk yang bersifat menjebak harus dihindari. c. Sebaiknya pendidik justru memotivasi peserta tes mengerjakan tesnya secara baik. Jangan sampai seorang pendidik justru menakut-nakuti peserta didik. d. Bila pendidik menggunakan tes baku, maka hendaknya pendidik tersebut bertanggung jawab penuh terhadap keamanan tes tersebut. Tidak ada tes baku yang boleh digunakan dalam latihan. e. Seorang pendidik dapat menggunakan hasil tes untuk mengidentifikasi kekuatan dan kelemahan peserta tes, asalkan hal tersebut tetap menjadi rahasia peserta tes dan pendidik yang bersangkutan. f. Guru hendaknya menghindari diri dari keterlibatan dalam bimbingan tes yang dapat diperkirakan akan menggangu proses hasil belajar peserta didik. Hal ini menjadi penting bila guru yang bersangkutan justru terlibat dalam penyusunan butir tes yang digunakan. g. Adalah tidak etik bila seorang guru mengembangkan butir soal atau perangkat

soal yang paralel dengan suatu tes baku dengan maksud untuk digunakan dalam bimbingan tes. h. Adalah tidak etik untuk mendiskriminasikan peserta didik tertentu atau kelompok tertentu yang boleh mengikuti suatu tes atau melarang mengikuti tes. i. Adalah tidak etik untuk memperpanjang waktu atau menyingkat waktu yang telah ditentukan oleh petunjuk tes. j. Guru tidak boleh meningkatkan rasa cemas peserta tes dengan penjelasan yang tidak perlu. Secara lebih mandasar etika tes ini diatur dalam standar tes yang dikembangkan oleh organisasi profesional seperi American Psycological Association (APA), American Educational Research Education (AERA), dan National Council on Measuremant in Educaton (NCME). Terakhir ketiga organiasi professional ini membentuk panitia bersama untuk menyusun standar dalam tes. Mereka menghasilkan buku yang dinamakan Standard for Educational and Psychological Testing (1985). Dalam standar ini dicantumkan berbagai tolak ukur, seperti : 1. Technical Standards for Test Construction and Evaluation; 2. Professional Standards for Test Use; 3. Standards for Particular Application; dan 4. Standards for Administrative Procedures. Semua standar ini mencangkup dua aspek utama, yaitu tes hasil belajar dan tes psikologi. Pelanggaran terhadap standar ini merupakan pelanggaran terhadap etika profesi, yang dalam hal tertentu dapat merupaakan pelanggaran atau kejahatan. http://www.anekanews.com/2010/04/pengertian-tes-pengukuran-penilaian-dan.html

http://file.upi.edu/Direktori/FIP/JUR._PSIKOLOGI/195010101980022SITI_WURYAN_INDRAWATI/TES_PSIKOLOGIS-tayangan.pdf

A. Pengertian Tes Tes merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah ditentukan. Tes hasil belajar adalah sekelompok pertanyaan atau tugas-tugas yang harus dijawab atau diselesaikan oleh siswa dengan tujuan untuk mengukur kemajuan belajar siswa.

B. Jenis-Jenis Tes 1. a. Dari segi bentuk pelaksanaannya Tes Tertulis ( paper and pencil test)

Tes tertulis dalam pelaksanaannya lebih menekankan pada penggunaan kertas dan pencil sebagai instrumen utamanya, sehingga tes mengerjakan soal atau jawaban ujian pada kertas ujian secara tertulis, baik dengan tulisan tangan maupun menggunakan komputer. b. Tes Lisan ( oral test)

Tes lisan dilakukan dengan pembicaraan atau wawancara tatap muka antara guru dan murid. c. Tes Perbuatan (performance test)

Tes perbuatan mengacu pada proses penampilan seseorang dalam melakukan sesuatu unit kerja. Tes perbuatan mengutamakan pelaksanaan perbuatan peserta didik.

2. a.

Dari segi bentuk soal dan kemungkinan jawabannya Tes Essay (uraian)

Tes Essay adalah tes yang disusun dalam bentuk pertanyaan terstruktur dan siswa menyusun, mengorganisasikan sendiri jawaban tiap pertanyaan itu dengan bahasa sendiri. Tes essay ini sangat bermanfaat untuk mengembangkan kemampuan dalam menjelaskan atau mengungkapkan suatu pendapat dalam bahasa sendiri. b. Tes Objektif

Tes objektif adalah tes yang disusun sedemikian rupa dan telah disediakan alternatif jawabannya. Tes ini terdiri dariberbagai macam bentuk, antara lain ; Tes Betul-Salah (TrueFalse) Tes Pilihan Ganda (Multiple Choice) Tes Menjodohkan (Matching) Tes Analisa Hubungan (Relationship Analysis) 3. a. Dari segi fungsi tes di sekolah Tes Formatif

Tes Formatif, yaitu tes yang diberikan untuk memonitor kemajuan belajar selama proses pembelajaran berlangsung. Tes ini diberikankan dalam tiap satuan unit pembelajaran. Manfaat tes formatif bagi peserta didik adalah : Untuk mengetahui apakah peserta didik sudah menguasai materi dalam tiap unit pembelajaran. Merupakan penguatan bagi peserta didik. Merupakan usaha perbaikan bagi siswa, karena dengan tes formatif peserta didik mengetahui kelemahan-kelemahan yang dimilikinya. Peserta didik dapat mengetahui bagian dari bahan yang mana yang belum dikuasainya. b. Tes Summatif

Tes sumatif diberikan dengan maksud untuk mengetahui penguasaan atau pencapaian peserta didik dalam bidang tertentu. Tes sumatif dilaksanakan pada tengah atau akhir semester. c. Tes Penempatan

Tes penempatan adalah tes yang diberikan dalam rangka menentukan jurusan yang akan dimasuki peserta didik atau kelompok mana yang paling baik ditempati atau dimasuki peserta didik dalam belajar. d. Tes Diagnostik

Tes diagnostik adalah tes yang digunakan untuk mendiagosis penyebab kesulitan yang dihadapi seseorang baik dari segi intelektual, emosi, fisik dan lain-lain yang mengganggu kegiatan belajarnya.

C.

Ciri-ciri Tes Yang Baik

Sebuah tes dikatakan baik jika memenuhi persyaratan: 1. Bersifat valid atau memiliki validitas yang cukup tinggi. Suatu tes dikatakan valid bila tes itu isinya dapat mengukur apa yang seharusnya di ukur, artinya alat ukur yang digunakan tepat 2. Bersifat reliable, atau memiliki reliabelitas yang baik. Reliabelitas sering diartikan dengan keterandalan. Suatu tes dikatakan relliabel jika tes itu diberikan berulang-ulang memberikan hasil yang sama. 3. Bersifat praktis atau memiliki kepraktisan. Tes memiliki sifat kepraktisan artinya praktis dari segi perencanaan, pelaksanaan tes dan memiliki nilai ekonomi tetapi harus tetap mempertimbangkan kerahasiaan tes. Namun syarat minimum yang harus dimiliki oleh sebuah tes yang baik adalah valid dan reliable.

D. Langkah-langkah Pengembangan Tes Ada enam tahap dalam merencanakan dan menyusun tes agar diperoleh tes yang baik,yaitu: 1) Pengembangan spesifikasi tes

Spesifikasi tes adalah suatu ukuran yang menunjukkan keseluruhan kualitas tes dan ciri-ciri yang harus dimiliki oleh tes yang akan dikembangkan. Hal yang perlu diperhatikan adalah : a) Menentukan tujuan, tujuan pembelajaran yang baik hendaklah berorientasi kepada peserta didik, bersifat menguraikan hasil belajar, harus jelas dan dapat dimengerti, mengandung kata kerja yang jelas (kata kerja operasional), serta dapat diamati dan dapat di ukur. b) Menyusun kisi-kisi soal, penyusunan kisi-kisi soal bertujuan untuk merumuskan setepat mungkin ruang lingkup, tekanan dan bagian-bagian tes sehingga perumusan tersebut dapat menjadi petunjuk yang efektif bagi penyusun tes.

c) Memilih tipe soal, dalam memilih tipe soal perlu diperhatikan kesesuaian antara tipe soal dengan materi, tujuan evaluasi, skoring, pengelolaan hasil evaluasi, penyelenggaraan tes, serta ketersediaan dana dan kepraktisan. d) Merencanakan tingkat kesukaran soal, untuk soal objektif dapat diketahui melalui uji coba atau dapat juga diperkirakan berdasarkan berat ringannya beban penyeleaian soal tersebut e) f) 2) Merencanakan banyak soal Merencanakan jadwal penerbitan soal Penulisan soal

3) Penelaahan soal, yaitu menguji validitas soal yang bertujuan untuk mencermati apakah butir-butir soal yang disusun sudah tepat untuk mengukur tujuan pembelajaran yang sudah dirumuskan, ditinjau dari segi isi/materi, kriteria dan psikologis. 4) Pengujian butir-butir soal secara empiris, kegiatan ini sangat penting jika soal yang dibuat akan dibakukan. 5) 6) Penganalisisan hasil uji coba. Pengadministrasian soal

E. Menganalisis Tes Menganalisis instrument (alat evaluasi) bertujuan untuk mengetahui apakah alat ukur yang digunakan atau yang akan digunakan sudah memenuhi syarat-syarat sebagai alat ukur yang baik, tepat mengukur sesuatu sesuai tujuan yang telah dirumuskan. Sebuah instrument dikatakan baik jika memenuhi syarat validitas, reliabelitas dan bersifat praktis. 1. Validitas Tes Suatu tes dikatakan valid jika tes itu dapat mengukur apa yang seharusnya diukur. Valid disebut juga sahih, terandalkan atau tepat. Tes hasil belajar yang valid, harus dapat menggambarkan hasil belajar yang di ukur Macam-macam validitas 1). Validitas isi (content validity) Validitas isi sering juga disebut validitas logis atau validitas rasional. Validitas isi dapat dianalisis dengan bantuan kisi-kisi tes dan pedoman penelaahan butir soal.

Penelaahan butir soal secara umum ditinjau dari tiga aspek yaitu: 1. 1. Aspek materi 2. Aspek bahasa 3. Aspek konstruksi 2). Validitas ramalan (predictive validity) Suatu tes dikatakan memiliki validitas ramalan, apabila hasil pengukuran yang dilakukan dengan tes itu dapat digunakan untuk meramalkan, atau tes itu mempunyai daya prediksi yang cukup kuat. Untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang memiliki validitas ramalan dapat dilakukan dengan mengkorelasikan tes hasil belajar yang sedang diuji dengan kriterium yang ada. 3) Validitas bandingan (concurent validity) Suatu tes dikatakan memiliki validitas concurrent, apabila tes tersebut mempunyai kesesuaian dengan hasil pengukuran lain yang dilaksanakan saat itu. Misalnya, membandingkan hasil tes dari soal yang sedang dicari validitasnya dengan hasil tes dari soal standar. Jika terdapat korelasi yang positif antara kedua tes tersbut, berarti soal tes yang dibuat mempunyai validitas concurrent. 4).Construct validity (validitas konstruk) Validitas konstruk artinya butir-butir soal dalam tes tersebut membangun setiap aspek berpikir seperti yang tercantum dalam tujuan pembelajaran yang telah dirumuskan. Penganalisisan validitas ini dapat dilakukan dengan jalan melakukan pencocokan antara aspek berpikir yang dikehendaki diungkapkan oleh tujuan pembelajaran, yaitu melalui penelaahan butir-butir soal. Meski terdapat beberapa jenis validitas, dalam periode terakhir validitas dianggap sebagai suatu konsep utuh, tidak dipilah-pilah sebagai jenis validitas.

Cara menentukan validitas instrumen

Validitas instrument dapat diketahui dengan mencari korelasi hasil instrument dengan dengan kriterium atau melakukan analisis butir. Apabila data yang digunakan adalah data interval maka dapat digunakan rumus Product Moment Korelasi, sebagai berikut :

v Rumus Angka Kasar

Keterangan : = Koefisien korelasi antara instrument X dan instrument Y

v Rumus untuk skor deviasi

Kriteria- kriteria hasil validitas : Antara sangat tinggi Antara tinggi Antara cukup Antara rendah Antara sangat rendah (Yusuf, 2005:75).

Cara menentukan validitas tiap butir soal

Tinggi rendahnya validitas soal secara keseluruhan berhubungan dengan validitas tiap butir soal. Validitas butir soal dapat dicari dalam hubungannya dengan skor total tiap individu yang ikut serta dalam evaluasi. Langkah-langkah yang ditempuh sebagai berikut : 1. Skor suatu instrument dengan baik dan teliti

Untuk individu yang benar diberi angka 1, sedangkan yang salah diberi angka nol.

2. 3.

Jumlahkan skor total untuk tiap individu. Gunakan rumus product moment correlation atau korelasi biserial.

2.

Reliabilitas

Suatu alat ukur dikatakan reliabel, apabila alat ukur itu dicobakan kepada objek yang sama secara berulang-ulang maka hasilnya akan tetap sama, konsisten, stabil atau relatif sama.

Faktor-faktor yang mempengaruhi reliabilitas

a. Konstruksi item yang tidak tepat, sehingga tidak dapat mempunyai daya pembeda yang kuat. b. c. d. e. f.

Panjang/pendeknya suatu instrumen Evaluasi yang surjektif akan menurunkan reliabilitas Ketidaktepatan waktu yang diberikan Kemampuan yang ada dalam kelompok Luas/tidaknya sampel yang diambil. Teknik pengujian reliabilitas tes hasil belajar Bentuk objektif Metode Belah dua

a. 1)

Dalam pelaksanaanya,seorang penilai hanya melakukan ujian satu kali terhadap sejumlah peserta, sehingga tidak ada pengaruh dari instrumen yang terdahulu. Jumlah butir soal yang diberikan harus genap sehingga dapat dibagi dua dan tiap kelompok mempunyai jumlah butir yang sama. Koefisien reliabilitas akan menunjukkan internal konsistensi dari pada butir soal dalam keseluruhan instrumen. Cara membelah dua instrumen tersebut dapat dilakukan dengan cara nomor genap dan ganjil, awal dan akhir. Untuk menentukan reliabilitas kedua bagian instrumen tersebut dapat digunakan Product Moment Coorelation, sedangkan untuk mencari reliabilitas keseluruhan instrumen dapat digunakan rumus Spearman Brown, sebagai berikut :

Keterangan : : koefisien reliabilitas

r : korelasi antara bagian instrumen 2) Metode Ulangan

Pelaksanaannya dilakukan dua kali kepada sejumlah subjek yang sama, dalam waktu yang berbeda. Reliabilitas metode ulangan ini untuk melihat bagaimana stabilnya skor setiap individu apabila dilakukan pengujian dalam waktu yang berbeda, dengan kondisi dan perlengkapan yang sama/ hampir bersamaan. Rumus yang digunakan untuk menentukan metode ulangan ini adalah Product Moment Correlation. 3) Metode Bentuk Paralel

Bentuk ini dapat digunakan untuk memperkirakan reliabilitas dari semua tipe, tetapi koefisien yang dihasilkan hanya menggambarkan ekivalensi antara kedua instrumen. Tidak akan menunjukkan ekivalensi dalam kesukaran butir dan isi. Kedua bentuk instrumen yang diberikan mengukura hal yang sama, dengan memiliki tingkat kesukaran yang sama, pengetahuan dan keterangpilan yang sama dengan sistematika yang tidak berbeda antara kedua bentuk instrumen tersebut, tetapi dalam bentuk pertanyaan yang berbeda. Rumus yang dapat digunakan untuk menentukan reliabilitas instrumen dalam bentuk paralel ini adalah product moment correlation dan Rank order correlation. b. Bentuk essay

Rumus yang digunakan untuk mengukur reliabilitas tes berbentuk uraian dinamakan rumus Alpha, yaitu :

Dimana: : Koefisien reliabilitas tes n : banyaknya butir item yang dikeluarkan dalam tes

: Jumlah variansi skor dari tiap-tiap butir item :Variansitotal Interpretasi terhadap koefisien reliabilitas tes pada umumnya digunakan patokan sebagai berikut: 0,80 < r11 1,00 0,60 < r11 0,80 0,40 < r11 0,60 reliabilitas sangat tinggi reliabilitas tinggi reliabilitas sedang

0,20 < r11 0,40 0,00 < r11 0,20

reliabilitas rendah reliabilitas sangat rendah

Nilai r yang diperoleh dibandingkan dengan rtabel. Jika rhitung > rtabel maka dapat disimpulkan bahwa soal tes reliabel.

3. Analisis soal tes Untuk mendapatkan kualitas soal yang baik, maka dilakukan langkah-langkah sebagai berikut: 1) Daya pembeda

Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai dengan siswa yang bodoh. Angka yang menunjukkan besarnya daya pembeda disebut indek diskriminan. Untuk menentukan daya pembeda soal dapat dilakukan seperti yang dikemukakan oleh Prawironegoro (1985:11): Terlebih dahulu dicari degress of freedom (df) dengan rumus: df = (nt 1) + (nr 1) dimana: nt = nr = 27% x N kemudian digunakan rumus:

dimana: Ip = daya pembeda soal Mt = rata-rata skor dari kelompok tinggi Mr = rata-rata skor dari kelompok rendah = jumlah kuadrat deviasi skor kelompok tinggi = jumlah kuadrat deviasi skor kelompok rendah n = 27% x N

= banyak pengikut tes

Soal mempunyai daya pembeda yang berarti (signifikan) jika Ip hitung Ip tabel pada derajat kebebasan yang sudah ditentukan. 2) Indek kesukaran.

Agar tes dapat digunakan secara luas, setiap soal harus diselidiki tingkat kesukarannya yaitu apakah soal tersebut termasuk soal yang mudah, sedang atau sukar. Untuk menentukan indek kesukaran digunakan rumus yang dikemukakan Prawironegoro (1985:14) yaitu:

dimana: Ik = indeks kesukaran Dt = jumlah skor dari kelompok tinggi Dr = jumlah skor dari kelompok rendah m = skor setiap soal jika benar n = 27% x N

N = banyak pengikut tes Soal dinyatakan sukar, jika sedang, jika mudah, jika 3) Penerimaan soal 27% Ik 73% Ik > 73% 0% Ik < 27%

Setiap soal yang telah dianalisa perlu diklasifikasikan menjadi soal yang tetap dipakai, direvisi atau dibuang. Menurut Prawironegoro (1985:16) tentang klasifikasi soal: a) b) i. ii. Soal yang baik akan tetap dipakai jika Ip signifikan dan 0% < Ik 100%. Soal diperbaiki jika: Ip signifikan dan Ik = 100% atau Ik = 0%. Ip tidak signifikan dan 0% < Ik < 100%.

c)

Soal diganti jika Ip tidak signifikan dan Ik = 100% atau Ik = 0%.

http://minaltimay.wordpress.com/2010/12/16/pengertian-tes-jenis-jenis-tes/

You might also like