You are on page 1of 21

VALIDITAS

A. Definisi Validitas
Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu instrument pengukuran (tes) dalam melakukan fungsi ukurnya. Dalam
bahasa Indonesia valid sering diwakili oleh istilah sahih (Suharsini A., 1999;65). Sahih
sendiri berasal dari bahasa arab artinya tepat atau yang benar (Ahmad Warson Munawwir,
1997:764)
Secara umum validitas merupakan kekuatan dari hasil interpretasi anda dan
menggunakan hasil penilaian (asesmen). Hasil penilaian memiliki perbedaan tingkat
validitas, yang bergantung pada bagaimana hasil di interpretasikan dan digunakan (Nitko
& Brookhart, 1996:38).

Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Validitas didefinisikan sebagai
ukuran seberapa cermat suatu tes dilakukan fungsi ukurnya. Tes hanya dapat melakukan
fungsinya dengan cermat kalau ada sesuatu yang diukurnya. Jadi, untuk dikatakan valid, tes
harus mengukur sesuatu dan melakukannya dengan cermat.
Validitas instrument tes adalah ketepatan mengukur apa yang seharusnya diukur melalui
item tes (Allen & Yen, 1979:95). Instrumen tes dalam penelitian dinyatakan valid berdasarkan
validitas fakta. Validitas fakta diperoleh melalui validitas isi, validitas kongruen dan validitas
konstrak (Ebel & Frisbie, 1986:90). Untuk itu dilakukan telaah item tes, mencari korelasi
(korelasi pearson) antara skor tiap item tes dengan skor total, dan mencari korelasi antara skor
uji coba intrumen dengan skor matematika ulangan.
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi
apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang
sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki
validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.
Terkandung di sini pengertian bahwa ketepatan pada validitas suatu alat ukur tergantung
pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan
tepat. Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan
hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas
tinggi. Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data
mengenai variabel A' atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas
rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A' atau B
Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur
yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus
memberikan gambaran yang cermat mengenai data tersebut.
Cermat berarti bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan
yang sekecil-kecilnya di antara subjek yang satu dengan yang lain. Sebagai contoh, dalam
bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas maka
kita harus menggunakan alat penimbang berat emas agar hasil penimbangannnya valid, yaitu
tepat dan cermat. Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah
cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang sangat kecil
pada berat emas itu tidak akan terlihat pada alat ukur berat badan.
Demikian pula kita ingin mengetahui waktu tempuh yang diperlukan dalam perjalanan
dari satu kota ke kota lainnya, maka sebuah jam tangan biasa adalah cukup cermat dan
karenanya akan menghasikan pengukuran waktu yang valid. Akan tetapi, jam tangan yang
sama tentu tidak dapat memberikan hasil ukur yang valid mengenai waktu yang diperlukan
seorang atlit pelari cepat dalam menempuh jarak 100 meter dikarenakan dalam hal itu
diperlukan alat ukur yang dapat memberikan perbedaan satuan waktu terkecil sampai kepada
pecahan detik yaitu stopwatch.
Masalah validitas berhubungan dengan sejauh mana suatu alat mampu mengukur apa yang
dianggap orang seharusnya diukur oleh alat tersebut. Definisi yang paling lazim mengenai
validitas tercerminkan dalam pertanyaan: Apakah kita benar-benar mengukur apa yang ingin
kita ukur? Dalam pertanyaan ini yang ditekankan adalah apa yang sedang diukur.
Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan
tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan menimbulkan kesalahan
atau eror. Alat ukur yang valid akan memiliki tingkat kesalahan yang kecil sehingga angka
yang dihasilkannya dapat dipercaya sebagai angka yang sebenarnya atau angka yang
mendekati keadaan sebenarnya.
Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran. Oleh karena itu,
tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur
biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Dengan
demikian, anggapan valid seperti dinyatakan dalam "alat ukur ini valid" adalah kurang
lengkap. Pernyataan valid tersebut harus diikuti oleh keterangan yang menunjuk kepada
tujuan (yaitu valid untuk mengukur apa), serta valid bagi kelompok subjek yang mana?
Lebih lanjut, pengertian validitas suatu tes tidaklah umum untuk semua tujuan ukur.
Sebuah tes biasanya hanya menghasilkan ukuran yang valid untuk satu tujuan ukur tertentu.
Karena itu predikat valid seperti dalam pernyataan tes ini valid tidaklah benar. Pernyataan
valid harus diiringi oleh keterangan yang menunjuk kepada tujuan, yaitu valid untuk
mengukur apa dan bagi siapa. Karena itu, suatu tes yang sangat valid guna pengambilan suatu
keputusan dapat sangat tidak berguna dalam pengambilan keputusan lain.
Berdasarkan hal di atas maka dapat disimpulkan bahwa validitas adalah suatu proses
untuk mengukur dan menggambarkan objek atau keadaan suatu aspek sesuai dengan fakta.
Dalam konsep validitas setidaknya terdapat dua makna yang terkandung di dalamnya, yaitu
relevans dan accuracy. Relevansi menunjuk pada kemampuan instrumen untuk memerankan
fungsi untuk apa instrumen tersebut dimaksudkan (what it is intended to measure). Accuracy
menunjuk ketepatan instrumen untuk mengidentifikasi aspek-aspek yang diukur secara tepat,
yang berarti dapat menggambarkan keadaan yang sebenarnya. Kedudukan validitas sangat
penting dalam suatu kegiatan termasuk dalam evaluasi pembelajaran karena menyangkut hasil
pembelajaran dilandasi dan didukung oleh fakta-fakta yang representatif. apabila tidak ada
validitas maka suatu proses maupun hasil pembelajaran tidak akan berjalan objektif
melainkan subjektif hal ini tentu akan merugikan semua pihak terutama siswa.

B. Hakekat Umum Validitas


Dalam pembahasan mengenai validitas beberapa konsep yang harus dipegang teguh antara lain:
1. Konsep validitas mengaplikasikan bagaimana kita menginterpretasikan dan
menggunakan hasil asesment dan bukan prosedur asesment itu sendiri
2. Hasil asesment memiliki derajat yang berbeda untuk tujuan yang berbeda dan situasi
yang berbeda.
3. Kita sebaiknya membuat keputusan tentang validitas dari interpretasi kita atau
menggunakan hasil asesment setelah kita mempelajari dan mengkombinasikan
beberapa tipe bukti validitas.
C. Empat Prinsip Validitas
1. Interpretasi (interpretation) yang kita berikan terhadap asesmen siswa hanya valid
terhadap derajat yang kita arahkan ke suatu bukti yang mendukung kecocokan dan
kebenarannya.
2. Kegunaan (use) yang bisa kita buat dari hasil asesment hanya valid terhadap derajat
yang kita arahkan ke suatu bukti yang mendukung kecocokan dan kebenarannya.
3. Interpretasi dan kegunaan dari hasil asesment hanya valid ketika nilai (values) yang
dihasilkan sesuai.
4. Interpretasi dan kegunaan dari hasil asesment hanya valid ketika konsekuensi
(consequences) dari interpretasi dan kegunaan ini konsisten dengan nilai kecocokan.
D. Kriteria untuk Meningkatkan Validitas dari Score Asesment Kelas untuk
Menentukan Grade Siswa

Kategori Kriteria yang harus dicapai


Representatif dan relevansi 1. Menekankan pada apa yang diajarkan
materi 2. Merempresentasikan materi kurikulum
sekolah.
3. Merepresentasikan pemikiran teraktual
terhadap materi
4. Memuat materi pembelajaran yang
berkembang
Proses berpikir dan representasi 5. Memerlukan siswa agar mengintegrasikan
skills dan menggunakan beberapa teknik
berpikir
6. Merepresentasikan proses berpikir dan
skill yang terdapat pada kurikulum
sekolah
7. Memuat tugas/masalah yang tak
terselesaikan tanpa menggunakan proses
berpikir yang serius
8. Memberikan waktu yang cukup bagi
siswa untu menggunakan skill dan proses
yang kompleks.
Konsitensi terhadap asesment 9. Biarkan keragaman hasil konsisten
kelas lain terhadap assesmen lain kita
10. Memuat tugas/masalah yang tak terlalu
mudah dan tak terlalu sulit
Reliabilitas dan objetivitas 11. Gunakan prosedur yang sistematik untuk
setiap siswa dalam memberikan kualitas
rating atau nilai.
12. Beri kesempatan pada setiap siswa untuk
menunjukkan kompetensi mereka untuk
setiap target pembelajaran yang dituju
Keseragaman terhadap tipe-tipe 13. Memuat tugas yang terinterpretasi sesuai
siswa yang berbeda dengan siswa yang memiliki latarbelakang
berbeda-beda
14. Layani siswa yang mengalami kesulitan,
jika memang itu diperlukan.
15. Tidak mempedulikan perbedaan SARA
Keekonomisan, keefektifan, 16. Membutuhkan beberapa waktu untuk
kemudahan, dan instruksi mengkonstruksikan dan
mengadministrasikan
17. Merepresentasikan kegunaan dari waktu
siswa didalam kelas
18. Merepresentasikan kegunaan dari waktu
didalam kelas
Barbagai kegunaan asesment 19. Gunakan secara bersamaan dengan
assessment yang lain untuk keputusan-
keputusan yang penting.

E. Tipe-tipe Umum Validasi


Tipe-tipe umum validasi tergantung pada pendekatannya, validitas dapat terbagi menurut
berbagai tipe. Berikut ini akan diikuti tipe-tipe validitas menurut yang ditetapkan oleh
American Psycological Association, yaitu content validity, construct validity, dan criterion-
related validity.
1. Content Validity
Dalam validasi ini, suatu tes harus menjawab pertanyaan sejauh mana item tes itu
mencakup keseluruhan situasi yang ingin diukur oleh tes tersebut. Sejauh mana suatu tes
memiliki content validity ditetapkan menurut analisis rasional terhadap isi tes, yang
penilaiannya didasarkan atas pertimbangan subjektif individual. Prosedur validasinya tidak
melibatkan statistik apapun.
Merupakan validitas yang diestimasi lewat pengujian terhadap isi tes dengan analisis
rasional atau lewat professional judgement. Pertanyaan yang dicari jawabannya dalam
validasi ini adalah sejauhmana aitem-aitem dalam tes mencakup keseluruhan kawasan isi
(dengan catatan tidak keluar dari batasan tujuan ukur) objek yang hendak diukur atau
sejauhmana isi tes mencerminkan ciri atribut yang hendak diukur.
Validitas isi merupakan validitas yang diperhitumgkan melalui pengujian terhadap isi alat
ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validasi ini adalah
"sejauhmana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang
hendak diukur oleh alat ukur yang bersangkutan?" atau berhubungan dengan representasi dari
keseluruhan kawasan.
Pengertian "mencakup keseluruhan kawasan isi" tidak saja menunjukkan bahwa alat ukur
tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi yang relevan dan
tidak keluar dari batasan tujuan ukur.
Validitas isi/muatan adalah kerepresentatifan sampling yang terdapat dalam isi/muatan
suatu instrumen pengukur. Sedangkan kata muatan itu menyiratkan pengertian, substansi,
bahan, topik. Mengenai validasi muatan dapat dibimbing dengan pertanyaan : Apakah
isi/muatan/substansi dari suatu alat ukur mewakili semua kemungkinan isi/muatan/substansi
yang berupa sifat yang hendak diukur?
Pertanyaan tersebut dapat dijawab dengan membahas satu demi satu butir pertanyaan
dalam suatu alat ukur terhadap suatu isi/muatan/substansi dari apa yang hedak kita ukur.
Pekerjaan ini jelas sangat sulit apabila dikerjakan oleh seorang diri. Diperlukan beberapa
orang yang ahli dalam bidang-bidang yang bersangkutan untuk menilai, mempertimbangkan,
dan memutuskan kerepresentatifan satu demi satu butir pertanyaan dalam suatu alat ukur
tersebut. Dengan demikian pengujian validitas muatan pada dasarnya merupakan kerja
menilai dan memutuskan suatu butir pertanyaan apakah valid secara isi/muatan/substansi
ataukah tidak.
Adalah seberapa besar derajat tes mengukur representasi isi yang dikehendaki untuk
diukur. Validitas aitem berkaitan dengan apakah aitem mewakili pengukuran dalam area isi
sasaran yang diukur, dan validitas sampling adalah seberapa baik sampel isi tes mewakili
keseluruhan isi sasaran yang diukur. Biasanya dinilai dengan menggunakan pertimbangan
pakar.
Apakah validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur, sebanyak
tergantung pada penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak
melibatkan komputasi statistik, melainkan hanya dengan analisis rasional maka tidak
diharapkan bahwa setiap orang akan sependapat dan sepaham dengan sejauhmana validitas isi
suatu alat ukur telah tercapai.
Walaupun isi atau kandungannya komprehensif tetapi bila suatu alat ukur
mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan hal-hal di luar
tujuan ukurnya, maka validitas alat ukur tersebut tidak dapat dikatakan memenuhi ciri
validitas yang sesungguhnya.
Walaupun isi atau kandungannya komprehensif tetapi bila suatu alat ukur
mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan hal-hal di luar
tujuan ukurnya, maka validitas alat ukur tersebut tidak dapat dikatakan memenuhi ciri
validitas yang sesungguhnya.
Apakah validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur, sebanyak
tergantung pada penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak
melibatkan komputasi statistik, melainkan hanya dengan analisis rasional maka tidak
diharapkan bahwa setiap orang akan sependapat dan sepaham dengan sejauhmana validitas isi
suatu alat ukur telah tercapai.
Selanjutnya, validitas isi ini terbagi lagi menjadi dua tipe, yaitu face validity (validitas
muka) dan logical validity (validitas logis).
a. Face Validity
Face validity tercapai apabila pemeriksaan terhadap item-item tes member kesimpulan
bahwa tes tersebut mengukur aspek yang relevan. Dasar penyimpulannya lebih banyak
diletakkan pada common sence atau akal sehat. Kesimpulan ini dapa diperoleh oleh siapa
saja walaupun tentu tidak semua orang diharapkan setuju menyatakan bahwa misalnya tes
A memiliki content validity yang baik. Akan tetapi, seorang yang ingin menggunakan tes
tersebut harus punya keyakinan terlebuh dahulu bahwa dari segi content, tes itu adalah
valid. Kalau tidak maka kuranglah alasan untuk tetap memakainya.
Validitas tipe ini tentu tidak menjadi hal yang perlu dirisaukan apabila suatu tes telah
terbukti valid lewat pengujian validitas tipe lain yang lebih dapat diandalkan. Dapatlah
dikatakan bahwa face validity adalah tipe validitas yang paling rendah signifikannya.
Tipe validitas yang paling rendah signifikansinya karena hanya didasarkan pada
penilaian terhadap format penampilan (appearance) tes. Apabila penampilan tes telah
meyakinkan dan memberikan kesan mampu mengungkap apa yang hendak diukur maka
dapat dikatakan bahwa validitas muka telah terpenuhi.
Face Validity (Validitas Muka). Validitas muka adalah tipe validitas yang paling
rendah signifikasinya karena hanya didasarkan pada penilaian selintas mengenai isi alat
ukur. Apabila isi alat ukur telah tampak sesuai dengan apa yang ingin diukur maka dapat
dikatakan validitas muka telah terpenuhi.
Dengan alasan kepraktisan, banyak alat ukur yang pemakaiannya terbatas hanya
mengandalkan validitas muka. Alat ukur atau instrumen psikologi pada umumnya tidak
dapat menggantungkan kualitasnya hanya pada validitas muka. Pada alat ukur psikologis
yang fungsi pengukurannya memiliki sifat menentukan, seperti alat ukur untuk seleksi
karyawan atau alat ukur pengungkap kepribadian (asesmen), dituntut untuk dapat
membuktikan validitasnya yang kuat.
b. Logical Validity
Logical validity disebut juga sampling validity. Tipe validitas ini menuntut batasan
yang seksama terhadap kawasan (domain) perilaku yang diukur dan suatu desain logis
yang dapat mencakup bagian-bagian kawasan perilaku tersebut.
Sejauh mana tipe validitas ini telah terpenuhi dapat dilihat dari cakupan item-ietm
yang ada dalam tes. Apakah keseluruhan item tersebut telah merupakan sampel yang
representative bagi seluruh item yang mungkin dibuat, ataukah item tersebut berisi hal-hal
yagn kurang relevan dan meninggalkan hal-hal yang seharusnya menjadi isi tes.
Dalam penyusunan tes prestasi, logical validity sangat penting artinya. Salah satu cara
agar tuntutan validitas ini dapat terpenuhi adalah dengan menyusun suatu perencanaan isi
tes menurut semacam blue print yang disandarkan pada rencana pelajaran atau program
latihan yang akan diujikan. Blue print tes dapat membantu agar penulis item tidak
meninggalkan hal yang penting yang harus ada dalam tes dan sekaligus menjaganya agar
tetap berada dalam batas cakupan isi yang relavan.
Validitas ini menunjuk pada sejauh mana isi tes merupakan representasi dari ciri-ciri
atribut yang hendak diukur. Untuk memperoleh validitas logik yang tinggi, suatu tes harus
dirancang sedemikian rupa sehingga benar-benar berisi hanya aitem yang relevan dan
perlu menjadi bagian tes secara keseluruhan. Penggunaan blueprint sangat membantu
tercapainya validitas logik.
Logical Validity (Validitas Logis). Validitas logis disebut juga sebagai validitas
sampling (sampling validity). Validitas tipe ini menunjuk pada sejauhmana isi alat ukur
merupakan representasi dari aspek yang hendak diukur.
Untuk memperoleh validitas logis yang tinggi suatu alat ukur harus dirancang
sedemikian rupa sehingga benar-benar berisi hanya item yang relevan dan perlu menjadi
bagian alat ukur secara keseluruhan. Suatu objek ukur yang hendak diungkap oleh alat
ukur hendaknya harus dibatasi lebih dahulu kawasan perilakunya secara seksama dan
konkrit. Batasan perilaku yang kurang jelas akan menyebabkan terikatnya item-item yang
tidak relevan dan tertinggalnya bagian penting dari objek ukur yang seharusnya masuk
sebagai bagian dari alat ukur yang bersangkuatan.
Validitas logis memang sangat penting peranannya dalam penyusunan tes prestasi
dan penyusunan skala, yaitu dengan memanfaatkan blue-print atau tabel spesifikasi.
2. Construct Validity
Construct validity menunjukkan pada sejauh mana suatu tes mengukur theoretical
construct yang menjadi dasar penyusunan tes itu. Pengukuran Construct validity merupakan
proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait (sifat) yang
diukur. Namun, pada situasi-situasi tertentu adanya bukti construct validity mungkin
diperlihatkan.
Campbell dan Fiske (1959) mengembangkan satu pendekatan terhadap construct validity
yang mereka sebut multitrait-multimethod validity. Validasi dengan multitrait-multimethod
digunakan dengan mengenakan lebih dari satu macam metode untuk mengukur lebih dari satu
macam trait.
Dengan menggunakan matriks validitas, maka interkolasi antara trait dan antar metode
dapat dilihat, dimana korelasi antara setiap variable dengan diri sendirinya tidak dituliskan
sama dengan 1.00, tetapi diganti oleh koefisien reliabilitasnya.
Secara ideal, koefisien reliabilitas yang ada pada diagonal matriks harus tinggi. Demikian
pula koefisien korelasi antara dua metode berbeda yang mengukur trai yang sama, harus
tinggi. Sedangkan korelasi antara metode yang mengukur dua macam trait yang berbeda,
harus rendah.
Validitas konstruk adalah tipe validitas yang menunjukkan sejauhmana alat ukur
mengungkap suatu trait atau konstruk teoritis yang hendak diukurnya (Allen & Yen, dalam
Azwar 1986).
Pengujian validitas konstruk merupakan proses yang terus berlanjut sejalan dengan
perkembangan konsep mengenai trait yang diukur.
Walaupun pengujian validitas konstruk biasanya memerlukan teknik analisis statistik
yang lebih kompleks daripada teknik yang dipakai pada pengujian validitas empiris lainnya,
akan tetapi validitas konstruk tidaklah dinyatakan dalam bentuk koefisien validitas tunggal.
Konsep validitas konstruk sangatlah berguna pada alat ukur yang mengukur trait yang
tidak memiliki kriteria eksternal.
Adalah seberapa besar derajat tes mengukur konstruk hipotesis yang dikehendaki untuk
diukur. Konstruk adalah perangai yang tidak dapat diamati, yang menjelaskan perilaku.
Menguji validitas konstruk mencakup uji hipotesis yang dideduksi dari suatu teori yang
mengajukan konstruk tersebut.
Adalah tipe validitas yang menunjukkan sejauh mana tes mengungkap suatu trait atau
konstrak teoritik yang hendak diukurnya (Allen & Yen, 1979). Pengujian validitas konstrak
merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait
yang diukur. Hasil estimasi validitas konstrak tidak dinyatakan dalam bentuk suatu koefisien
validitas.
Dukungan terhadap adanya validitas konstrak, menurut Magnusson, dapat dicapai
melalui beberapa cara antara lain :
Studi mengenai perbedaan diantara kelompok-kelompok yang menurut teori harus
berbeda
Apabila teori mengatakan bahwa antara suatu kelompok dengan kelompok lainnya harus
memiliki skor yang berbeda.
Studi mengenai pengaruh perubahan yang terjadi dalam diri individu dan lingkungannya
terhadap hasil tes
Apabila teori mengatakan bahwa hasil tes dipengaruhi oleh kondisi subjek dikarenakan
faktor kematangan.
Studi mengenai korelasi diantara berbagai variabel yang menurut teori mengukur aspek
yang sama
Studi ini dapat diperluas dengan mengikutsertakan korelasi antara berbagai skor tes yang
mengukur aspek yang berbeda.
Studi mengenai korelasi antaraitem atau antar belahan tes
Interkorelasi yang tinggi antarbelahan dari suatu tes dapat dianggap sebagai bukti bahwa
tes mengukur satu variabel satuan (unitary variable).
Dua diantara pendekatan yang banyak digunakan dalam pengujian validitas konstruk
antara lain adalah pengujian multitrait-multimetod dan pendekatan faktor.
a. Validitas Multitrait-Multimethod
Pendekatan ini dapat digunakan bilamana terdapat dua trait atau lebih yang diukur
oleh dua macam metode atau lebih.
b. Validitas Faktor
Analisis faktor merupakan kumpulan prosedur matematika yang kompleks guna
menganalisis hubungan diantara variabel-variabel dan menjelaskan hubungan tersebut
dalam bentuk kelompok variabel yang terbatas yang disebut vaktor. Oleh karena itu,
validitas yang ditegakkan melalui analisis vaktor disebut sebagai validitas vaktor.
3. Criterion-related Validity
Prosedur guna mencapai criterion-related validity menghendaki adanya criteria eksternal
yang dapat dihubungkan dengan skor tes yang diuji validitasnya. Kriteria adalah variable
periliku yang akan diprediksi oleh skor tes. Koefisien korelasi antara skor tes (X) dengan
criteria (Y) merupakan koefisien validitas yang disimbolkan oleh . Koefisien ini dapat
diperoleh melalui dua prosedur yang berbeda dari segi waktu pengambilan data (skor)
kriterianya, masing-masing akan menghasilkan predictive validity dan concurrent validity.
Predictive validity diperoleh apabila pengambilan skor criteria tidak bersamaan dengan
pengambilan skor tes. Setelah subjek dikenai tes yang akan dicari validitasnya, lalu diberikan
tenggang waktu tertentu sebelum skor criteria diambil dari subyek yang sama. Prosedur
predictive validity memerlukan waktu yang banyak dan mungkin pula biaya yang besar
karena prosedur ini pada dasarnya bukan pekerjaan yang dianggap selesai setelah sekali
melakukan analisis, malainkan lebih merupakan kontinyuitas dalam mengembangkan tes
sebagai predictor. Sebagaimana pada umumnya prosedur validitas yang lain, predictive
validity harus diiringi oleh peningkatan kualitas item tes berupa modifikasi dan
pengembangan item-item baru.
Validitsa relasi-kruteria dikaji dengan cara membandingkan skor tes atau skala dengan
atu atau lebih peubah ekstra (Variabel eksternal) atau kriteria yang diketahui (atau diyakini)
merupakan pengukur atribut yang sedang dikaji. Yang lebih diperhatikan dalam validasi
relasi-kriteria adalah bukan apa yang diukur oleh tes tersebut melainkan kemampuan test
tersebut dalam membuat prediksi.
Pengujian validitas relasi-kriteria dapat dilakukan dengan mengkorelasikan suatu alat
ukur dengan kriteria lain yang dianggap (atau diyakini) merupakan pengukur atribut yang
sedang dikaji. Semakin tinggi korelasinya, maka makin baiklah validitasnya. Kesulitan
terbesar dalam hal validasi ini adalah bagaimana mendapatkan ktiteria yang digunakan
sebagai pembanding.
Menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor
tes. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor tes atau berupa
suatu ukuran lain yang relevan. Untuk melihat tingginya validitas berdasar kriteria dilakukan
komputasi korelasi antara skor tes dengan skor kriteria. Koefisien ini merupakan koefisien
validitas bagi tes yang bersangkutan, yaitu r xy, dimana X melambangkan skor tes dan Y
melambangkan skor kriteria
Pendekatan validitas berdasar kriteria menghendaki tersedianya kriteria eksternal yang
dapat dijadikan dasar pengujian skor alat ukur. Suatu kriteria adalah variabel perilaku yang
akan diprediksikan oleh skor alat ukur.
Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi korelasi antara
skor alat ukur dengan skor kriteria. Koefisien ini merupakan koefisien validitas bagi alat ukur
yang bersangkutan, yaitu r xy, dimana x melambangkan skor alat ukur dan y melambangkan
skor kriteria.
Dilihat dari segi waktu untuk memperoleh skor kriterianya, prosedur validasi berdasar
kriteria menghasilkan dua macam validitas yaitu validitas prediktif (predictive validity) dan
validitas konkuren (concurrent validity).
a. Validitas Prediktif
Validitas prediktif sangat penting artinya bila alat ukur dimaksudkan untuk berfungsi
sebagai prediktor bagi kinerja di masa yang akan datang. Contoh situasi yang
menghendaki adanya prediksi kinerja ini antara lain adalah dalam bimbingan karir; seleksi
mahasiswa baru, penempatan karyawan, dan semacamnya.
Contohnya adalah sewaktu kita melakukan pengujian validitas alat ukur kemampuan
yang digunakan dalam penempatan karyawan. Kriteria yang terbaik antara lain adalah
kinerjanya setelah ia betul-betul ditempatkan sebagai karyawan dan melaksanakan
tugasnya selama beberapa waktu. Skor kinerja karyawan tersebut dapat diperoleh dari
berbagai cara, misalnya menggunakan indeks produktivitas atau rating yang dilakukan
oleh atasannya.
Koefisien korelasi antara skor alat ukur dan kriteria merupakan petunjuk mengenai
saling hubungan antara skor alat ukur dengan skor kriteria dan merupakan koefisien
validitas prediktif. Apabila koefisien ini diperoleh dari sekelompok individu yang
merupakan sampel yang representatif, maka alat ukur yang telah teruji validitasnya akan
mempunyai fungsi prediksi yang sangat berguna dalam prosedur alat ukur di masa datang.
Prosedur validasi prediktif pada umumnya memerlukan waktu yang lama dan
mungkin pula beaya yang tidak sedikit dikarenakan prosedur ini pada dasarnya bukan
pekerjaan yang dianggap selesai setelah melakukan sekali tembak, melainkan lebih
merupakan kontinuitas dalam proses pengembangan alat ukur. Sebagaimana prosedur
validasi yang lain, validasi prediktif pada setiap tahapnya haruslah diikuti oleh usaha
peningkatan kualitas item alat ukur dalam bentuk revisi, modifikasi, dan penyusunan
item-item baru agar prosedur yang dilakukan itu mempunyai arti yang lebih besar dan
bukan sekedar pengujian secara deskriptif saja.
Validitas prediktif, sangat penting artinya bila tes dimaksudkan untuk berfungsi
sebagai prediktor bagi performansi diwaktu yang akan datang.
Adalah seberapa besar derajat tes berhasil memprediksi kesuksesan seseorang pada
situasi yang akan datang. Validitas prediktif ditentukan dengan mengungkap hubungan
antara skor tes dengan hasil tes atau ukuran lain kesuksesan dalam satu situasi sasaran.
b. Validitas Konkuren
Apabila skor alat ukur dan skor kriterianya dapat diperoleh dalam waktu yang sama,
maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkuren.
Suatu contoh dimana validitas konkuren layak diuji adalah apabila kita menyusun
suatu skala kecemasan yang baru. Untuk menguji validitas skala tersebut kita dapat
mengunakan skala kecemasan lain yang telah lebih dahulu teruji validitasnya, yaitu
dengan alat ukur TMAS (Tylor Manifest Anxiety Scale).
Validitas konkuren merupakan indikasi validitas yang memadai apabila alat ukur tidak
digunakan sebagai suatu prediktor dan merupakan validitas yang sangat penting dalam
situasi diagnostik. Bila alat ukur dimaksudkan sebagai prediktor maka validitas konkuren
tidak cukup memuaskan dan validitas prediktif merupakan keharusan.
Validitas ini menunjukkan seberapa besar derajat skor tes berkorelasi dengan skor
yang diperoleh dari tes lain yang sudah mantap, bila disajikan pada saat yang sama, atau
dibandingkan dengan kriteria lain yang valid yang diperoleh pada saat yang sama.
Validitas konkruen, apabila skor tes dan skor kriterianya dapat diperoleh dalam waktu
yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas
konkruen.

F. Aplikasi
Validitas konstruk mencakup syarat-syarat empiris dan logis dari validitas isi dan validitas
kriteria. Hal Ini berari bahwa validitas konstruk menggabungkan syarat-syarat yang terdapat
dalam validitas isi dan validitas relasi kriteria (Anastasi, 1997). Validitas konstruk
menghubungkan gagasan dan praktek pengukuran di satu pihak, dengan gagasan teoretik di
pihak lain. Para penyusunan instrumen biasanya bertolak dengan bekal suatu konstruk,
kemudian mengembangkan instrumen untuk mengukur konstruk tersebut. Selanjutnya, butir-
butir instrumen yang telah dikembambangkan diujicobakan secara empiris.
Validitas isi dan validitas konstruk berhubungan dengan kecocokan butir-butir instrumen
dengan tujuan ukurnya. Kedua jenis validitas tersebut dapat ditentukan melalui pengkajian
secara teoretis dan secara empiris, yang mencakup: (1) menjelaskan pokok bahasan dan sub
pokok bahasan; (2) menetapkan pokok bahasan dan subpokok bahasan yang diukur oleh
setiap butir instrumen; (3) mencocokkan butir-butir instrumen dengan pokok bahasan dan
subpokok bahasan yang diukurnya. Secara teoretis validitas isi dan validitas konstruk dapat
dikaji melalui penilaian panelis. Penilaian panelis dimaksudkan untuk menilai kesesuaian
setiap butir instrumen dengan pokok bahasan dan subpokok bahasan yang diukurnya.
Prosedur yang digunakan adalah meminta para panelis untuk mencermati butir-butir
instrumen. Kemudian menilai kesesuaian setiap butir instrumen dengan pokok bahasan dan
subpokok bahasan yang diukurnya.
Suatu contoh penilaian validitas isi dan validitas konstruk secara teoretis dapat dilakukan
melalui penilaian panelis (pakar). Pengembangan prosedur penilaian panelis dapat dilakukan
melalui beberapa langkah, yaitu: Pertama, menetapkan skala yang digunakan, yaitu: 1 = tidak
relevan, 2 = kurang relevan, 3 = cukup relevan, 4 = relevan, dan 5 = sangat relevan. Kedua,
menetapkan kriteria penilaian yang mencakup: (1) mengukur indikatornya; (2) hanya
memiliki satu arti; (3) jelas dan mudah dipahami; (4) tidak bersifat faktual; dan (5) tidak
tumpang tindih dengan butir-butir lainnya. Ketiga, menetapkan pilihan, yaitu: 1 (tidak
relevan) jika hanya satu atau semua kriteria tidak terpenuhi; 2 (kurang relevan) jika hanya dua
kriteria yang terpenuhi; 3 (cukup relevan) jika hanya tiga kriteria yang terpenuhi; 4 (relevan)
jika hanya empat kriteria yang terpenuhi; dan 5 (sangat relevan) jika semua kriteria terpenuhi.
Keempat, kualitas masing-masing butir instrumen didasarkan atas rerata hasil penilaian
panelis, dengan kriteria sebagai berikut:
Rerata Penilaian Keputusan
1,0 2,9 Tidak sesuai Direvisi
3,0 3,9 Cukup sesuai Diterima dengan revisi
4,0 5,0 SesuaiDiterima
Penilaian validitas isi dan validitas konstruk secara empiris dilakukan dengan ujicoba
instrumen kepada responden yang sesuai dengan karakteristik responden tempat pemberlakuan
instrumen final. Penetapan jumlah sampel dapat diacuh dari pendapat Nunnaly (1970) bahwa
untuk mengurangi resiko kehilangan butir-butir instrumen dan agar memungkinkan untuk
mengeliminasi faktor-faktor yang tidak dikehendaki maka dalam analisis instrumen
direkomendasikan untuk digunakan sampel 510 kali jumlah butir instrumen.
Ujicoba secara empiris dimaksudkan untuk menganalisis validitas isi dan validitas konstruk
instrumen secara empiris. Validitas isi biasanya digunakan untuk menyebut validitas instrumen
tes, sedangkan validitas konstruk biasanya digunakan untuk menyebut validitas instrumen non
tes. Secara empiris, kedua jenis validitas tersebut dianalisis dengan cara yang berbeda.
Validitas isi. Secara empiris alat analisis validitas isi yang biasa digunakan (khusus untuk
tes pilihan ganda) adalah Item and Test Analysis (ITEMAN). Alat analisis ini dimaksudkan
untuk mendapatkan informasi tentang: indeks kesukaran butir tes, indeks daya beda butir, dan
keberfungsian pengecoh. Disamping itu, juga untuk menentukan: korelasi biserial titik (point
biserial correlation), dan keseimbangan isi atau keterwakilan materi yang hendak diukur.
Secara empiris kelima informasi tersebut dibutuhkan karena saling berhubungan antara satu
dengan yang lainnya, dimana keberfungsian pilihan dapat meningkatkan indeks kesukaran
butir tes, indeks kesukaran butir tes dapat menentukan daya beda butir, dan indeks kesukaran
dan daya beda butir dapat mempengaruhi interkorelasi butir, dan secara keseluruhan kelima
informasi tersebut merupakan penentu tingkat reliabilitas tes. Untuk jelasnya prosedur analisis
butir dan penetapan kriteria untuk menerima, menolak atau merevisi butir-butir tes, secara
berturut-turut sebagai berikut:
a) Indeks kesukaran butir (p). Indeks kesukaran butir tes adalah proporsi peserta yang
menjawab benar butir tes. Indeks kesukaran butir yang baik berkisar antara 0,3-0,7
paling baik pada 0,5; karena p=0,5 dapat memberikan kontribusi optimal terhadap
korelasi biserial titik, daya pembeda butir, dan reliabilitas tes. Butir-butir tes yang
memiliki indeks kesukaran di bawah atau di atas kriteria 0,3 - 0,7 dapat digunakan
apabila ada pertimbangan keterwakilan pokok bahasan yang diukurnya.
b) Daya pembeda butir (D). Daya pembeda butir adalah kemampuan butir tes untuk
membedakan siswa mampu dan kurang mampu. Indeks daya beda butir mempunyai
rentang nilai 1 ke +1, namun nilai negatif dan rendah menunjukkan kinerja butir
yang rendah. Suatu butir tes dapat dipertahankan apabila memiliki nilai D 2,0.
Indeks daya beda butir dihitung dengan menggunakan rumus: D= pu - pi; dimana: pu
= proporsi kelompok atas yang menjawab benar, pi = proporsi kelompok bawah yang
menjawab benar. Pembagian kelompok responden didasarkan atas pendapat Kelly
(1939) yang dikutip oleh Crocker dan Algina (1996) bahwa indeks daya beda butir
yang lebih stabil dan sensitif dapat dicapai dengan menggunakan 27 persen kelompok
atas dan 27 persen kelompok bawah.
c) Korelasi biserial titik (rpbi). Korelasi biserial titik adalah korelasi antara skor butir tes
dengan skor total. Korelasi biserial titik dapat disamakan dengan daya beda butir,
namun rpbi itu sendiri perlu dihitung karena dapat menyediakan refleksi yang
sebenarnya dari kontribusi setiap butir tes terhadap keberfungsian tes. Semakin tinggi
rpbi suatu butir tes semakin tinggi kontribusinya dalam memprediksi kriteria. Suatu
butir tes dapat dipertahankan apabila memiliki rpbi 0,30.
d) Keberfungsian pengecoh. Suatu pengecoh dapat dipertahankan apabila memenuhi
syarat-syarat: (1) kunci jawaban (keyed answer) harus dipilih lebih banyak oleh
kelompok atas daripada kelompok bawah; (2) setiap penggagal (foils) harus dipilih
minimal 2 persen dari keseluruhan peserta tes dan dipilih minimal 5 persen kelompok
bawah, (3) Indeks daya beda kunci jawaban harus positif dan indeks daya beda
penggagal harus negatif.
Validitas konstruk. Sama halnya dengan prosedur ujicoba instrumen tes, instrumen non
tes juga diujicobakan secara empiris kepada sejumlah responden (5-10 kali jumlah butir
instrumen). Data hasil ujicoba secara empiris dari instrumen non tes biasanya dianalisis
dengan menggunakan Analisis Faktor Konfirmasi (Confirmatory Factor Analysis) dengan
menggunakan metode ekstraksi komponen utama (principle component extraction). Analisis
tersebut bertujuan untuk menguji kebenaran konstruk teori yang dijadikan acuan dalam
pengembangan instrumen, dengan cara menentukan struktur atau model faktor dari sejumlah
butir instrumen berdasarkan muatan faktor (factor loading) jumlah varians (eigenvalue), dan
proporsi varians (communality). Dalam analisis ini juga digunakan rotasi ortogonal dan
varimax. Beberapa kriteria yang dijadikan acuan dalam analisis faktor adalah:
a) Ukuran kecukupan pensampelan (sampling adequacy). Ditentukan dengan
menggunakan rumus Kaiser-Meyer-Olkin (KMO), yaitu dengan membandingkan nilai
koefisien korelasi observasi dengan koefisien korelasi parsial (Norusis, 1996). Jika
koefisien korelasi parsial kecil maka nilai KMO besar (mendekati satu) berarti dapat
digunakan analisis faktor, sebaliknya jika nilai koefisien korelasi parsial besar maka
nilai KMO kecil (mendekati nol) berarti tidak dapat digunakan analisis faktor.
Jelasnya penafsiran nilai KMO diacuh dari ciri yang dikemukakan oleh Kaiser (1974)
seperti dikutip oleh Norusis (1996) bahwa KMO 0,90 baik sekali (marvelous); 0,80
baik (meritorius); 0,70 sedang (middling); 0,60 kurang (mediocre); 0,50 sangat kurang
(miserable); dan dibawah 0,50 tidak dapat diterima (unacceptable).
b) Uji Bartlett tentang bentuk matriks korelasi (Bartletts test of sphericity). Uji ini
dimaksudkan untuk memastikan apakah matriks korelasi berasal dari matriks identitas
atau bukan. Dalam uji ini digunakan pendekatan Chisquare dan dibutuhkan data yang
berasal dari populasi normal multivariat. Dengan ketentuan bahwa bila matriks
korelasi merupakan matriks identitas (makriks dengan diagonal 1 dan selain diagonal
0) maka tidak dapat digunakan analisis faktor, sebaliknya bila matriks korelasi bukan
matriks identitas maka dapat digunakan analisis faktor.
c) Banyaknya faktor. Banyaknya faktor ditetapkan berdasarkan aturan yang
dikemukakan oleh Norusis (1996) bahwa jumlah faktor harus diekstraksi sama dengan
jumlah faktor yang mempunyai varians (eigenvalue) lebih besar dari 1,0.
d) Muatan faktor (factor loading). Muatan faktor diseleksi setelah melalui ekstraksi
komponen utama (extracting principal component) dengan rotasi ortogonal untuk
memaksimalkan varians (variance maximizing/ varimax) antara variabel utama.
Muatan faktor yang tetap dipertahankan adalah di atas 0,3. Hal ini sesuai dengan
aturan yang dikemukakan oleh Crocker dan Algina (1996) bahwa muatan faktor yang
lebih dari 0,3 cenderung siginifikan, sebaliknya muatan faktor yang kurang dari 0,3
tidak dapat memberikan kontribusi yang siginifikan terhadap suatu faktor tertentu.

G. Konsep Pengukuran Validitas


Pengukuran validitas sebenarnya dilakukan untuk mengetahui seberapa besar (dalam arti
kuantitatif) suatu aspek psikologis terdapat dalam diri seseorang, yang dinyatakan oleh skor
pada instrumen pengukur yang bersangkutan.
Dalam hal pengukuran ilmu sosial, validitas yang ideal tidaklah mudah untuk dapat
dicapai. Pengukuran aspek-aspek psikologis dan sosial mengandung lebih banyak sumber
kesalahan (error) daripada pengukuran aspek fisik. Kita tidak pernah dapat yakin bahwa
validitas instrinsik telah terpenuhi dikarenakan kita tidak dapat membuktikannya secara
empiris dengan langsung.
Pengertian validitas alat ukur tidaklah berlaku umum untuk semua tujuan ukur. Suatu alat
ukur menghasilkan ukuran yang valid hanya bagi satu tujuan ukur tertentu saja. Tidak ada alat
ukur yang dapat menghasilkan ukuran yang valid bagi berbagai tujuan ukur. Oleh karena itu,
pernyataan seperti "alat ukur ini valid" belumlah lengkap apabila tidak diikuti oleh keterangan
yang menunjukkan kepada tujuannya, yaitu valid untuk apa dan valid bagi siapa. Itulah yang
ditekankan oleh Cronbach (dalam Azwar 1986) bahwa dalam proses validasi sebenarnya kita
tidak bertujuan untuk melakukan validasi alat ukur akan tetapi melakukan validasi terhadap
interpretasi data yang diperoleh oleh prosedur tertentu.
Dengan demikian, walaupun kita terbiasa melekatkan predikat valid bagi suatu alat ukur
akan tetapi hendaklah selalu kita pahami bahwa sebenarnya validitas menyangkut masalah
hasil ukur bukan masalah alat ukurnya sendiri. Sebutan validitas alat ukur hendaklah diartikan
sebagi validitas hasil pengukuran yang diperoleh oleh alat ukur tersebut.

H. Koefisien Validitas dan Variasi Skor Murni Presiktor


Bila skor pada tes diberi lambang x dan skor pada kriterianya mempunyai lambang y
maka koefisien antara tes dan kriteria itu adalah r xy inilah yang digunakan untuk menyatakan
tinggi-rendahnya validitas suatu alat ukur.
Koefisien validitas pun hanya punya makna apabila apalagi mempunyai harga yang
positif. Walaupun semakin tinggi mendekati angka 1 berarti suatu tes semakin valid hasil
ukurnya, namun dalam kenyataanya suatu koefisien validitas tidak akan pernah mencapai
angka maksimal atau mendekati angka 1. Bahkan suatu koefisien validitas yang tinggi adalah
lebih sulit untuk dicapai daripada koefisien reliabilitas. Tidak semua pendekatan dan estimasi
terhadap validitas tes akan menghasilkan suatu koefisien. Koefisien validitas diperoleh hanya
dari komputasi statistika secara empiris antara skor tes dengan skor kriteria yang besarnya
disimbolkan oleh rxy tersebut. Pada pendekatan-pendekatan tertentu tidak dihasilkan suatu
koefisien akan tetapi diperoleh indikasi validitas yang lain.
Dalam pembahasan mengenai reliabilitas bahwa besarnya koefisien reliabiiltas tergantung
antara lain pada variasi skor-murni. Sebagai pegangan praktis, dapat dikatakan bahwa
validitas uji dengan cara menghitung kecocokan antara skor-tampak tes dan skor kriterianya.
Akan tetapi dalam berbagai hal sering terjadi restriksi sebaran (restriction of range) baik pada
distribusi skor tes sebagai predictor maupun pada distribusi skor criteria.
Bila skor predictor adalah x dan skor criteria adalah y, maka korelasi x dan y adalah
yang merupakan koefisien validitas prediktif tes x. hubungan antara dan kesalahan
standar estimasi dirumuskan sebagai:

Keterangan:
= Kesalahan standad estimasi x terhadap y, yaitu deviasi standard distribusi y
untuk harga x tertentu.
= Deviasi standard skor criteria y (distribusi marginal).
= Koefisien korelasi antara predictor x dan criteria y.
Dengan asumsi homoscedasticity, maka harga akan mengecil akibat restriksi
sistematis yang terjadi. Secara umum dapat dikatakan bahwa restriksi sebaran yang
menjadikan variasi skor murni predictor mengecil akan menghasilkan underestimasi
terhadap koefisien validitas yang sesungguhnya.

I. Validitas dan Panjang Tes


Bilamana panjang tes ditingkatkan dengan menambahkan sejumlah item baru yang isinya
parallel dengan isi tes semula, maka reliabilitas tes akan meningkat.Tes yang reliabilitasnya
meningkat akan bertambah pula tinggi validitasnya. Semakin besar proporsi varians skor-
tampak yang merupakan varians skor murni (artinya, semakin reliable) maka semakin besar
pula proporsi varians yang sama-sama dimiliki oleh tes dan kriterianya (artinya, semakin
valid).
Telah diketahui bahwa validitas maksimum tes yang mempunyai reliabilitas adalah

. Dengan bertambah panjangnya tes sebesar J kali panjang semula, maka validitas
maksimumnya dapat dilambangkan sebagai , sehingga rasio antara validitas
maksimum setelah penambahan dan sebelum penambahan item adalah:

Dimana:

= validitas maksimum setelah memperpanjang tes menjadi J kali jumlah item semula.

= validitas maksimum sebelum penambahan item.

= reliabilitas setelah penambahan item.

= reliabilitas sebelum penambahan item.

J. Pendekatan Internal Consistency dalam Validasi Item


Pada tipe validitas dan concurrent yang dikategorikan sebagai criterion-related validity,
criteria yang digunakan adalah skor tes atau skor pengukuran lain yang disebut criteria
eksternal. Dalam prosedur seleksi item pada tes prestasi, berbagai skala sikap dan tes
kemampuan lain, umumnya item-item dipilih menurut daya diskriminasinya. Daya
diskriminasi ini diperlihatkan oleh indeks atau koefisien yang dihitung menurut formula
tertentu.

Dimana:

= Nilai t sebagai indeks diskriminasi item i.

= Mean distribusi skor golongan atas, yang biasanya diambil dari 25% subyek
yang mempunyai skor total tertinggi, untuk item i.

= Mean skor subyek golongan bawah untuk item i.

= Varians skor subjek golongan atas untuk item i.


= Varians skor subjek golongan bawah untuk item i.

= Jumlah subjek golongan atas.

= Jumlah subjek golongan bawah.

K. Penyebab Invaliditas
Ancaman utama terhadap validitas instrumen adalah:
1. Ketakterwakilan konstruk; menunjukkan bahwa tugas yang diukur dalam penilaian
tidak mencakup dimensi penting dari konstruk. Oleh karena itu, hasil tes tersebut tidak
mungkin untuk mengungkapkan kemampuan siswa sebenarnya dalam konstruk yang
hendak diukur oleh instrumen;
2. Penyimpangan keragaman konstruk berarti bahwa instrumen tersebut mengukur
terlalu banyak variabel, dan kebanyakan variabel tersebut tidak relevan terhadap isi
konstruk. Jenis penyimpangan validitas seperti ini mencakup dua bentuk, yaitu
penyimpangan kemudahan konstruk (Construct irrelevant easiness) dan penyimpangan
kesukaran konstruk (Construct irrelevant difficulty). Penyimpangan kemudahan
konstruk terjadi ketika faktor-faktor luar seperti kata-kata kunci atau bentuk instrumen
memungkinkan seseorang untuk menjawab benar dengan cara yang tidak sesuai
dengan konstruk yang diukur, dan penyimpangan kesukaran konstruk terjadi bila
aspek-aspek luar dari tugas membuat tingkat kesukaran tugas tidak sejalan terhadap
sebagian atau keseluruhan anggota kelompok. Sementara bila terjadi penyimpangan
keragaman konstruk yang pertama menyebabkan seseorang memperoleh skor yang
lebih tinggi dibanding dengan kemampuan yang sebenarnya, dan terjadinya
penyimpangan keragaman konstruk yang kedua menyebabkan seseorang memperoleh
skor yang lebih rendah dibanding dengan kemampuan yang sebenarnya.

Keterangan
Validitas mengacu pada apakah kuesioner benar-benar dapat mengukur apa yang ingin diukur
Sebagian besar validitas diukur secara logika (subyekif), hanya validitas konstruk yang dapat
diukur secar matematika/statistika.
DAFTAR PUSTAKA

Allen, M. J., & Yen, W. M. (1979). Introduction to measurement theory. California:


Brooks/Cole Publishing Company.

Ebel, R. L., & Frisbie, D. A. (1986). Essential of educational measurement ( ed). New
Jersey: Prentice-Hall, Inc.

Djemari Mardapi, (2004). Penyusunan tes hasil belajar. Yogyakarta: Pascasarjana Univarsitas
Negeri Yogyakarta.

You might also like