You are on page 1of 22

A.

CARA PENGUKURAN VALIDITAS


1. Pengertian Validitas
Valid (dalam bahasa Indonesia) disebut dengan istilah "sahih".
Misalnya: Untuk mengukur panjang dipakai meteran, mengukur berat
dipakai timbangan, mengukur penguasaan matematika dipakai ujian
matematika untuk kelas yang setara, dan sebagainya. Secara lebih jelas, suatu
ujian untuk mata kuliah tertentu dikatakan valid jika ia benar-benar cocok
dengan tujuan-tujuan yang telah ditetapkan untuk dicapai dengan penyajian
mata kuliah tersebut. Suatu alat pengukur dikatakan valid jika ia benar-
benar cocok untuk mengukur apa yang hendak diukur. Sebagaimana
dikemukakan oleh Scarvia B. Anderson dalam bukunya "Encyclopedia of
Educational Evaluation" disebutkan bahwa "A test is valid it measures
what it purpose to measure" (sebuah tes dikatakan valid apabila tes
tersebut mengukur apa yang hendak diukur).
Validitas bukan ditekankan pada tes itu sendiri tetapi pada hasil
pengetesan atau skornya. Suatu tes hasil belajar dapat dikatakan tes yang
valid apabila tes tersebut betul-betul dapat mengukur hasil belajar. Jadi
bukan sekedar mengukur daya ingat atau kemampuan bahasa saja misalnya.
a. Menurut Gronlund dan Linn (1990): Validitas adalah ketepatan
interpretasi yang dibuat dari hasil pengukuran atau evaluasi.
b. Menurut Anastasi (1990): Validitas adalah ketepatan mengukur
konstruk, menyangkut; What the test measure and how well it does
c. Menurut Arikunto (1995): Validitas adalah keadaan yang
menggambarkan tingkat instrumen bersangkutan yang mampu
mengukur apa yang akan diukur.
d. Menurut Sukadji (2000): Validitas adalah derajat yang menyatakan
suatu tes mengukur apa yang seharusnya diukur.
e. Menurut Azwar (1986): Validitas adalah sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsinya.
Validitas berasal dari kata validity yang mempunyai arti sejauh mana
ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi
ukurnya. Dalam kaitannya dengan tes dan penilaian, Retno
mengemukakan tiga pokok pengertian yang bisa digunakan sebagai
berikut:
a. Validitas berkenaan dengan hasil dari suatu alat tes atau alat
evaluasi, dan tidak menyangkut alat itu sendiri. Tes intelegensi
sebagai alat untuk melakukan tes kecerdasan hasilnya valid, tapi
kalau digunakan untuk melakukan tes hasil belajar tidak valid.
b. Validitas adalah persoalan yang menyangkut tingkat (derajat),
sehingga istilah yang digunakan adalah derajat validitas suatu tes
maka suatu tes ada yang disebut validitasnya tinggi, sedang dan
rendah.
c. Validitas selalu dibatasi pada pengkhususannya dalam penggunaan
dan tidak pernah dalam arti kualitas yang umum. Suatu tes berhitung
mungkin tinggi validitasnya untuk mengukur keterampilan
menjumlah angka, tetapi rendah validitasnya untuk mengukur
berfikir matematis dan sedang validitasnya untuk meramal
keberhasilan siswa dalam pelajaran matematik yang akan datang.
Validitas adalah kesahihan pengukuran atau penilaian dalam penelitian.
Dalam analisis isi, validitas dilakukan dengan berbagai cara atau metode
sebagai berikut:
a. Pengukuran produktivitas (productivity), yaitu derajat di mana suatu
studi menunjukkan indikator yang tepat yang berhubungan dengan
variabel.
b. Predictive validity, yaitu derajat kemampuan pengukuran dengan
peristiwa yang akan datang.
c. Construct validity, yaitu derajat kesesuaian teori dan konsep yang
dipakai dengan alat pengukuran yang dipakai dalam penelitian
tersebut
2. Bentuk-Bentuk Validitas Secara Garis besar
Secara garis besar ada dua macam validitas yaitu validitas logis dan validitas
empiris :
a. Validitas logis
Istilah validitas logis mengandung kata logis berasal dari kata
logika yang berarti penalaran. Dengan makna demikian maka validitas
logis untuk sebuah instrumen evaluasi menunjuk pada kondisi bagi
sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil
penalaran. Kondisi valid tersebut dipandang terpenuhi karena
instrumen yang bersangkutan sudah dirancang secara baik, mengikuti
teori dan ketentuan yang ada. Sebagaimana pelaksanaan tugas yang
lain misalnya membuat karangan, jika penulis sudah mengikuti aturan
mengarang, tentu secara logis karangannya sudah baik. Berdasarkan
penjelasan tersebut maka instrumen yang sudah disusun berdasarkan
teori penyusunan instrumen, secara logis sudah valid. Dari penjelasan
tersebut kita dapat memahami bahwa validitas logis dapat dicapai
apabila instrumen disusun mengikuti ketentuan yang ada. Dengan
demikian dapat disimpulkan bahwa validitas logis tidak perlu di uji
kondisinya tetapi langsung diperoleh sesudah instrumen tersebut
selesai di susun. Ada dua macam validitas logis yang dapat dicapai
oleh sebuah instrumen yaitu: validitasisi dan validitas konstrak.
1) Validitas isi (conten validity)
Sebuah tes di katakan memiliki validitas isi apabila mengukur
tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran
yang diberikan. Oleh karena materi yang diajarkan tertera pada
kurikulum maka validitas isi sering juga disebut validitas
kurikuler. Validitas isi dapat diusahakan tercapainya sejak saat
penyusunan dengan cara memerinci materi kurikulum atau materi
buku pelajaran. Bagaimana cara memerinci materi
untuk kepentingan diperolehnya validitas isi sebuah tes akan
dibicarakan secara lebih mendalam pada waktu menjelaskan cara
penyusunan tes.
2) Validitas konstruksi (contruct validity)
Sebuah tes di katakan memiliki validitas konstruksi apabila
butir-butir soal yang membangun tes tersebut mengukur setiap
aspek berpikir seperti yang disebutkan dalam tujuan instruksional
khusus. Dengan kata lain jika butir-butir soal mengukur aspek
berpikir tersebut sudah sesuai dengan aspek berpikir yang menjadi
tujuan instruksional.
b. Validitas empiris
Istilah validitas empiris memuat kata empiris yang artinya
pengalaman. Sebuah instrumen dapat dikatakan memiliki validitas
empiris apabila sudah di uji dari pengalaman. Sebagai contoh sehari-
hari, seseorang dapat diakui jujur oleh masyarakat apabila
dalam pengalaman dapat di buktikan bahwa orang tersebut memang
jujur. Dari penjelasan dan contoh-contoh tersebut diketahui bahwa
validitas empiris tidak dapat diperoleh hanya dengan menyusun
instrumen berdasarkan ketentuan seperti halnya validitas logis, tetapi
harus dibuktikan melalui pengalaman. Ada dua macam validitas
empiris, yakni ada dua cara yang dapat di lakukan untuk menguji
bahwa sebuah instrumen memang valid.
Pengujian tersebut dilakukan dengan membandingkan kondisi
instrumen yang bersangkutan dengan kriterium atau sebuah ukuran.
Kriterium yang di gunakan sebagai pembanding kondisi instrumen
dimaksud ada dua yaitu: yang sudah tersedia dan yang belum ada
tetapi akan terjadi di waktu yang akan datang (prediksi).
1) Validitas ada sekarang (concurrent validity)
Validitas ini lebih garis besar dikenal dengan validitas empiris.
Sebuah tes dikatakan memiliki validitas empiris jika hasilnya
sesuai dengan pengalaman. Jika ada istilah sesuai tentu ada dua
hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan dengan
hasil pengalaman. Pengalaman selalu mengenai hal yang telah
lampau sehingga data pengalaman tersebut sekarang sudah ada
(ada sekarang, concurrent).
Dalam membandingkan hasil sebuah tes maka diperlukan suatu
kriterium atau alat pembanding. Maka hasil tes merupakan sesuatu
yang dibandingkan. Untuk jelasnya di bawah ini dikemukakan
sebuah contoh. Misalnya seorang guru ingin mengetahui apakah
tes sumatif yang disusun sudah valid atau belum. Untuk itu
diperlukan sebuah kriterium masa lalu yang sekarang datanya
dimiliki. Misalnya nilai ulangan harian atau nilai ulangan sumatif
yang lalu.
2) Validitas prediksi (predictive valydity)
Memprediksi artinya meramal, dengan meramal selalu
mengenai hal yang akan datang jadi sekarang belum terjadi.
Sebuah tes dikatakan memiliki validitas prediksi atau validitas
ramalan apabila mempunyai kemampuan untuk meramalkan apa
yang akan terjadi pada masayang akan datang. Misalnya tes masuk
perguruan tinggi adalah sebuah tes yang diperkirakan mampu
meramalkan keberhasilan peserta tes dalam mengikuti kuliah
dimasa yang akan datang. Apabila calon peserta memiliki nilai tes
yang tinggi tentu menjamin keberhasilannya kelak.
Sebaliknya seorang calon dikatakan tidak lulus apabila
memiliki nilai yang rendah jadi diperkirakan akan tidak mampu
mengikuti perkuliahan yang akan datang. Sebagai alat pembanding
validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta
tes mengikuti pelajaran di perguruan tinggi. Jika ternyata siapa
yang memiliki nilai tes yang lebih tinggi gagal dalam ujian
semester 1 dibandingkan dengan yang dahulu nilai tesnya lebih
rendah maka tes masuk yang dimaksud tidak memiliki validitas
prediksi.

3. Bentuk-Bentuk Validitas Menurut Para Ahli.


a. Menurut Ebel (dalam Nazir 1988) ada 9 jenis-jenis validitas:
1) Concurrent Validity adalah validitas yang berkenaan dengan
hubungan antara skor dengan kinerja.
2) Construct Validity adalah validitas yang berkenaan dengan kualitas
aspek psikologisapa yang diukur oleh suatu pengukuran serta
terdapat evaluasi bahwa suatu konstruk tertentu dapat dapat
menyebabkan kinerja yang baik dalam pengukuran.
3) Face Validity adalah validitas yang berhubungan apa yang nampak
dalam mengukur sesuatu dan bukan terhadap apa yang seharusnya
hendak diukur.
4) Factorial Validity dari sebuah alat ukur adalah korelasi antara alat
ukur dengan faktor-faktor yang yang bersamaan dalam suatu
kelompok atau ukuran-ukuran perilaku lainnya, dimana validitas ini
diperoleh dengan menggunakan teknik analisis faktor.
5) Empirical Validity adalah validitas yang berkenaan dengan
hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah
ukuran yang bebas dan langsung dengan apa yang ingin diramalkan
oleh pengukuran.
6) Intrinsic Validity adalah validitas yang berkenaan dengan
penggunaan teknik uji cobauntuk memperoleh bukti kuantitatif dan
objektif untuk mendukung bahwa suatu alatukur benar-benar
mengukur apa yang seharusnya diukur.
7) Predictive Validity adalah validitas yang berkenaan dengan
hubungan antara skor suatu alat ukur dengan kinerja seseorang di
masa mendatang.
8) Content Validity adalah validitas yang berkenaan dengan baik
buruknya sampling dari suatu populasi.
9) Curricular Validity adalah validitas yang ditentukan dengan cara
menilik isi dari pengukuran dan menilai seberapa jauh pengukuran
tersebut merupakan alat ukur yang benar-benar mengukur aspek-
aspek sesuai dengan tujuan instruksional.
b. Sementara Kenneth Bailey mengelompokan tiga jenis utama validitas
yaitu:
1) Validitas Rupa (Face validity).
Validitas rupa (face validity) adalah validitas yang menunjukan
apakah alat pengukur/instrumen penelitian dari segirupanya
nampak mengukur apa yang ingin diukur, validitas ini lebih
mengacu pada bentuk dan penampilan instrumen. Menurut
Djamaludin Ancok validitas rupa amat penting dalam pengukuran
kemampuan individu seperti pengukuran kejujuran, kecerdasan,
bakat dan keterampilan.
2) Validitas isi (Content Validity).
Validitas isi berkenaan dengan kesanggupan instrumen
mengukur isi yang harus diukur. Artinya, alat ukur tersebut
mampu mengungkap isi suatu konsep atau variabel yang hendak
diukur. Misalnya tes hasil belajar bidang studi IPS, harus bisa
mengungkap isi bidang studi tersebut. Hal ini bisa dilakukan
dengan cara menyusun tes yang bersumber dari kurikulum bidang
studi yang hendak diukur. Di samping kurikulum dapat juga
diperkaya dengan melihat/mengkaji buku sumber. Sungguhpun
demikian tes hasil belajar tidak mungkin dapat mengungkap semua
materi yang ada dalam bidang studi tertentu sekalipun hanya untuk
satu semester. Oleh sebab itu harus diambil sebagian dari materi
dalam bentuk sampel tes. Sebagai sampel maka harus dapat
mencerminkan materi yang terkandung dari seluruh materi bidang
studi. Cara Yang ditempuh dalam menetapkan sampel tes adalah
memilih konsep-konsep yang esensial dari materi yang di
dalamnya. Misalnya menetapkan sejumlah konsep dari setiap
pokok bahasan yang ada. Dari setiap konsep dikembangkan
beberapa pertanyaan tes (lihat bagan). Di sinilah pentingnya
peranan kisi-kisi sebagai alat untuk memenuhi validitas isi.
TES HASIL BELAJAR

Bidang studi : ....................

Semester : ....................

Kelas : ....................

Pokok bahasan Konsep atau Jumlah abilitas


untuk satu semester materi perta- Jenis tes yang
sesuai dengan esensial nyaan diakui
kurikulum
Pokok bahasan 1 1.1 3 soal pilihan Aplikasi
ganda dan
seterusnya
Pokok bahasan 2 1.2 2 Aplikasi
soal dan
seterusnya
Pokok bahasan 2 2.1 2
soal
2.2 3
soal
Pokok bahasan 3 3.1 3
soal
3.2 2
soal
dan seterusnya

Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum (materi dan
tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes dapat meminta
bantuan ahli bidang studi untuk menelaah apakah konsep materi yang diajukan telah
memadai atau tidak, sebagai sampel tes. Dengan demikian validitas isi tidak
memerlukan uji coba dan analisis statistik atau dinyatakan dalam bentuk angka-
angka.

1) Validitas kriteria (Criterion validity).


Validitas ramalan artinya dikaitkan dengan kriteria tertentu. Dalam validitas ini
yang diutamakan bukan isi tes tapi kriterianya, apakah alat ukur tersebut dapat
digunakan untuk meramalkan suatu ciri atau perilaku tertentu atau kriteria tertentu
yang diinginkan. Misalnya alat ukur motivasi belajar, apakah dapat digunakan untuk
meramal prestasi belajar yang dicapai. Artinya terdapat hubungan yang positif antara
motivasi dengan prestasi. Dengan kata lain dalam validitas ini mengandung ciri
adanya relevansi dan keajegan atau ketetapan (reliability).
Motivasi dapat digunakan meramal prestasi bila skor-skor yang diperoleh dari
ukuran motivasi berkorelasi positif dengan skor prestasi. Validitas ramalan ini
mengandung dua makna. Pertama validitas jangka pendek dan kedua jangka panjang.
Validitas jangka pendek, artinya daya ramal alat ukur tersebut hanya untuk masa yang
tidak lama. Artinya, skor tersebut berkorelasi pada waktu yang sama. Misalnya,
ketetapan (reliability) terjadi pada semester dua artinya daya ramal berlaku pada
semester dua, dan belum tentu terjadi pada semester berikutnya. Sedangkan validitas
jangka panjang mengandung makna skor tersebut akan berkorelasi juga di kemudian
hari. Mengingat validitas ini lebih menekankan pada adanya korelasi, maka faktor
yang berkenaan dongan persyaratan terjadinya korelasi harus dipenuhi. Faktor
tersebut antara lain hubungan dari konsep dan variabel dapat dijelaskan berdasarkan
pengetahuan ilmiah, minimal masuk akal sehat dan tidak mengada-ada. Faktor lain
adalah skor yang dikorelasikan memenuhi linieritas.
Ketiga validitas yang dijelaskan di atas idealnya dapat digunakan dalam
menyusun instrumen penelitian, minimal dua validitas, yakni validitas isi dan
validitas bangun pengertian. Validitas isi dan bangun pengertian mutlak diperlukan
dan bisa diupayakan tanpa melakukan pengujian secara statistika.
2) Validitas konstruk (Construct Validity).
Validitas bangun atau bangun pengertian (Construct validity) berkenaan dengan
kesanggupan alat ukur mengukur pengertian-pengertian yang terkandung dalam
materi yang diukurnya. Pengertian-pengertian yang terkandung dalam konsep
kemampuan, minat, sebagai variabel penelitian dalam berbagai bidang kajian harus
jelas apa yang hendak diukurnya. Konsep-konsep tersebut masih abstrak, memer-
lukan penjabaran yang lebih spesifik, sehingga mudah diukur. Ini berarti setiap
konsep harus dikembangkan indikator-indikatomya. Dengan adanya indikator dari
setiap konsep maka bangun pengertian akan nampak dan memudahkan dalam
menetapkan cara pengukuran. Untuk variabel tertentu, dimungkinkan penggunaan
alat ukur yang beraneka ragam dengan cara mengukurnya yang berlainan.

Menetapkan indikator suatu konsep dapat dilakukan dalam dua cara, yakni

(a) menggunakan pemahaman atau logika berpikir atas dasar teori pengetahuan
ilmiah dan
(b) menggunakan pengalaman empiris, yakni apa yang terjadi dalam kehidupan
nyata.
Contoh: Konsep mengenai Hubungan Sosial, dilihat dari pengalaman,
indikatornya empiris adalah keterkaitan dari
(1) bisa bergaul dengan orang lain
(2) disenangi atau banyak teman-temannya
(3) menerima pendapat orang lain
(4) tidak memaksakan pendapatnya
(5) bisa bekerja sama dengan siapa pun, dan lain-lain.
Mengukur indikator-indikator tersebut, berarti mengukur bangun
pengertian yang terdapat dalam konsep hubungan sosial. Contoh lain: Konsep
sikap dapat dilihat dari indikatornya secara teoretik (deduksi teori) antara lain
keterkaitan dari
(1) kesediaan menerima stimulus objek sikap
(2) kemauan mereaksi stimulus objek sikap
(3) menilai stimulus objek sikap
(4) menyusun/mengorganisasi objek sikap
(5) internalisasi nilai yang ada dalam objek sikap.
Apabila hasil tes menunjukkan indikator-indikator tes yang tidak berhubungan
secara positif satu sama lain, berarti ukuran tersebut tidak memiliki validitas bangun
pengertian. Atas dasar itu indikatornya perlu ditinjau atau diperbaiki kembali. Cara
lain untuk menetapkan validitas bangun pengertian suatu alat ukur adalah
menghubungkan (korelasi) antara alat ukur yang dibuat dengan alat ukur yang sudah
baku/standardized, seandainya telah ada yang baku. Bila menunjukkan koefisien
korelasi yang tinggi maka alat ukur tersebut memenuhi validitasnya.
Untuk menguji validitas konstruksi digunakan pendapat para ahli (judgment
experts) setelah sebelumnya instrumen tersebut dikonstruksi aspek-aspek yang akan
diukur dengan berlandaskan teori tertentu. Jumlah tenaga ahli yang digunakan
minimal tiga orang dan umumnya mereka telah bergelar doktor sesuai dengan lingkup
yang diteliti.
Langkah selanjutnya yaitu melakukan uji coba instrumen kepada sampel dari
mana populasi diambil. Jumlah anggota sampel yang digunakan sekitar 30 orang.
Setelah data ditabulasikan, maka pengujian validitas konstruksi dilakukan dengan
analisis faktor, yaitu dengan mengkorelasikan antar skor item instrumen dalam satu
faktor, dan mengkorelasikan skor faktor dengan skor total. Berikut ini adalah contoh
menguji validitas konstruksi dengan analisis faktor.
Misalnya akan dilakukan pengujian validitas konstruksi melalui analisis faktor
terhadap instrumen untuk mengukur prestasi kerja pegawai. Jadi dalam hal ini
variabel penelitiannya adalah prestasi kerja. Berdasarkan teori dan konsultasi ahli,
indikator pretasi kerja pegawai meliputi dua faktor yaitu: kualitas hasil kerja dan
kecepatan kerja. Selanjutnya indikator (faktor) kecepatan kerja dikembangkan
menjadi tiga pertanyaan, dan kualitas hasil kerja dikembangkan menjadi 4 butir
pertanyaan. Instrumen yang terdiri dari 7 butir pertanyaan tersebut, selanjutnya
diberikan kepada 5 orang pegawai sebagai responden untuk menjawabnya. Jawaban
responden ditunjukkan pada tabel 2. Arti angka: 4 berarti sangat tinggi, 3 tinggi, 2
rendah, 1 sangat rendah prestasinya.
Analisis faktor dilakukan dengancara mengkorelasikan jumlah skor faktor
dengan skor total. Bila korelasi tiap faktor tersebut positif dan besarnya 0,3 ke atas
maka faktor tersebut merupakan construct yang kuat. Jadi berdasarkan analisis faktor
itu dapat disimpulkan bahwa instrumen tersebut memiliki validitas konstruksi yang
baik.

Tabel 1
Data Prestasi Kerja Pegawai
No. Skor Faktor 1 Jml Skor Faktor 2 untuk Jml Jml
Res. untuk butir no: 1 butir no: 2 Total
1 2 3 (X1) 1 2 3 4 (X2) (Y)
1. 3 4 3 10 3 3 2 4 12 22
2. 4 3 2 9 4 3 4 4 15 24
3. 1 2 1 4 3 2 1 2 8 12
4. 3 3 3 9 4 4 3 3 14 23
5. 2 2 4 8 3 1 2 1 7 15

Berdasarkan tabel 2 tersebut telh dihitung bahwa korelasi antara jumlah faktor 1
(X1) dengan skor total (Y) = 0,85 dan korelasi antara jumlah faktor 2 (X2) dengan
skor total (Y) = 0,94. Karena koefisien korelasi kedua faktor tersebut di atas 0,3,
maka dapat disimpulkan bahwa kualitas hasil kerja dan kecepatan kerja merupakan
konstruksi (construct) yang valid untuk variabel prestasi kerja pegawai.
Selanjutnya apakah setiap butir dalam instrumen itu valid atau tidak, dapat
diketahui dengan cara mengkorelasikan antara skor butir dengan skor total (Y). Jadi
untuk keperluan ini ada tujuh koefisien korelasi yang perlu dihitung. Bila harga
korelasi di bawah 0,3, maka dapat disimpulkan bahwa butir instrumen tersebut tidak
valid, sehingga harus dperbaiki atau dibuang.
Dari hasil perhitungan diketahui bahwa korelasi ketujuh butir instrumen dengan
skor total ditunjukkan pada tabel 3.
Tabel 2
Hasil Perhitungan Pengujian Validitas Konstruk
No. r hitung r kritis Keputusan
r1y 0,95 0,30 valid
r2y 0,79 0,30 valid
r3y 0,22 0,30 tidak valid
r4y 0,73 0,30 valid
r5y 0,79 0,30 valid
r6y 0,84 0,30 valid
r7y 0,83 0,30 valid

Berdasarkan tabel 3 dapat diketahui bahwa butir no 2 (faktor 1) tidak valid


karena koreasi butir tersebut dengan skor total hanya 0,22. Butir tersebut tidak selaras
dengan butir yang lain.
Pengujian seluruh butir instrumen dalam satu variabel dapat juga dilakukan
dengan mencari daya pembeda skor tiap item dari kelompok yang memberikan
jawaban tinggi dan jawaban rendah. Jumlah kelompok yang tinggi diambil 27% dan
kelompok yang rendah diambil 27% dari sampel uji coba. Pengujian analisis daya
pembeda dapat menggunakan t-test. Berikut ini diberikan contoh analisis daya
pembeda untuk menguji validitas instrumen.

Tabel 3
Kelompok Skor Tinggi dan Rendah pada Instrumen untuk mengukur
kinerja aparatur Negara
Skor-skor kelompok tinggi Skor-skor kelompok rendah
126 81
128 96
135 104
135 107
135 108
140 108
142 109
X1 = 135,1 X2 = 101,85
S1 = 6,1 S2 = 10,2
S12 = 38,1 S22 = 104,4

Contoh:
Suatu instrumen penelitian akan digunakan untuk mengukur kinerja aparatur
Negara. Instrumen tersebut telah dikonsultasikan kepada paara ahli aparatur dn
dinyatakan siap untuk diujicoba. Uji coba diberlakukan terhadap sampel 25
responden yang tahu maslaah aparatur. Berdasarkan 25 responden tersebut
dapat dikelompokkan 27% responden yang memberikan skor tinggi dan 27%
skor rendah.
Untuk menguji daya pembeda digunakan rumus t-test sebagai berikut:
12
t=
1 1
+
1 2

Di mana:

(11)12 + (21)22
Sgab =
(1+2) 2

Berdasarkan data yang ada pada tabel 4 dan rumus tersebut, maka:
(71)3,81+ (71)104,4
Sgab =
(7+7) 2

Sgab = 8,4
135,1101,85
t=
1 1
8,4 +
7 7

jadi t hitung = 7,37

Untuk mengetahui apakah perbedaan tu signifikan atau tidak, maka harga t


hitung tersebut peru dibandingkan dengan t tabel. Bila t hitung lebih besar daripada t
tabel, maka perbedaan itu signifikan, sehingga instrumen dinyatakan valid.
Pengujian validitas dengan uji beda ini didasarkan asumsi bahwa kelompok
responden yang digunakan sebagai uji coba berdistribusi normal. Dengan demikian,
kelompok skor tinggi dan rendah harus berbeda secara signifikan, sesuai dengan
kurva normal.

2. Konsep Pengukuran Validitas


Pengukuran validitas sebenarnya dilakukan untuk mengetahui seberapa besar
(dalam arti kuantitatif) suatu aspek psikologis terdapat dalam diri seseorang, yang
dinyatakan oleh skor pada instrumen pengukur yang bersangkutan. Dalam hal
pengukuran ilmu sosial, validitas yang ideal tidaklah mudah untuk dapat dicapai.
Pengukuran aspek-aspek psikologis dan sosial mengandung lebih banyak sumber
kesalahan (error) daripada pengukuran aspek fisik. Kita tidak pernah dapat yakin
bahwa validitas instrinsik telah terpenuhi dikarenakan kita tidak dapat
membuktikannya secara empiris dengan langsung. Pengertian validitas alat ukur
tidaklah berlaku garis besar untuk semua tujuan ukur. Suatu alat ukur menghasilkan
ukuran yang valid hanya bagi satu tujuan ukur tertentu saja. Tidak ada alat ukur yang
dapat menghasilkan ukuran yang valid bagi berbagai tujuan ukur. Oleh karena itu,
pernyataan seperti "alat ukur ini valid" belumlah lengkap apabila tidak diikuti oleh
keterangan yang menunjukkan kepada tujuannya, yaitu valid untuk apa dan valid bagi
siapa. Itulah yang ditekankan oleh Cronbach (dalam Azwar, 1986) bahwa dalam
proses validasi sebenarnya kita tidak bertujuan untuk melakukan validasi alat ukur
akan tetapi melakukan validasi terhadap interpretasi data yang diperoleh oleh
prosedur tertentu.

3. Validitas Butir Soal atau Validitas Item


Jika seorang guru atau peneliti mengetahui bahwa validitas soal tes misalnya
terlalu rendah atau rendah saja, maka selanjutnya ingin mengetahui butir-butir tes
manakah yang menyebabkan soal secara keseluruhan tersebut jelek karena memiliki
validitas rendah. Untuk itu perlu dicari validitas butir soal. Secara umum validitas
butir soal adalah demikian sebuah item dikatakan valid apabila mempunyai dukungan
yang besar terhadap skor total. Skor item yang menyebabkan bisa tinggi atau rendah.
Dengan kata lain dapat dikemukakan di sini bahwa sebuah item memilki validitas
yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total. Untuk
soal-soal bentuk objektif skor untuk item biasa diberikan dengan 1 (bagi item yang
dijawab benar) dan 0 (item yang dijawab salah), sedangakan skor total selanjutnya
merupakan jumlah dari skor untuk semua item yang membangun soal tersebut.

4. Teknik Pengujian Validitas Item Tes Hasil Belajar


1. Pengertian Validitas Item
Validitas item dari suatu tes adalah ketepatan mengukur yang dimiiliki oleh
sebutir item, dalam mengukur apa yang seharusnya diukur lewat butir item tersebut.
2. Teknik Pengujian Validitas Item Tes Hasil Belajar
Dari uraian yang telah dikemukakan diatas, kiranya menjadi cukup jelas bahwa
sebutir item dapat dikatakan telah memiliki validitas yang tinggi atau dapat
dinyatakan valid, jika skor-skor pada butir item yang bersangkutan memiliki
kesesuaian atau kesesajaran arah dengan skor totalnya; atau dengan bahasa statistik:
ada korelasi positif yang signifikan antara skor item dengan skor totalnya.
3. Faktor-faktor yang Mempengaruhi Validitas
Banyak faktor yang dapat mempengaruhi hasil tes evaluasi tidak valid. Beberapa
faktor tersebut secara garis besar dapat dibedakan menurut sumbernya, yaitu faktor
internal dari tes, faktor eksternal tes, dan faktor yang berasal dari siswa yang
bersangkutan.

a. Faktor yang berasal dari dalam tes


1) Arahan tes yang disusun dengan makna tidak jelas sehingga dapat
mengurangi validitas tes
2) Kata-kata yang digunakan dalam struktur instrument evaluasi, tidak terlalu
sulit.
3) Item tes dikonstruksi dengan jelas.
4) Tingkat kesulitan item tes tidak tepat dengan materi pembelajaran yang
diterima siswa.
5) Waktu yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu
kurang atau terlalu longgar.
6) Jumlah item terlalu sedikit sehingga tidak mewakili sampel
7) Jawaban masing-masing item evaluasi bisa diprediksi siswa

b. Faktor yang berasal dari administrasi dan skor tes.


1) Waktu pengerjaan tidak cukup sehingga siswa dalam memberikan jawaban
dalam situasi tergesa-gesa
2) Adanya kecrangan dalam tes sehingga tidak membedakan antara siswa
yang belajar dengan melakukan kecurangan.
3) Pemberian petunjuk dari dari pengawas yang tidak dapat dilakukan pada
semua siswa.
4) Teknik pemberian skor yang tidak konsisten.
5) Siswa tidak dapat memngikuti arahan yang diberikan dalam tes baku.
6) Adanya joki (orang lain bukan siswa) yang masuk dalam menjawab item
tes yang diberikan
c. Faktor yang berasal dari jawaban siswa
Seringkali terjadi bahwa interpretasi terhadap item-item tes evaluasi tidak
valid, karena dipengaruhi oleh jawaban siswa dari pada interpretasi item-item
pada tes evaluasi (Sukardi, 2008).

3. Langkah dalam melakukan uji validitas dan reliabilitas internal adalah


sebagai berikut:
a. Cobalah item di lapangan kepada paling sedikit 30 orang responden (batas
sampel besar dalam statistik)
b. Tabulasi data yang telah masuk
c. Ujilah validitas dan reliabilitasnya

4. Langkah-langkah uij validitas den reliabilitas, yaitu:


a. Mempersiapkan butir-butir pertanyaan berdasarkan konstruk, konsep dan
indikator dari variabel yang akan diteliti.
b. Instrumen (pertanyaan) diberikan kepada responden untuk diujicobakan
c. Setelah instrumen diujicobakan kepada responden, kemudian
ditabulasikanuntukmempermudah penghitungan dan analisis ujicoba tersebut.
d. Responden target ujicoba instrumen, tidak dapat dijadikan responden
penelitian

5. Beberapa analisis yang sering dipergunakan untuk melakukan uji validitas,


adalah:
a. Korelasi Product Moment
Item butir dinyatakan valid jika mempunyai korelasi dengan skor total (r
hitung) di atas r tabel. Perhitungan dengan SPSS menggunakan Analyze ==>
correlate ==> bivariate, pilih Pearson. Pindahkan data jawaban pada masing-
masing butir dan skor total dari kiri ke kanan. Hasilnya pada output, ikat table
yang paling kanan.
b. Corrected Item to Total Correlation
Adalah dengan mengkoreksi nilai r hitung karena adanya spurious overlap.
Perhitungan dengan SPSS menggunakan Analyze ==> Scale ==> Reliability
Analysis, pindahkan jawaban responden pada masing-masing butir (tanpa skor
total) dari kiri ke kanan ==> Pilih Statistic ==> Klik pada Scale if item deleted
==> OK. Nilai yang dipergunakan pada kolom Corrected item-total
correlation.

c. Analisis Faktor
Item yang valid akan mengelompok pada konstruk yang diukur. Analisis
dengan SPSS menggunakan Analyze ==> Data reduction ==> Factor Analysis
==> masukan semua jawaban responden. Item pertanyaan yang tidak
mengelompok dinyatakan tidak valid.
Uji reliabilitas adalah untuk melihat apakah rangkaian kuesioner yang
dipergunakan untuk mengukur suatu konstruk tidak mempunyai
kecenderungan tertentu. Nilai yang lazim dipakai adalah 0,6. Perhitungan
dengan SPSS sama dengan perhitungan validitas dengan Corrected Item to
Total Correlation. Nilai yang dilihat adalah Alpha, pada bagian kiri bawah.
Uji validitas menunjukkan ukuran yang benar-benar mengukur apa yang akan
diukur. Jadi dapat dikatakan semakin tinggi validitas suatu alat test, maka alat
test tersebut semakin mengenai pada sasarannya, atau semakin menunjukkan
apa yang seharusnya diukur. Suatu test dapat dikatakan mempunyai validitas
tinggi apabila test tersebut menjalankan fungsi ukurnya, atau memberikan
hasil ukur sesuai dengan makna dan tujuan diadakannya test tersebut. Jika
peneliti menggunakan kuesioner di dalam pengumpulan data penelitian, maka
item-item yang disusun pada kuesioner tersebut merupakan alat test yang
harus mengukur apa yang menjadi tujuan penelitian.
Salah satu cara untuk menghitung validitas suatu alat test yaitu dengan
melihat daya pembeda item (item discriminality). Daya pembeda item adalah
metode yang paling tepat digunakan untuk setiap jenis test. Daya pembeda
item dalam penalitian ini dilakukan dengan cara korelasi item-total.
Korelasi item-total yaitu konsistensi antara skor item dengan skor secara
keseluruhan yang dapat dilihat dari besarnya koefisien korelasi antara setiap
item dengan skor keseluruhan, yang dalam penelitian ini menggunakan
koefisien korelasi RankSpearman karena skala pengukuran dalam penelitian
ini adalah skala ordinal.

6. Adapun langkah-langkah melakukan uji validitas adalah:


a. Tentukan koefesien korelasi Rank Sperman dengan cara sebagai berikut:
Apabila item yang dihadapi berbentuk skala ordinal (skala sikap), maka nilai
korelasi rank spearman pada item ke-i adalah :

Rumus diatas digunakan apabila tidak terdapat data kembar.


Jika terdapat banyak data kembar, maka digunakan rumus berikut:
dimana : R(X) = Ranking nilai X
R(Y) = Ranking nilai Y

b. Bandingkan nilai koefesien korelasi rank sperman (rs) dengan nilai korelasi
rank spearman dalam table (rtabel), atau bandingkan nilai p-value (Sig.) pada
koefesien korelasi rank sperman (rs) dengan taraf (nyata)

c. Jika rs > rtabel atau p-value < , maka item tersebut valid dan dapat dijadikan
sebagai indikator terhadap dimensi/variabel tersebut.
Reliabilitas artinya adalah tingkat keterpercayaan hasil suatu pengukuran.
Pengukuran yang memiliki reliabilitas tinggi, yaitu pengukuran yang mampu
memberikan hasil ukur yang terpercaya (reliabel). Reliabilitas merupakan
salah satu ciri atau karakter utama intrumen pengukuran yang baik. Kadang-
kadang reliabilitas disebut juga sebagai keterpercayaan, keterandalan,
keajegan, konsistensi, kestabilan, dan sebagainya, namun ide pokok dalam
konsep reliabilitas adalah sejauh mana hasil suatu pengukuran dapat
dipercaya, artinya sejauh mana skor hasil pengukuran terbebas dari kekeliruan
pengukuran (measurement error).
Tinggi rendahnya reliabilitas, secara empiris ditunjukkan oleh suatu angka
yang disebut koefisien reliabilitas. Walaupun secara teoritis, besarnya
koefisien reliabilitas berkisar antara 0,00 1,00; akan tetapi pada
kenyataannya koefisien reliabilitas sebesar 1,00 tidak pernah dicapai dalam
pengukuran, karena manusia sebagai subjek pengukuran psikologis
merupakan sumber kekeliruan yang potensial. Di samping itu walaupun
koefisien korelasi dapat bertanda positif (+) atau negatif (-), akan tetapi dalam
hal reliabilitas, koefisien reliabilitas yang besarnya kurang dari nol (0,00)
tidak ada artinya karena interpretasi reliabilitas selalu mengacu kepada
koefisien reliabilitas yang positif.
Ada beberapa metode yang dapat digunakan dalam menentukan tingkat
reliabilitas suatu alat ukur, salah satunya adalah dengan internal cosistency
dengan teknik belah dua (split half) yang dianalisis dengan rumus Spearman-
Brown yaitu :
x 100%
Keterangan:
R = nilai koefesien reliabilitas
r = nilai korelasi antara item belahan pertama dengan item belahan kedua.
Dafus :

Arikunto, Suharsimi, Prof. Dr. 2007. Dasar-Dasar Evaluasi Pendidikan. Jakarta :


Bumi Aksara.
Elita, Sari yuni. Validitas dan Reabilitas Instrument. (Online) Available :
https://www.scribd.com/user/243408924/Yuni-Elita-Sari-Tambunsaribu, diakses pada
tanggal 14 Oktober 2017, pukul 20.45 Wita

Kadir, Abdul. 2017. Validitas dan Reabilitas Instrument. (Online) Available :


https://www.scribd.com/document/349120520/Validitas-Dan-Reliabilitas-Instrumen,
diakses pada tanggal 14 Oktober 2017, pukul 20.30 Wita

Lintangsari, Putri Ayu Asmaningtyas. 2011. Validitas, (online) Available :


http://id.scribd. com/doc/78922659/Validitas.html diakses 14 Oktober 2014,
pukul 20.15 Wita.
Sagar, Mutiara. 2014. Makalah Validitas. (Online) Available :
https://www.scribd.com/doc/243744226/MAKALAH-VALIDITAS# diakses
pada tanggal 14 Oktober 2017, pukul 20.00 Wita

Sari, Kustina Atika. 2013. Validitas, (online) Available :


http://kustinaatikasari.wordpress.com/2013/06/10/makalah-tentang-
validitas/.html, diakses 14 Oktober 2017, pukul 20.20 Wita

You might also like