Pengujian Validitas dan Reabilitas Lengkap
A. Pengujian Validitas
Instrumen
Menurut Azwar (1987: 173) menyatakan bahwa validitas berasal dari kata validity
yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrumen pengukur
(tes) dalam melakukan fungsi ukurnya.
Suatu tes dikatakan
memiliki validitas yang tinggi apabila alat tersebut menjalankan fungsi ukur
secara tepat. Konsep validitas tes dapat dibedakan
atas tiga macam yaitu validitas
isi (content validity), validitas konstruk (construct validity), dan validitas empiris atau validitas
kriteria.
1. Validitas Konstruk (Construct
Validity)
Validitas
konstruk adalah validitas yang mempermasalahkan seberapa jauh butir-butir tes
mampu mengukur apa yang benar-benar hendak diukur sesuai dengan konsep khusus atau
definisi konseptual yang telah ditetapkan. Validitas konstruk biasa digunakan
untuk instrumen yang dimaksudkan mengukur variabel konsep, baik yang sifatnya
performansi tipikal seperti instrumen untuk mengukur sikap, minat konsep diri,
lokus kontrol, gaya kepemimpinan, motivasi berprestasi, dan lain-lain, maupun
yang sifatnya performansi maksimum seperti instrumen untuk mengukur bakat (tes
bakat), inteligansi (kecerdasan intelektual), kecerdasan, emosional dan
lain-lain.
Untuk
menguji validitas konstruksi, dapat digunakan pendapat dari ahli (judgment
experts). Setelah pengujian konstruksi dari ahli dan berdasarkan pengalaman
empiris dilapangan selesai, maka diteruskan dengan uji coba instrumen. Instrumen
tersebut dicobakan pada sampel dari mana populasi diambil (pengujian pengalaman
empiris ditunjukkan pada pengujian validitas eksternal). Jumlah anggota sampel
yang digunakan sekitar 30 orang. Setelah data ditabulasikan, maka pengujian
validitas konstruksi dilakukan dengan analisis faktor, yaitu dengan
mengkorelasikan antar skor item instrumen dalam suatu faktor, dan
mengkorelasikan skor faktor dengan skor total.
Misalnya
akan dilakukan pengujian construct validity melalui analisis faktor terhadap
instrumen untuk mengukur prestasi kerja pegawai. Jadi dalam hal ini variabel
penelitiannya adalah prestasi kerja. Berdasarkan teori dan hasil konsultasi
ahli, indikator prestasi kerja pegawai meliputi dua faktor yaitu: kualitas
hasil kerja dan kecepatan kerja. Selanjutnya indikator (faktor) kecepatan kerja
dikembangkan menjadi tiga pertanyaan, dan kualitas hasil kerja dikembangkan
menjadi 4 butir pertanyaan. Instrumen yang terdiri 7 butir pertanyaan tersebut,
selanjutnya diberikan kepada 5 pegawai sebagai responden untuk menjawabnya.
(Dalam prakteknya menggunakan sekitar 30 responden) jawaban 7 responden
ditunjukkan pada tabel 1 Arti angka: 4 berarti sangat tinggi, 3 tinggi, 2
rendah, 1 sangat rendah prestasinya.
Seperti
telah dikemukakan bahwa, analisis faktor dilakukan dengan cara
mengkorelasikan jumlah skor faktor
dengan skor total. Bila korelasi tiap faktor tersebut positif dan besarnya 0,3
ke atas maka faktor tersebut merupakan construct yang kuat. Jadi berdasarkan
analisis faktor itu dapat disimpulkan bahwa instrumen tersebut memiliki
validitas konstruksi yang baik.
Tabel 1
DATA PRESTASI KERJA 5 PEGAWAI
No. Res.
|
Skor Faktor 1untuk butir no:
|
Jml 1
(X1)
|
Skor Faktor 2 untuk butir
no:
|
Jml 2 (X2)
|
Jml Total (Y)
|
|||||
1
|
2
|
3
|
1
|
2
|
3
|
4
|
||||
1.
|
3
|
4
|
3
|
10
|
3
|
3
|
2
|
4
|
12
|
22
|
2.
|
4
|
3
|
2
|
9
|
4
|
3
|
4
|
4
|
15
|
24
|
3.
|
1
|
2
|
1
|
4
|
3
|
2
|
1
|
2
|
8
|
12
|
4.
|
3
|
3
|
3
|
9
|
4
|
4
|
3
|
3
|
14
|
23
|
5.
|
2
|
2
|
4
|
8
|
3
|
1
|
2
|
1
|
7
|
15
|
Berdasarkan tabel 1 tersebut telah dihitung
bahwa korelasi antara jumlah faktor 1 (X1) dengan skor total (Y) =
0,85 dan korelasi antara jumlah faktor 2 (X2) dengan skor total (Y)
= 0,94. Karena koefisien korelasi kedua faktor tersebut di atas 0,3, maka dapat
disimpulkan bahwa kualitas hasil kerja
dan kecepatan kerja merupakan
konstruksi (construct) yang valid untuk variabel prestasi kerja pegawai.
Selanjutnya apakah setiap butir dalam instrumen itu
valid atau tidak, dapat diketahui dengan cara mengkorelasikan antara skor butir
dengan skor total (Y). Jadi untuk keperluan ini ada tujuh koefisien korelasi
yang perlu dihitung. Bila harga korelasi di bawah 0,3, maka dapat disimpulkan
bahwa butir instrumen tersebut tidak valid, sehingga harus dperbaiki atau
dibuang.
Dari hasil perhitungan diketahui bahwa korelasi
ketujuh butir instrumen dengan skor total ditunjukkan pada tabel 2 berikut.
Tabel 2
HASIL
PERHITUNGAN PENGUJIAN
VALIDITAS
KONSTRUK
No.
|
r hitung
|
r kritis
|
Keputusan
|
r1y
|
0,95
|
0,30
|
valid
|
r2y
|
0,79
|
0,30
|
valid
|
r3y
|
0,22
|
0,30
|
tidak
valid
|
r4y
|
0,73
|
0,30
|
valid
|
r5y
|
0,79
|
0,30
|
valid
|
r6y
|
0,84
|
0,30
|
valid
|
r7y
|
0,83
|
0,30
|
valid
|
Berdasarkan tabel 2 dapat diketahui bahwa butir no 2 (faktor 1) tidak
valid karena korelasi butir
tersebut dengan skor total hanya 0,22 (dibawah r kritis 0,3). Butir tersebut tidak selaras dengan butir yang lain.
Pengujian seluruh butir instrumen dalam satu variabel
dapat juga dilakukan dengan mencari daya pembeda skor tiap item dari kelompok
yang memberikan jawaban tinggi dan jawaban rendah. Dalam hal ini
Masrun (1979) menyatakan bahwa “.... analisis untuk mengetahui daya pembeda,
sering juga dinamakan analisis untuk mengetahui validitas item.”
Jumlah kelompok yang tinggi diambil 27% dan kelompok
yang rendah diambil 27% dari sampel uji coba. Pengujian analisis daya pembeda dapat
menggunakan t-test. Berikut ini diberikan contoh analisis daya pembeda untuk menguji
validitas instrumen.
Tabel 3
KELOMPOK SKOR TINGGI DAN RENDAH PADA
INSTRUMEN UNTUK MENGUKUR KINERJA APARATUR NEGARA
Skor-skor kelompok tinggi
|
Skor-skor kelompok rendah
|
126
|
81
|
128
|
96
|
135
|
104
|
135
|
107
|
135
|
108
|
140
|
108
|
142
|
109
|
s1 = 6,1
s12 = 38,1
|
s2 = 10,2
s22 = 104,4
|
Contoh:
Suatu instrumen penelitian akan digunakan untuk
mengukur kinerja aparatur negara.
Instrumen tersebut telah dikonsultasikan kepada para ahli aparatur dan dinyatakan siap untuk diuji coba. Uji coba diberlakukan
terhadap sampel 25 responden yang tahu masalah aparatur.
Berdasarkan 25 responden tersebut dapat dikelompokkan 27% responden yang
memberikan skor tinggi dan 27% skor rendah. (27% responden berarti 0,27 × 25 = 7),
seperti tertera dalam tabel 2 di atas.
Untuk menguji daya
pembeda secara signifikan digunakan rumus t-test
sebagai berikut:
t =
|
Dimana:
Sgab
=
|
|
Berdasarkan
data yang ada pada tabel 3diatas dan rumus tersebut, maka varian gabungan (Sgab) dapat dihitung:
|
|
|
|
t =
jadi t hitung = 7,37
|
Untuk mengetahui
apakah perbedaan itu
signifikan atau tidak, maka harga t hitung tersebut perlu dibandingkan dengan harga t tabel.
Bila t hitung lebih besar daripada t tabel, maka perbedaan itu
signifikan, sehingga instrumen dinyatakan valid.
Berdasarkan tabel t (tabel II dalam
lampiran), dapat diketahui bahwa bila tingkat kesalahan 5%, dengan dk 12, maka
harga t tabel = 1, 78. (dk
̶ 2 = 7 + 7
̶ 2 = 12). Ternyata harga t
hitung 7,37 jauh lebih besar daripada t tabel
1,78 sehingga dapat dinyatakan terdapat perbedaan signifikan antara
kelompok skor tinggi (X1) dan kelompok rendah (X2). Hal ini dapat disimpulkan bahwa instrumen tersebut valid.
Pengujian validitas
dengan uji beda ini didasarkan asumsi bahwa kelompok responden yang digunakan
sebagai uji coba berdistribusi normal. Dengan demikian, kelompok skor tinggi dan rendah
harus berbeda secara signifikan, sesuai dengan kurva normal.
2. Validitas Isi
Validitas
isi menunjukkan sejauhmana pertanyaan dalam suatu tes atau instrumen mampu
mewakili secara keseluruhan dari sampel yang dikenai tes tersebut. Artinya tes
itu valid apabila butir-butir tes itu mencerminkan keseluruhan konten atau
materi yang diujikan. Untuk mengetahui apakah tes itu valid atau tidak, harus dilakukan
melalui penelaahan kisi-kisi tes untuk memastikan bahwa soal-soal tes itu sudah
mewakili atau mencerminkan keseluruhan konten atau materi yang seharusnya
dikuasai.
Oleh
karena itu, validitas isi suatu tes tidak mempunyai besaran tertentu yang
dihitung secara statistika tetapi dipahami bahwa tes itu sudah valid berdasarkan
telaah kisi-kisi tes. Untuk menguji validitas butir-butir instrumen lebih
lanjut, maka setelah dikonsultasikan dengan ahli, maka selanjutnya diujicobakan
dan dianalisis dengan analisis item atau uji beda. Analisis item dilakukan
dengan menghitung korelasi antara skor butir instrumen dengan skor total dan
uji beda dilakukan dengan menguji signifikansi perbedaan antara 27% skor
kelompok atas dan 27% skor kelompok bawah.
3. Validitas Empiris
Validitas
empiris ditentukan berdasarkan kriteria, baik kriteria internal
maupun kriteria
eksternal. Validitas empiris diperoleh melalui hasil uji coba tes kepada
responden yang setara dengan responden yang akan dievaluasi atau diteliti. Kriteria
internal adalah tes atau instrumen itu sendiri yang menjadi kriteria, sedang
kriteria eksternal adalah hasil ukur instrumen atau tes lain di luar instrumen
itu sendiri yang menjadi kriteria.
Validitas Internal
Validitas
internal (validitas butir) merupakan validitas yang diukur dengan besaran yang menggunakan
tes sebagai suatu kesatuan (keseluruhan butir) sebagai kriteria untuk
menentukan validitas butir dari tes itu. Validitas internal diperlihatkan oleh
seberapa jauh hasil ukur butir tersebut konsisten dengan hasil ukur tes secara
keseluruhan. Oleh karena itu, validitas butir tercermin pada besaran koefisien
korelasi antara skor butir dengan skor total tes.
Sebagai
gambaran mengenai pengujian validitas instrument berikut ini disajikan contoh
instrument untuk mengungkap kerajinan anak dari sebuah judul penelitian “Korelasi
antara kerajinan dengan prestasi belajar Bahasa Indonesia kelas V SD Sidoarjo
tahun 2018”.
Agar dapat diperoleh
gambaran mengenai kerajinan siswa, peneliti tersebut memeriksa dari tiga aspek.
Yakni kerajinan di rumah, di sekolah, dan dalam masyarakat. Misalnya dalam
belajar bersama, pinjam meminjam catatan, dan sebagainya. Tiga aspek inilah
yang dapat dipandang sebagai faktor dari angket. Masing-masing faktor diungkap
dengan beberapa pertanyaan angket, misalnya saja 10 nomor per aspek. Dengan demikian,
seluruh angket terdiri dari 30 butir pertanyaan. Apabila skor untuk tiap butir
minimal 1 dan maksimal 3, akan diperoleh skor untuk tiap subjek
serendah-rendahnya 30 dan setinggi-tingginya 90.
B.
Pengujian
Reliabilitas Instrumen
Pengujian
reliabilitas instrumen dapat dilakukan secara eksternal maupun internal. Secara
eksternal pengujian dapat dilakukan dengan test-retest
(stability), equivalent, dan gabungan keduanya. Secara internal
reliabilitas instrumen dapat diuji dengan menganalisis konsistensi butir-butir
yang ada pada instrumen dengan teknik tertentu.
1. Test-retest
Instrumen
penelitian yang reliabilitasnya diuji dengan test-retest dilakukan dengan cara
mencobakan instrumen beberapa kali pada responden. Jadi dalam hal ini
instrumennya sama, respondennya sama, dan waktunya yang berbeda. Reliabilitas
diukur dari koefisien korelasi positif dan signifikan maka instrumen tersebut
sudah dinyatakan reliabel. Pengujian cara ini sering juga disebut stability.
2. Ekuivalen
Instrumen
yang ekuivalen adalah pertanyaan yang secara bahasa berbeda, tetapi maksudnya
sama. Sebagai contoh; Berapa tahun pengalaman kerja anda di lembaga ini?.
Pertanyaan tersebut dapat ekuivalen dengan pertanyaan berikut; Tahun berapa
anda mulai bekerja di lembaga ini?. Pengujian reliabilitas instrumen dengan
cara ini cukup dilakukan sekali, tetapi instrumennya dua, pada responden yang
sama, waktu yang sama, instrumen berbeda.
Reliabilitas
instrumen dihitung dengan cara mengkorelasikan antara data instrumen yang satu
dengan data instrumen yang dijadikan ekuivalen. Bila korelasi positif dan
signifikan, maka instrumen dapat dinyatakan reliabel.
3. Gabungan
Pengujian reliabilitas ini dilakukan
dengan cara mencobakan dua instrumen yang ekuivalen itu beberapa kali ke
responden yang sama. Reliabilitas instrumen dilakukan dengan mengkorelasikan
dua instrumen, setelah itu dikorelasikan pada pengujian kedua, dan selanjutnya dikorelasikan secara
silang. Hal ini dapat digambarkan seperti gambar berikan.
Jika dengan dua
kali pengujian dalam waktu yang berbeda, akan dapat dianalisis enam koefisien
reliabilitas. Bila keenam koefisien korelasi itu semuanya positif dan
signifikan, maka dapat dinyatakan bahwa instrumen tersebut reliabel.
4. Internal consistency
Pengujian dengan cara ini dilakukan
dengan cara mencobakan instrumen sekali saja. Kemudian data yang diperoleh
dianalisis dengan teknik tertentu. Hasil analisis dapat digunakan untuk
memprediksi reliabilitas instrumen. Berikut rumus-rumus untuk uji reliabilitas
instrumen:
Rumus
Spearman Brown:
1 + rb
Keterangan:
ri = reliabilitas internal
seluruh instrumen
rb = korelasi product moment antara belahan pertama dan kedua
Contoh:
Untuk keperluan pengujian ini, maka
butir-butir instrumen di belah menjadi dua kelompok, yaitu kelompok instrumen
ganjil dan kelompok genap. Selanjutnya skor data tiap kelompok itu disusun
sendiri. Untuk kelompok ganjil ditunjukkan pada tabel 7 berikut :
Tabel 7
DATA UNTUK ITEM GANJIL
No.
Res
|
Skor
untuk butir No :
|
Skor
Total
|
||||||||
1
|
3
|
5
|
7
|
9
|
11
|
13
|
15
|
17
|
||
1.
|
4
|
4
|
4
|
4
|
4
|
4
|
3
|
2
|
2
|
31
|
2.
|
3
|
4
|
3
|
3
|
3
|
4
|
3
|
3
|
2
|
28
|
3.
|
2
|
3
|
1
|
3
|
2
|
1
|
2
|
2
|
2
|
18
|
4.
|
3
|
3
|
4
|
4
|
4
|
2
|
4
|
2
|
3
|
29
|
5.
|
3
|
2
|
4
|
2
|
2
|
1
|
2
|
3
|
2
|
21
|
6.
|
1
|
1
|
2
|
1
|
3
|
2
|
2
|
1
|
1
|
14
|
7.
|
2
|
3
|
3
|
2
|
4
|
2
|
3
|
4
|
3
|
26
|
8.
|
3
|
2
|
2
|
3
|
4
|
2
|
2
|
4
|
3
|
25
|
9.
|
4
|
4
|
4
|
4
|
3
|
2
|
4
|
2
|
4
|
31
|
10.
|
1
|
2
|
3
|
3
|
4
|
3
|
3
|
3
|
3
|
25
|
11.
|
3
|
3
|
3
|
3
|
3
|
3
|
3
|
3
|
3
|
27
|
12.
|
1
|
3
|
2
|
2
|
3
|
2
|
2
|
2
|
1
|
18
|
13.
|
2
|
2
|
2
|
3
|
4
|
3
|
2
|
3
|
2
|
23
|
14.
|
4
|
4
|
4
|
4
|
3
|
3
|
3
|
2
|
3
|
30
|
15.
|
2
|
4
|
3
|
3
|
1
|
1
|
3
|
1
|
1
|
19
|
16.
|
3
|
4
|
2
|
4
|
4
|
3
|
3
|
2
|
4
|
29
|
17.
|
2
|
4
|
1
|
3
|
3
|
2
|
3
|
3
|
3
|
24
|
18.
|
3
|
3
|
3
|
3
|
3
|
4
|
2
|
4
|
2
|
27
|
19.
|
4
|
2
|
2
|
3
|
3
|
2
|
4
|
1
|
3
|
24
|
20.
|
2
|
4
|
2
|
4
|
2
|
1
|
2
|
2
|
4
|
23
|
21.
|
2
|
2
|
4
|
2
|
4
|
4
|
2
|
2
|
2
|
24
|
22.
|
1
|
1
|
1
|
1
|
2
|
1
|
2
|
2
|
2
|
13
|
23.
|
2
|
3
|
3
|
3
|
3
|
3
|
4
|
2
|
3
|
26
|
24.
|
4
|
2
|
2
|
4
|
2
|
4
|
2
|
4
|
4
|
28
|
25.
|
3
|
3
|
3
|
1
|
1
|
2
|
2
|
1
|
3
|
19
|
26.
|
3
|
3
|
3
|
3
|
3
|
3
|
3
|
1
|
2
|
24
|
27.
|
2
|
2
|
3
|
3
|
3
|
3
|
3
|
2
|
2
|
23
|
28.
|
3
|
3
|
3
|
3
|
3
|
2
|
3
|
2
|
3
|
25
|
29.
|
4
|
4
|
4
|
4
|
3
|
3
|
2
|
4
|
2
|
30
|
30.
|
3
|
3
|
2
|
2
|
3
|
3
|
1
|
1
|
3
|
21
|
Tabel 8
DATA UNTUK ITEM GENAP
No.
Res
|
Item
No :
|
Skor
Total
|
||||||||
2
|
4
|
6
|
8
|
10
|
12
|
14
|
16
|
18
|
||
1.
|
3
|
3
|
2
|
4
|
3
|
4
|
3
|
4
|
3
|
29
|
2.
|
3
|
2
|
4
|
4
|
2
|
3
|
3
|
3
|
3
|
27
|
3.
|
1
|
2
|
2
|
2
|
1
|
1
|
2
|
1
|
2
|
14
|
4.
|
3
|
3
|
2
|
3
|
3
|
3
|
3
|
3
|
2
|
25
|
5.
|
3
|
3
|
3
|
3
|
3
|
2
|
3
|
2
|
2
|
24
|
6.
|
1
|
1
|
1
|
2
|
2
|
3
|
2
|
1
|
1
|
14
|
7.
|
3
|
3
|
3
|
3
|
3
|
3
|
3
|
2
|
4
|
27
|
8.
|
3
|
2
|
3
|
3
|
3
|
3
|
3
|
3
|
2
|
25
|
9.
|
4
|
4
|
4
|
3
|
3
|
3
|
3
|
3
|
3
|
30
|
10.
|
2
|
3
|
3
|
3
|
3
|
2
|
4
|
2
|
2
|
24
|
11.
|
4
|
4
|
4
|
2
|
2
|
4
|
2
|
4
|
2
|
28
|
12.
|
2
|
1
|
1
|
3
|
3
|
1
|
1
|
3
|
2
|
17
|
13.
|
3
|
3
|
3
|
3
|
3
|
2
|
2
|
3
|
3
|
25
|
14.
|
3
|
3
|
3
|
2
|
4
|
2
|
4
|
3
|
3
|
27
|
15.
|
3
|
3
|
2
|
4
|
2
|
2
|
1
|
2
|
2
|
21
|
16.
|
2
|
3
|
3
|
3
|
2
|
4
|
3
|
3
|
3
|
26
|
17.
|
3
|
3
|
2
|
2
|
3
|
3
|
2
|
4
|
2
|
24
|
18.
|
1
|
2
|
2
|
4
|
3
|
3
|
3
|
3
|
3
|
24
|
19.
|
3
|
3
|
4
|
4
|
2
|
3
|
3
|
2
|
1
|
25
|
20.
|
2
|
4
|
3
|
3
|
3
|
2
|
3
|
3
|
2
|
25
|
21.
|
2
|
3
|
3
|
3
|
3
|
3
|
2
|
3
|
3
|
25
|
22.
|
1
|
1
|
2
|
2
|
3
|
4
|
1
|
1
|
3
|
18
|
23.
|
3
|
4
|
2
|
4
|
2
|
3
|
3
|
4
|
4
|
29
|
24.
|
3
|
3
|
3
|
3
|
3
|
3
|
3
|
3
|
3
|
27
|
25.
|
2
|
4
|
2
|
3
|
2
|
3
|
4
|
3
|
1
|
24
|
26.
|
2
|
4
|
2
|
4
|
2
|
4
|
2
|
2
|
3
|
25
|
27.
|
3
|
4
|
2
|
2
|
4
|
2
|
2
|
3
|
3
|
25
|
28.
|
3
|
3
|
3
|
3
|
3
|
3
|
2
|
2
|
2
|
24
|
29.
|
3
|
3
|
3
|
2
|
4
|
2
|
3
|
3
|
4
|
27
|
30.
|
4
|
4
|
2
|
3
|
4
|
1
|
2
|
2
|
2
|
24
|
Dan skor butirnya
dijumlahkan sehingga menghasilkan skor total. Selanjutnya skor total antara
kelompok ganjil dan genap dicari korelasinya. Jadi yang dikorelasikan adalah :
31, 28, 18, ..., 30, 21 dengan 29, 27, 14, ..., 27, 24. Setelah dihitung
didapat koefisien korelasi 0,853.
Koefisien korelasi
ini selanjutnya dimasukkan dalam rumus Spearman Brown.