Lompat ke konten Lompat ke sidebar Lompat ke footer

Pengujian Validitas dan Reabilitas Lengkap

A.  Pengujian Validitas Instrumen
Menurut Azwar (1987: 173) menyatakan bahwa validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya.
Suatu tes dikatakan memiliki validitas yang tinggi apabila alat tersebut menjalankan fungsi ukur secara tepat. Konsep validitas tes dapat dibedakan atas tiga macam yaitu validitas isi (content validity), validitas konstruk (construct validity), dan validitas empiris atau validitas kriteria.
1.    Validitas Konstruk (Construct Validity)
Validitas konstruk adalah validitas yang mempermasalahkan seberapa jauh butir-butir tes mampu mengukur apa yang benar-benar hendak diukur sesuai dengan konsep khusus atau definisi konseptual yang telah ditetapkan. Validitas konstruk biasa digunakan untuk instrumen yang dimaksudkan mengukur variabel konsep, baik yang sifatnya performansi tipikal seperti instrumen untuk mengukur sikap, minat konsep diri, lokus kontrol, gaya kepemimpinan, motivasi berprestasi, dan lain-lain, maupun yang sifatnya performansi maksimum seperti instrumen untuk mengukur bakat (tes bakat), inteligansi (kecerdasan intelektual), kecerdasan, emosional dan lain-lain.
Untuk menguji validitas konstruksi, dapat digunakan pendapat dari ahli (judgment experts). Setelah pengujian konstruksi dari ahli dan berdasarkan pengalaman empiris dilapangan selesai, maka diteruskan dengan uji coba instrumen. Instrumen tersebut dicobakan pada sampel dari mana populasi diambil (pengujian pengalaman empiris ditunjukkan pada pengujian validitas eksternal). Jumlah anggota sampel yang digunakan sekitar 30 orang. Setelah data ditabulasikan, maka pengujian validitas konstruksi dilakukan dengan analisis faktor, yaitu dengan mengkorelasikan antar skor item instrumen dalam suatu faktor, dan mengkorelasikan skor faktor dengan skor total.
Misalnya akan dilakukan pengujian construct validity melalui analisis faktor terhadap instrumen untuk mengukur prestasi kerja pegawai. Jadi dalam hal ini variabel penelitiannya adalah prestasi kerja. Berdasarkan teori dan hasil konsultasi ahli, indikator prestasi kerja pegawai meliputi dua faktor yaitu: kualitas hasil kerja dan kecepatan kerja. Selanjutnya indikator (faktor) kecepatan kerja dikembangkan menjadi tiga pertanyaan, dan kualitas hasil kerja dikembangkan menjadi 4 butir pertanyaan. Instrumen yang terdiri 7 butir pertanyaan tersebut, selanjutnya diberikan kepada 5 pegawai sebagai responden untuk menjawabnya. (Dalam prakteknya menggunakan sekitar 30 responden) jawaban 7 responden ditunjukkan pada tabel 1 Arti angka: 4 berarti sangat tinggi, 3 tinggi, 2 rendah, 1 sangat rendah prestasinya.
Seperti telah dikemukakan bahwa, analisis faktor dilakukan dengan cara mengkorelasikan  jumlah skor faktor dengan skor total. Bila korelasi tiap faktor tersebut positif dan besarnya 0,3 ke atas maka faktor tersebut merupakan construct yang kuat. Jadi berdasarkan analisis faktor itu dapat disimpulkan bahwa instrumen tersebut memiliki validitas konstruksi yang baik.
Tabel 1
DATA PRESTASI KERJA 5 PEGAWAI
No. Res.
Skor Faktor 1untuk butir no:
Jml 1
(X1)
Skor Faktor 2 untuk butir no:
Jml 2 (X2)
Jml Total (Y)
1
2
3
1
2
3
4
1.
3
4
3
10
3
3
2
4
12
22
2.
4
3
2
9
4
3
4
4
15
24
3.
1
2
1
4
3
2
1
2
8
12
4.
3
3
3
9
4
4
3
3
14
23
5.
2
2
4
8
3
1
2
1
7
15
Berdasarkan tabel 1 tersebut telah dihitung bahwa korelasi antara jumlah faktor 1 (X1) dengan skor total (Y) = 0,85 dan korelasi antara jumlah faktor 2 (X2) dengan skor total (Y) = 0,94. Karena koefisien korelasi kedua faktor tersebut di atas 0,3, maka dapat disimpulkan bahwa kualitas hasil kerja dan kecepatan kerja merupakan konstruksi (construct) yang valid untuk variabel prestasi kerja pegawai.
Selanjutnya apakah setiap butir dalam instrumen itu valid atau tidak, dapat diketahui dengan cara mengkorelasikan antara skor butir dengan skor total (Y). Jadi untuk keperluan ini ada tujuh koefisien korelasi yang perlu dihitung. Bila harga korelasi di bawah 0,3, maka dapat disimpulkan bahwa butir instrumen tersebut tidak valid, sehingga harus dperbaiki atau dibuang.
Dari hasil perhitungan diketahui bahwa korelasi ketujuh butir instrumen dengan skor total ditunjukkan pada tabel 2 berikut.
Tabel 2
HASIL PERHITUNGAN PENGUJIAN
VALIDITAS KONSTRUK
No.
r hitung
r kritis
Keputusan
r1y
0,95
0,30
valid
r2y
0,79
0,30
valid
r3y
0,22
0,30
tidak valid
r4y
0,73
0,30
valid
r5y
0,79
0,30
valid
r6y
0,84
0,30
valid
r7y
0,83
0,30
valid
Berdasarkan tabel 2 dapat diketahui bahwa butir no 2 (faktor 1) tidak valid karena korelasi butir tersebut dengan skor total hanya 0,22 (dibawah r kritis 0,3). Butir tersebut tidak selaras dengan butir yang lain.
Pengujian seluruh butir instrumen dalam satu variabel dapat juga dilakukan dengan mencari daya pembeda skor tiap item dari kelompok yang memberikan jawaban tinggi dan jawaban rendah.  Dalam hal ini Masrun (1979) menyatakan bahwa “.... analisis untuk mengetahui daya pembeda, sering juga dinamakan analisis untuk mengetahui validitas item.”
Jumlah kelompok yang tinggi diambil 27% dan kelompok yang rendah diambil 27% dari sampel uji coba. Pengujian analisis daya pembeda dapat menggunakan t-test. Berikut ini diberikan contoh analisis daya pembeda untuk menguji validitas instrumen.
Tabel 3
KELOMPOK SKOR TINGGI DAN RENDAH PADA INSTRUMEN UNTUK MENGUKUR KINERJA APARATUR NEGARA
Skor-skor kelompok tinggi
Skor-skor kelompok rendah
126
81
128
96
135
104
135
107
135
108
140
108
142
109
1 = 135,1
s1 = 6,1
s12 = 38,1
2 = 101,85
s2 = 10,2
s22 = 104,4
Contoh:
Suatu instrumen penelitian akan digunakan untuk mengukur kinerja aparatur negara. Instrumen tersebut telah dikonsultasikan kepada para ahli aparatur dan dinyatakan siap untuk diuji coba. Uji coba diberlakukan terhadap sampel 25 responden yang tahu masalah aparatur. Berdasarkan 25 responden tersebut dapat dikelompokkan 27% responden yang memberikan skor tinggi dan 27% skor rendah. (27% responden berarti 0,27 × 25 = 7),  seperti tertera dalam tabel 2 di atas.
Untuk menguji daya pembeda secara signifikan digunakan rumus t-test sebagai berikut:

t =



Dimana:
Sgab =

Berdasarkan data yang ada pada tabel 3diatas dan rumus tersebut, maka varian gabungan (Sgab) dapat dihitung:

Selanjutnya dimasukkan dalam rumus t
Sgab =
Sgab = 8,4

t =
jadi t hitung = 7,37
Untuk mengetahui apakah perbedaan itu signifikan atau tidak, maka harga t hitung tersebut perlu dibandingkan dengan harga t tabel. Bila t hitung lebih besar daripada t tabel, maka perbedaan itu signifikan, sehingga instrumen dinyatakan valid.
Berdasarkan tabel t (tabel II dalam lampiran), dapat diketahui bahwa bila tingkat kesalahan 5%, dengan dk 12, maka harga t tabel = 1, 78. (dk  ̶  2 = 7 + 7  ̶  2 = 12). Ternyata harga t hitung 7,37 jauh lebih besar daripada t tabel  1,78 sehingga dapat dinyatakan terdapat perbedaan signifikan antara kelompok skor tinggi (X1) dan kelompok rendah (X2). Hal ini dapat disimpulkan bahwa instrumen tersebut valid.
Pengujian validitas dengan uji beda ini didasarkan asumsi bahwa kelompok responden yang digunakan sebagai uji coba berdistribusi normal. Dengan demikian, kelompok skor tinggi dan rendah harus berbeda secara signifikan, sesuai dengan kurva normal.
2.    Validitas Isi
Validitas isi menunjukkan sejauhmana pertanyaan dalam suatu tes atau instrumen mampu mewakili secara keseluruhan dari sampel yang dikenai tes tersebut. Artinya tes itu valid apabila butir-butir tes itu mencerminkan keseluruhan konten atau materi yang diujikan. Untuk mengetahui apakah tes itu valid atau tidak, harus dilakukan melalui penelaahan kisi-kisi tes untuk memastikan bahwa soal-soal tes itu sudah mewakili atau mencerminkan keseluruhan konten atau materi yang seharusnya dikuasai.
Oleh karena itu, validitas isi suatu tes tidak mempunyai besaran tertentu yang dihitung secara statistika tetapi dipahami bahwa tes itu sudah valid berdasarkan telaah kisi-kisi tes. Untuk menguji validitas butir-butir instrumen lebih lanjut, maka setelah dikonsultasikan dengan ahli, maka selanjutnya diujicobakan dan dianalisis dengan analisis item atau uji beda. Analisis item dilakukan dengan menghitung korelasi antara skor butir instrumen dengan skor total dan uji beda dilakukan dengan menguji signifikansi perbedaan antara 27% skor kelompok atas dan 27% skor kelompok bawah.  
3.    Validitas Empiris
Validitas empiris ditentukan berdasarkan kriteria, baik kriteria internal
maupun kriteria eksternal. Validitas empiris diperoleh melalui hasil uji coba tes kepada responden yang setara dengan responden yang akan dievaluasi atau diteliti. Kriteria internal adalah tes atau instrumen itu sendiri yang menjadi kriteria, sedang kriteria eksternal adalah hasil ukur instrumen atau tes lain di luar instrumen itu sendiri yang menjadi kriteria.
Validitas Internal
Validitas internal (validitas butir) merupakan validitas yang diukur dengan besaran yang menggunakan tes sebagai suatu kesatuan (keseluruhan butir) sebagai kriteria untuk menentukan validitas butir dari tes itu. Validitas internal diperlihatkan oleh seberapa jauh hasil ukur butir tersebut konsisten dengan hasil ukur tes secara keseluruhan. Oleh karena itu, validitas butir tercermin pada besaran koefisien korelasi antara skor butir dengan skor total tes.
Sebagai gambaran mengenai pengujian validitas instrument berikut ini disajikan contoh instrument untuk mengungkap kerajinan anak dari sebuah judul penelitian “Korelasi antara kerajinan dengan prestasi belajar Bahasa Indonesia kelas V SD Sidoarjo tahun 2018”.
Agar dapat diperoleh gambaran mengenai kerajinan siswa, peneliti tersebut memeriksa dari tiga aspek. Yakni kerajinan di rumah, di sekolah, dan dalam masyarakat. Misalnya dalam belajar bersama, pinjam meminjam catatan, dan sebagainya. Tiga aspek inilah yang dapat dipandang sebagai faktor dari angket. Masing-masing faktor diungkap dengan beberapa pertanyaan angket, misalnya saja 10 nomor per aspek. Dengan demikian, seluruh angket terdiri dari 30 butir pertanyaan. Apabila skor untuk tiap butir minimal 1 dan maksimal 3, akan diperoleh skor untuk tiap subjek serendah-rendahnya 30 dan setinggi-tingginya 90.


B.  Pengujian Reliabilitas Instrumen
Pengujian reliabilitas instrumen dapat dilakukan secara eksternal maupun internal. Secara eksternal pengujian dapat dilakukan dengan test-retest (stability), equivalent, dan gabungan keduanya. Secara internal reliabilitas instrumen dapat diuji dengan menganalisis konsistensi butir-butir yang ada pada instrumen dengan teknik tertentu.
1.    Test-retest
Instrumen penelitian yang reliabilitasnya diuji dengan test-retest dilakukan dengan cara mencobakan instrumen beberapa kali pada responden. Jadi dalam hal ini instrumennya sama, respondennya sama, dan waktunya yang berbeda. Reliabilitas diukur dari koefisien korelasi positif dan signifikan maka instrumen tersebut sudah dinyatakan reliabel. Pengujian cara ini sering juga disebut stability.
2.    Ekuivalen
Instrumen yang ekuivalen adalah pertanyaan yang secara bahasa berbeda, tetapi maksudnya sama. Sebagai contoh; Berapa tahun pengalaman kerja anda di lembaga ini?. Pertanyaan tersebut dapat ekuivalen dengan pertanyaan berikut; Tahun berapa anda mulai bekerja di lembaga ini?. Pengujian reliabilitas instrumen dengan cara ini cukup dilakukan sekali, tetapi instrumennya dua, pada responden yang sama, waktu yang sama, instrumen berbeda.
Reliabilitas instrumen dihitung dengan cara mengkorelasikan antara data instrumen yang satu dengan data instrumen yang dijadikan ekuivalen. Bila korelasi positif dan signifikan, maka instrumen dapat dinyatakan reliabel.


3.    Gabungan
Pengujian reliabilitas ini dilakukan dengan cara mencobakan dua instrumen yang ekuivalen itu beberapa kali ke responden yang sama. Reliabilitas instrumen dilakukan dengan mengkorelasikan dua instrumen, setelah itu dikorelasikan pada pengujian kedua, dan selanjutnya dikorelasikan secara silang. Hal ini dapat digambarkan seperti gambar berikan. 
Jika dengan dua kali pengujian dalam waktu yang berbeda, akan dapat dianalisis enam koefisien reliabilitas. Bila keenam koefisien korelasi itu semuanya positif dan signifikan, maka dapat dinyatakan bahwa instrumen tersebut reliabel.
4.    Internal consistency
Pengujian dengan cara ini dilakukan dengan cara mencobakan instrumen sekali saja. Kemudian data yang diperoleh dianalisis dengan teknik tertentu. Hasil analisis dapat digunakan untuk memprediksi reliabilitas instrumen. Berikut rumus-rumus untuk uji reliabilitas instrumen:
Rumus Spearman Brown:
          ri = 2rb
1 + rb
Keterangan:
r= reliabilitas internal seluruh instrumen
rb = korelasi product moment antara belahan pertama dan kedua
Contoh:
Untuk keperluan pengujian ini, maka butir-butir instrumen di belah menjadi dua kelompok, yaitu kelompok instrumen ganjil dan kelompok genap. Selanjutnya skor data tiap kelompok itu disusun sendiri. Untuk kelompok ganjil ditunjukkan pada tabel 7 berikut :
Tabel 7
DATA UNTUK ITEM GANJIL
No. Res
Skor untuk butir No :
Skor Total
1
3
5
7
9
11
13
15
17
1.
4
4
4
4
4
4
3
2
2
31
2.
3
4
3
3
3
4
3
3
2
28
3.
2
3
1
3
2
1
2
2
2
18
4.
3
3
4
4
4
2
4
2
3
29
5.
3
2
4
2
2
1
2
3
2
21
6.
1
1
2
1
3
2
2
1
1
14
7.
2
3
3
2
4
2
3
4
3
26
8.
3
2
2
3
4
2
2
4
3
25
9.
4
4
4
4
3
2
4
2
4
31
10.
1
2
3
3
4
3
3
3
3
25
11.
3
3
3
3
3
3
3
3
3
27
12.
1
3
2
2
3
2
2
2
1
18
13.
2
2
2
3
4
3
2
3
2
23
14.
4
4
4
4
3
3
3
2
3
30
15.
2
4
3
3
1
1
3
1
1
19
16.
3
4
2
4
4
3
3
2
4
29
17.
2
4
1
3
3
2
3
3
3
24
18.
3
3
3
3
3
4
2
4
2
27
19.
4
2
2
3
3
2
4
1
3
24
20.
2
4
2
4
2
1
2
2
4
23
21.
2
2
4
2
4
4
2
2
2
24
22.
1
1
1
1
2
1
2
2
2
13
23.
2
3
3
3
3
3
4
2
3
26
24.
4
2
2
4
2
4
2
4
4
28
25.
3
3
3
1
1
2
2
1
3
19
26.
3
3
3
3
3
3
3
1
2
24
27.
2
2
3
3
3
3
3
2
2
23
28.
3
3
3
3
3
2
3
2
3
25
29.
4
4
4
4
3
3
2
4
2
30
30.
3
3
2
2
3
3
1
1
3
21
Tabel 8
DATA UNTUK ITEM GENAP
No. Res
Item No :
Skor Total
2
4
6
8
10
12
14
16
18
1.
3
3
2
4
3
4
3
4
3
29
2.
3
2
4
4
2
3
3
3
3
27
3.
1
2
2
2
1
1
2
1
2
14
4.
3
3
2
3
3
3
3
3
2
25
5.
3
3
3
3
3
2
3
2
2
24
6.
1
1
1
2
2
3
2
1
1
14
7.
3
3
3
3
3
3
3
2
4
27
8.
3
2
3
3
3
3
3
3
2
25
9.
4
4
4
3
3
3
3
3
3
30
10.
2
3
3
3
3
2
4
2
2
24
11.
4
4
4
2
2
4
2
4
2
28
12.
2
1
1
3
3
1
1
3
2
17
13.
3
3
3
3
3
2
2
3
3
25
14.
3
3
3
2
4
2
4
3
3
27
15.
3
3
2
4
2
2
1
2
2
21
16.
2
3
3
3
2
4
3
3
3
26
17.
3
3
2
2
3
3
2
4
2
24
18.
1
2
2
4
3
3
3
3
3
24
19.
3
3
4
4
2
3
3
2
1
25
20.
2
4
3
3
3
2
3
3
2
25
21.
2
3
3
3
3
3
2
3
3
25
22.
1
1
2
2
3
4
1
1
3
18
23.
3
4
2
4
2
3
3
4
4
29
24.
3
3
3
3
3
3
3
3
3
27
25.
2
4
2
3
2
3
4
3
1
24
26.
2
4
2
4
2
4
2
2
3
25
27.
3
4
2
2
4
2
2
3
3
25
28.
3
3
3
3
3
3
2
2
2
24
29.
3
3
3
2
4
2
3
3
4
27
30.
4
4
2
3
4
1
2
2
2
24
Dan skor butirnya dijumlahkan sehingga menghasilkan skor total. Selanjutnya skor total antara kelompok ganjil dan genap dicari korelasinya. Jadi yang dikorelasikan adalah : 31, 28, 18, ..., 30, 21 dengan 29, 27, 14, ..., 27, 24. Setelah dihitung didapat koefisien korelasi 0,853.
Koefisien korelasi ini selanjutnya dimasukkan dalam rumus Spearman Brown.
Jadi reliabilitas instrumen gaya kepemimpinan = 0,92. Karena berdasarkan uji coba instrumen ini sudah valid dan reliabel seluruh butirnya, maka instrumen dapat digunakan untuk pengukuran dalam rangka pengumpulan data.