Pengembangan tes di Fakultas Psikologi UGM dilakukan dengan mengikuti prosedur pengembangan tes psikologi yang dipaparkan dalam berbagai literatur tes. Dokumen yang dipakai untuk memandu pengembangan tes adalah Buku The Standards for Educational and Psychological Testing yang dikembangkan oleh (American Educational Research Association (AERA), American Psychological Association (APA), dan National Council on Measurement in Education (NCME) tahun 1999 dan 2014). Semua proses yang dilakukan dalam pengembangan tes dilakukan berdasarkan rekomendasi-rekomendasi yang tertera di dalam buku tersebut beserta beberapa literatur. Sistem penjaminan mutu dilakukan dengan cara memastikan bahwa pengembangan tes telah melalui prosedur pengembangan tes yang ilmiah dan dapat dipertanggungjawabkan. Bagian ini akan menjelaskan prosedur pengembangan tes dimana TKDA merupakan salah satu bagian dari tes yang telah dikembangkan secara rutin. Selain prosedur, jaminan mutu juga ditunjukkan oleh pihak-pihak yang terlibat dalam pengembangan tes yang harus memenuhi kualifikasi yang ditetapkan. Secara teknis penjaminan mutu dilakukan oleh lembaga yang dibentuk Fakultas Psikologi UGM yang bernama Unit Pengembangan Alat Psikodiagnostika (UPAP) yang didukung oleh dosen-dosen yang memiliki kepakaran dalam bidang pengukuran di KBK Psikometrika Fakultas Psikologi UGM.
Keberfungsian Butir Diferensial dalam Pengukuran Dukungan Sosial
Arifa Norma Dewi & Wahyu Widhiarso
Fakultas Psikologi UGM
Tahun 2010
Perbedaan karakter dan perilaku manusia antara laki-laki dan perempuan terjadi pada banyak hal. Perbedaan tersebut bisa dilihat baik secara fisik maupun nonfisik yang terjadi dalam konteks jender. Jender merupakan sebuah aspek inti dari identitas diri internal, sebuah set laki-laki dan perempuan dari sisi perilaku dan mental yang dibentuk dan dikembangkan oleh kelompok masyarakat tertentu. Kajian jender meliputi proses kognitif dan perilaku pada laki-laki dan perempuan di lingkup masyarakat tertentu (Galliano, 2003). Setiap kelompok masyarakat memiliki pandangan yang berbeda-beda mengenai karakteristik laki-laki dan perempuan. Pandangan yang ada tidak terlepas dari stereotipe yang berkembang sesuai dengan kondisi dan internalisasi nilai-nilai budaya masing-masing daerah. Jender merupakan set stereotipe yang mempengaruhi bagaimana laki-laki dan perempuan dipandang oleh masyarakat serta membentuk perbedaan karakteristik mereka. Telah banyak dilakukan pengukuran dengan berbagai tujuan namun ternyata masih ada alat ukur yang belum mengukur konstrak psikologis dengan optimal karena berbagai sebab. Sejauh ini banyak muncul kritik terhadap alat ukur, seperti adanya alat ukur yang tidak bebas budaya. Alat ukur tersebut dibuat dan atau dikembangkan serta digunakan di negara barat namun juga digunakan di Indonesia. Hasilnya, alat ukur tersebut belum mampu mengungkap konstrak psikologis yang diukur dengan optimal. Permasalahan lain yang terjadi dalam alat ukur adalah masalah bias dalam pengukuran, misalnya adanya aitem-aitem yang bias. Aitem yang bias ini menyebabkan ketidakadilan karena menguntungkan salah satu kelompok tertentu namun merugikan kelompok lainnya. Bias pengukuran ini terjadi pada alat ukur yang mengungkap dinamika perbedaan karakteristik dalam jender yang lebih dikenal dengan istilah bias jender (Einarsdóttir & Rounds, 2009).
Skala Kepribadian merupakan alat yang dapat digunakan untuk memperkuat validitas sistem seleksi kerja (Schmidt & Hunter, 1998 dalam Chan, dkk. 2001). Selama lebih dari 30 tahun para ilmuan psikologi berkutat dengan masalah tipuan yang diberikan subjek dalam merespon aitem tes kepribadian (Smith, 1999). Silverthorn and Gekoski (1995) dalam Beere, dkk (1996) menyatakan bahwa beberapa tes pengukuran diri dapat dipengaruhi oleh aspek kepatutan sosial. Perhatian utama dari para pengguna skala pelaporan pribadi yang meliputi skala kepribadian dan psikopatologi adalah adanya kerentanan skala-skala tersebut terhadap adanya tipuan (Anastasi, 1988 dalam Holden, dkk 1992). Hasil penelitian membuktikan bahwa tes non-kognitif seperti halnya pengukuran kepribadian dan biodata rentan terhadap bias tipuan yang dilakukan oleh subjek (Hough et al., 1990; Kluger, Reilly, & Russell, 1991; Ones, Viswesvaran, & Korbin, 1995 dalam Douglas, dkk 1996). Lautenschlager dan Flaherty (1990) dalam Beere, dkk (1996) membuktikan bahwa kepatutan sosial dapat berpengaruh dalam penggunaan skala pengukuran diri yang digunakan untuk mengukur emosi, sikap, dan karakteristik kepribadian lainnya.
Penelitian Mandinach, Bridgeman, Cahalan‐Laitusis, & Trapani (2005) menunjukkan bahwa waktu dan pembagian waktu secara terpisah lebih menguntungkan siswa. Beberapa waktu tambahan dapat meningkatkan kinerja akan tetapi terlalu banyak dapat mengganggu validitas. Waktu tambahan bermanfaat bagi siswa berkemampuan sedang dan tinggi tetapi memberikan sedikit atau tidak ada keuntungan bagi siswa berkemampuan rendah. Efek dari perpanjangan waktu lebih jelas untuk bagian matematika dari SAT. Implikasi untuk perubahan potensial pada SAT dan kebutuhan untuk penelitian masa depan dibahas. Tulisan lainnya adalah Theory Based University Admissions Testing for a New Millenium (Stenberg, Collaborators, & Collaborators, 2004). Jurnal ini menjelaskan dua proyek berdasarkan teori intelijen sukses Robert J. Sternberg dan dirancang untuk memberikan pengujian berbasis teori dalam penerimaan di universitas. Pertama, Rainbow Project, memberikan tes tambahan keterampilan analitis, praktis, dan kreatif untuk meningkatkan SAT dalam memprediksi performansi di perguruan tinggi. Rainbow Project mengukur validitas prediktif yang ditingkatkan untuk IPK perguruan tinggi relatif terhadap IPK sekolah menengah. Kedua, Proyek University of Michigan Business School, memberikan tes tambahan berupa keterampilan praktis untuk Graduate Management Admission Test (GMAT) dalam memprediksi kinerja di sekolah bisnis. Skor pada dua jenis ukuran keterampilan praktis memprediksi kinerja di dalam dan di luar kelas dan menjelaskan perbedaan kinerja diluar skor GMAT dan IPK sarjana. Langkah-langkah tersebut cenderung menunjukkan kesenjangan yang lebih sedikit mengenai gender dan ras atau kelompok etnis daripada GMAT. Temuan dari kedua proyek menunjukkan nilai potensial termasuk berbagai kemampuan yang lebih luas dalam pengujian penerimaan mahasiswa.
Fakultas Psikologi UGM memiliki tes potensi akademik yang bernama tes potensi akademik Pascasarjana (PAPS) yang merupakan instrumen pengukuran yang dipakai secara intensif dalam proses seleksi calon mahasiswa pascasarjana di lingkungan UGM. Tes ini dikembangkan semenjak tahun 2008 oleh dosen-dosen di Fakultas Psikologi UGM. Hingga kini tes tersebut masih dipakai oleh UGM dalam menyeleksi calon mahasiswa pascasarjana di lingkungan UGM. Tes ini setiap tahun dievaluasi dan diadministrasikan oleh Unit Pengembangan Alat Psikodiagnostika (UPAP). Hasil evaluasi yang dilakukan menunjukkan bahwa Tes PAPS memiliki validitas yang memuaskan. Namun demikian, Tes PAPS memiliki potensi untuk meningkatkan kualitasnya dari aspek yang lain untuk mengakomodasi tuntutan dan relevansi perubahan zaman.
Situational Judgment Test (SJT)
Unit Pengembangan Alat Psikodiagnostika (UPAP)
Fakultas Psikologi Universitas Gadjah Mada
Oleh: Wahyu Widhiarso
Latar Belakang
Fakultas Psikologi UGM memiliki akar dan tradisi yang sangat kuat dalam hal penelitian terutama dalam bidang pengembangan alat ukur. Secara historis para pendiri Fakultas Psikologi UGM adalah para pakar dalam metodologi penelitian dan para ahli psikometri. Akar dan tradisi ini hingga saat ini masih lestari dan menjadi keunggulan komparatif Fakultas Psikologi UGM. Fakultas Psikologi UGM secara berkesinambungan melakukan penelitian dan pengembangan instrumen untuk mendukung aktivitas asesmen psikologi.
Pengujian Validitas Struktural Tes Kognitif AJT
Retno Suhapti
Wahyu Widhiarso
Ammik Kisriyani
Abstrak
Penelitian ini bertujuan untuk menguji validitas konstruk Tes Kognitif AJT (AJT Cogtest). Tes Kognitif AJT merupakan tes kognitif yang dikembangkan dengan menggunakan teori kognitif yang dikembangkan oleh Cattel-Horn-Caroll (CHC). Tes Kognitif AJT adalah baterai tes yang memuat subtes-subtes yang mengukur sebagian besar kemampuan umum (broad ability) yang dicakup dalam Teori CHC. Pengujian validitas struktural dilakukan pada 27 subtes Tes Kognitif AJT yang masing-masing merepresentasikan kemampuan spesifik (broad ability) yang berbeda-beda. Sampel penelitian adalah 4.839 orang usia anak-anak hingga remaja di Pulau Jawa. Pengujian dilakukan dengan menggunakan analisis faktor konfirmatori untuk menguji kesesuaian Tes Kognitif AJT dengan Teori CHC. Model yang diuji merupakan model berjenjang yang terdiri dari tiga jenjang, yaitu kemampuan umum, kemampuan luas dan kemampuan spesifik. Masing-masing kemampuan sempit memuat 3 hingga 4 subtes. Hasil analisis menemukan bahwa model faktor berjenjang yang diajukan memiliki ketepatan dengan data. Temuan ini kemudian ditindaklanjuti dengan pengembangan versi-versi Tes Kognitif AJT, yaitu versi ringkas, lengkap, dan komprehensif.