Eksplorasi Framework Tes Potensi

Penelitian Mandinach, Bridgeman, Cahalan‐Laitusis, & Trapani (2005) menunjukkan bahwa waktu dan pembagian waktu secara terpisah lebih menguntungkan siswa. Beberapa waktu tambahan dapat meningkatkan kinerja akan tetapi terlalu banyak dapat mengganggu validitas. Waktu tambahan bermanfaat bagi siswa berkemampuan sedang dan tinggi tetapi memberikan sedikit atau tidak ada keuntungan bagi siswa berkemampuan rendah. Efek dari perpanjangan waktu lebih jelas untuk bagian matematika dari SAT. Implikasi untuk perubahan potensial pada SAT dan kebutuhan untuk penelitian masa depan dibahas. Tulisan lainnya adalah Theory Based University Admissions Testing for a New Millenium (Stenberg, Collaborators, & Collaborators, 2004). Jurnal ini menjelaskan dua proyek berdasarkan teori intelijen sukses Robert J. Sternberg dan dirancang untuk memberikan pengujian berbasis teori dalam penerimaan di universitas. Pertama, Rainbow Project, memberikan tes tambahan keterampilan analitis, praktis, dan kreatif untuk meningkatkan SAT dalam memprediksi performansi di perguruan tinggi. Rainbow Project mengukur validitas prediktif yang ditingkatkan untuk IPK perguruan tinggi relatif terhadap IPK sekolah menengah. Kedua, Proyek University of Michigan Business School, memberikan tes tambahan berupa keterampilan praktis untuk Graduate Management Admission Test  (GMAT) dalam memprediksi kinerja di sekolah bisnis. Skor pada dua jenis ukuran keterampilan praktis memprediksi kinerja di dalam dan di luar kelas dan menjelaskan perbedaan kinerja diluar skor GMAT dan IPK sarjana. Langkah-langkah tersebut cenderung menunjukkan kesenjangan yang lebih sedikit mengenai gender dan ras atau kelompok etnis daripada GMAT. Temuan dari kedua proyek menunjukkan nilai potensial termasuk berbagai kemampuan yang lebih luas dalam pengujian penerimaan mahasiswa.

Tes Potensi Akademik merupakan instrumen untuk mengukur kemampuan kognitif potensial umum (pengukuran performansi maksimal) yang khusus dirancang untuk memprediksi peluang keberhasilan belajar di perguruan tinggi (Azwar, 2008). Tes Potensi untuk tujuan akademik sudah lama dikembangkan di dunia. Pada tahun 1926 Scholastic Aptitude Test (SAT) pertama kali digunakan. Tes ini pada awal pengembangannya memiliki 9 subtes, tujuh diantaranya merupakan konten verbal (definisi, klasifikasi, bahasa, antonim, analogi, kesimpulan logis, dan pembacaan paragraf) dan dua lainnya mengukur konten matematika (deret angka dan persoalan aritmatika). Kritik mengenai tes awal yaitu terlalu sulit dikerjakan oleh siswa. (Lawrence, Rigol, Essen, & Jackson, 2003)

Awal 1930, Scholastic Aptitude Test (SAT) dipisah menjadi 2 bagian yaitu untuk mengukur kemampuan verbal dan kemampuan matematis. Hal ini memperbolehkan institusi untuk menilai salah satu kemampuan lebih besar tergantung dari kebutuhan universitasnya. Selain Scholastic Aptitude Test (SAT), pada tahun 1937, Graduate Record Examination (GRE) juga berkembang. Komponen Matematika dihapus dari Scholastic Aptitude Test (SAT) dan analogi diubah menjadi bagian verbal. Perkembangan Scholastic Aptitude Test (SAT) pada tahun 1930-an sangat lambat, adanya kritik “premature standardization”. (Jacobsen, 2018)

Di abad 20, College Board memperkenalkan teknologi terbaru SAT yaitu dengan penggunaan lembar jawab dengan skoring pada mesin sehingga penggunaannya lebih efisien dan murah.  Seiring dengan penggunaanya, SAT banyak mengalami perubahan karena menyesuaikan dengan pandangan mengenai pendidikan di Amerika. Pada masa ini juga muncul kritik mengenai perbedaan pandangan penilaian SAT dan sekolah, sehingga menimbulkan pertanyaan yang mana yang lebih baik dalam mengembangkan kemampuan kognitif siswa. Pada 2013 SAT didesain ulang agar sesuai dengan kebutuhan siswa, guru dan universitas di setiap tingkat. (Everson, 2004)

Berdasarkan perkembangan awal SAT, jelas bahwa konten dan praktek pengukuran yang dilakukan tidak merefleksikan kebutuhan ilmuwan sosial. Selain itu muncul juga perdebatan di antara ahli untuk berpikir ulang mengenai penggunaan SAT sebagai tolak ukur untuk penerimaan mahasiswa, Lemann ( 2004) berpendapat bahwa secara substansi SAT memiliki dampak yang negatif. Lemann (2004) juga mendukung usulan dari Atkinson (2001) mengenai penggunaan tes prestasi pada penerimaan mahasiswa baru. Tujuan Atkinson (2001) adalah untuk memindahkan penerimaan mahasiswa di University of California dari formula kuantitatif menjadi lebih komprehensif.

Menurut Everson (2004) ada 3 alasan mengapa perlu berpikir ulang mengenai SAT untuk masa yang akan datang yaitu:

  1. Tingginya tekanan dari reformis pendidikan untuk meningkatkan konten, kinerja dan standar dalam penilaian untuk kelulusan SMA
  2. Perkembangan teknologi dan informasi juga akan mempengaruhi konten serta bentuk dari tes penerimaan, kemampuan komputer dapat dimanfaatkan melebihi standar dari pilihan ganda dengan penyajian item uji, simulasi dengan multimedia. sehingga penggunaanya akan lebih berskala besar jika dibandingkan dengan paper and pencil test (PPT)
  3. Yang paling penting yaitu pengaruh dari kajian psikologi kognitif dan pendidikan pada penilaian dan asesmen.

David Coleman, CEO College Board President, pengembang Scholastic Aptitude Test (SAT) mengatakan bahwa Standar tes yang berkembang saat ini sudah jauh dari apa yang dipelajari di sekolah menengah atas. Siswa harus menjawab sesuatu yang penuh misteri bahkan juga menggunakan semacam trik untuk meningkatkan nilainya, dan hal tersebut tidak selalu menjadikan siswa untuk siap di dunia perkuliahan. Pada 2016, SAT dirancang ulang secara signifikan. Bagian Reading and Writing akan disajikan pernyataan berdasarkan konteks disiplin ilmu tertentu, pertanyaannya mengharuskan siswa mengutip bukti dari bacaan untuk jawaban mereka. Dengan begini siswa tidak perlu menghafal kata-kata yang tidak jelas, namun mereka harus mempertimbangkan konteks dari sebuah kata. Bagian matematika akan lebih fokus pada analisis data dan penyelesaian masalah di dunia nyata, al-jabra, dan beberapa konsep matematika yang lebih maju, yaitu bidang yang relevan dengan kebutuhan siswa di perkuliahan dan karir. (Gumbrecht, 2014)

SAT terbaru memiliki komponen berupa Evidence-Based Reading and Writing, Matematika, dan Essay. Komponen critical reading dan writing pada SAT yang lama diperjelas dengan adanya konteks bacaan pada SAT model terbaru. Essay menjadi optional, sehingga sebuah lembaga/institusi yang membutuhkan dapat memutuskan penggunaan komponen tersebut penting atau tidak dalam penerimaan mahasiswa baru. Efisiensi waktu dalam SAT terbaru juga menjadi hal yang penting, waktu tes yang semula berdurasi 3 jam 45 menit dapat diubah menjadi 3 jam dengan 50 menit untuk essay menjadi pilihan masing-masing pengguna. Adanya bentuk essay berguna untuk mengukur kemampuan membaca, menganalisis dan kemampuan menulis sehingga akan menghasilkan analisis tertulis bersumber dari bacaan (Collegeboard.org, 2018).

Keunggulan dari bentuk SAT yang baru adalah:

  1. Fokus pada pengetahuan, keterampilan, dan pemahaman yang diidentifikasi oleh penelitian sebagai yang paling penting untuk kesiapan dan kesuksesan perguruan tinggi dan karier
  2. Lebih menekankan pada makna kata dalam konteks yang luas mengenai arti, nada dan dampak pada pemilihan kata.
  3. Skoring lebih sederhana hanya dengan menilai jawaban yang benar sehingga peserta tidak akan dikenai sanksi dengan menebak jawaban.
  4. Dari segi waktu pengerjaanya tidak berbeda jauh dari model lama, namun jumlah soal dikurangi. (Collegeboard.org, 2018)

Howard T. Everson (2004) memberikan framework mengenai tes yang akan datang. Menurut Everson penilaian kemampuan kognitif berbeda dengan prestasi subjek. Penilaian ini lebih umum dan bersamaan bisa menjadi ukuran pencapaian serta dapat memberikan diagnosis potensi akademik yang lebih komprehensif. Sehingga kemampuan siswa yang telah dikembangkan, seperti penalaran verbal, pemahaman membaca, kemampuan menulis, dan pemecahan masalah matematis dapat dinilai dengan item-item tes dan tugas-tugas yang didasarkan pada landasan teori yang lebih kuat. Desain yang ditawarkan oleh Everson (2004) tentunya memberi pencerahan mengenai perdebatan ahli selama ini mengenai standar tes yang digunakan untuk penerimaan mahasiswa.

Konstruk yang diukur oleh sebagian besar tes potensi adalah kecerdasan umum (general intelligence). Tes Potensi Akademik Pascasarjana (PAPS) UGM memiliki spesifikasi yang sama dengan GRE dan SAT, yaitu mengukur penalaran umum atau potensi kognitif. SAT terbaru mengukur apa yang dipelajari siswa di sekolah menengah dan kemampuan yang dibutuhkan agar dapat sukses di perguruan tinggi. Sama halnya dengan SAT, Tes PAPS juga sudah banyak mengalami evaluasi. Pada 2015, Widhiarso & Haryanta menguji kemampuan komponen subtes verbal (sinonim dan antonim) dalam mengukur domain kemampuan verbal yang sama. Hasilnya menunjukkan bahwa keduanya memiliki domain kemampuan verbal yang sama, hanya saja butir soal antonim memerlukan proses kognitif yang lebih kompleks dibandingkan sinonim. Sehingga kedua komponen tersebut tidak bisa dibedakan menjadi dua metode karena tidak memiliki keunikan tersendiri.

Khairunisa (2018) melakukan penelitian mengenai eksplorasi efek metode pada PAPS, hasilnya secara keseluruhan menunjukkan bahwa tidak terdapat efek metode dengan porsi yang cukup besar pada PAPS karena hampir semua variasi dalam skor komponen masih mengarah pada konstruk penalaran umum bukan konstruk media. Namun, berdasarkan Analisis Faktor Konfirmatori juga diketahui terdapat tiga komponen (padanan kata, klasifikasi dan geometri) yang memiliki harga muatan faktor yang lebih besar ke media pengukuran daripada konstruk penalaran umum. Lawrence, Rigol, Essen, & Jackson (2003) memaparkan mengenai perubahan yang terjadi pada konten matematika dan verbal SAT dari tahun 1926-2002. Adanya rekomendasi Komisi untuk menjadikan konten tes dapat memprediksi sekiranya lebih dekat dengan kemampuan yang dibutuhkan di perguruan tinggi dan sekolah. Terjadi perubahan pada bacaan yang lebih panjang serta membutuhkan kemampuan analisis, aitem mengenai antonim dihapuskan, dan di bagian pengenalan pertanyaan matematika juga mengharuskan siswa agar menghasilkan solusi sendiri daripada adanya pilihan jawaban (multiple choice).  Berdasarkan data tersebut, diketahui bahwa pada SAT terlebih dahulu menghapus aitem antonim karena dinilai sudah tidak relevan. Penelitian mengenai PAPS juga menemukan bahwa padanan kata dan dua komponen lainnya cenderung berkontribusi kecil terhadap konstruk penalaran umum.

Everson (2004) menyarankan penggunaan model kognitif dan psikometri yang lebih canggih agar dapat mendeskripsikan pengetahuan siswa dan struktur bakat yang dimilikinya. Hasil tes menjadi lebih diagnostik, sehingga bisa dijadikan alat pengambil keputusan dalam proses pembelajaran. Selain itu saat ini penelitian mengenai writing assessment, pengukuran creative and practical intelligence, dan uji strategic learning ability sedang dikembangkan dan berpotensi untuk memberikan gambaran mengenai tes penerimaan terbaru.

Seiring perkembangan teknologi, administrasi tes pun berkembang mengikuti arus tersebut. Pada tahun 1941, pengembangan SAT juga sudah mencoba menggunakan data penyimpanan dan teknologi komputer yang berkembang saat itu (Everson, 2004). Pada tahun 2015 ACT (American College Testing) juga mengubah administrasi menjadi Computer-based (Jacobsen, 2018). SAT pada perkembangannya juga semakin kesini memanfaatkan perkembangan teknologi informasi. Implikasi dari ini adalah tes lebih mudah diadministrasikan serta bebas dari kesalahan manusia. Selain itu administrasi tes juga dapat dilakukan dalam jumlah yang besar dan lebih efisien dari segi waktu. Kedepannya perkembangan teknologi dan informasi juga akan mempengaruhi konten serta bentuk dari tes penerimaan, kemampuan komputer dapat dimanfaatkan melebihi standar dari pilihan ganda dengan penyajian item uji, simulasi dengan multimedia. sehingga penggunaanya akan lebih berskala besar jika dibandingkan dengan pensil dan kertas (Everson, 2004). Analisis psikometri dengan Item Response Theory (IRT) atau teori respon butir melengkapi kekurangan teori klasik. Administrasi yang dilakukan dalam skala besar dapat dilakukan analisis IRT, kelebihannya lainnya IRT akan memperlihatkan interaksi subjek dengan butir tes (Sumintono & Widhiarso, 2013)). Selain itu estimasi terhadap parameter aitem tidak bergantung pada sampel aitem tertentu atau responden yang dipilih dalam suatu tes (Nurcahyo, 2016)

Daftar Pustaka

Atkinson, R. C. (2001). Achievement Versus Aptitude in College Admissions . In R. Zwick, Rethinking The SAT (p. 15). New York: Routledge.

Azwar, S. (2008). Kualitas Tes Potensi Akademik Versi 07 A. Jurnal Penelitian & Evaluasi Pendidikan, 12 (2).

Collegeboard.org. (2018, September 26). SAT Suite of Assessment. Retrieved from College Readiness: https://collegereadiness.collegeboard.org/sat/inside-the-test/compare-new-sat-act

Everson, H. T. (2004). Innovation & Change in the SAT: A Design Framework for Future College Admission Tests. In R. Zwick, Rethinking the SAT (p. 75). New York: Routledge.

Gumbrecht, J. (2014, March 6). Major changes coming to 2016 SAT test: Here’s what, how and why. Retrieved from CNN: https://edition.cnn.com/2014/03/05/living/sat-test-changes-schools/index.html

Jacobsen, E. (2018, November 8). Erikthered. Retrieved from A (Mostly) Brief History Of The SAT And ACT Tests: https://www.erikthered.com/tutor/sat-act-history.html

Khairunisa, A. R. (2018). Eksplorasi Efek Metode dalam Tes Potensi Akademik Pascasarjana (PAPS) UGM. Yogyakarta: Skripsi Fakultas Psikologi Universitas Gadjah Mada.

Lawrence, I., Rigol, G., Essen, T. V., & Jackson, C. (2003). A Historical Perspective on the Content of The SAT. In R. Zwick, Rethinking SAT (p. 57). New York: Routledge.

Lemann, N. (2004). A History of Admissions Testing. In R. Zwick, Rethinking the SAT (p. 25). New York: Routledge .

Mandinach, E. B., Bridgeman, B., Cahalan‐Laitusis, C., & Trapani, C. (2005). The Impact of Extended Time on SAT Test Performance. ETS Research Report Series, i-35.

Nurcahyo, F. A. (2016). Aplikasi IRT dalam Analisis Aitem Tes Kognitif. Buletin Psikologi, Vol.24, No.2 : 65-76.

Stenberg, R. J., Collaborators, T. R., & Collaborators, T. U. (2004). Theory-Based University Admissions Testing for a New Millenium. Educational Psychologist, Vol. 39:3.

Sumintono, B., & Widhiarso, W. (2013). Aplikasi Model Rasch untuk Penelitian Ilmu-Ilmu Sosial. Cimahi: Komunikata Publishing House.

Widhiarso, W., & Haryanta. (2015). Examining Method Effect of Synonym, Antonym Test in Verbal Abilities Measures. Europe’s Journal of Psychology, Vol. 11, No.3.

Leave A Comment

Your email address will not be published.

*