Penilaian Semula Pandangan Chomsky Terhadap Penggunaan Pangkalan Data Korpus dalam Kajian Linguistik: Antara Cabaran Teoretikal dan Peluang Empirikal Ahmad Syafiq Amir Abdullah ZAWAWI*, Fazal Mohamed Mohamed SULTAN
(1) Program Linguistik Melayu, Universiti Malaya
(2) Program Linguistik, Universiti Kebangsaan Malaysia
Abstract
Dalam tradisi linguistik generatif, Noam Chomsky secara konsisten menolak kebergantungan terhadap data korpus empirikal dalam menganalisis struktur bahasa, khususnya dalam kajian sintaksis. Beliau menekankan kepentingan intuisi penutur natif dalam kajian bahasa dan mempersoalkan ketepatan data korpus kerana menganggapnya terdedah kepada unsur gangguan variasi dan tidak mencerminkan kecekapan linguistik yang sebenar. Namun, perkembangan pesat teknologi kecerdasan buatan dan teknologi linguistik, ketersediaan pangkalan data korpus yang berskala besar serta peningkatan keperluan terhadap analisis empirikal yang lebih meluas telah menimbulkan semula perdebatan terhadap kerelevenan pandangan tersebut dalam konteks kajian linguistik kontemporari. Oleh itu, kertas ini bertujuan menilai semula hujah-hujah Chomsky terhadap korpus dengan pendekatan metodologi korpus dalam kajian sintaksis yang dapat menyumbang kepada pemahaman yang lebih luas dan mendalam terhadap struktur sintaktik sejagat. Kajian ini mendapati antara cabaran penggunaan korpus ialah keterbatasannya dalam menunjukkan kompetensi penutur natif, keterbatasan bukti negatif, keterbatasannya dalam memperlihatkan keupayaan sistem mental serta data yang mungkin bias dan terhad. Namun, peluang baharu turut wujud dalam penyelidikan berpacukan korpus melibatkan keupayaan penyelidik bahasa memiliki korpus yang berbilion token (leksikon) dari pelbagai sumber dan genre, keupayaan pangkalan berteknologi tinggi yang membolehkan penemuan struktur morfosintaksis dan keupayaan data raya untuk menguji sesuatu hipotesis dan teori. Kesimpulannya, gabungan penyelidikan berpacukan korpus amat diperlukan dalam konteks semasa dengan kepentingan pendekatan integratif. Korpus bukanlah musuh kepada teori, namun ia sebagai pelengkap kepada analisis linguistik moden yang semakin berkembang.
Keywords: Pangkalan Korpus, Linguistik, Kecerdasan Buatan, Sintaksis, Data Digital.
Topic: AI in Language, Literature and Arts Education