Archive
Stylometry
Pada bulan April 2013, novel berjudul The Cuckoo’s Calling hasil karya Robert Galbraith – seorang pengarang baru – diterbitkan. Novel tersebut mendapat tanggapan baik, meski tidak istimewa. Namun pada Juli 2013, seseorang menulis twit bahwa novel tersebut sejatinya ditulis oleh J.K. Rowling, penulis yang dikenal melalui karyanya serial Harry Potter. Beberapa orang mulai mengadakan penyelidikan, dan kemudian mendapatkan hasil analisis bahwa kemungkinan besar The Cuckoo’s Calling benar ditulis oleh J.K. Rowling. Dunia penerbitan gempar, terlebih setelah J.K. Rowling memberikan konfirmasi bahwa benar dialah yang menulis novel tersebut.
Yang menarik dari kejadian tersebut adalah: bagaimana penyelidikan atas naskah novel dilakukan hingga akhirnya mendapatkan kesimpulan bahwa kemungkinan besar penulisnya benar J.K. Rowling? Di sinilah stylometry, penerapan ilmu stilistika – cabang ilmu linguistik yang membahas tentang gaya bahasa – berperan.
Kita sudah menyadari bahwa ada gaya bahasa tertentu dalam setiap tulisan. Gaya bahasa itu tentu mengikuti siapa penulisnya. Tiap penulis punya gaya bahasa, gaya tulisan tersendiri. Tidak jarang kita dapat mengenali seorang penulis sebuah tulisan dari kata-kata atau frase (gabungan kata) khas yang sering digunakannya. Bisa juga kita mengenali panjang pendek rumit sederhana kalimat-kalimatnya.
Dalam kasus The Cuckoo’s Calling tadi, orang-orang menggunakan perangkat lunak untuk membantu mengenali pola-pola seperti disebut di atas. Salah satu ciri J.K. Rowling adalah, ia sering menggunakan istilah-istilah dalam bahasa Latin dalam novelnya. Ini tentu dapat dikenali oleh pengamat yang teliti, namun akan jauh lebih mudah diketahui jika menggunakan perangkat lunak. Perangkat lunak yang digunakan pada waktu itu adalah Java Graphical Authorship Attribution Program (JGAAP) – sebuah perangkat lunak gratis. JGAAP bekerja dengan memuat naskah referensi (dalam hal ini naskah novel-novel J.K. Rowling sebelumnya), dan kemudian membandingkannya dengan naskah The Cuckoo’s Calling.
Dengan alat bantu yang makin cepat dan cermat kerjanya: perangkat lunak, stylometry dapat digunakan untuk hal-hal lain seperti misalnya: mengenali penulis dari tulisan-tulisan anonim yang sering dijumpai di internet. Ini ancaman nyata atas anonimitas dan privasi orang. Jika selama ini orang dapat berlindung di balik akun-akun anonim atau bahkan palsu, dengan stylometry sosok di balik akun anonim dapat dikenali melalui gaya bahasa tulisan-tulisannya.
Referensi:
https://www.techwell.com/techwell-insights/2013/07/analysis-software-wrecked-jk-rowling-s-anonymity
http://languagelog.ldc.upenn.edu/nll/?p=5315
Yohanes – John – Jan – Jean – Joao
Waktu saya duduk di bangku SD dulu, saya pertama kali mengenal nama2 tokoh Alkitab dalam bahasa Inggris. Yohanes – John, Petrus – Peter, Yesus – Jesus, Matius – Matthew. Mengamati kemiripan bentuk penulisan nama2 ini menarik perhatian saya. Cukup dengan melihat nama versi Inggrisnya saja, saya dapat menebak padanan nama Indonesianya … untuk sebagian besar nama. Ternyata ada juga nama yang tidak mudah saya tebak padanannya, misalnya Isaiah (yang ternyata adalah Yesaya), atau Jesse (yang ternyata adalah Isai).
Semakin lama, pengamatan saya mulai meluas, baik lingkup katanya (tidak hanya seputar nama) maupun lingkup bahasanya (tidak hanya Indonesia dan Inggris). Saya menjumpai bahwa banyak kata yang sering kita pakai ternyata mirip bentuk dan maknanya dengan kata dari bahasa lain (atau malah berasal dari bahasa lain), misalnya sepatu dan zapata (Spanyol), atau almari / lemari dan armario (Spanyol), juga tiga dan tatlo (Filipina/Tagalog) — perhatikan juga telu (Jawa).
Semakin banyak saya menjumpai kesamaan2 semacam ini, membuat saya semakin berani menebak arti kata dalam suatu bahasa yang tidak saya kenal. Développement? Rasanya tidak terlalu sulit ditebak, ini kata bahasa Prancis yang sama dengan development dalam bahasa Inggris. Pour? For 🙂
Bagaimana dengan ini:
Novembre?
Servir?
Lingua?
Documento?
Dios? Petunjuk: Theos
Texte? Texto?
Mungkin pengetahuan semacam ini tidak cukup untuk nekat melancong ke negeri dengan bahasa yang asing di telinga saya, tapi kalo untuk sekedar gaya2an ya lumayan lah 🙂