A.
Pendahuluan
Bahasa
sebagai bagian yang penting dari kehidupan manusia, dalam bentuk tulis dapat
merupakan catatan dari pengetahuan yang didapat oleh umat manusia dari satu
generasi ke generasi berikutnya sedangkan dalam bentuk lisan merupakan sarana
komunikasi antar individu dalam suatu masyarakat. Tujuan dalam bidang Natural
Language ini adalah melakukan proses pembuatan model komputasi dari bahasa,
sehingga dapat terjadi suatu interaksi antara manusia dengan komputer dengan
perantaraan bahasa alami. Model komputasi ini dapat berguna untuk keperluan
ilmiah misalnya meneliti sifat-sifat dari suatu bentuk bahasa alami maupun
untuk keperluan sehari-hari dalam hal ini memudahkan komunikasi antara manusia
dengan Computer.
Sebuah
Natural Language System harus memperhatikan pengetahuan terhadap bahasa itu
sendiri, baik dari segi kata yang digunakan, bagaimana kata - kata tersebut
digabung untuk menghasilkan suatu kalimat, apa arti sebuah kata, apa fungsi
sebuah kata dalam sebuah kalimat dan sebagainya. Akan tetapi kita juga harus
mempertimbangkan ada satu hal lagi yang sangat berperan dalam bahasa, yaitu
kemampuan manusia untuk mengerti dan kemampuan untuk itu didapat dari
pengetahuan yang didapat secara terus
menerus sewaktu hidup. Sebagai contoh dalam suatu percakapan,
seseorang mungkin dapat menjawab suatu pertanyaan atau ikut dalam suatu
percakapan dengan tidak hanya berdasar pada kemampuan berbahasa tapi juga harus
tahu misalnya kata istilah yang umum digunakan dalam kelompok percakapan
ituatau bahkan harus tahu konteks dari percakapan itu sendiri.
B.
Difinisi
Natural Language Processing
Natural Language
Processing (NLP) adalah salah satu bidang ilmu komputer, kecerdasan buatan, dan
bahasa (linguistik) yang berkaitan dengan interaksi antara komputer dan bahasa
alami manusia, seperti bahasa Indonesia atau bahasa Inggris. Tujuan utama dari
studi NLP adalah membuat mesin yang mampu mengerti dan memahami makna bahasa
manusia lalu memberikan respon yang sesuai..
C.
Bidang
Pengetahuan Dalam Natural Language Procesing
Secara
singkat pengolahan bahasa alami (Natural Language Processing)mengenal beberapa
tingkat
pengolahan yaitu :
Dibawah
ini dijelaskan bidang-bidang pengetahuan yang berhubungan dengan Natural
Language
Processing
:
·
Fonetik
dan fonologi : berhubungan dengan suara yang menghasilkan kata yang dapat
dikenali. Bidang ini menjadi penting dalam proses aplikasi yang memakai metoda
speech based system.
·
Morfologi
: yaitu pengetahuan tentang kata dan bentuknya dimanfaatkn untuk membedakan
satu kata dengan lainnya. Pada tingkat ini juga dapat dipisahkan antara kata
dan elemen lain seperti tanda baca. Sebagai contoh
kata going :
Ø
going
(word)
Ø
go
(root)
Ø
ing
(suffix)
kata understand :
Ø
under(prefix)
Ø
stand(root)
·
Sintaksis
: yaitu pemahaman tentang urutan kata dalam pembentukan kalimat dan hubungan
antar kata tersebut dalam proses perubahan bentuk dari kalimat menjadi bentuk
yang sistematis. Meliputi proses pengaturan tata letak suatu kata dalam kalimat
akan membentuk kalimat yang dapat dikenali. Selain itu dapat pula dikenali
bagian - bagian kalimat dalam suatu kalimat yang lebih besar. Sebagai contoh
kalimat S dibentuk dari noun phrase (NP) dan verb phrase (VP)
Ø
S
-> NP,VP
Dan berikutnya :
Ø
NP
-> DET,N
Ø
VP
-> V,NP
·
Semantik
: yaitu pemetaan bentuk struktur sintaksis dengan memanfaatkan tiap kata ke
dalam bentuk yang lebih mendasar dan tidak tergantung struktur kalimat.
Semantik mempelajari arti suatu kata dan bagaimana dari arti kata - arti kata
tersebut membentuk suatu arti dari kalimat yang utuh. Dalam tingkatan ini belum
tercakup konteks dari kalimat tersebut.
·
Pragmatik
: pengetahuan pada tingkatan ini berkaitan dengan masing – masing konteks yang
berbeda tergantung pada situasi dan tujuan pembuatan system
·
Discourse
Knowledge : melakukan pengenalan apakah suatu kalimat yang sudah dibaca dan
dikenali sebelumnya akan mempengaruhi arti dari kalimat selanjutnya. Informasi
ini penting diketahui untuk melakukan pengolahan arti terhadap kata ganti orang
dan untuk mengartikan aspek sementara dari informasi.
·
World
Knowledge : mencakup arti sebuah kata secara umum dan apakah ada arti khusus
bagi suatu kata dalam suatu percakapan dengan konteks tertentu.
Definisi ini tidaklah bersifat kaku, dan
untuk setiap bentuk bahasa alami yang ada biasanya ada
pendefinisian
lagi yang lebih spesifik sesuai dengan karakter bahasa tersebut. Pada beberapa
masalah mungkin hanya mengambil beberapa dari pendekatan tersebut bahkan
mungkin ada yang melakukan tambahan proses sesuai dengan karakter dari bahasa yang
digunakan dan sistem yang
dibentuk.
Selain yang sudah disebutkan di atas masih
ada lagi satu masalah yang cukup menantang dalam Natural Language yaitu
ambiguitas atau makna ganda dari suatu kata atau kalimat. Dari satu masukan
yang sama dapat menjadi beberapa arti yang berbeda dan masing - masing dapat
bernilai benar tergantung pada keperluan pemakai. Hal ini dapat terjadi pada
hampir semua tingkatan pendekatan di atas
D.
Komponen Utama Bahasa Alami
Pengolahan
bahasa alami terdiri dari tiga bagian utama, yaitu : parser, sistem
representasi pengetahuan dan pengolahan output.
·
Parser
Suatu sistem yang mengambil kalimat input bahasa alami dan menguraikannya ke dalam beberapa bagian gramatikal (kata benda, kata kerja, kata sifat, dan lain-lain).
Suatu sistem yang mengambil kalimat input bahasa alami dan menguraikannya ke dalam beberapa bagian gramatikal (kata benda, kata kerja, kata sifat, dan lain-lain).
·
Sistem Representasi Pengetahuan
Suatu sistem yang menganalisis output parser untuk menentukan maknanya.
Suatu sistem yang menganalisis output parser untuk menentukan maknanya.
·
Output Translator
Suatu terjemahan yang merepresentasikan sistem pengetahuan dan melakukan langkah- langkah yang bisa berupa jawaban atas bahasa alami atau output khusus yang sesuai dengan program komputer lainnya.
Suatu terjemahan yang merepresentasikan sistem pengetahuan dan melakukan langkah- langkah yang bisa berupa jawaban atas bahasa alami atau output khusus yang sesuai dengan program komputer lainnya.
E.
Kategori Aplikasi Pengolahan Bahasa
Alami
Teknologi Natural Language Processing (NLP) atau Pemrosesan Bahasa Alami adalah
teknologi yang memungkinkan untuk melakukan berbagai macam pemrosesan terhadap
bahasa alami yang biasa digunakan oleh manusia. Sistem ini biasanya mempunyai
masukan dan keluaram berupa bahasa tulisan (teks). NLP mempunyai aplikasi yang
sangat luas. Beberapa diantara berbagai kategori aplikasi NLP adalah sebagai
berikut
1.
Natural Language Translator, yaitu translator dari satu
bahasa alami ke bahasa alami lainnya, misalnya translator bahasa Inggris ke
bahasa Indonesia, Bahasa Indonesia ke Bahasa Jawa dan sebagainya. Translator
bahasa alami bukan hanya kamus yang menerjemahkan kata per kata, tetapi harus
juga mentranslasikan sintaks dari bahasa asal ke bahasa tujuannya.
2.
Translator bahasa
alami ke bahasa buatan, yaitu translator yang mengubah perintah-perintah
dalam bahasa alami menjadi bahasa buatan yang dapat dieksekusi oleh mesin atau
komputer. Sebagai contoh, translator yang memungkinkan kita memberikan perintah
bahasa alami kepada komputer. Dengansistem seperti ini, pengguna sistem dapat
memberikan perintah dengan bahasa sehari-hari, misalnya, untuk menghapus semua
file, pengguna cukup memberikan perintah ”komputer, tolong hapus semua file !”
Translator akan mentranslasikan perintah bahasa alami tersebut menjadi perintah
bahasa formal yang dipahami oleh komputer, yaitu ”dir *.* ”.
3.
Text Summarization,
yaitu suatu sistem yang dapat ”membuat ringkasan” hal-hal yang penting dari
suatu wacana yang diberikan.
Dalam
dunia kecerdasan buatan pengolahan bahasa alami merupakan aplikasi terbesar
setelah sistem pakar. Banyak para ahli Artificial Intelligence berpendapat
bahwa bidang yang penting yang dapat dipecahkan oleh Artificial Intelligence
adalah Natural Language Processing (Pengolahan Bahasa Alami).
F.
Aplikasi
NLP
Secara umum, Jenis aplikasi yang
bisa dibuat dalam bidang ilmu NLP terbagi dua, yaitu text-based application
dan dialogue-based application.
Text-based application adalah segala macam aplikasi yang
melakukan proses terhadap teks tertulis seperti misalnya dokumen, e-mail, buku
dan sebagainya. Beberapa jenis aplikasi NLP yang berbasis teks :
·
Programs
for classifying and retrieving documents by content.
Program yang mampu mengklasifikasi dan mengambil isi dari suatu dokumen berdasarkan kontennya. Seperti spam filtering (pemfilteran pesan sampah), language identification (identifikasi bahasa), dan lain-lain.
Program yang mampu mengklasifikasi dan mengambil isi dari suatu dokumen berdasarkan kontennya. Seperti spam filtering (pemfilteran pesan sampah), language identification (identifikasi bahasa), dan lain-lain.
·
Machine
Translation
Program yang mampu mentranslasi
kalimat baik berupa teks maupun suara dari satu bahasa alami ke bahasa lainnya.
Contoh : Google Translate.
Tampilan Google Translate. (Sumber : Dokumen pribadi)
Dialogue-based application idealnya melibatkan bahasa lisan
atau pengenalan suara, akan tetapi bisa juga memasukan interaksi dialog dengan
mengetikkan teks pertanyaan melalui keyboard. Contoh :
·
Intelligent
personal assistant.
Perangkat lunak yang mampu melakukan tugas-tugas dan jasa berdasarkan inputan dari pengguna, lokasi, dan memiliki kemampuan untuk mengakses informasi dari berbagai sumber online (seperti cuaca, keadaan lalu lintas, berita, saham, dll). Contohnya adalah Siri pada produk-produk Apple dan S-Voice pada produk-produk seluler Samsung.
Perangkat lunak yang mampu melakukan tugas-tugas dan jasa berdasarkan inputan dari pengguna, lokasi, dan memiliki kemampuan untuk mengakses informasi dari berbagai sumber online (seperti cuaca, keadaan lalu lintas, berita, saham, dll). Contohnya adalah Siri pada produk-produk Apple dan S-Voice pada produk-produk seluler Samsung.
·
Chatbot.
Chatbot adalah program komputer yang didesain untuk mensimulasikan sebuah
percakapan cerdas dengan satu atau lebih pengguna manusia melalui inputan suara
atau teks, utamanya digunakan untuk percakapan kecil. Contoh : Cleverbot,
SimSimi, dan begobet.
sumber :
http://novtani.wordpress.com/2012/06/04/natural-language-processing-nlp/#more-972
http://id.wikipedia.org/wiki/Sejarah_komputer http://kelompokapaajabole.blogspot.com/2010/12/nlp-natural-language-programmingnlp.html