Page 1Page 2Page 3Page 4Page 5Page 6Page 7Page 8Page 9Page 10Page 11Page 12Page 13Page 14

Page 1 of 14
next >

Perancangan Modul Bahasa Indonesia untuk Microsoft FAST ESP Search Engine

Alfian Akbar Gozali

Universitas Telkom

alfian@tass.telkomuniversity.ac.id

Abstrak

Fungsi utama dari search engine atau mesin pencari adalah mempermudah dan mempercepat

pencarian. Latar belakang dibuatnya mesin pencari ini adalah banyaknya jumlah dokumen di internet

yang mempersulit proses pencarian user.Selain digunakan di internet, mesin pencari juga banyak

diterapkan pada perusahaan.Mesin pencari untuk perusahaan sudah ada banyak, salah satunya adalah

FAST ESP Search Engine.FAST ESP adalah sebuah software terintegrasi yang menyediakan sebuah

platform untuk layanan pencarian dan filtering. Sistem ini dibuat terdistribusi sehingga dapat

menyediakan temu balik informasi dari beberapa jenis informasi (dan dataset).FAST ESP secara

otomatis mengenali 81 jenis bahasa termasuk Indonesia namun jika ingin mengaplikasikan FAST ESP

untuk dokumen berbahasa Indonesia, penambahan modul custom harus dilakukan.

Proses perancangan modul bahasa Indonesia untuk FAST ESP adalah analisis proses Microsoft

FAST ESP, analisis strategi awal perancangan modul bahasa Indonesia, perancangan model linguistik

bahasa Indonesia, dan studi prioritas proses pada model lingustik bahasa Indonesia. Pada akhirnya

environment dan proses dalam FAST ESP sangat menentukan posisi dari modul bahasa Indonesia

yang akan dimasukkan. Berdasarkan hasil analisis didapatkan bahwa tahap pipeline adalah satu-

satunya tahap yang dapat digunakan. Proses penyisipan modul bahasa Indonesia adalah dengan

mengganti atau menambahkan stage pada pipeline. Stage yang akan disisipi atau bahkan diubah dapat

dibagi berdasarkan kebergantungannya kepada bahasa.

Kata kunci:FAST ESP, search engine, search enginebahasa Indonesia

I.

Pendahuluan

1.1. Latar Belakang

Search engine pertama kali dibuat oleh McBrian dan diberi nama World Wide Web

Worm(WWW) [1]. McBrian membuat WWWW dengan tujuan untuk „menjinakkan‟ world wide web

alias internet.Hal ini karena masalah yang muncul setelah internet muncul adalah jumlah website yang

demikian banyaknya, sehingga diperlukan alat untuk mengindeks website yang ada di internet untuk

mempermudah pencarian.Dari sinilah muncul sebuah rumpun penelitian yang bernama sistem temu

balik informasi (information retrieval). WWWW ini jugalah yang menginspirasi Sergey Brin and

Lawrence (Larry) Page untuk membuat Google[2], mesin pencari yang saat ini masih menjadi

pemimpin di world wide web dengan algoritma Google Page Rank-nya.

Karena kehandalan dalam mememukan sebuah informasi dalam bongkahan data yang sangat

besar, kini mesin pencari bukan hanya milik world wide web. Saat ini telah banyak perusahaan yang

memasukkan mesin pencari dalam proses bisnis atau sistemnya. Salah satu contohnya adalah

Facebook yang menggandeng Microsoft Bing untuk pencarian non-graf [3] walaupun pada akhirnya

Facebook mengembangkan mesin pencarinya sendiri [4]. Contoh yang lain adalah open source search

engine Solr, yang mempunyai core dari Apache Lucene, mempunyai puluhan pengguna yang terdiri

dari public website hingga private company [5]. Bahkan perusahaan sebesar Microsoft yang

mempunyai search engine, Bing [6]pun pada bulan April 2008 melakukan akuisisi pada FAST ESP

search engine [7]. FAST ESP search engine adalah sebuah mesin pencari yang dikhususkan untuk

enterprise (perusahaan).

FAST ESP search engine merupakan search engine yang cukup lengkap dan tinggi

skalabilitasnya. Namun FAST ESP mempunyai kekurangan jika ingin diterapkan di perusahaan

Indonesia karena hingga saat ini, FAST ESP belum mendukung bahasa Indonesiawalaupun sudah

dapat mendeteksi adanya kata dalam bahasa Indonesia [8]. Oleh karena itu diperlukan tambahan

modul khusus jika ingin menerapkan FAST ESP search engine ini untuk dokumen berbahasa

Indonesia.