Ismail Fahmi, Pengoprek Semantic Web untuk Bahasa Indonesia
May 6, 2010
Netsains.Com – Siapa bilang belajar teknologi informasi hanya akan berakhir menjadi administrator saja, atau bahkan “tukang” servis komputer? Hilangkan pikiran pesimis macam itu, sebab jika ditekuni dengan serius, bukan tak mungkin melahirkan programmer andal.
Ismail Fahmi adalah salah satunya. Semantic web, yang juga disebut sebagai Web 3.0, membuat lelaki kelahiran 4 Januari, 36 tahun silam ini, penasaran berat. Belum lama ini ia merilis Gresnews.com, yang bisa dikatakan sebagai situs yang menjalankan teknologi semantic web pertama di Indonesia. Apa kelebihan situs yang menjadi “oprekan” doktor Universitas Groningen, Belanda ini? Yuk, ikuti bincang-bincang saya dengan istri dari Agnes Tri Harjaningrum.
Netsains (NS): Sejak kapan mempelajari semantic web?
Ismail Fahmi (IF): Saya mulai mengenal dan mempelajari semantic web sejak tahun 2006. Itu tahun kedua ketika saya mengambil PhD di Belanda. Kebetulan, selain riset saya juga bekerja untuk Perpustakaan Universitas Groningen, dan saya dibebaskan untuk mengembangkan teknologi baru yang bisa diimplementasikan di perpustakaan. Kemudian saya mencoba mencari riset terbaru di bidang teknologi informasi dan internet, dan saya temukan semantic web merupakan salah satunya. Usulan saya untuk menerapkan teknologi ini di perpustakaan disetuju oleh bos saya. Kemudian, sejak saat itu saya mulai menggeluti semantic web.
NS: Kenapa tertarik mempelajarinya?
IF: Awalnya simpel. Semantic web dibilang sebagai Web 3.0. Saat itu Web 2.0 sudah banyak dibicarakan dan direalisasikan. Yang masih belum luas implementasinya adalah Web 3.0. Saya pikir tentu ini salah satu teknologi Internet di masa depan. Dari pada mendalami apa yang sudah dikembangkan oleh orang (WEb 2.0), saya pikir lebih baik saya mendalami yang belum banyak didalami, yaitu semantic web.
Kebetulan yang kedua adalah, riset PhD saya tentang Natural Language Processing (NLP), dimana saya belajar bagaimana komputer bisa memahami bahasa alamiah manusia, dan dengan pengetahuannya ini komputer bisa memproses teks. Contohnya, dari sebuah string kalimat, komputer bisa mengetahui mana subjek, predikat, atau objek. Juga tahu sebuah kata itu kata benda, kata kerja, kata sifat, atau yang lainnya. Dengan kemampuan menganalisa teks ini, komputer akhirnya bisa mengolah dokumen yang tidak terstruktur, bukan berbentu data, menjadi data yang bisa dipahami oleh komputer.
Nah, karena semantic web itu hanya bisa bekerja jika inputnya adalah data, dan NLP bisa mengubah teks menjadi data, maka saya menjadi semakin bersemangat untuk mempelajari semantic web ini. Dengan begitu, saya bisa terapkan hasil pengolahan teks menggunakan teknologi NLP untuk konsumsi semantic web.
Lulusan SMA 1 Bojonegoro (Jawa Timur) ini adalah juga alumni Jurusan Elektro Institut Teknologi Bandung (ITB), dan terakhir lulusan Alfa-Informatika di Universitas Groningen. Selain ngoprek komputer, yang merupakan hobi utamnya, Ismail juga suka motret-motret menggunakan kamera ‘aliran hitam’. Jika ada waktu juga suka mengolah foto menggunakan Gimp.
NS: Sebenarnya apa fungsi utama dari aplikasi ini? Dan apa bisa menguntungkan dari sisi bisnis?
IF: Fungsi utama dari aplikasi di balik Gresnews.com adalah untuk mentransformasi teks yang hanya bisa ditampilkan di halaman web, tanpa bisa diolah lebih lanjut oleh komputer, tidak bisa digunakan oleh komputer untuk mengetahui mood, perasan, pendapat positif atau negatif seseorang, menjadi data yang bisa dimengerti komputer. Dengan transformasi ini, pengunjung tidak sekedar membaca berita (teks), tetapi bisa mendapatkan insight atau pemahaman baru yang sudah dioleh terlebih dahulu secara otomatis oleh komputer.
Sebagai contoh, fitur Relation Graph di Gresnews.com, dihasilkan dari data subjek-predikat-objek yang sudah diolah sebalumnya dari teks berita. Dengan relasi ini, komputer bisa menampilkan aktor-aktor memiliki relasi tertentu di dalam berita. Misalnya ‘Presiden SBY’ memiliki hubungan dengan Budiono melalui relasi ‘mengangkat’ atau ‘memerintahkan’, dan seterusnya.
Jika setiap kata kerja menjadi relasi penghubung antara subjek dan predikat, maka komputer yang memiliki pengetahuan NLP dapat kita minta untuk menampilkan sepasang aktor yang memiliki relasi tertentu. Misalnya, kita bisa minta komputer agar menampilkan pasangan-pasangan aktor yang memiliki relasi ‘mencintai’. Dengan mudah, saya bisa dapatkan data berikut dari database Gresnews:
{“s”:”Jude”,
“p”:”mencintai”,
“o”:”Sienna”,
“score”:11.66189},
{
“s”:”Allah SWT”,
“p”:”mencintai”,
“o”:”hamba-Nya”,
“score”:11.66189},
{
“s”:”Ari”,
“p”:”mencintai”,
“o”:”Inge”,
“score”:11.66189},
Saat saya menulis ini, pencarian berdasarkan relasi di atas belum ditampilkan di Gresnews. Yang sudah ditampilkan adalah anda bisa menelusuri relasi S-P-O yang sudah disajikan oleh Relation Graph.
Anda bisa bayangkan sendiri, tanpa perlu membaca teks berita, anda bisa mendapatkan potongan-potongan informasi menarik yang mungkin akan menambah insight bagi anda.
NS: Apakah hal ini menguntungkan dari sisi bisnis?
IF: Jika yang anda maksud dengan pertanyaan ini adalah apakah dengan ditambahkannya semantic web pada aggregator berita seperti Gresnews, maka Gresnews akan lebih untung secara bisnis? Jawaban saya, saya tidak tahu. Saya pribadi tidak berharap mendapatkan revenue yang banyak dari situs Gresnews.com. Situs ini lebih sebagai media eksperimen saya dalam menerapkan semantic web. Saya ingin melihat apakah benar komputer bisa membantu manusia memahami teks secara cepat dan otomatis? Bagaimana pengunjung memanfaatkan fitur-fitur baru ini? Apakah mereka menyukainya, atau mereka lebih memilih fitur tradisional seperti headline dan link ke sumber berita agar bisa membaca sendiri beritanya? Juga bagaimana pengunjung meresponse iklan teks, image, dan video? Saya ingin mengetahui hal-hal ini.
Untuk bisnis, saya ingin membidik institusi riset atau perusahaan yang ingin lebih maju dengan mendengarkan apa kata konsumen mereka di koran online, blog, twitter, dan forum diskusi. Saat ini, opini konsumen setiap saat bisa disebarkan di internet melalui media-media online ini. Dan secara realtime, perusahaan yang sedang memasarkan sebuah produk bisa langsung memonitor response konsumen jika mereka bisa mengolah pesan-pesan online tersebut. Nah, teknologi NLP dan semantic web, bisa menjawab kebutuhan itu.
NS: Apakah web kamu Gresnews.Com merupakan realisasi dari semantic web?
IF: Seperti saya jelaskan di atas, Gresnews memang diharapkan menjadi realisasi dari semantic web. Porsi teknologi semantic web ini nantinya akan semakin besar. Saat ini, Gresnews baru menggunakan sebagian kecil teknologi semantic web. Pelan-pelan, kami akan tambahkan fitur semantic web ke dalamnya.
NS: Apakah itu berarti kamu bisa mengoperasikan web tersebut sendirian saja, dengan hanya mengandalkan program semantic web?
IF: Soal pengoperasian web yang dilakukan secara otomatis, ini bisa dilakukan meskipun tidak menggunakan semantic web. Cukup dengan crawler, text clustering, indexing, dan berbagai teknik visualisasi, kita bisa bikin web yang otomatis terupdate secara periodik.
Teknik ini juga digunakan di Gresnews, sehingga saya tidak perlu mengoperasikan Gresnews secara manual. Bahkan saya turut menjadi penikmat berita yagn disajikan Gresnews. Saya sangat terbantu, karena saya tidak perlu mengunjungi ribuan sumber berita untuk mendapatkan berita terbaru dan yang lagi ngetrend.
NS: Apakah program itu kamu modifikasi secara khusus seorang diri?
IF: Saat ini saya sendirian yang mengerjakan program ini. Karena saya siang hari kerja di perusahaan Belanda, maka hanya pada malam hari saya bisa mengerjakannya. Saya cicil sedikit demi sedikit sejak bulan Agustus tahun lalu.
NS: Dengan semantic web ini, yg juga disebut web 3.0, mungkinkah web versi sebelumnya bisa digantikan atau “dikalahkan” dari sisi kompetisi bisnis atau eksistensi?
IF: Saya bukan ahli di bidang bisnis, jadi soal bisnis saya tidak bisa jawab. Hanya yang saya tahu, dalam setiap masa, kita akan melihat sebuah teknologi begitu dominan dan mewarnai. Pada tahun 1993 saya ingat pertama kali ada sambungan ke internet di ITB, menggunakan modem 64 Kbps melalui BPPT. Saat itu ketika kita bisa membuat web status, sudah sangat hebat. Namun, sekarang, kondisinya sudah jauh sekali dari web statis. Kita melihat web yang statis seperti dinosaurus.
Sekarang setiap orang bisa menjadi sukses, hebat, terkenal, melalui talen yang mereka miliki ketika mereka bisa membangun network. Sekarang setiap orang bisa menerbitkan berita melalui blog mereka. Siapapun bisa membuat blog, tanpa harus membayar sepeserpun. Setelah blog dibuat, mereka tinggal menunggu orang datang untuk memberi komentar. Sebagian orang menjadi selebritis internet, yang memiliki blog paling banyak dikunjungi dan paling banyak komentarnya. Blog-blog ini bisa memiliki kekuatan dan pengaruh yang sangat besar, selain bisa menghasilkan revenue yang menguntungkan. Inilah jaman Web 2.0.
Dan saya yakin, kondisi ini tak akan lama lagi bergeser. Jika saat ini adalah jaman dimana ‘manusia’ berkomunikasi dengan ‘manusia’, melalui komentar di status Facebook, misalnya, maka di masa depan apa yang mereka tuliskan akan bisa dipahami komputer. Sehingga nanti akan tiba jaman dimana ‘komputer’ berkomunikasi dengan ‘komputer’ setelah memahami setiap teks yang diprosesnya. Komputer akan berkomunikasi dengan smartphone, dan smartphone akan memberitahu si empunya tentang pesan yang dikirim oleh komputer itu.
Kuncinya memang ada di pemahaman akan makna yang terkandung dalam teks/data oleh komputer. Dan itu adalah jaman Web 3.0. Mungkin itu pula jamannya Semantic Web. Saya tidak tahu pasti.
Sejauh ini Gresnews sebagai semactic web sudah cukup menghipnotis pengembang situs lainnya. Seperti yang dikemukakan Ruby, seorang web developer asal Malang, Jawa Tumir. “Sepertinya ini web nantinya bakalan besar dan tambah canggih serta banyak dicari. Situs ini menyedot informasi per segmen, per kategori, bahkan lebih detail lagi nanti. Selain itu, dia menyedot informasi, dan ditampilkan ke web ini dengan screen terlebih dahulu , tentunya bersama sama script screeningnya, dan membuat berita tersebut tidak sama dengan web aslinya, walau intinya sama,” papar Ruby.
NS: Selain Gresnews, adakah web lain yang sudah bisa disebut sebagai web 3.0 yang dikembangkan oleh orang Indonesia juga selain kamu?
IF: Saya sendiri sebenarnya agak kuper dengan perkembangan web-web inovatif yang dibuat oleh orang Indonesia. Saya kurang mengikuti infonya setiap hari, jadi saya tidak bisa jawab apakah ada yang lain atau tidak. Pernah ada yang tanya di Twitter, dan teman saya bilang kalau yang mengimplementasikan semantic web baru Gresnews. Tapi pastinya saya kurang tahu. Mungkin pembaca blog ini bisa membantu.
NS: Saat ini sedang sibuk apa?
IF: Secara profesional saya saat ini bekerja di sebuah perusahaan Rich Media di Amsterdam. Bisnis utamanya adalah menjual slot untuk iklan-iklan rich media (yang mengandung flash, movie, homepage takeover, dan lain-lain) di ratusan situs yang diajak bekerjasama. Tugas saya membuat aplikasi reporting, kurang lebih seperti Google Analytics, tapi untuk iklan yang ditampilkan. Informasi yg dikelola seperti impresi, klik, rate klik, visibility, dan lain-lain.
Selain itu ya sibuk dengan proyek Gresnews ini. Dan sekarang sedang menyiapkan Gresnews Media Center, yang akan memudahkan seseorang untuk memonitor coverage institusinya dan kompetitornya di berita-berita online dan media sosial (blog, twitter, forum).
Foto-foto: Dokumen pribadi Ismail Fahmi.
Tentang Penulis: Merry Magdalena
Merry Magdalena Merry Magdalena adalah mantan jurnalis desk Teknologi Informasi dan Iptek di Sinar Harapan. Ia sempat memenangkan sejumlah penulisan jurnalistik bidang Iptek, Lingkungan dan TI. Di sela kesibukan sebagai jurnalis, Merry juga masih menekuni hobi menulis buku dan berorganisasi di dunia maya. Bukunya yang sudah terbit “Cyberlaw, Tidak Perlu Takut” ditulis bersama Mas Wigrantoro Roes Setiyadi, “Situs Gaul Gak Cuma buat Ngibul” (Gramedia Pustaka Utama, Mei 2009), “UU ITE, Don’t be The Next Victim”
* Website Pribadi/Blog: http://merry.netsains.com
Sumber : http://netsains.com/2010/03/ismail-fahmi-pengoprek-semantic-web-ala-indonesia/


