Kekuatan Komputasi Google Menyempurnakan Alat Penerjemah
Menggunakan kekuatan dahsyat komputasi menghaluskan hasil terjemahan
Pada suatu pertemuan yang dilaksanakan di Google pada tahun 2004, pokok
bahasannya terarah pada sebuah surel yang diterima perusahaan itu dari
seorang penggemar di Korsel. Sergey Brin yang merupakan salah satu dari
dua pendiri
Perusahaan Google, menjalankan pesan itu melalui sebuah layanan terjemahan otomatis yang telah dipatenkan perusahaan itu.
Pesan itu berbunyi Google adalah mesin pencari favorit, tapi hasil
terjemahan mengatakan: "Irisan ikan mentah memasang ladam kehendak. Hal
bawang hijau Google!"
Pak Brin mengatakan Google harus bisa melakukannya lebih baik. Enam tahun kemudian, layanan gratis
Penerjemahan Google
menangani 52 bahasa, lebih dari sistem lain yang serupa, dan
orang-orang menggunakannya ratusan juta kali seminggu untuk
menerjemahkan halaman-halaman Web dan naskah lain.
"Apa yang anda lihat pada Penerjemahan Google merupakan karya seni"
dalam penerjemahan komputer yang tak dibatasi oleh wilayah subyek
tertentu, ujar Alon Lavie, seorang kolega profesor peneliti pada
Institut Teknologi Bahasa di Universitas Carnegie Mellon, seperti yang
dikutip
The New York Times.
Usaha Google untuk berekspansi lebih dari sekedar mesin pencari telah
menghasilkan berbagai kesuksesan. Buku-buku digitalnya telah digantung
di pengadilan, dan pengenalan jejaring sosialnya,
Buzz,
meningkatkan ketakutan akan privasi. Contoh itu memperlihatkan bahwa
Google bisa salah melangkah ketika dia mencoba untuk menantang tradisi
bisnis dan konvensi kultural.
Namun kenaikan cepat Google ke tingkat eselon atas pada bisnis
penerjemahan merupakan suatu pengingat tentang apa yang akan terjadi
jika Google melepaskan kekuatan komputasinya yang dahsyat terhadap
masalah-masalah rumit.
Jaringan pusat-pusat data yang dibangunya untuk pencarian Web sekarang
bisa saja menjadi komputer terbesar di dunia jika digabungkan. Google
menggunakan mesin itu untuk menekan batas-batas teknologi penerjemahan.
Sebagai contoh, kira-kira dua bulan lalu dia mengatakan bahwa dia sedang
bekerja menggabungkan alat penerjemahannya dengan analisis gambar yang
dapat menerjemahkan tulisan dalam gambar.
"Penerjemahan Mesin merupakan salah satu contoh terbaik yang menunjukkan
visi strategis Google," ujar Tim O'Reilly yang merupakan pendiri dan
kepala
technology publisher O'Reilly Media. "Itu bukanlah sesuatu
yang ditanggapi sangat serius oleh siapa saja. Tapi Google mengerti
sesuatu tentang data yang tak diketahui orang lain, dan dia sudi membuat
investasi yang perlu untuk mengatasi masalah-masalah rumit ini lebih
dulu dari pasar."
Menciptakan satu mesin penerjemah sudah lama dilihat sebagai salah satu tantangan tersulit dalam bidang
kecerdasan buatan.
Selama berpuluh-puluh tahun, para ilmuwan komputer mencoba menggunakan
sebuah pendekatan berdasarkan aturan-aturan yaitu mengajarkan komputer
aturan-aturan linguistik dua bahasa dan memberikannya kamus-kamus yang
diperlukan.
Tapi di pertengahan 1990an, para peneliti mulai memfavoritkan pendekatan
statistikal. Mereka menemukan bahwa jika mereka memberitahukan komputer
ribuan atau jutaan paragraf beserta hasil terjemahan manusianya,
komputer itu bisa belajar membuat terkaan akurat mengenai bagaimana
menerjemahkan naskah-naskah baru.
Ternyata teknik ini yang memerlukan data yang sangat besar dan kekuatan
komputasi, sangat cocok dengan situasi dan kondisi Google.
"Infrastruktur kami sangat sesuai dengan ini," kata Vic Gundotra yang
merupakan wakil presiden bagian teknik di Google. "Kami bisa melakukan
pendekatan-pendekatan yang bahkan tak bisa diimpikan pihak lain."
Sistem-sistem penerjemahan otomat masih jauh dari sempurna, bahkan
Google tak akan membuat para penerjemah manusia kehilangan pekerjaan
dalam waktu dekat ini. Para ahli mengatakan sangatlah sulit bagi sebuah
komputer untuk memecahkan satu kalimat ke dalam bagian-bagian kemudian
menerjemahkan dan menyatukan mereka kembali.
Tapi layanan Google cukup lumayan untuk menyampaikan inti dari sebuah
artikel berita, dan itu telah menjadi sumber instan penerjemahan bagi
jutaan orang. "Jika anda menginginkan sebuah terjemahan kasar siap saji,
itu merupakan tempat untuk dikunjungi. ujar Philip Resnik yang
merupakan ahli penerjemahan mesin dan seorang kolega profesor pada
bagian linguistik di Universitas Maryland, College Park.
Seperti para pesaingnya di lapangan, yang paling dikenal Microsoft dan
I.B.M., Google telah memasukkan mesin penerjemahnya dengan transkrip
pembukaan Perserikatan Bangsa-Bangsa yang diterjemahkan oleh manusia ke
dalam enam bahasa, dan dari Parlemen Eropa yang diterjemahkan ke dalam
23 bahasa. Materi-materi dasar ini digunakan untuk melatih sistemnya
dengan bahasa-bahasa paling umum.Tapi Google telah menjelajah naskah Web, begitu juga data dari proyek
pemindaian buku dan sumber-sumber lain, untuk bergerak ke luar batas
bahasa-bahasa itu. Untuk bahasa yang lebih tak jelas, dia menghadirkan
sebuah "kotak peralatan" yang membantu para pengguna dalam penerjemahan
dan kemudian menambahkan naskah-naskah tersebut ke dalam basis datanya.
Penawaran Google bisa merugikan penjualan perangkat lunak dari
perusahaan seperti I.B.M. Tapi penerjemahan otomat nampaknya tidak akan
pernah menjadi penghasil uang banyak, setidaknya bukan dari standar
bisnis iklan Google. Tetap saja, kerja keras Google bisa menguntungkan
dalam berbagai hal.
Oleh karena iklan-iklan Google online di mana-mana, apa pun yang membuat
orang mudah menggunakan Web menguntungkan perusahaan itu. Dan sistem
itu bisa mengarah kepada aplikasi-aplikasi baru. Beberapa minggu lalu,
perusahaan itu mengatakan dia akan menggunakan pengenalan suara untuk
membuat tulisan-tulisan di bawah gambar video
YouTube berbahasa Inggris, yang kemudian bisa diterjemahkan ke dalam 50 bahasa lain.
"Teknologi ini bisa membuat barikade bahasa hilang," kata Franz Och yang
merupakan kepala ilmuwan di Google yang mengepalai tim penerjemahan
mesin perusahaan itu. "Itu bisa memperkenankan siapa saja untuk
berkomunikasi dengan yang lain."
Pak Och seorang peneliti Jerman yang sebelumya bekerja di Universitas
California Selatan, mengatakan dia pada mulanya enggan bergabung dengan
Google, takut perusahaan itu akan memperlakukan penerjemahan sebagai
proyek sampingan. Larry Page yang merupaka pendiri Google satunya,
memanggil dan meyakinkan Pak Och.
"Pada dasarnya dia berkata bahwa ini merupakan sesuatu yang sangat
penting bagi Google," kata Pak Och barusan. Pak Och masuk pada tahun
2004 dan segera membawa janji dari Pak Page ke dalam uji coba.
Sementara banyak sistem penerjemahan serupa dengan punya Google
menggunakan hingga milyaran naskah kata-kata untuk membangun pemetaan
sebuah bahasa, Google menggunakan lebih banyak lagi: beberapa ratus
milyar kata-kata dalam bahasa Inggris. "Pemetaannya menjadi lebih baik
dan terus membaik jika lebih banyak naskah yang diproses," ujar Pak Och.
Usaha keras akhirnya memberikan keuntungan. Setahun kemudian, Google
memenangkan sebuah kompetisi yang diselenggarakan oleh pemerintah yang
menguji berbagai sistem penerjemahan rumit.
Google telah menggunakan pendekatan serupa yaitu kekuatan komputasi
besar, tumpukan data dan statistik, untuk mengatasi masalah-masalah
rumit lainnya. Sebagai contoh, pada tahun 2007, perusahaan itu mulai
menawarkan
800-GOOG-411
yang merupakan layanan direktori bantuan cuma-cuma yang menerjemahkan
kata-kata yang diucapkan. Layanan ini memperkenankan Google mengumpulkan
berbagai suara dari jutaan orang agar supaya lebih baik dalam hal
mengenali bahasa Inggris yang diucapkan.
Setahun kemudian, Google meluncurkan sebuah sistem pencarian berdasarkan
suara yang sama baiknya dengan buatan bertahun-tahun perusahaan lain.
Dan pada akhir tahun lalu, Google memperkenalkan sebuah layanan yang disebut
Goggles
yang menganalisa foto-foto telepon genggam, mencocokkannya dengan basis
data lebih dari satu milyar gambar-gambar online, termasuk foto-foto
berbagai jalan yang diambil untuk layanan
Street Viewnya.
Pak Och mengakui bahwa sistem penerjemahan Google masih membutuhkan
penyempurnaan, tapi dia mengatakan sistem itu cepat menjadi lebih baik.
"Kurva penyempurnaan kualitas masih tetap tinggi," tambahnya.