Untuk masa yang lama, penerjemah sejagat telah menjadi obsesi budaya pop. Star Trek membentangkannya sebagai mesin pegang tangan, menyerupai mikrofon, yang boleh menterjemahkan kebanyakan bahasa dengan segera . Panduan Hitchhiker ke Galaxy menawarkan sesebuah ikan Babel, makhluk yang, ketika terjebak dalam telinga seseorang, menawarkan terjemahan segera dari bahasa apa pun di galaksi.
Oleh itu, tidaklah menghairankan bahawa manusia sekarang cuba mencipta peranti yang berfungsi dengan baik. Berpuluh-puluh aplikasi telefon pintar terjemahan wujud, tetapi kebanyakannya menerjemahkan perkataan secara mudah, satu demi satu; jenis pengguna atau bercakap perkataan dan aplikasi memantul kembali dengan terjemahan. Kini matlamat, dan kejatuhan kewangan sebenar, adalah untuk jurutera dan usahawan untuk membolehkan dua orang bercakap dalam bahasa yang berbeza, sementara peranti kecil meludahkan terjemahan dalam masa nyata.
Aplikasi Terjemahan yang sedia ada
Dalam perjalanan ke Greece, Andrew Lauder yang berbahasa Inggeris jatuh sakit.
"Saya pergi ke farmasi, dan mereka tidak dapat memahami bahasa Inggeris, jadi saya tidak mendapat meds, " kata Lauder, Ketua Pegawai Eksekutif Vocre Translate. Label ubat itu secara ringkasnya adalah bahasa Yunani kepadanya. Halangan bahasa adalah perkara biasa bagi pelancong dunia. Di negara asing, urus niaga kecil seperti membeli ubat atau mendapatkan arahan-lain yang dihadapi Lauder dihadapi - menjadi tugas herculean.
Apabila dia kembali ke negeri, Lauder mencipta Vocre Translate, sebuah aplikasi terjemahan suara dan teks. Ia bermula sebagai aplikasi teks-ke-teks (disebut MyLangauge), kemudian pada mulanya berubah menjadi model ucapan-ke-teks yang, seperti aplikasi lain termasuk SayHi Translate, menggunakan model tradisional di mana kata diterjemahkan terus ke perkataan lain. Katakanlah "Hello, " dan telefon pintar atau tablet menghiasi kembali "Hola." "Selamat tinggal" menjadi "Sayonara." Dan sebagainya, seperti penterjemah teks.
Untuk membuat terjemahan audio mudah, pencipta aplikasi ini memerlukan data. Vocre menarik maklumatnya dari rakaman dan dokumen domain awam, seperti filem lama atau pendengaran awam. "Kami pada dasarnya memohon perkhidmatan transkripsi mel suara untuk membolehkan kami menggunakan awan mereka untuk pengiktirafan ucapan, " kata CEO SayHi Lee Bossier.
Setelah jurutera mempunyai data audio dan teks, mereka berpasangan audio dan teks, kata demi kata. Perisian pengiktirafan suara mengiktiraf "keju" dan menukarkannya ke dalam teks. Itu ditukar menjadi bahasa Perancis, dan aplikasinya menemui sebutan Perancis untuk "pemangkasan".
Yang berkata, jika pengguna cheekily menyebut sesuatu "cheesy, " penterjemah tidak berfungsi juga, kerana bahasa lisan tidak hampir sama statik seperti bahasa yang ditulis. Cadangan, slang, infleksi, sebutan, dialek dan aliran perbualan dapat mengubah makna
Walau bagaimanapun, dari masa ke masa, Lauder mahukan peranti perbualan yang lebih banyak. Dalam e-mel, dia berkata, "Berdasarkan data penggunaan kami, kami mendapati bahawa orang bercakap dengan sangat berbeza dari cara mereka menulis. Kata-kata yang dituturkan jauh lebih spontan dan kurang formal dan harfiah. "Oleh itu, beliau menggunakan terjemahan mesin statistik, pendekatan yang digunakan oleh Google yang menggunakan data untuk mencari penggunaan kata umum, melampaui model penterjemahan perkataan-ke-kata tradisional. Pada asasnya, Vocre belajar kerana ia digunakan. "Ia belajar berdasarkan setiap perbualan, setiap frasa yang melaluinya. Ia sesuatu yang lebih pintar dari masa ke masa, "kata Lauder.
Walau bagaimanapun, pada masa ini, kedua-dua aplikasi mengambil beberapa saat untuk diterjemahkan, tetapi tidak semestinya berkesan, terutama sekali dengan bahasa badan, untuk perbualan transaksional seperti pesanan makan. Lagipun, manusia telah mengarahkan makanan dalam bahasa bukan asli selama bertahun-tahun dan sentiasa dapat makan. Tetapi mereka tidak dapat mempunyai perbualan mendalam, rumit.
Dengan Vocre dan SayHi, perbualan boleh menonjol secara tegas, tetapi ia tidak sama dengan berbual dalam bahasa ibunda anda. Google berhasrat untuk mengubahnya sepenuhnya.
Pendekatan Google (Terjemahan Mesin Statistik)
Apabila belajar bahasa baru di sekolah, kita bermula dengan istilah perbendaharaan kata individu. Tetapi bahasa lebih kontemporari-perkataan memerlukan konteks.
"Pendekatan [Google] yang diambil adalah pendekatan yang lebih umum, " kata Josh Estelle, seorang jurutera perisian untuk Terjemahan Google. "Daripada cuba hardcode semua peraturan ini, kami cuba untuk mempelajari peraturan dengan melihat data."
Syarikat teknologi mengelakkan kaedah one-to-one, word-for-word dan sebaliknya menggunakan terjemahan mesin statistik, tidak melihat apa maksud perkataan tetapi bagaimana bahasa dimodelkan, yang ia belajar melalui data . Jadi, ia bertujuan untuk hutan, bukan pokok-pokok. Satu contoh bahasa Inggeris: kita tahu definisi perkataan "break" dan "up." Tetapi frasa "putus" bukan gabungan literal dari dua kata.
Terjemahan mesin statistik memerlukan data. Gunung itu. Untuk kaedah untuk bekerja, ia tidak hanya memerlukan fakta bahawa "ofage" adalah Perancis untuk keju tetapi 100 contoh kedua-dua "berasaskan" dan keju digunakan dalam ayat-ayat sebenar.
Estelle berkata jika seorang penceramah bahasa Inggeris mempunyai dua menu, kecuali untuk fakta bahawa orang itu dicetak dalam bahasa Inggeris dan satu dalam bahasa Cina, "anda mungkin dapat mengetahui watak Cina untuk 'sup'." Konteks adalah raja. Tetapi untuk mewujudkan konteks itu, anda memerlukan akses kepada berjuta-juta menu, dan setiap dokumen lain boleh dibayangkan.
Yang betul-betul apa yang Google ada. Tanpa gergasi web untuk mengumpul timbunan data, ikan Babel dunia nyata tidak dapat wujud. Ia merangkak web dan mengumpulkan semua teks dan audio. Kemudian, ia memakan data ini ke dalam algoritma yang membandingkan semuanya dengan yang lain. Perbandingan ini membantu mendapatkan akar bagaimana bahasa secara semula jadi berfungsi.
"Satu perkara yang mengejutkan orang apabila kita bercakap mengenai Terjemahan adalah pasukan kita tidak mempunyai ahli bahasa di dalamnya, " kata Estelle. "Kami telah melancarkan 71 bahasa, dan saya akan mengatakan bahawa pasukan kami tidak tahu bagaimana bercakap majoriti mereka. Seorang penerjemah manusia tidak akan dapat mempelajari semua terma dan perkara ini secepat data [kita] boleh belajar dari web. "
Apa gunanya?
Seperti Google, Facebook melihat faedah. Pertimbangkan laman web media sosial untuk menerjemahkan.
"Misi Facebook telah menghubungkan seluruh dunia, dan salah satu penghalang untuk menghubungkan dunia bukanlah semua orang yang berbicara bahasa yang sama, " kata Tom Stocky, pengarah kejuruteraan di Facebook. "Di sebelah terjemahan, saya fikir visi yang sangat bercita-cita untuk masa depan adalah jika anda boleh menggunakan Facebook dalam bahasa ibunda anda dan berinteraksi dengan mana-mana bahasa lain."
Pada bulan Ogos lalu, Facebook memperoleh Jibbigo, aplikasi terjemahan ucapan untuk ucapan yang tersedia untuk peranti Android dan iOS.
Keen pengguna Facebook akan perhatikan bahawa laman sosial sudah menggunakan terjemahan. Jika anda pernah mempunyai jawatan Bahasa Sepanyol di laman berasaskan Bahasa Inggeris anda, anda telah diberi peluang untuk diterjemahkan ke dalam bahasa ibunda anda.
Tetapi Stocky melihat komponen suara sebagai pengubah permainan yang berpotensi. Kebangkitan telefon pintar dan tablet mengalu-alukan dunia yang sentiasa saling berkait, dan kebangkitan peranti ucapan pengiktirafan menjemput cara baru interaksi web. Stocky membayangkan masa depan di mana pengguna hanya dapat memberi arahan kepada telefon pintar mereka dan berinteraksi dengan pengguna lain, perbezaan bahasa selain.
"Tidak ada persoalan yang akan berlaku pada akhirnya, kerana satu-satunya batasan terdapat kuasa enjin bahasa dan tentu saja masa pemprosesan dan kuasa pemprosesan, " katanya.
Laura Murphy, seorang profesor di jabatan sistem dan pembangunan kesihatan global di Tulane University dan skeptik yang mengakui teknologi, mempertanyakan nilai penterjemah sejagat, dan tidak perlu mengenal lebih dari satu bahasa.
Dia fikir peranti itu mungkin agak berguna untuk perjalanan, perniagaan dan hubungan antarabangsa tetapi tidak pecah. Di peringkat tertentu, kami sudah mempunyai penterjemah (orang) di tempatnya, dan kebanyakan orang yang bekerja dalam hubungan asing tahu bahasa yang sesuai. Peranti, Murphy percaya, boleh mempunyai akibat negatif.
"Saya rasa ia boleh membuat orang malas, " kata Murphy. Menterjemah bahasa boleh mencabar mental dengan memaksa otak-terutama sekali yang tahu lebih dari dua bahasa-untuk bekerja dengan cara yang berbeza, tetapi latihan itu bermanfaat. Otak menarik diri dari tempat empati bahasa yang bahkan penerjemah suara terbaik tidak dapat dicapai.
Walaupun komunikasi sejagat ini boleh menjadi positif, Murphy mengakui, "ia mungkin membawa kepada orang-orang yang berfikir bahawa mereka berkomunikasi apabila mereka tidak." Kebudayaan tidak selalunya terwujud dalam bahasa (mengambil sindiran, misalnya), dan komunikasi tidak sentiasa mengenai maklumat yang diluluskan.
Bila Bolehkah Kita Mengharapkan Teknologi Ini?
"Pada tahun 2005, kami mengambil masa 40 jam untuk menterjemahkan 1, 000 ayat, " kata Estelle, dari Google. "Hari ini, kami menerjemahkan setara dengan 1, 000 ayat setiap 10 milisaat."
Seperti yang dikatakan oleh Richard Anderson dalam siri TV tahun 1970 The Six Million Dollar Man, "Kami mempunyai teknologi." Kini ia hanya menunggu untuk mengumpul dan menganalisis data. Berapa lama masa yang diperlukan tidak diketahui, menurut Estelle. Tetapi anggaran yang berhati-hati meletakkan peranti sedemikian di tangan kita dalam satu dekad.
Walaupun pencipta aplikasi seperti Bossier atau syarikat-syarikat raksasa seperti Google dan Facebook tidak mahu membina versi mereka sendiri dari Menara Alkitab Babel, ia mahu menghentikan pengumuman. Ia membayangkan dunia di mana kita semua berkomunikasi, tentang perubatan, mengenai politik, tentang idea-idea.
Dan, dunia itu mungkin tidak jauh.
Nota Editor: Kami mengemas kini kisah ini pada 4 April 2014, untuk menerangkan dengan tepat Vocre Translate technology.