https://frosthead.com

Bolehkah Komputer Memecahkan Bahasa 5,000 Tahun yang Lama?

Peradaban Indus, yang berkembang sepanjang milenium ketiga SM, adalah masyarakat yang paling luas pada waktunya. Pada ketinggiannya, ia merangkumi kawasan lebih daripada setengah juta batu persegi yang berpusat pada apa yang kini sempadan India-Pakistan. Sisa-sisa Indus telah dijumpai sejauh utara sebagai Himalaya dan sejauh selatan sebagai Mumbai. Ia adalah budaya bandar paling awal yang terkenal di benua itu dan ia membanggakan dua bandar besar, satu di Harappa dan satu di Mohenjo-daro. Namun walaupun saiz dan panjang umurnya, dan walaupun hampir satu abad penyiasatan arkeologi, banyak tentang Indus masih diselubungi misteri.

Apa sedikit yang kita ketahui telah datang dari penggalian arkeologi yang bermula pada tahun 1920-an dan diteruskan hari ini. Selama beberapa dekad, ahli arkeologi telah menghasilkan banyak artifak, termasuk seal seal, jimat dan tablet kecil. Kebanyakan artifak ini menampakkan apa yang kelihatan seperti spesimen tulisan berukir yang menyerupai, antara lain, horseshoes bersayap, roda bercorak, dan ikan tegak. Bagaimanapun, sebenarnya, simbol-simbol tersebut mungkin merupakan salah satu teka-teki yang tidak dapat diselesaikan dalam beasiswa tamadun kuno.

Terdapat kod lain yang sukar untuk retak dalam sejarah. Ahli-ahli falsafah yang tersangkut menemui pemergian bertuah dengan penemuan batu Rosetta yang terkenal pada tahun 1799, yang mengandungi teks dalam bahasa Mesir dan Yunani. Kajian mengenai hierogliaan Mayan telah menghilang sehingga seorang ahli bahasa Rusia bernama Yury Knorozov menggunakan penggunaan bijak Maya dalam kontemporari pada tahun 1950-an. Tetapi tidak ada batu Rosetta dari Indus, dan para ulama tidak tahu yang, jika ada, bahasa mungkin berasal dari yang diucapkan oleh orang Indus.

Kira-kira 22 tahun yang lalu, di Hyderabad, India, pelajar kelas lapan bernama Rajesh Rao menjadikan halaman buku teks sejarah dan pertama kali mempelajari tentang tamadun yang menarik ini dan skrip misteriusnya. Pada tahun-tahun yang berikutnya, persekolahan dan profesion Rao membawanya ke arah yang berbeza-dia akhirnya mengejar sains komputer, yang dia mengajar hari ini di University of Washington di Seattle-tetapi dia memantau kesarjanaan Indus dengan teliti, menyimpan tabung-larangan gagal percubaan membuat skrip. Walaupun dia belajar kecerdasan buatan dan robotika, Rao mengumpulkan perpustakaan kecil buku dan monograf pada skrip Indus, kira-kira 30 daripadanya. Di atas rak buku yang berdekatan, dia juga menyimpan buku teks sejarah peringkat kelapan yang dihargai yang memperkenalkannya ke Indus.

"Ia hanya menakjubkan untuk melihat bilangan idea yang dicadangkan oleh orang lain, " katanya. Sesetengah ulama mendakwa penulisan itu adalah skrip Sumerian; yang lain terletak di dalam keluarga Dravidian; masih ada yang menganggap ia berkaitan dengan bahasa Pulau Paskah. Rao menghargai bahawa ini adalah "mungkin salah satu masalah yang paling mencabar dari segi sejarah kuno."

Sebagai percubaan selepas percubaan gagal menguraikan skrip, sesetengah pakar mula kehilangan harapan agar ia dapat diterjemahkan. Pada tahun 2004, tiga ilmuwan berhujah dalam makalah kontroversial bahawa simbol Indus tidak mempunyai kandungan linguistik sama sekali. Sebaliknya simbol-simbol mungkin sedikit lebih daripada piksel yang mewakili tokoh-tokoh politik atau agama. Penulis pergi sejauh mencadangkan bahawa Indus bukan tamadun melek huruf sama sekali. Bagi sesetengah di lapangan, usaha mencari bahasa di belakang etnik Indus mula menyerupai latihan dalam kesia-siaan.

Beberapa tahun kemudian, Rao memasuki pertelingkahan. Sehingga itu, orang yang mempelajari skrip itu adalah ahli arkeologi, ahli sejarah, ahli bahasa atau ahli kriptologi. Tetapi Rao memutuskan untuk membuang rahsia skrip Indus menggunakan alat yang dia tahu sains komputer terbaik.

Tertarik dengan tamadun Indus sejak gred kelapan, Rajesh Rao menggunakan sains komputer dan konsep yang dipanggil "entropi bersyarat" untuk membantu menodai skrip Indus. (Sempurna oleh David Zax) Sepanjang dekad, ahli arkeologi telah menghasilkan banyak artifak dari tamadun Indus, termasuk penutupan meterai, azimat dan tablet kecil. (Robert Harding / Robert Harding World Imagery / Corbis) Rao dan kolaboratornya menerbitkan penemuan mereka dalam jurnal Science pada bulan Mei. Mereka tidak mentakrifkan bahasa tetapi hasilnya mengasah pemahamannya. (Robert Harding / Robert Harding World Imagery / Corbis) Rao dan rakan-rakannya kini melihat watak-watak yang lebih panjang daripada mereka dianalisis dalam kertas Sains . Mencari corak akan membantu menentukan keluarga bahasa yang mana skrip itu mungkin miliknya. (Sempurna oleh David Zax)

Pada hari musim panas di Seattle, Rao mengalu-alukan saya ke pejabatnya untuk menunjukkan kepada saya bagaimana dia dan rakan-rakannya menghampiri masalah itu. Dia menyusun koleksi replika kesan jejari tanah liat yang ahli arkeologi telah muncul dari tapak Indus. Mereka kecil seperti coklat kecil persegi-dan kebanyakannya mempunyai imej haiwan di bawah satu siri simbol Indus. Kebanyakan sampel skrip Indus adalah miniatur seperti ini, hanya mengandungi beberapa aksara; tiada monolith yang besar telah ditemui. Para ilmuwan tidak pasti tentang fungsi meterai kecil, Rao memberitahu saya, tetapi satu teori adalah bahawa mereka mungkin telah digunakan untuk mengesahkan kualiti barang dagangan. Satu lagi menunjukkan bahawa meterai mungkin merupakan cara untuk memastikan bahawa pedagang membayar cukai apabila memasuki atau meninggalkan bandar-banyak meterai telah dijumpai di antara runtuhan rumah pintu, yang mungkin berfungsi seperti gerai tol purba.

Rao dan rakan-rakannya tidak berusaha untuk melakukan mukjizat-mereka tahu bahawa mereka tidak mempunyai maklumat yang mencukupi untuk menguraikan skrip purba-tetapi mereka hipotesiskan bahawa dengan menggunakan kaedah pengiraan, mereka sekurang-kurangnya dapat menegaskan apa jenis tulisan Indus skrip adalah: adakah ia menyandikan bahasa, atau tidak? Mereka melakukan ini menggunakan konsep yang dipanggil "entropi bersyarat."

Walaupun nama yang memaksakan, entropi bersyarat adalah satu konsep yang agak mudah: ia adalah ukuran jumlah rawak dalam urutan. Pertimbangkan abjad kami. Sekiranya anda mengambil jubin Scrabble dan melemparkannya ke udara, anda mungkin mendapati mana-mana surat lama yang muncul selepas mana-mana pihak lain. Tetapi dalam kata-kata bahasa Inggeris sebenarnya, huruf-huruf tertentu lebih cenderung berlaku selepas orang lain. Q dalam bahasa Inggeris hampir selalu diikuti oleh u . A t boleh diikuti oleh r atau e, tetapi kurang mungkin diikuti oleh n atau b .

Rao dan kolaboratornya-sebuah kumpulan antarabangsa termasuk saintis komputer, astrofizik dan matematikawan-menggunakan program komputer untuk mengukur entropi bersyarat skrip Indus. Kemudian mereka mengukur entropi bersyarat lain-lain jenis sistem-bahasa semula jadi (Sumeria, Tamil, Sanskrit, dan Bahasa Inggeris), bahasa tiruan (bahasa pengaturcaraan komputer Fortran) dan sistem bukan linguistik (urutan DNA manusia, urutan protein bakteria, dan dua kumpulan buatan yang mewakili entropi bersyarat tinggi dan rendah). Apabila mereka membandingkan jumlah rawak dalam skrip Indus dengan sistem lain, mereka mendapati bahawa ia lebih hampir menyerupai kadar yang terdapat dalam bahasa semula jadi. Mereka menerbitkan penemuan mereka pada bulan Mei dalam jurnal Science .

Jika ia kelihatan seperti bahasa, dan ia bertindak seperti bahasa, maka ia mungkin adalah bahasa, kertas mereka mencadangkan. Penemuan ini tidak menguraikan skrip, sudah tentu, tetapi mereka mempertajam pemahaman kita tentangnya, dan telah memberi jaminan kepada para ahli arkeologi yang telah bekerja di bawah anggapan bahawa skrip Indus menyandi bahasa.

Selepas menerbitkan kertas itu, Rao terkejut. Persoalan keluarga bahasa mana skrip milik, ternyata, adalah satu yang sensitif: kerana umur dan kepentingan tamadun Indus, banyak kumpulan kontemporer di India ingin menuntutnya sebagai nenek moyang langsung. Sebagai contoh, kaum India yang berbahasa Tamil di selatan lebih suka mempelajari bahawa skrip Indus adalah semacam proto-Dravidian, kerana Tamil berasal dari proto-Dravidian. Pembesar suara Hindi di utara lebih suka ia menjadi bentuk lama Sanskrit, nenek moyang Hindi. Kertas Rao tidak menyimpulkan keluarga bahasa mana skrip itu dimiliki, walaupun ia menyedari bahawa entropi bersyarat itu mirip dengan Tamil Lama yang menyebabkan beberapa pengkritik untuk "menuduh kita sebagai nasionalis Dravidian, " kata Rao. "Keganasan tuduhan dan serangan tidak dijangka sepenuhnya."

Rao kadang-kadang mengambil kesempatan untuk kembali ke dunia saraf neurosains dan robotics kurang gelisah. Tetapi panggilan skrip Indus masih menggembirakan, dan "apa yang dulu menjadi hobi kini memonopoli lebih daripada sepertiga masa saya, " katanya. Rao dan rakan-rakannya kini melihat watak-watak yang lebih panjang daripada mereka dianalisis dalam kertas Sains . "Sekiranya terdapat corak, " kata Rao, "kita boleh membuat peraturan tatabahasa. Ini akan memberikan kekangan kepada keluarga jenis apa "skrip itu boleh dimiliki.

Dia berharap penemuan masa depannya akan bercakap bagi diri mereka sendiri, yang menimbulkan kemarahan yang kurang dari penentang-penentang untuk satu rantau India berbanding yang lain. Bagi pihaknya, ketika Rao bercakap tentang apa artinya skrip Indus kepadanya, dia cenderung bercakap dari segi India secara keseluruhan. "Warisan India akan sangat diperkayakan jika kita dapat memahami peradaban Indus, " katanya. Rao dan kolaboratornya mengerjakannya, satu baris kod sumber pada satu masa.

Bolehkah Komputer Memecahkan Bahasa 5,000 Tahun yang Lama?