https://frosthead.com

AI Baru Google Adalah Sarjana Permainan, tetapi Bagaimana Ia Bandingkan dengan Pikiran Manusia?

Bagi manusia, catur mungkin mengambil masa seumur hidup untuk menguasai. Tetapi program kecerdasan buatan baru Google DeepMind, AlphaZero, boleh mengajar dirinya untuk menakluk papan dalam masa beberapa jam.

Membangun kejayaan masa lalu dengan suite AlphaGo-satu siri program komputer yang direka untuk memainkan permainan papan Cina Go-Google membanggakan bahawa AlphaZero yang baru mencapai tahap "prestasi superhuman" bukan hanya satu permainan papan, tetapi tiga: Pergi, catur, dan shogi (pada dasarnya, catur Jepun). Pasukan saintis komputer dan jurutera, yang diketuai oleh David Silver Google, melaporkan penemuannya baru-baru ini dalam jurnal Science .

"Sebelum ini, dengan pembelajaran mesin, anda boleh mendapatkan mesin untuk melakukan apa yang anda mahu-tetapi hanya perkara itu, " kata Ayanna Howard, pakar dalam pengkomputeran interaktif dan kecerdasan buatan di Institut Teknologi Georgia yang tidak terlibat dalam penyelidikan. "Tetapi AlphaZero menunjukkan bahawa anda boleh mempunyai algoritma yang tidak begitu [spesifik], dan ia boleh belajar dalam parameter tertentu."

Program pemrograman yang bijak AlphaZero sememangnya menimbulkan ante pada permainan untuk manusia dan mesin, tetapi Google telah lama mempunyai pandangannya mengenai sesuatu yang lebih besar: kecerdasan kejuruteraan.

Para penyelidik berhati-hati untuk tidak mendakwa bahawa AlphaZero berada di ambang dominasi dunia (yang lain telah sedikit lebih cepat untuk melompat pistol). Namun, Perak dan skuad DeepMind yang lain sudah pun berharap mereka akan melihat satu sistem yang sama digunakan untuk reka bentuk dadah atau sains bahan.

Jadi apa yang menjadikan AlphaZero begitu menarik?

Gameplay telah lama dianggap sebagai standard emas dalam penyelidikan kecerdasan buatan. Permainan berstruktur, berstruktur adalah penyederhanaan senario dunia sebenar: Keputusan sukar dibuat; kemenangan dan kerugian memandu kepentingan; dan ramalan, pemikiran kritis, dan strategi adalah kunci.

Pengekodan kemahiran semacam ini adalah rumit. AIs bermain-permainan yang lebih tua-termasuk prototaip pertama AlphaGo asli-telah secara tradisinya dipam penuh dengan kod dan data untuk meniru pengalaman yang biasa diperolehi melalui tahun-tahun permainan semula jadi manusia (pada dasarnya, pembaziran pengetahuan yang berpengalaman, programmer yang diperolehi). Dengan AlphaGo Zero (versi terbaru AlphaGo), dan sekarang AlphaZero, para penyelidik memberi program hanya satu input: peraturan permainan yang dipersoalkan. Kemudian, sistem itu menguasai dan secara aktif mempelajari teknik perdagangan itu sendiri.

Pergi AlphaZero adalah berdasarkan AlphaGo Zero, sebahagian daripada suite AlphaGo yang direka untuk memainkan permainan papan Cina Go, yang digambarkan di atas. Penyebaran awal program asal diberi data daripada permainan manusia-manusia; versi yang kemudiannya terlibat dalam pengajaran kendiri, di mana perisian memainkan permainan melawan dirinya untuk mempelajari strategi sendiri. (Chad Miller / Flickr / CC BY-SA 2.0)

Strategi ini, yang dipanggil bermain pertahanan diri sendiri, adalah sangat tepat seperti apa yang dikatakan: Untuk melatih liga besar, AlphaZero memainkan dirinya dalam lelaran selepas lelaran, mengasah kemahirannya melalui percubaan dan kesilapan. Dan pendekatan kekerasan berlaku. Tidak seperti AlphaGo Zero, AlphaZero tidak hanya bermain Go: Ia boleh mengalahkan AI terbaik dalam perniagaan di catur dan shogi. Proses pembelajaran juga berkesan, yang memerlukan hanya dua, empat, atau 30 jam kendiri kendiri untuk mengatasi program khusus yang disesuaikan untuk menguasai shogi, catur, dan Go. Terutama, penulis kajian tidak melaporkan apa-apa kejadian AlphaZero yang akan mengetuai dengan manusia sebenar, kata Howard. (Para penyelidik mungkin menganggap bahawa, memandangkan bahawa program-program ini secara konsisten merangkul rakan sejawat mereka, perlawanan seperti itu tidak sia-sia.)

AlphaZero juga dapat mengalahkan Stockfish (tuan catur AI yang kini tidak dapat dikalahkan) dan Elmo (bekas ahli AI shogi) walaupun menilai kemungkinan langkah seterusnya pada setiap giliran semasa bermain permainan. Tetapi kerana algoritma yang dimaksudkan adalah berbeza, dan boleh menggunakan kuasa yang berlainan, sukar untuk membandingkan AlphaZero secara langsung dengan program lain yang lebih tua, kata Joanna Bryson, yang mengkaji kecerdasan buatan di University of Bath di United Kingdom dan melakukan tidak menyumbang kepada AlphaZero.

Google menyimpan banyak cetakan yang baik pada perisiannya, dan AlphaZero tidak terkecuali. Walaupun kita tidak mengetahui segala-galanya mengenai penggunaan kuasa program, apa yang jelas ialah: AlphaZero perlu membungkus beberapa peluru pengiraan yang serius. Dalam masa-masa kurang latihan, program itu sendiri sibuk, melibatkan puluhan atau beratus-ratus beribu-ribu pusingan amalan untuk mendapatkan strategi permainan papannya sehingga menghentam-jauh lebih banyak daripada pemain manusia yang diperlukan (atau, dalam kebanyakan kes, boleh bahkan dapat dicapai) dalam mengejar kecekapan.

Rejimen intensif ini juga menggunakan 5, 000 unit pemproses mesin pembelajaran milik Google, atau TPU, yang oleh beberapa perkiraan mengkonsumsi sekitar 200 watt per cip. Tidak kira bagaimana anda memotongnya, AlphaZero memerlukan lebih banyak tenaga daripada otak manusia, yang berjalan pada kira-kira 20 watt.

Penggunaan tenaga mutlak AlphaZero harus dipertimbangkan, tambah Bin Yu, yang bekerja di antarmuka statistik, pembelajaran mesin, dan kecerdasan buatan di University of California, Berkeley. AlphaZero berkuasa, tetapi mungkin tidak baik untuk mendapatkan wang itu-terutamanya apabila menambah orang-jam yang masuk ke dalam penciptaan dan pelaksanaannya.

Secara semangat mahal atau tidak, AlphaZero membuat percikan: Kebanyakan AIs adalah hyper-khusus dalam tugas tunggal, menjadikan program baru ini-dengan ancaman triple bermain permainan-sangat fleksibel. "Sangat mengagumkan bahawa AlphaZero dapat menggunakan seni bina yang sama untuk tiga permainan yang berbeza, " kata Yu.

Jadi, ya. AI baru Google menetapkan tanda baharu dalam beberapa cara. Ia pantas. Ia kuat. Tetapi adakah itu menjadikannya pintar?

Di sinilah definisi mula menjadi keruh. "AlphaZero dapat belajar, bermula dari awal tanpa pengetahuan manusia, untuk memainkan setiap permainan ini dengan tahap superhuman, " kata DeepMind's Silver dalam satu kenyataan kepada media.

Walaupun kepakaran permainan papan memerlukan ketajaman mental, semua proksi untuk dunia nyata mempunyai batasnya. Dalam lelaran semasa, AlphaZero mengatasi dengan memenangi permainan yang direka oleh manusia-yang mungkin tidak menjamin label berpotensi membimbangkan "superhuman." Ditambah lagi, jika terkejut dengan set peraturan baru pertengahan permainan, AlphaZero mungkin mendapat flummoxed. Otak manusia yang sebenarnya, sebaliknya, boleh menyimpan lebih daripada tiga permainan papan dalam himpunannya.

Lebih-lebih lagi, membandingkan baseline AlphaZero untuk tabula rasa (slate kosong) - seperti yang dilakukan oleh penyelidik-adalah regangan, kata Bryson. Pengaturcara masih menyuap sekadar pengetahuan penting manusia: peraturan permainan yang akan dimainkan. "Ia tidak jauh daripada apa yang berlaku sebelum ini, " Bryson menambah, "tetapi perkara yang paling asas adalah, ia masih diberikan peraturan. Itu jelas. "

Dan peraturan yang menjengkelkan itu boleh menjadi tongkat yang penting. "Walaupun program ini belajar bagaimana melakukan, mereka memerlukan peraturan jalan raya, " kata Howard. "Dunia penuh dengan tugas yang tidak mempunyai peraturan ini."

Apabila ditolak, AlphaZero adalah peningkatan program yang sudah berkuatkuasa-AlphaGo Zero, menerangkan JoAnn Paul, yang mempelajari kecerdasan buatan dan bermimpi pengimejan di Virginia Polytechnic Institute dan State University dan tidak terlibat dalam penyelidikan baru. AlphaZero menggunakan banyak blok bangunan dan algoritma yang sama seperti AlphaGo Zero, dan masih merupakan sebahagian daripada pintar sejati. "Saya fikir perkembangan baru ini lebih evolusi daripada revolusi, " tambahnya. "Tiada algoritma ini boleh dibuat . Perisikan juga mengenai bercerita. Ia membayangkan perkara-perkara yang belum ada. Kami tidak memikirkan istilah itu dalam komputer. "

Sebahagian daripada masalah itu, masih belum ada kata sepakat tentang definisi "kecerdasan, " kata Yu-dan bukan hanya dalam bidang teknologi. "Masih belum jelas bagaimana kita melatih makhluk pemikiran kritis, atau bagaimana kita menggunakan otak yang tidak sedarkan diri, " tambahnya.

Sehingga ini, ramai penyelidik percaya terdapat beberapa jenis kecerdasan. Dan mengetuk menjadi satu jauh dari menjamin ramuan yang lain. Sebagai contoh, sesetengah orang yang paling bijak di luar sana mengerikan catur.

Dengan batasan-batasan ini, wawasan Yu mengenai masa depan rakan kongsi kecerdasan buatan manusia dan mesin dalam semacam coevolution. Mesin pastinya akan terus cemerlang dalam tugas-tugas tertentu, dia menerangkan, tetapi input dan pengawasan manusia selalu diperlukan untuk mengimbangi unauthenticated.

Sudah tentu, tidak ada yang mengatakan bagaimana hal-hal akan meletup di arena AI. Sementara itu, kita mempunyai banyak untuk berfikir. "Komputer-komputer ini berkuasa, dan boleh melakukan perkara-perkara tertentu lebih baik daripada manusia, " kata Paul. "Tetapi itu masih kurang daripada misteri kecerdasan."


Artikel ini pada asalnya diterbitkan pada NOVA.
AI Baru Google Adalah Sarjana Permainan, tetapi Bagaimana Ia Bandingkan dengan Pikiran Manusia?