AI BELAJAR KERJA BERPASUKAN DENGAN MENDOMINASI DALAM PERMAINAN VIDEO MULTIPLAYER | BERITA PINTAR | SMITHSONIAN - BERITA PINTAR, SAINS BERITA PINTAR

Komputer telah mendominasi manusia dalam permainan satu sama lain seperti catur selama beberapa dekad, tetapi mendapat kepintaran buatan (AI) untuk bekerjasama dengan rakan sepasukan adalah lebih rumit. Sekarang, penyelidik di projek DeepMind Google telah mengajar pemain AI untuk bekerjasama dalam pasukan dengan kedua-dua manusia dan komputer lain untuk bersaing dalam permainan video Quake III Arena 1999.

Edd Gent di Science melaporkan bahawa apabila AI hanya mempunyai satu lawan, biasanya ia cukup baik kerana ia hanya menjangkakan langkah-langkah yang mungkin untuk minda tunggal. Tetapi kerja berpasukan adalah satu perkara yang berbeza kerana ia termasuk tindakan yang tidak baik secara tradisional di komputer, seperti memprediksi bagaimana sekelompok rakan sepasukan akan berkelakuan. Untuk menjadikan AI benar-benar berguna, ia perlu belajar bagaimana untuk bekerjasama dengan kecerdasan lain.

Pasukan DeepMind Google menerangkan dalam jawatan blog:

"Beribu-ribu orang mendiami planet ini, masing-masing dengan matlamat dan tindakan masing-masing, tetapi masih dapat berkumpul melalui pasukan, organisasi dan masyarakat dalam mempamerkan kecerdasan kolektif. Ini adalah penetapan yang kita sebut pembelajaran multi-agen: banyak ejen individu mesti bertindak secara bebas, namun belajar untuk berinteraksi dan bekerjasama dengan ejen lain. Ini adalah masalah yang sangat sukar - kerana dengan ejen menyesuaikan diri dunia sentiasa berubah. "

Multiplayer, permainan video orang pertama, di mana pasukan pemain berjalan di dunia maya, biasanya menembak senjata atau pelancar bom tangan di antara satu sama lain, adalah tempat yang sesuai untuk AI untuk mempelajari selok-belok kerja berpasukan. Setiap pemain mesti bertindak secara individu dan membuat pilihan yang memberi manfaat kepada pasukan secara keseluruhan.

Untuk kajian ini, pasukan melatih AI untuk memainkan penanda bendera di platform Arena Quake III . Peraturannya agak mudah: Dua pasukan menghadapi di medan perang seperti labirin. Matlamatnya adalah untuk menawan seberapa banyak bendera maya pasukan lain sambil melindungi mereka sendiri, dan mana-mana pasukan menangkap bendera paling dalam masa lima minit. Walau bagaimanapun, dalam amalan, perkara-perkara boleh menjadi sangat rumit dengan cepat.

Pasukan DeepMind mewujudkan 30 algoritma rangkaian saraf dan membantahnya satu sama lain dalam satu siri peta permainan yang dijana secara rawak. Bot-bot mencetak mata dengan menangkap bendera dan mengetuk pemain lain, menghantar mereka kembali ke kawasan respawn di mana karakter mereka reboot. Pada mulanya, tindakan bot muncul secara rawak. Walau bagaimanapun, semakin mereka bermain, semakin baik mereka menjadi. Rangkaian saraf apa pun yang hilang secara konsisten telah dihapuskan dan digantikan oleh versi pemulihan AI yang telah diubah suai. Pada akhir 450, 000 permainan, pasukan itu dinobatkan sebagai satu rangkaian saraf yang dijuluki For The Win (FTW) sebagai juara.

Kumpulan DeepMind memainkan algoritma FTW terhadap apa yang disebut bot cermin, yang hilang kemahiran belajar AI, dan kemudian menentang pasukan manusia juga. FTW menghancurkan semua pencabar.

Kumpulan itu kemudian mengadakan kejohanan di mana 40 pemain manusia dipadankan secara rawak sebagai kedua-dua rakan sepasukan dan penentang bot. Menurut catatan blog, pemain manusia mendapati bahawa bot lebih kolaboratif daripada rakan sepasukan sebenar mereka. Pemain manusia yang dipasangkan dengan agen FTW dapat mengalahkan pejuang siber dalam kira-kira 5 peratus perlawanan.

Seperti yang mereka pelajari, bot mendapati beberapa strategi yang lama dipeluk oleh pemain manusia, seperti melepak berhampiran titik respon bendera untuk merebutnya apabila ia muncul semula. Pasukan FTW juga mendapati pepijat yang boleh mereka eksploitasi: jika mereka menembak rakan sepasukan mereka sendiri di belakang, ia memberi mereka peningkatan kelajuan, sesuatu yang digunakan untuk kelebihan mereka.

"Apa yang luar biasa semasa pembangunan projek ini adalah melihat kemunculan beberapa tingkah laku peringkat tinggi ini, " penyelidik DeepMind dan penulis utama Max Jaderberg memberitahu Gent. "Ini adalah perkara yang boleh kita kaitkan sebagai pemain manusia."

Satu sebab utama bot adalah lebih baik daripada pemain manusia ialah mereka adalah penanda yang cepat dan tepat, menjadikannya lebih cepat pada seri daripada lawan manusia mereka. Tetapi itu bukan satu-satunya faktor kejayaan mereka. Menurut blog itu, apabila para penyelidik membina masa reaksi yang menunda waktu reaksi ke dalam penembak robo, manusia terbaik masih boleh mengalahkan mereka sekitar 21 peratus masa itu.

Sejak kajian awal ini, FTW dan keturunannya telah dilepaskan di medan perang Quake III Arena penuh, dan telah menunjukkan bahawa mereka dapat menguasai dunia yang lebih kompleks dengan lebih banyak pilihan dan nuansa. Mereka juga telah membuat bot yang unggul di ruang permainan strategi ultra-kompleks Starcraft II.

Tetapi penyelidikan bukan sekadar membuat algoritma permainan video yang lebih baik. Belajar tentang kerja berpasukan akhirnya boleh membantu AI bekerja dalam armada kereta memandu sendiri atau mungkin suatu hari nanti menjadi pembantu robot yang membantu menjangkakan keperluan pakar bedah, laporan Gent Gentil.

Walau bagaimanapun, tidak semua orang berpendapat bahawa bot bintang arked mewakili kerja berpasukan yang benar. Penyelidik AI Mark Riedl dari Georgia Tech memberitahu The New York Times bahawa bot begitu baik pada permainan kerana setiap orang memahami strategi secara mendalam. Tetapi itu tidak semestinya kerjasama kerana pasukan AI kekurangan satu elemen penting dalam kerja berpasukan manusia: komunikasi dan kerjasama yang disengajakan.

Dan, tentu saja, mereka juga kekurangan ciri khas permainan pengalaman video koperasi: sampah bercakap pasukan lain.