https://frosthead.com

Bercakap Dengan Mesin

Perisian pengiktirafan suara, kebanyakan kita mungkin setuju, adalah perkara yang sangat keren. Tetapi bercakap dengan mesin sebahagiannya-sama ada telefon pintar, skrin TV atau papan pemuka-baik, tidak begitu banyak. Meminta nasihat mengenai peranti? Reek geek. Mengemukakan setiap kata supaya anda dapat difahami? Betapa keren awak boleh?

Tetapi Apple, benar untuk membentuk, telah mengambil kepimpinan ini dengan menyewa tiga ikon yang sejuk untuk menjadi bintang dalam kempen iklan terbaru mereka untuk Siri, suara iPhone 4S. Terdapat Zooey Deschanel (Adorable Cool) dan John Malkovich (Cerebral Cool) dan Samuel L. Jackson (Ultimate Cool), dan semua membuat kata-kata rapi dengan telefon kelihatan sukan tuhan.

Pengkritik, bagaimanapun, menunjukkan bahawa dalam kehidupan sebenar, Siri tidak responsif dan tidak mengetahui sepenuhnya seperti yang digambarkan dalam iklan. Anda juga, saya pasti terkejut mendengar ini. Orang lain melihat semuanya sebagai parodi-lihat abang Zooey Jooey melakukan versi Funny atau Die Zooey dan hari hujan bersama bersama.

Tidak kira apa pun. Siri telah menjadi penyanyi utama dalam korus robot, suara "You Got Mail" suara generasi baru.

Ia adalah bergaya di beberapa kalangan untuk menunjukkan bahawa Siri bukan Steve Jobs yang layak, jika dia masih hidup, Jobs akan menariknya dari pasaran atau sekurang-kurangnya, tidak akan pernah meluluskan iklan berprofil tinggi itu kempen untuk mencacatkan produk.

Tetapi sebagai pengganti Jobs, Tim Cook, berkata awal minggu ini, pemilik iPhone 4S seperti Siri. Menurut kaji selidik yang dikeluarkan pada bulan Mac, hampir 90 peratus mengatakan mereka menggunakannya sekurang-kurangnya sebulan sekali. Dan perlu diingat bahawa Siri, salah satu daripada produk Apple yang paling sedikit dikatakan beta ketika dibebaskan, tidak akan merayakan ulang tahun pertamanya hingga Oktober. Dia masih belajar bahasa dan, lebih penting lagi, hanya mula memanfaatkan kecerdasan tiruan.

Siri kemungkinan akan menjadi pusat Apple TV, dijangka akan membuat debutnya pada bulan Disember. Tetapi kemungkinan, tempat di mana bercakap dengan mesin akan pergi ke arus utama adalah di dalam kereta kita.

Pandu, katanya

Pasti, itu sudah berlaku, tetapi anda masih perlu bertukar kepada robot bercakap jika anda mahu difahami. Dan walaupun tidak ada jaminan. Itu akan mula berubah pada musim panas ini apabila beberapa model baru akan dilengkapi dengan sesuatu yang dipanggil Dragon Drive!

Ia adalah ciptaan Komunikasi Nuance, sebuah syarikat yang berpangkalan di Massachusetts yang menjadi pusat kuasa dalam perniagaan pengecaman suara. (Ia dipercayai secara meluas menjadi otak di belakang Siri.) Nuansa dan pengiktirafan suara di dalam kereta mengambil lonjakan besar minggu depan apabila firma mengumumkan bahawa Dragon Drive! akan dapat memanfaatkan awan.

Apa yang dimaksudkan ialah sistem ini akan meningkatkan daya pengomputeran dan keupayaan memori secara dramatik. Dan itu bermakna bahawa suara di papan pemuka anda akan menjadi lebih Siri-seperti dan membolehkan anda untuk benar-benar berbincang dengannya. Tidak ada lagi monosyllabic menjerit. Hari akan datang apabila anda akan dapat menyebut bahawa anda berasa seperti Allman Brothers dan beberapa saat kemudian "Whipping Post" akan datang mengepam melalui pembesar suara.

Kuncinya ialah sejauh mana kita dapat mengajar konteks mesin dan pragmatik-bagaimana bahasa digunakan dalam situasi sosial. Dan itu perniagaan yang rumit. Sebagai permulaan, walaupun peranti pengiktirafan suara yang paling canggih perlu menunggu seorang manusia untuk selesai bercakap supaya dapat mengurai dan mentafsirkan seluruh kalimat. Kemudian ada "teori fikiran, " keupayaan untuk memahami bahawa orang lain boleh mempunyai kepercayaan dan niat yang berbeza daripada kita sendiri. Sejauh yang kita tahu, hanya manusia yang boleh melakukan ini.

Satu kajian terbaru oleh dua psikolog Stanford dapat memberi anda rasa apa yang terlibat dalam membantu mesin intuitinya. Penyelidik Michael Frank dan Noah Goodman menubuhkan eksperimen dalam talian di mana para peserta diminta untuk melihat satu set objek dan kemudian memilih mana yang dimaksudkan sebagai perkataan tertentu. Sebagai contoh, satu kumpulan peserta melihat persegi biru, bulatan biru dan dataran merah. Persoalan untuk kumpulan itu ialah: Bayangkan anda bercakap dengan seseorang dan anda mahu merujuk kepada objek tengah. Kata mana yang akan anda gunakan, "biru" atau "bulatan"?

Kumpulan lain telah ditanya: Bayangkan seseorang bercakap dengan anda dan menggunakan perkataan "biru" untuk merujuk kepada salah satu benda tersebut. Objek yang mereka bicarakan?

Maklum balas membantu para penyelidik mendapatkan gambaran yang lebih jelas tentang bagaimana pendengar memahami penyampai dan bagaimana penceramah memutuskan apa yang hendak dikatakan. Dari itu, mereka mengembangkan jenis model matematik yang boleh mengembangkan dan memperbaiki proses pemikiran komputer.

Kata Frank: "Ia akan mengambil masa bertahun-tahun bekerja tetapi mimpi adalah komputer yang benar-benar berfikir tentang apa yang anda mahu dan apa yang anda maksudkan bukan hanya apa yang anda katakan."

Cara bercakap

Berikut adalah perkembangan terkini dalam pengiktirafan suara:

  • Siri bersidang: IBM cenderung menjadi saraf sebenar tentang rahsia korporat daripada keluar, jadi kini melarang para pekerjanya daripada menggunakan laman pemindahan fail awam, seperti Dropbox. Tetapi ia juga telah mengharamkan penggunaan Siri di pejabat kerana pihak keselamatan bimbang bahawa seseorang, sambil bercakap dengan telefon mereka, dapat mendedahkan maklumat sensitif yang berakhir pada pelayan Apple.
  • Ambil itu, Apple !: Samsung melancarkan telefon pintar Galaxy X III yang baru di London minggu ini, dan sementara skrin sentuh yang besar semakin mendapat perhatian, ia juga mempunyai perisian pengenalan suara dan muka baru.
  • Lakukan apa yang saya katakan, bukan apa yang saya lakukan: Dan Samsung tidak berhenti di sana. Baru-baru ini memfailkan permohonan paten untuk robot yang memahami ucapan manusia. Robot akan dapat menyesuaikan keupayaan "mendengar" mereka untuk mengambil kira bunyi ambien yang mungkin mengganggu atau mengganggu arahan yang telah diberikan. Ia juga akan dapat mengenali siapa yang bercakap dengannya, walaupun bunyi latar belakang sangat kuat.

Bon Infographic: Anda fikir kereta anda dikomputerkan sekarang. Tunggu sehingga ia dipasang sepenuhnya ke Internet. Dapatkan penurunan pada apa yang boleh dilakukan kereta yang bersambung.

Bercakap Dengan Mesin