https://frosthead.com

Perisian Mencipta Satu Gambar Yang Mengatakan Semua

Setiap hari, pengguna memuat naik lebih daripada 350 juta foto ke Facebook. Imbauan imej ini telah menyebabkan penganalisis menganggarkan bahawa 10 peratus daripada 3.5 trilion gambar dunia telah diambil pada tahun lepas. Semua data yang membanjiri Web bermakna bahawa jika anda mencari imej atau objek tertentu-apa yang kelihatan seperti kucing tabir oren, misalnya-anda secara positif membanjiri hasil carian.

Bulan lepas, penyelidik di University of California, Berkeley memperkenalkan perisian baru, AverageExplorer, yang membolehkan pengguna melihat imej "purata" yang mewakili apa yang mereka cari. Daripada gambar bernilai seribu perkataan, gambar itu bernilai seribu atau lebih-gambar.

"Apabila anda memasukkan carian imej Google, anda akan menapis halaman dan halaman imej, " jelas Jun-Yan Zhu, pelajar siswazah UC Berkeley dan pengarang utama kertas itu, yang disampaikan pada Persidangan dan Pameran Antarabangsa pada Grafik Komputer dan Teknik Interaktif di Vancouver. "Ia besar dan sukar untuk diringkaskan; anda tidak boleh memahami apa yang berlaku. "

Untuk tawaran awal, Zhu dan pasukannya mengumpul gambar menerusi carian imej Flickr, Google dan Bing. Perisian ini adalah kuasa rendah yang cukup untuk berjalan pada desktop purata dan boleh mengetuk kira-kira 10, 000 imej pada masa yang sama.

Pengguna menyempurnakan carian mereka dalam beberapa cara yang berbeza. Mereka boleh melukis dan mewarnai bentuk, sama seperti lukisan dalam Adobe Photoshop atau Illustrator, untuk mempertajam hasil imej purata mereka. Sebagai contoh, mewarna latar belakang imej rata-rata Menara Eiffel akan memilih sendiri imej purata untuk menarik hanya tembakan yang diambil pada waktu malam. Atau, anda boleh menarik garisan yang tersusun untuk mengawal orientasi rama-rama dalam komposit.

Bridge of Sighs, Dari Hari ke Malam Dengan menapis warna-warna dalam imej AverageExplorer Bridge of Sighs, anda boleh mengubah pemandangan dari siang hingga senja hingga malam. (Courtesy UC Berkeley)

Sebaik sahaja imej purata dibuat, proses yang boleh mengambil masa seminit, pengguna dapat memperhalusi hasil dengan menggunakan pasukan yang dikenali sebagai Explorer Mode. Dalam mod ini, mengklik bahagian tertentu imej-kata, hidung kucing-akan mendedahkan pilihan biasa atau penghalusan yang lain untuk tempat itu-mungkin hidung biru atau hitam, atau yang bulat bukan sudut. Dalam video demo, sebagai contoh, pasukan menapis imej kanak-kanak di pangkuan Santa dengan memilih hanya gambar di mana Santa mempunyai satu anak pada setiap lengan.

Di mana sistem itu akan menjadi sangat kuat, kata Zhu, adalah sebagai alat untuk melatih algoritma penglihatan komputer, seperti yang digunakan oleh Google Goggles atau aplikasi Amazon Firefly, yang boleh mengenal pasti apa yang ditunjukkan kamera. "Dalam bidang penglihatan komputer, orang banyak menghabiskan wang untuk memberi penjelasan objek, " jelasnya. "Sekarang anda boleh menggunakan anotasi kepada imej purata. Ideanya ialah anda hanya perlu bekerja pada satu imej untuk menyebarkan semua imej dalam set data. "

Mencari Kucing Baka Dengan menapis mod hasil carian, para penyelidik dapat menemui kucing spesifik kucing, termasuk (dari kiri ke kanan) Ragdoll, Siam, Maine Coon dan Sphinx. (Courtesy UC Berkeley)

Mencipta karya seni adalah buah gantung yang rendah untuk Rata-Rata. Pasukan itu menarik inspirasi dari artis-artis baru seperti Jason Salavon, yang telah membuat gambar dengan rata-rata dengan teliti dengan tangan. Ia juga boleh digunakan untuk membuat pemalam Facebook yang membolehkan pengguna menggeram dengan imej purata diri mereka.

Cita-cita penyelidik lebih luas dan berdampak. Ahli sosiologi boleh menggunakan sistem ini untuk mencari dan menyelidik aliran sosial; Sebagai contoh, imej rata-rata boleh membuktikan bahawa pengantin perempuan paling sering berdiri di sebelah kanan pengantin lelaki dalam potret pernikahan. AverageExplorer mungkin juga alat yang berguna untuk penganalisis media yang cuba membedah liputan televisyen - adakah perubahan sikap Stephen Colbert ketika dia bercakap tentang George W. Bush dan Barack Obama?

Dengan membenarkan pengguna untuk berinteraksi secara intuitif dengan data visual dan bukannya berjuang untuk memasukkan rentetan kata kunci yang betul, pengguna akan dapat menjembatani apa penasihat Zhu dan pencipta bersama-sama RataExplorer, Alexei Efros, memanggil "kemacetan bahasa."

Pasukan ini membayangkan satu kumpulan alat tersuai yang direka untuk tugas-tugas tertentu yang sukar ditonjolkan. Permohonan membeli-belah, misalnya, akan membolehkan pengguna untuk membuat labah-labah web untuk sepasang tumit dengan warna yang tepat, bentuk tumit dan ketinggian yang dialaminya. Zhu membayangkan sebuah alat yang mengintegrasikan dengan alur kerja artis lakar polis, yang membolehkan seorang saksi mencari pangkalan muka muka untuk ciri-ciri yang sepadan dengan pelaku dan membina potret komposit.

Versi asas AverageExplorer akan dikeluarkan pada musim gugur ini.

Perisian Mencipta Satu Gambar Yang Mengatakan Semua