Bolehkah Rangkaian Neural "Superhuman" Benar Google Beritahu Lokasi Mana-mana Imej?

$config[ads_kvadrat] not found

6.1 Teori Pengantar Neural Network/ Jaringan Syaraf Tiruan

6.1 Teori Pengantar Neural Network/ Jaringan Syaraf Tiruan
Anonim

Mencari imej lebih mudah berbanding sebelum ini. Tetapi jika anda cuba mencari gambar sesuatu di lokasi yang tidak benar-benar jelas (jadi tidak piramid Mesir atau patung ibu jari gergasi di Paris), ia lebih sukar daripada yang anda fikirkan - walaupun dengan maklumat geolokasi berdasarkan apa yang dalam imej.

Masukkan jurutera Google yang bernama Tobias Weyand dan sepasang rakannya. Mengikut makalah baru dalam jurnal arXiv (diucapkan "arkib"), trio telah membina mesin pembelajaran mendalam yang mampu menentukan lokasi hampir semua foto yang hanya berdasarkan analisis pikselnya.

Untuk mendapatkan mesin untuk berjaya melaksanakan tugas seperti ini, anda ingin memberikan keupayaan untuk intuit maklumat berdasarkan petunjuk visual. Anda mahu berfikir, dengan kata lain, seperti manusia.

Weyand menetapkan untuk membangunkan rangkaian neural buatan - sistem mesin yang direka untuk meniru laluan neurologi otak, yang membolehkan ia belajar, memproses, dan mengingat maklumat seperti manusia. Sistem baru ini, PlaNet, nampaknya mampu mengalahkan manusia pada menentukan lokasi imej tidak kira apa keadaannya - sama ada di dalam atau di luar, dan memaparkan sebarang isyarat visual yang unik atau tidak jelas.

Bagaimana dengan PlaNet? Weyand dan pasukannya membahagikan peta dunia ke dalam grid yang meletakkan lebih dari 26,000 bentuk seperti persegi di kawasan berbeza, bergantung kepada berapa banyak imej yang diambil di tempat tersebut. Tempat yang padat di mana banyak gambar diambil sesuai dengan dataran yang lebih kecil, manakala kawasan yang lebih besar, jauh lebih jauh boleh dipotong menjadi dataran yang lebih besar.

Pasukan itu kemudiannya membuat pangkalan data imej yang besar yang sudah geolocated - hampir 126 juta foto yang berbeza. Sekitar 91 juta telah digunakan sebagai dataset untuk mengajar PlaNet bagaimana untuk mengetahui imej mana yang boleh diletakkan di mana grid di peta dunia.

Kemudian, rangkaian neural ditugaskan dengan geolokasi 34 juta imej lain dari pangkalan data. Akhir sekali, PlaNet telah ditetapkan pada set data sebanyak 2.3 juta imej geotag dari Flickr.

Keputusan? PlaNet boleh menentukan negara asal untuk 28.4 peratus daripada gambar dan benua untuk 48 peratus. Selain itu, sistem itu boleh menentukan lokasi peringkat jalan untuk 3.6 peratus imej Flickr, dan lokasi peringkat bandar untuk 10.1 peratus.

Dan PlaNet lebih baik daripada kebanyakan manusia - bahkan globetrotters terbesar. Weyand menyenaraikan 10 individu yang berkelana untuk bersaing dengan PlaNet dalam permainan pelabelan lokasi gambar yang terdapat di Google Street View.

"Secara keseluruhannya, PlaNet memenangi 28 daripada 50 pusingan dengan kesilapan penyetempatan median 1131.7 km, manakala kesilapan lokalisasi manusia median adalah 2320.75 km," tulis para penyelidik. "Percubaan berskala kecil ini menunjukkan PlaNet mencapai prestasi luar biasa dalam tugas geolokasikan pemandangan Street View."

Adakah ini untuk sebenar? Adakah jurutera Google benar-benar hanya membangunkan "superhuman" A.I. sistem?

Apabila ia datang kepada imej geolocating, mungkin. Dan itu tidak terlalu mengejutkan - titik A.I. tidak secara asasnya meniru otak manusia dalam segala cara, tetapi melampaui batasan manusia dalam beberapa cara tertentu untuk menyelesaikan tugas yang lebih sukar. Jadi dalam erti kata itu, apa yang ditulis para penyelidik adalah benar.

Walau bagaimanapun, ia adalah peralihan untuk memanggil PlaNet sebagai "rangkaian saraf." Bentuk yang ideal bagi jenis teknologi itu akan dapat belajar lebih banyak daripada geolokasi imej. A.I. sistem mampu menulis simil dan bermain Super Mario, tetapi ini adalah perkara kecil berbanding dengan sistem "tuan" yang sesuai yang boleh memantau dan mengekalkan daya tahan secara automatik, menguruskan pengangkutan atau infrastruktur tenaga, dan banyak lagi.

$config[ads_kvadrat] not found