Rangkaian Neural AI ini Dari Nvidia Mencipta Imej Palsu Photorealistic

$config[ads_kvadrat] not found

Eksperimen Pikiran tentang Batas Kecerdasan Buatan (AI)

Eksperimen Pikiran tentang Batas Kecerdasan Buatan (AI)
Anonim

Sekilas, foto di atas kelihatan seperti gambar biasa jalan biasa, diambil dari cam dash atau dari seseorang yang bodoh untuk bersiar-siar ke jalan untuk merakam gambar adegan sedemikian biasa.

Tetapi kelihatan lebih dekat. Perhatikan bagaimana isyarat lalu lintas sedikit melengkung, atau bagaimana sesetengah kereta kelihatan kabur? Ada sesuatu yang salah di sini. Ini bukan gambar sama sekali. Ia adalah imej yang dibuat sepenuhnya oleh A.I.

Para saintis komputer dari syarikat teknologi Nvidia dan University of California, Berkeley telah menulis kertas penyelidikan, yang boleh didapati di pre-arXiv, memperinci bagaimana mereka dapat mendapatkan rangkaian saraf untuk menjana imej jalan realistik dan potret manusia. Mereka juga termasuk antara muka pengguna yang membolehkan anda tweak gambar-gambar yang anda mahukan dengan menambahkan dedaunan tambahan atau mengubah cuaca.

"Permainan berkembang pesat, kerana orang suka berinteraksi antara satu sama lain dalam persekitaran maya," kata Ming-Yu Liu, saintis senior di Nvidia, Songsang dalam e-mel. "Bagaimanapun, bangunan dunia maya mahal dengan teknologi hari ini, kerana ia memerlukan para seniman untuk model dan mensimulasikan tekstur dan pencahayaan bagi dunia yang mereka bangun. Dengan terjemahan imej-ke-imej, kita boleh mencontohi dunia sebenar untuk mencipta dunia maya."

Rangkaian saraf adalah komputer yang dimodelkan untuk berfungsi seperti otak manusia dengan mengambil maklumat, memohon, dan belajar dari hasilnya. Kajian ini menggunakan jenis neural jenis khas yang diperkenalkan oleh Ian Goodfellow pada tahun 2014, yang dikenali sebagai rangkaian adversarial generik - atau GAN - yang umumnya terdiri daripada dua rangkaian, penjana dan diskriminator.

Penjana diberi gambar dan mula membuat imej sintetik sama seperti yang diberikan kepadanya. Ia kemudiannya menunjukkan campuran imej yang diberikan dan kepalsuan kepada pembeza, yang tugasnya untuk membedakannya. Apabila proses ini berjalan, penjana menjadi lebih baik untuk meniru imej asal dan diskriminator menjadi lebih baik untuk memberitahu kekurangannya. Hasilnya adalah beberapa yang cukup meyakinkan - dan benar-benar palsu - gambar.

Penyelidikan ini membina model GAN ​​tradisional dengan menambahkan pembahagian penjana dan rangkaian diskriminator ke beberapa sub-rangkaian, yang membolehkan output imej resolusi tinggi. Rangkaian saraf juga boleh mengambil peta semantik - atau rangka tindakan bagaimana bentuk sepatutnya kelihatan seperti - dan isi tekstur secara autonomi. Pengguna juga boleh masuk ke dalam pelan tindakan dan mengubah perkara jika mereka mahu menambah bangunan dan bukannya pokok dalam paparan jalan atau menjadikan mata lebih luas dalam potret.

Makalah membandingkan hasilnya dengan eksperimen yang sama dengan menggunakan kaedah ini, yang paling ketara adalah pix2pix. Kajian Nvidia dan UC Berkeley dapat menghasilkan imej dengan butiran sebagai kecil dan tepat sebagai plat lesen yang boleh dibaca, sementara pix2pix menghasilkan imej yang hampir kelihatan seperti lukisan cat air.

Walaupun alat ini boleh digunakan untuk mendapatkan beberapa reddit karma percuma dengan beberapa gambar luar biasa, penulis melihat potensi yang besar dalam menggunakan pendekatan ini untuk menghasilkan grafik realistik dengan hanya satu pelan tindakan mudah.

Beratus-ratus jam tenaga kerja susah payah menjana dunia maya untuk digunakan dalam Peta Google, filem, dan permainan video. Liu mengatakan model ini boleh menjadi cara untuk secara tidak sengaja mendapatkan kebanyakan rekaan yang dilakukan dan kemudian masuk dan tweak butiran kemudian.

"Alih-alih menjadikan dunia secara jelas memodelinya, kita boleh membina dunia secara tersirat dengan menggunakan terjemahan imej-untuk-imej untuk menerjemahkan antara model mudah dunia yang tidak mengandungi sebarang tekstur atau pencahayaan, dan hasil foto-realistik. Keupayaan ini sepatutnya menjadikannya lebih murah untuk membina dunia maya, "katanya Songsang.

Untuk langkah seterusnya dalam penyelidikan ini, pasukan berharap untuk menerokai terjemahan video-ke-video, yang akan menggunakan rangkaian saraf untuk membuat video yang realistik. Satu matlamat yang dikatakan Lui telah mencabar penyelidik di lapangan.

Sekarang anda tahu bagaimana imej palsu boleh dibuat. Jangan percaya semua yang anda lihat pada imej Google.

$config[ads_kvadrat] not found