Princeton Undergrad Mewujudkan Deepjazz yang diilhami Deep Deep Deep Google. Pembuat muzik

$config[ads_kvadrat] not found

Deep Exploration

Deep Exploration
Anonim

Ji-Sung Kim menghabiskan waktu pagi pada hujung minggu pertama April yang berwayar pada kafein dan pengekodan pada komputernya semasa dia membangunkan deepjazz, penjana muzik pembelajaran yang mendalam. ProtoComputer sains komputer berusia 20 tahun hanya mempunyai 36 jam untuk menyelesaikan deepjazz semasa hackathon pertama, HackPrinceton, yang diadakan pada April 1-3 di universiti. Setelah menyelesaikan marathon coding, dia membuat laman web untuk deepjazz, dan menyiarkan kod sumber pada GitHub.

Tetapi banyak yang mengejutkan Kim, program itu ditembak. Deepjazz sedang berjalan dengan lancar di Python dan GitHub - mencapai setinggi program ketujuh di GitHub secara keseluruhan. Ia juga dipaparkan di halaman depan HackerNews dan masih menjana perbincangan yang meriah.

"Saya tidak pernah menjangkakan projek sampingan pertama saya menjadi bahan letupan dari segi populariti," kata Kim Songsang. "Ia sangat gila dan menyeronokkan."

deepjazz - Generasi jazz yang didorong pembelajaran dalam menggunakan Keras & Theano! http://t.co/G5wscglzO7 #python

- Trend Python (@pythontrending) 11 April 2016

Antara makan, tidur, dan menamatkan kerja kursus lain, Kim mengambil keputusan bahawa ia mengambil masa kira-kira 12 jam untuk membangunkan kod sumber untuk deepjazz. Walau bagaimanapun, dia datang dengan idea untuk penggubalan muzik kecerdasan buatan jauh sebelum HackPrinceton. Semasa latihan musim panas di University of Chicago, dia merentasi Deep Dream Google, penjana foto yang menafsirkan corak dalam imej dan mengubahnya menjadi objek lain yang ia tahu. Hasilnya adalah imej-imej mewah yang kelihatan seperti mimpi liar.

"Idea menggunakan pembelajaran mendalam untuk menafsirkan seni sangat menarik untuk saya," kata Kim. "Rangka kerja Deep Dream yang dikemukakan dan diterbitkan oleh Google sangat menarik kerana anda mencipta karya seni baru dari karya seni yang ada."

Deepjazz menggunakan mesin pembelajaran untuk menghasilkan muzik jazz - "an A.I. dibina untuk membuat jazz "sebagai profil SoundCloud menyatakan. Kim, yang tidak mengambil kelas teori muzik tetapi telah memainkan klarinet selama tujuh tahun, memilih muzik jazz kerana melodi yang tidak konvensional. A A.I. muzik sistem, "mungkin mempunyai beberapa output yang luar biasa, jadi saya fikir jazz sangat sesuai dengan idea untuk menghasilkan muzik dengan cepat," katanya.

Dia mengalahkan penjana muzik sedia ada yang dioptimumkan untuk muzik jazz yang rakannya Evan Chow dibangunkan dipanggil JazzML, menggunakan kod untuk mendapatkan data yang relevan tetapi mengubahnya menjadi matriks binari yang serasi dengan dua perpustakaan pembelajaran yang mendalam iaitu Keras dan Theano.

Kerangka deepjazz itu sendiri merupakan dua lapisan LSTM, yang merupakan sejenis arsitektur rangkaian saraf tiruan, Kim menggambarkan. Selepas ia mempelajari urutan awal benih awal nota muzik (Kim menggunakan sebahagian daripada Pat Metheny "Dan Kemudian Saya Tahu"), ia memberikan kebarangkalian kepada nota dan menjana nota seterusnya berdasarkan kebarangkalian tersebut. Sebagai contoh, jika anda memberi suai program skala A, B, C, terdapat kebarangkalian yang tinggi bahawa nota yang akan dibangkitkan seterusnya akan menjadi D, Kim menjelaskan.

Dari segi sejarah, para pengkritik mengatakan penjana muzik kecerdasan buatan diganggu dengan menghasilkan lagu-lagu yang terlalu robotik dan steril - kurang warna yang didengar dalam muzik yang dibuat oleh manusia. Jeffrey Bilmes, bekas pelajar MIT yang menulis tesis mengenai komputer yang menghasilkan semula irama muzik pada tahun 1993, Songsang pada bulan November:

"Apabila anda belajar bermain muzik dan anda belajar bermain jazz, ada kemudahan untuk memahami secara intuitif tentang muzik yang menjadikannya manusia," kata Bilmes. "Manusia adalah makhluk yang intuitif, dan manusia sering tidak dapat menjelaskan bagaimana mereka dapat melakukan hal-hal manusia. Saya merasakan pada masa yang mungkin saya melanggar sumpah yang suci dalam menentukan perkara ini untuk program komputer."

Apabila Kim melakukan penyelidikan untuk mendalaminya, dia mendapati banyak sistem yang menghasilkan muzik yang terdengar robot.

"Muzik dan seni adalah perkara yang kita anggap sangat manusia," kata Kim. "Untuk menjadikannya lebih sihat dan lebih cergas, ia sangat sukar untuk dikategorikan." Kim mencadangkan bahawa penjana boleh membuat lagu-lagu yang terdengar lebih manusia dengan memprogramkannya untuk bunyi kurang serupa dengan trek asal.

Pemaju lain telah menghubungi Kim dan berminat untuk memperluas deepjazz supaya lebih banyak orang boleh berinteraksi dengannya. Kim boleh melihat deepjazz suatu hari yang berkembang menjadi rakan kongsi improvisasi yang boleh menjejakkan balik kepada seorang pemuzik untuk membuat riff. Lebih jauh lagi ke masa depan, dia dapat melihat aplikasi yang mencipta muzik berbunyi baru, serupa dengan trek kegemaran anda atau yang dapat mencadangkan lagu baru dan perkembangan untuk pemuzik.

Kim mengakui bahawa dia masih jauh dari menjadi pakar dalam pembelajaran mendalam, tetapi pengalamannya mengembangkan deepjazz dan latihan di magang dan Princeton telah memberikannya beberapa pandangan berharga ke dalam bidang.

"A.I. tidak lagi mimpi sci-fi lagi. Ia sesuatu yang sangat nyata dan ia sesuatu yang menghampiri dengan pantas, "kata Kim. "Mudah-mudahan melihat pelajar kolej ini, yang bukan ahli kelas atas, mampu membuat sesuatu dalam hackathon yang menggalakkan kepada pelajar lain yang bergelut masuk ke sains komputer."

$config[ads_kvadrat] not found