Pengertian Bahasa Semula Jadi Masa Depan A.I. Pengiktirafan Suara

$config[ads_kvadrat] not found

Suara Nashwa, bikin Kak Rizky pingsan! - AUDITION 2 - Indonesian Idol Junior 2018

Suara Nashwa, bikin Kak Rizky pingsan! - AUDITION 2 - Indonesian Idol Junior 2018
Anonim

Dengan kemunculan keupayaan konsisten Alexa dan Siri Amazon untuk mengambil lebih banyak tugas (dan mendapatkan lebih banyak ketinggalan), ramai yang tertanya-tanya: apa yang seterusnya untuk pemahaman bahasa semula jadi dan antara muka suara perbualan?

Terdapat beberapa syarikat leher dan leher dalam perlumbaan ini. Terdapat Wit.ai, syarikat Facebook yang diperoleh - anda boleh main-main dengan demo. (Cuba arahan ini: "Saya mahu menonton kucing.") Apple mempunyai HomeKit dan, dengan itu, melakukan apa yang Apple lakukan - menendang pantat. Amazon juga di hadapan dengan Echo Dot dan Echo Dot yang dilengkapi dengan Alexa.

Satu syarikat yang panas dalam jejak pemahaman bahasa semula jadi ialah MindMeld. MindMeld menyediakan keupayaan pemahaman bahasa semulajadi kepada syarikat lain yang ingin menambah antara muka suara cerdas kepada produk, perkhidmatan, atau peranti mereka. Syarikat yang berpangkalan di San Francisco memberikan rakan pilihan infrastruktur dan penyesuaian supaya peranti mereka boleh memiliki pembantu peribadi mereka sendiri yang halus. MindMeld baru-baru ini mengumumkan perkongsian itu dengan Spotify, tetapi juga bekerja dengan syarikat automotif, agensi pertahanan, syarikat e-dagang, dan banyak lagi. (Dan, secara semula jadi, ia tidak dapat berkongsi banyak spesifikasi perkongsian tersebut.)

Songsang bercakap dengan Sam Vasisht dari MindMeld tentang keadaan bidang pengiktirafan suara - tetapi dia cepat menunjukkan bahawa "pengiktirafan suara," sebagai perusahaan, kini menjadi "topik biasa." Hari ini, ini adalah mengenai "pemahaman bahasa semula jadi. "Pengiktirafan suara hampir mencapai kemuncaknya: selepas 50 tahun pembangunan, AI kini boleh mengiktiraf ucapan secara berkesan. Sistem ini hampir lebih baik daripada manusia di tempat kerja, dan pastinya akan melampaui manusia semata-mata tidak lama lagi.

Langkah yang dapat diramalkan seterusnya, maka - sama seperti perkembangan kanak-kanak - adalah untuk mengajarkan sistem ini faham bahasa yang mereka boleh kenal sekarang. "Manusia ini adalah kata-kata yang berkata; ini adalah perkataan "jauh dari," saya memahami apa yang dikatakan manusia ini; izinkan saya membantu."

Dan langkah dan perkembangan selanjutnya memerlukan tafsiran makna: Meniru cara minda manusia memproses maklumat lisan. Terdapat dua bahagian untuk persamaan ini. Tujuan pertama ialah: Apakah matlamat atau hasrat manusia dalam membicarakan ayat ini? Sebuah komputer yang boleh mengekstrak maksud dari suatu kalimat yang dituturkan boleh "memahami" bahawa manusia mahu mempengaruhi x atau berinteraksi dengan y. Bersama-sama dengan proses ini adalah bahagian kedua persamaan: Entiti. A.I. mesti tahu bagaimana menentukan entiti yang ditangani, objek niat manusia.

Untuk melakukannya, MindMeld tidak (seperti yang saya anggap, atau diharapkan) menggunakan ahli falsafah. Ia menggunakan pakar bahasa semula jadi, tetapi kebanyakan dari A.I. Proses "pembelajaran" sendiri agak mudah dilakukan. Sekiranya anda mengajar sistem untuk memahami pesanan kopi, anda perlu menunjukkan sistem semua cara yang mungkin orang dapat memesan kopi.

"Saya mahu mocha."

"Bolehkah saya minta secawan joe?"

"Hanya kopi yang besar untuk saya."

Dan di sinilah pakar bahasa semulajadi - ahli bahasa - masuk. Tetapi itu tidak lagi perlu kerana kita boleh menggunakan sumber data. Alat ini membolehkan anda meminta ribuan orang soalan yang sama dan menyusun jawapannya. Kemudian anda hanya memberi respons kepada A.I., dan voila: A.I. boleh bertindak balas kepada pelbagai pertanyaan yang mungkin. "Dari beribu-ribu pertanyaan, kita kini hanya boleh pada dasarnya mesin-belajar bagaimana berbilion pertanyaan lain dijana," kata Vasisht.

Songsang Tanya Vasisht, yang lama menjadi orang dalam A.I. dan alam pemahaman bahasa semula jadi, untuk membuat spekulasi untuk kita.

Bolehkah MindMeld mengambil bahagian dalam dialog lanjutan? Sebagai contoh, jika saya bertanya soalan susulan, adakah A.I. memahami dan terus bertindak balas?

Ya. Itulah sebahagian daripada reka bentuk. Jika seseorang bertanya soalan yang tidak lengkap - jadi, contohnya, jika saya memesan kopi, dan saya tidak menentukan saiz kopi yang saya mahu, ia akan datang kembali dan berkata, "Apa saiz kopi yang anda lakukan mahu?"

Adakah anda menjangkakan sebarang kemajuan pada ujian Turing?

Saya fikir kami cukup dekat dengannya. Maksud saya, IBM Watson lakukan Jeopardy!, dan saya fikir itu adalah contoh yang sangat baik. Kami pada ketika itu: Ia semakin dekat. Sama seperti sekarang, dari segi pengecaman pertuturan, kita berada di titik di mana mesin adalah sama seperti manusia, saya fikir kita akan - pastinya dalam masa tiga hingga lima tahun akan datang - menjadi titik di mana kebanyakan suara perbualan ini sistem akan dianggap sebagai sebaik manusia.

Apa jenis perkara automasi rumah yang dilakukan oleh MindMeld?

Kami boleh menggunakan teknologi kami untuk sebarang jenis produk, sebarang jenis perkhidmatan, apa-apa jenis domain data. Automasi rumah adalah salah satu daripada mereka. Di dalam rumah, anda mempunyai kawalan pencahayaan, termostat, sistem keselamatan, sistem audio, sistem video, semua jenis perkara. Kami dapat mengawal mana-mana sistem dengan syarat terdapat antara muka yang sesuai.

Apa yang anda mahukan anda boleh menyambung ke MindMeld di dalam rumah anda sendiri?

Saya fikir bahawa kes penggunaan lebih maju - seperti bercakap dengan Spotify saya untuk mengatakan "Mainkan saya senarai main Rolling Stones," atau "Mainkan muzik klasik saya malam ini" - perkara-perkara seperti itu akan menjadi … hebat.

Apa-apa perkara yang lebih tidak dijangka atau keluar-of-the-box yang anda ingin mengawal dengan suara anda?

Perkara-perkara yang saya nyatakan kepada anda adalah perkara-perkara yang saya fikir akan berlaku. Dengan kata lain, ini akan berlaku tidak lama lagi. Apa yang tidak akan berlaku dengan segera, saya fikir, akan menjadi perkara seperti gelombang mikro, mesin kopi, dan peti sejuk. Mempunyai peralatan seperti ini dikawal - jadi saya pada dasarnya boleh berkata, "Adakah mesin kopi saya siap untuk membuat kopi? Hidupkan mesin kopi "dan jika ia belum disiapkan, ia sepatutnya kembali dan berkata" Saya minta maaf, tetapi mesin kopi anda belum siap "- kecerdasan semacam itu belum lagi wujud. Itu akan menjadi kubur suci: Di ​​mana pada dasarnya setiap peranti boleh bercakap kembali kepada anda dan memberitahu anda apa yang boleh dan tidak boleh dilakukan. Tetapi kita masih belum ada.

Apa yang anda fikir memegang kembali industri itu?

Ini adalah peralatan yang sangat murah, sekarang. Maksud saya, ini adalah peralatan yang anda boleh beli hampir tidak ada apa-apa. Sepuluh tahun yang lalu, mereka lebih mahal.Jadi, membina dalam ciri baharu adalah sesuatu yang menambah kos alat-alat ini. Pada akhirnya, cadangan nilai semasa sangat kuat; kebanyakan pengeluar tidak cenderung untuk menambah ciri-ciri baru, melainkan mereka berada pada titik kos yang sangat rendah.

Saya rasa itu satu aspek daripadanya. Aspek lain adalah, kita bercakap tentang mempunyai peranti ini disambungkan. Oleh itu, perlu ada lebih daripada sekadar suara guna untuk menyambungkan peranti ini. Harus ada lebih banyak keupayaan yang perlu menunggang sambungan itu sebelum mereka menjadi berdaya maju.

Adakah anda tahu mana-mana syarikat yang bekerja pada kapasiti yang terakhir itu?

Banyak syarikat semikonduktor bekerja pada array mikrofon yang sangat murah. Jenis perkara yang anda pada dasarnya dapat menanamkan - pada kos yang sangat rendah, pada apa saja peranti atau aplikasi yang cukup - yang akan membolehkan ada input suara. Dan anda tidak perlu berdiri di sebelah peranti ini - anda boleh bercakap dari jarak 10 kaki. Membina keupayaan itu - saya fikir itulah titik permulaan. Dan saya fikir ia akan membolehkan orang ramai untuk mula meletakkan mikrofon pada peranti, dan yang lain, keupayaan lanjutan akan diikuti. Tetapi pada masa sekarang, saya tidak tahu mana-mana syarikat yang membina mesin kopi pintar ini, atau microwave pintar, atau mesin basuh.

Apakah anggaran terbaik anda apabila kami mempunyai rumah pintar sepenuhnya, pangsapuri pintar sepenuhnya?

Hari ini, kita sebenarnya hampir mempunyai semua subsistem penting di dalam rumah yang orang mahu automatik, yang mampu menjadi automatik. Ini termasuk lampu, termostat, sistem keselamatan, pintu garaj, kunci pintu depan - perkara seperti itu. Semua perkara ini boleh dilakukan. Isu ini benar-benar di sekitar titik harga. Ini masih berada di titik harga di mana ia terutamanya pendatang awal dan orang yang mempunyai keperluan yang sangat mengerikan untuk mereka. Tetapi titik harga pada perkara-perkara ini jatuh dramatik, sangat pantas. Saya fikir kita mungkin akan mendapat subsistem ini untuk pasaran besar-besaran dalam beberapa tahun akan datang.

Perkara-perkara lain yang saya bicarakan - mengautomasikan peralatan yang sangat murah - saya fikir mereka mungkin dalam tempoh lima hingga tujuh tahun pada awalnya. Lebih 10 tahun lagi, sebelum mereka menjadi kenyataan. Tetapi, seperti yang saya katakan sebelumnya, ini adalah perkara yang memerlukan beberapa perkara lain untuk bersama-sama. Dan ia boleh berlaku lebih awal jika bahan-bahan yang berlapis bersama-sama lebih cepat.

Apa yang anda fikir sebuah apartmen di New York City atau San Francisco akan kelihatan seperti, katakan, 2050?

2050! Wow. Saya fikir kita akan berada di sana sepenuhnya. Perkara-perkara yang kita lihat dalam filem-filem fiksyen sains - di mana anda boleh berbincang dengan banyak sistem di rumah anda, dan mengawal segala-galanya dengan suara - Saya fikir jenis keupayaan ini akan tersebar luas. Sudah tentu di bandar-bandar seperti New York dan San Francisco.

$config[ads_kvadrat] not found