Speechmatics Menggunakan AI untuk Transcribe Bahasa, dan Ia Menangkap Google

$config[ads_kvadrat] not found

Kata.ai Manifesto

Kata.ai Manifesto
Anonim

Speechmatics akan berlaku selepas Google. Permulaan British mengambil bungkusan automatik Linguist bulan lalu, kecerdasan buatan yang kuat yang boleh mempelajari bahasa apa-apa untuk transkripsi ucapan-teks-teks dalam masa beberapa hari. Pasukan ini ingin membolehkan teknologi untuk setiap satu daripada kira-kira 7,000 bahasa di dunia, dengan potensi untuk mengubah kehidupan.

Sejak melancarkan alat linguistik, Speechmatics telah bekerja pada Omniglot, satu cabaran untuk membina bahasa sehari. Minggu lalu, syarikat itu melanda peristiwa besar: Ia secara rasmi mengalahkan Google, dengan 72 bahasa yang unik.

Sistem ini menggunakan pembelajaran mesin untuk memadankan data audio dengan rakan kongsi transkrip. Ia kemudian menggunakan corak linguistik dari bahasa-bahasa lain untuk membuat proses sebagai lugas yang mungkin, mengenal pasti persamaan antara bunyi dan struktur tatabahasa dan menerapkannya kepada bahasa baru. Proses ini sangat berkesan: sebagai contoh, kerja Speechmatics 'pada Hindi hanya mengambil masa dua minggu untuk mencapai ketepatan 80 peratus. Apabila produk akhir diuji terhadap usaha Google, ia membuat 23 peratus lebih sedikit kesilapan.

Songsang bercakap dengan Benedikt von Thüngen, Ketua Pegawai Eksekutif Speechmatics, untuk mengetahui lebih lanjut.

Bagaimana pasukan anda mula bekerja pada projek itu?

Kami memulakan projek Omniglot sebagai satu cabaran kepada diri sendiri - untuk melihat berapa banyak bahasa yang kami dapat membina dalam enam minggu. Kami menyedari bahawa pendekatan tradisional untuk membina setiap bahasa secara individu tidak lagi berdaya maju apabila melihat skala pada kadar yang cepat. Mengingat bahawa dalam fikiran, kita terpaksa memikirkan semula bahasa apa, bagaimana ia tersusun dan apa persamaan di antara bahasa yang berbeza. Kami telah menemui cara untuk menggunakan persamaan ini untuk mengenal pasti corak dan membantu kerangka kerja AI kami, Automatic Linguist (AL), untuk membina bahasa lebih cepat dari sebelumnya - 46 dalam enam minggu untuk tepat, atau kira-kira satu bahasa sehari selama enam minggu !

Bagaimanakah ini berbeza dengan usaha Google?

Pendekatan kami terhadap bangunan bahasa adalah salah satu aspek utama yang membezakan kami dari Google. Walaupun kita menganggap bahawa mereka membina bahasa masing-masing (atau dengan apa yang kita panggil 'kekerasan'), kita menggunakan kuasa A.I. untuk memperkemaskan dan mempercepat proses pembinaan bahasa. Selain itu, sementara perkhidmatan lain seperti Google memberi tumpuan kepada membina dialek dan bukannya bahasa yang unik, kami bangga mengatakan bahawa usaha kami telah difokuskan pada bahasa yang unik dari seluruh dunia, termasuk kawasan yang sebelum ini kurang mendapat perhatian oleh syarikat teknologi tinggi.

Apakah beberapa aplikasi dunia sebenar untuk ini?

Kami kini mempunyai teknologi dan pengetahuan untuk menjadikan perkhidmatan kami jauh lebih luas daripada sebelumnya dan membawa pengiktirafan ucapan automatik (ASR) kepada semua orang. Ini amat relevan di negara-negara yang mempunyai kadar celik huruf yang rendah, di mana keupayaan untuk menggunakan teknologi pertuturan-ke-teks yang tidak dapat digunakan untuk berkomunikasi dapat membuat semua perbezaan bagi orang. Kes-kes kehidupan sebenar yang lain di mana teknologi ASR boleh membantu mempunyai isu-isu aksesibiliti - pendengaran dan / atau penglihatan cacat orang dari seluruh dunia kini boleh menggunakan peranti semudah telefon untuk berinteraksi dengan orang-orang di sekeliling mereka.

Adakah ini meningkatkan ketepatan bahasa yang dilindungi dengan baik seperti bahasa Inggeris?

Semasa kami terus membangunkan lebih banyak bahasa, kami A.I. rangka kerja akan semakin mahir mengenal pasti ciri dan corak bahasa. Kami akan menggunakan pengetahuan ini untuk terus menyempurnakan pangkalan bahasa semasa kami, termasuk bahasa Inggeris.

Bolehkah ini memperbaiki sesuatu seperti alat terjemahan masa nyata Google Pixel Buds?

Kami pasti melihat projek seperti Omniglot membantu memperbaiki alat terjemahan masa kini. Oleh kerana lebih banyak sumber dilaburkan dalam mengembangkan jangkauan dan ketepatan bahasa, kita akan melihat peningkatan berterusan dalam sektor perkhidmatan terjemahan.

Adakah ini berfungsi dengan bahasa apa pun, walaupun bahasa yang dibina seperti Klingon?

Kami masih belum mencuba dan membina apa-apa kononnya, tetapi kami tidak melihat sebarang alasan mengapa mereka tidak akan berfungsi. Oleh kerana bahasa-bahasa ini masih dituturkan oleh manusia, mereka juga mengikuti peraturan struktur dan kekangan yang sama seperti bahasa sehari-hari (seperti bilangan fonem), yang akan memberikan data AL yang cukup untuk membina.

Adakah anda membuka sumber projek?

Tidak, kami tidak mempunyai rancangan untuk itu.

Bagaimanakah kerja pelesenan?

Bahasa yang ditawarkan di bawah projek Omniglot adalah percuma dan tidak boleh digunakan untuk tujuan komersil. Oleh itu, tidak akan ada pelesenan yang melekat pada mereka untuk masa depan yang boleh dijangka.

Apakah langkah seterusnya dari sini?

Projek Omniglot adalah permulaan untuk kami. Kami mahu akhirnya membina setiap bahasa di dunia, jadi kami akan berusaha keras ke arah matlamat itu!

$config[ads_kvadrat] not found