Are You a Zetizen?
Show Menu

Google DeepMind WaveNet, Ciptakan Suara Komputer Seperti Manusia

Zetizen Zetizen 14 Sep 2016
Google DeepMind WaveNet, Ciptakan Suara Komputer Seperti Manusia

 

Zetizen.com - berkomunikasi dengan mesin mungkin udah jadi salah satu impian manusia sejak lama. Meski berbagai metode kayak teknologi sintesis suara sudah banyak ditemukan, suara yang dapat dihasilkan mesin masih sangat terbatas.

Nah, baru baru ini, Google, lewat DeepMind, perusahaan Artificial Intelligence bawahannya, berhasil mengembangkan sistem sintesis suara komputer tercanggih yang pernah ada. Dengan algoritma bernama WaveNet, sintesis suara ini disebut mampu menghasilkan suara natural yang sangat mirip cara bicara manusia.

“Membuat manusia bisa berkomunikasi dengan mesin adalah sebuah imipan lama untuk mewujudkan interaksi anatara manusia dengan kompute,” ujar para peneliti DeepMind, dilansir dari Business Insider. wavenet mampu meniru suara siapa pun karena cara kerjannya terfokus pada gelombang suara yang dibuat berlawanan. Beda dengan sama pengahasil suara buatan serupa seperti, google Now, Siri dari Apple, atau Alexa dari Amazon.

 

 

Perusahaan yang diakusisi google pada 2014 ini, berhasil membuat speech synthesis tersebut dengan menggunakan cara yang berbeda khusunya dalam membuat TTS atau text-to-speech. Sebelumnya, ada dua jenis metode TTS yang digunakan. Yang pertama adalah concatenative TTS seperti yang digunakan pada Siri milik Apple. Sementara yang lebih rumit adalah parametric TTS. Model concatenative menggunakan kepingan suara yang telah direkam sementara parametric membuat kalimat menggunakan algoritma komputer.

Meski metoda parametrik sudah lebih canggih, namun penggunaannya masih terdengar kaku. Suara yang dihasilkan pun masih terdengar sangat robotik.

Nah, hal itulah yang akhirnya diatasi sistem terbaru keluaran deepmind ini. wavenet menggunakan “Neural Network”, semacam teknologi yang dibuat dengan meniru otak manusia. Sehingga, nggak lagi bergantung pada kata kata yang diinputkan, WavNet bekerja dengan menganalisa bentuk gelombang dari sinyal audio dan beragam suara termasuk bunyi musik.

Oh iya, google udah melakukan studi pengujian pada 500 orang dengan meminta mereka untuk mendengarkan wavenet berbicara dan menilai seberapa realistik cara bicara AI tersebut loh! Dan hasilnya, hampir sebagian besar respondennya mengaku kalau suara keluarannya udah sangat real dan mirip suara manusia. Kalau kalian penasaran dengan hasil suaranya, coba aja cek laman resmi wavenet berikut: https://deepmind.com/blog/wavenet-generative-model-raw-audio/

Namun, meskipun WaveNet memiliki kemampuan suara lebih baik dari suara buatan lain, komputer ini masih butuh banyak data sebelum benar-benar dipakai untuk kebutuhan praktis. Karena itu, teknologi ini belum akan diintegrasikan dengan produk Google dalam waktu dekat. Waah, tapi keren kan? kira-kira teknologi canggih apa lagi ya yang bakal dikembangkan Google? (businessinsider/theverge/dhs/giv)

 

RELATED ARTICLES

Please read the following article