Google, Gerçek İnsan Sesine Benzeyen Yapay Zeka Sesi Geliştirdi!


Vay canına
Google, Tacotron 2 adlı yeni bir metin-konuşma sistemine öncülük etti ve bu sistemin gerçek bir insanın sesine benzeyen sesli anlatımlar sunarak çarpıcı doğrulukla çalıştığı gözlemlendi. Bu bir abartı değil: Tacotron 2, teknolojinin ikinci jenerasyonudur ve metni özel bir spektograma çeviren iki derin sinir ağı içermektedir. İlki,
metni özel bir spektograma (yukarıdaki görsel) dönüştürüyor. İkincisi ise WaveNet. Bu tabloyu okur ve onu gerçek bir ses haline getirir. Bu arada spektogram, ses frekanslarının grafiksel döküm halinde oluşturulmasına deniyor.
Sistem şuanda şimdilik sadece İngizlice konuşabilen bir kadın sesiyle çalışıyor. Sistem sadece okuma işini görmüyor ayrıca ince nüansları da söyleyebiliyor. Öte yandan kelimelerin vurgusunu da yaparak daha gerçekçi bir AI ses deneyimi ortaya koyuyor. Ayrıca yazım hatalarıyla da bir miktar başa çıkabiliyor.
Hemen aşağıda Tacotron 2 için bazı test örnekleri göreceksiniz.

Yazım Hatalarını Tolere Ediyor

“Thisss isrealy awhsome.”

Stres ve Vurgulamaları Öğreniyor

“The buses aren’t the problem, they actually provide a solution.”


 

“The buses aren’t the PROBLEM, they actually provide a SOLUTION.”

Tacotron 2 veya İnsan? Ama hangisi?

“That girl did a video about Star Wars lipstick.”



 

“She earned a doctorate in sociology at Columbia University.”



 

“George Washington was the first President of the United States.”


Tekerlemelerde de başarılı

“Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?”


 

“She sells sea-shells on the sea-shore. The shells she sells are sea-shells I’m sure.”


Teknolojiyi ve popüler kültürü takip etmeyi sever, onlar hakkında yazmayı daha çok sever. Ayrıca sizden gelen soruları da cevaplamaktan hoşnut kalır; [email protected] twitter.com/MtnAKPINAR

0 Yorum

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir