20 April 2014

TEXT TO SPEECH

Definisi Text to Speech
Pada prinsipnya, sistem TTS (Text to Speech) adalah suatu sistem yang dapat melakukan konversi dari teks menjadi ucapan. Saat ini terdapat berbagai sistem yang dapat melakukan fungsi seperti itu, misalnya sistem IVR (interactive voice response) yang banyak digunakan untuk layanan informasi otomatis melalui telpon (call center). Sistem IVR biasanya menggunakan rekaman kata atau kalimat yang direkam secara utuh. Untuk mempertegas definisi TTS dalam disertasi ini, berikut ini akan ditinjau beberapa definisi TTS dari beberapa literatur.
Dutoit dalam buku “An Introduction to Text-to-Speech Synthesis” [Dut97] mendefinisikan Text-to-Speech sebagai “production of speech by machines, by way of the automatic phonetization of the sentences to utter”.

Pelton dalam buku “Voice Processing” [Pel93] menyatakan bahwa “The task of Text to Speech system is to convert plain text into speech …”. Dalam bagian lainnya, Pelton menyatakan pula “A very attractive advantage of text to speech is that any text can be read, vocabulary is not restricted to utterances that have been decided upon beforehand”.

Speech FAQ, suatu situs Internet yang merangkum pendapat dari berbagai universitas, lembaga penelitian dan industri di bidang aplikasi ucapan, menyatakan bahwa “Speech synthesis programs convert written input to spoken output by automatically generating synthetic speech. Speech synthesis is often referred to a Text-to-Speech conversion (TTS)”.

Berdasarkan ketiga sumber tersebut, suatu sistem TTS dapat didefinisikan sebagai “Sistem yang dapat mengubah suatu teks menjadi ucapan secara otomatis dengan cara fonetisasi (penyusunan fonem-fonem untuk membentuk ucapan)”. Sebuah sistem TTS dapat mengucapkan kata apapun, dan kosa katanya tidak terbatas. Berdasarkan definisi tersebut, maka suatu sistem IVR tidak dapat dikategorikan sebagai sistem TTS, karena hanya dapat mengucapkan kata-kata atau kalimat dengan jumlah atau kombinasi yang sangat terbatas, tidak dapat mengucapkan semua kata atau kalimat. Selain itu, IVR tidak melakukan fonetisasi.

RESUME
Berdasarkan jurnal diatas terdapat 3 pengertian yang berbeda dari text to speech, namun dapat disimpulkan bawah text to speech merupahan sistem yang mengubah suatu teks menjadi ucapan secara otomatis. Salah satu contoh sistem yang menggunakan TTS adalah IVR (interactive voice response). Tetapi berdasarkan pengertian dari TTS menurut ketiga definisi diatas, maka IVR tidak termasuk ke dalam TTS karena IVR menggunakan suara rekaman yang direkan secara utuh. Berbeda dengan TTS yang dapat mengucapkan kata secara otomatis dengan cara fonetisasi.

Sumber



Tidak ada komentar:

Posting Komentar