Definisi
Text to Speech
Pada prinsipnya,
sistem TTS (Text to Speech) adalah suatu sistem yang dapat melakukan konversi
dari teks menjadi ucapan. Saat ini terdapat berbagai sistem yang dapat
melakukan fungsi seperti itu, misalnya sistem IVR (interactive voice response)
yang banyak digunakan untuk layanan informasi otomatis melalui telpon (call
center). Sistem IVR biasanya menggunakan rekaman kata atau kalimat yang direkam
secara utuh. Untuk mempertegas definisi TTS dalam disertasi ini, berikut ini
akan ditinjau beberapa definisi TTS dari beberapa literatur.
Dutoit
dalam buku “An Introduction to Text-to-Speech Synthesis” [Dut97] mendefinisikan
Text-to-Speech sebagai “production of speech by machines, by way of the
automatic phonetization of the sentences to utter”.
Pelton
dalam buku “Voice Processing” [Pel93] menyatakan bahwa “The task of Text to
Speech system is to convert plain text into speech …”. Dalam bagian lainnya,
Pelton menyatakan pula “A very attractive advantage of text to speech is that
any text can be read, vocabulary is not restricted to utterances that have been
decided upon beforehand”.
Speech
FAQ, suatu situs Internet yang merangkum pendapat dari berbagai universitas,
lembaga penelitian dan industri di bidang aplikasi ucapan, menyatakan bahwa “Speech
synthesis programs convert written input to spoken output by automatically
generating synthetic speech. Speech synthesis is often referred to a Text-to-Speech
conversion (TTS)”.
Berdasarkan
ketiga sumber tersebut, suatu sistem TTS dapat didefinisikan sebagai “Sistem
yang dapat mengubah suatu teks menjadi ucapan secara otomatis dengan cara
fonetisasi (penyusunan fonem-fonem untuk membentuk ucapan)”. Sebuah sistem TTS
dapat mengucapkan kata apapun, dan kosa katanya tidak terbatas. Berdasarkan
definisi tersebut, maka suatu sistem IVR tidak dapat dikategorikan sebagai
sistem TTS, karena hanya dapat mengucapkan kata-kata atau kalimat dengan jumlah
atau kombinasi yang sangat terbatas, tidak dapat mengucapkan semua kata atau
kalimat. Selain itu, IVR tidak melakukan fonetisasi.
RESUME
Berdasarkan jurnal diatas terdapat
3 pengertian yang berbeda dari text to speech, namun dapat disimpulkan bawah
text to speech merupahan sistem yang mengubah suatu teks menjadi ucapan secara
otomatis. Salah satu contoh sistem yang menggunakan TTS adalah IVR (interactive
voice response). Tetapi berdasarkan pengertian dari TTS menurut ketiga definisi
diatas, maka IVR tidak termasuk ke dalam TTS karena IVR menggunakan suara
rekaman yang direkan secara utuh. Berbeda dengan TTS yang dapat mengucapkan
kata secara otomatis dengan cara fonetisasi.
Sumber
Sumber
Tidak ada komentar:
Posting Komentar