Зміст:
Визначення - Що означає синтез мови?
Синтез мови - це штучне моделювання людської мови за допомогою комп'ютера чи іншого пристрою. Аналог розпізнавання голосу, синтезу мови в основному використовується для перекладу текстової інформації в аудіоінформацію та в таких додатках, як послуги з підтримкою голосу та мобільні додатки. Крім цього, він також використовується в допоміжних технологіях для допомоги людям з порушеннями зору в читанні текстового вмісту.
Техопедія пояснює синтез мовлення
VODER Гомера Дадлі, який базувався на вокодері з Bell Laboratories, вважається першим повністю функціональним синтезатором голосу. Комп'ютер, що використовується в синтезі мовлення, відомий як синтезатор мови або мовний комп'ютер. Якість мовного комп’ютера часто судять за його схожістю з людським голосом. Більшість комп'ютерних операційних систем включають синтезатори мови з початку 1990-х. Синтезована мова зазвичай генерується за допомогою об'єднання частин записаної мови, яка міститься в базі даних.
Початковою стадією синтезу мовлення є попередня обробка, яка виключає неоднозначність навколо способу читання конкретного слова, яка також включає обробку гомографів. На наступному етапі синтезу мовлення комп’ютер бере за допомогою фонеми перетворення тексту в послідовність звуків. Останній етап передбачає використання людських записів або основних прийомів генерування звуку для імітації механізму голосу людини та зчитування всього тексту. Однією з популярних галузей синтезу мовлення є аудіо-візуальний синтез мовлення або багатомодальний синтез мовлення, який використовує анімоване обличчя, щільно синхронізоване для доповнення синтезованого мовлення. Мультимодальний синтез мови також включає додаткові функції, такі як невербальні підказки до мови, щоб допомогти у більшій точності передавати слова користувача. Багато систем синтезу мовлення дозволяють користувачам обирати тип голосу, такий як чоловічий чи жіночий голос.
Більшість систем синтезу мовлення здатні читати тексти та виводити їх дуже розумно, хоча голос часом може бути тьмяним. Проте синтез мови ще повинен розвинути здатність повністю імітувати широкий спектр людських інтонацій та каденцій.
