Головна

Кодери вихідної інформації (вокодер) та гібридні алгоритми

  1. A) джерела потрібної і корисної інформації
  2. E) джерела потрібної і корисної інформації 1 сторінка
  3. E) джерела потрібної і корисної інформації 2 сторінка
  4. E) джерела потрібної і корисної інформації 3 сторінка
  5. E) джерела потрібної і корисної інформації 4 сторінка
  6. I. Основні поняття УПРАВЛІННЯ ТА АВТОМАТИЗОВАНИХ СИСТЕМ ОБРОБКИ ІНФОРМАЦІЇ ТА УПРАВЛІННЯ
  7. II. Основні методи збору соціологічної інформації, їх коротка характеристика.

Багато методи кодування використовують особливості людської мови, пов'язані з будовою голосового апарату. Кодери, в яких реалізуються такі методи, називають кодерами вихідної інформації або Вокодер (voice coding).

Звуки мови утворюються при проходженні повітря, що видихається через голосовий апарат людини, найважливішими елементами якого є мова, небо, губи, зуби і голосові зв'язки. У формуванні того або іншого звуку бере участь та чи інша частина цих елементів. Якщо звук формується за участю голосових зв'язок, потік повітря з легенів викликає їх коливання, що породжує звуковий гон. Послідовність формованих таким чином звуків становить тонову мова (або тоновий сегмент мови). Якщо звук формується байдужості зв'язок, тон в ньому відсутня, і послідовність таких звуків становить нетоновую мова {нетоновий сегмент мови). Спектр тонового звуку може бути змодельований шляхом подачі спеціальним чином сформованого сигналу збудження на вхід цифрового фільтру з параметрами, обумовленими кількома дійсними коефіцієнтами. Спектр нетонових звуків - практично рівномірний, що обумовлено їх шумовим характером.

У реальних мовних сигналах не всі звуки можна чітко розділити на тонові і нетоновие, а доводиться мати справу з якимись перехідними варіантами, що ускладнює створення алгоритмів кодування, що забезпечують високу якість передачі мови при низькій швидкості передачі інформації.

Мал. 3.5 ілюструє описану спрощену модель функціонування голосового тракту людини. Робота кодера, згідно такої моделі, полягає в тому, щоб, аналізуючи блок відліків мовного сигналу, обчислити параметри відповідного фільтра і параметри збудження (тоновий / нетоновий сегмент мови, частота тону, гучність і т.д.).

Мал. 3.5 Модель функціонування голосового тракту

Описаний принцип кодування отримав назву LPC (Linear Prediction Coding - кодування з лінійним передбаченням), оскільки центральним елементом моделі голосового тракту є лінійний фільтр. Найбільш відомий стандартний алгоритм, побудований за описаним принципом, був стандартизований міністерством оборони США під назвою LPC-10, де число 10 відповідає кількості коефіцієнтів фільтра. Даний кодер забезпечує дуже низьку швидкість передачі інформації 2.4 Кбіт / с, проте якість відтворюваних мовних сигналів залишає бажати кращого і не задовольняє вимогам комерційної мовного зв'язку - мова носить яскраво виражений «синтетичний» характер.

Як уже зазначалося, алгоритми кодування форми сигналу засновані на наявності кореляційних зв'язків між відліками сигналу, які дають можливість лінійного передбачення. У поєднанні з адаптивним квантуванням цей підхід дозволяє забезпечити гарну якість мовлення при швидкості передачі бітів порядку 24-32 Кбіт / с. LPC-кодери (вокодер) використовують просту математичну модель голосового тракту і дозволяють використовувати дуже низькі швидкості передачі інформації 1200-2400 біт / с, однак ціною «синтетичного» характеру мови.

Гібридні алгоритми кодування і алгоритми типу «аналіз шляхом синтезу» (ABS) являють собою спроби поєднати позитивні властивості двох описаних вище основних підходів та будувати ефективні схеми кодування з діапазоном швидкостей передачі бітів 6-16Кбіт / с.

Важлива відмінність кодерів такого типу полягає в тому, що в рамках цих алгоритмів немає необхідності приймати рішення про тип відтвореного звуку (тоновий або нетоновий), так як передбачаються спеціальні заходи для кодування сигналу помилки після проходження збудження через LPC-фільтр. Наприклад, сигнал помилки може бути закодований за алгоритмом, аналогічним АДИКМ, що забезпечить високу точність його передачі. ABS-кодери не можуть бути строго класифіковані як кодери форми сигналу, проте реально метою процедури мінімізації помилки (рис. 3.6), тобто відмінності між вхідним і синтезованим сигналами, є синтез на виході кодера сигналів, форма яких найбільш близька до форми вхідних. ABS-декодер є малою частиною кодера і дуже простий (рис. 3.7).

Мал. 3.6 Спрощена блок-схема ABS-кодера

Мал. 3.7 Спрощена блок - схема ABS - декодера

 



Кодування форми сигналу | Процесори цифрової обробки сигналів для мовних кодеків

Глава 3 Передача мови по IP-мереж | затримки | Пристрої обмеження ефектів луни | Принципи кодування мови | Основні алгоритми кодування мови, що використовуються в IP-телефонії | Кодеки, стандартизовані ETSI | Передача сигналів DTMF | Передача факсимільного інформації |

© um.co.ua - учбові матеріали та реферати