Головна

Огляд підходів до стиснення інформації

  1. IV етап. Спосіб представлення інформації.
  2. А. Школа людських відносин (1930-1950) Короткий огляд
  3. Автоматизація збору і передачі інформації про перевізних процесах при управлінні пасажирськими перевезеннями
  4. Аналіз вторинної інформації
  5. АНАЛІЗ ІНФОРМАЦІЇ ДЛЯ ДІАГНОСТИКИ І ОЦІНЮВАННЯ СТАНУ МЕХАНІЗМІВ
  6. Б. Поведінкові науки (1950 - по теперішній час) Короткий огляд

Як вже було сказано, дискретна форма подання інформації є найбільш загальною і універсальною. У вигляді сукупності символів, що належать до обмеженого алфавітом, можна уявити як текст або масиви чисел, так і оцифровані звук і зображення. З огляду на це очевидно, що повинні існувати універсальні методи стиснення даних (цифрової інформації), які застосовуються до всіх її різновидах. В силу своєї універсальності ці методи повинні виключати втрату інформації (така втрата може бути допустима при передачі, наприклад дрібної деталі зображення, але є неприйнятною, коли мова йде, скажімо, про коді програми). З іншого боку, в ряді програм загальні методи напевно не будуть найбільш ефективними. Наприклад, в силу особливостей зорового і слухового сприйняття, деякий «огрубіння» зображення або звуку може виявитися малопомітним, при цьому виграш в обсязі переданих даних виявиться значним. У цих випадках доречно використовувати спеціальні методи стиснення з втратами (рис.5.1).

При кодуванні із стисненням без втрат виділяються два різновиди методів: Перша заснована на роздільному кодуванні символів. Основна ідея полягає в тому, що символи різних типів зустрічаються неоднаково частини і якщо кодувати їх нерівномірно, - так, щоб короткі бітові послідовності відповідали часто зустрічається символам, - то в середньому обсяг, коду буде менше. Такий підхід, що його, статистичними кодуванням, Реалізований, зокрема, в широко поширеному коді Хаффмана, про який ми розповімо докладно нижче.

Очевидно, що посимвольного кодування не використовує такого важливого резерву стиснення даних, як облік повторюваності послідовностей (ланцюжків) Символів.

Найпростіший варіант обліку ланцюжків - так зване «Кодування повторів» або код RLE, Коли послідовність однакових символів замінюється парою - "код символу + кількість його повторів в ланцюжку". У більшості випадків ланцюжка однакових символів зустрічаються нечасто. Однак, наприклад, при кодуванні чорно-білих растрових зображень, кожен рядок яких складається з послідовних чорних або білих крапок, такий підхід видається дуже ефективним (він широко застосовується при факсимільного передачі документів). Крім того, кодування повторів нерідко використовується як складовий елемент більш складних алгоритмів стиснення.

Набагато більш універсальним є алгоритм, що дозволяє ефективно кодувати повторювані ланцюжка різних символів, Що мають при цьому довільну довжину. Такий алгоритм був розроблений Лемпелем і Зівом і застосовується в різних версіях в більшості сучасних програм-архіваторів. Ідея алгоритму полягає в тому, що ланцюжок символів, вже зустрічалася в переданому повідомленні, кодується посиланням на більш ранню (при цьому вказуються «адреса» почала такого ланцюжка в «словнику» повідомлення і її довжина). Нижче ми обговоримо особливості алгоритму Лемпеля-Зива.

Спеціалізовані методи стиснення з втратами інформації, природно принципово різняться для графіки і звуку.

К методам стиснення зображень відносяться «Блоковий» алгоритм JPEG заснований на незалежному «огрубіння» невеликих фрагментів зображень (квадрати 8х8 пікселів). Тут з ростом ступеня стиснення проявляється мозаїчність зображення. Блоковий метод JPEG (розроблений спеціальною групою міжнародного комітету по стандартизації) отримав зараз повсюдне поширення і нижче ми розглянемо його докладніше. Досягається ступінь стиснення - в середньому в десятки разів.

при хвильовому стисненні на відміну від блокового зображення як би «розмивається» (чим вище ступінь стиснення, тим більше нечіткі межі і деталі). При передачі даних отримується зображення поступово «проявляється» в деталях. Це дозволяє одержувачеві самому вибирати необхідний компроміс між якістю і швидкістю отримання зображення, що дуже зручно, наприклад в Інтернет. До того ж «розмитість» не настільки різко сприймається оком як втрата якості в порівнянні з «мозаїчністю». Так що при суб'єктивно близькому рівні якості хвильової метод дає велику ступінь стиснення у порівнянні з «блоковим». Саме такий підхід реалізований в новому стандарті JPEG 2000.

нарешті, фрактальное стиснення грунтується на тому, що в зображенні можна виділити фрагменти, повороти і масштабування яких дозволяє багаторазово використовувати їх при побудові всієї «картинки». Виділення і побудова математичного опису таких елементів-фракталів - трудомістка в обчислювальному відношенні завдання. Зате високий ступінь стиснення (в сотні разів) і швидкість побудови зображення по його фрактальному опису роблять метод дуже зручним, коли не потрібно швидкість компресії. Наприклад, цей метод зручно використовувати під час запису зображень на CD-ROM.

нарешті, методи стиснення звуку істотно розрізняються в залежності від того, наскільки добре відомі специфічні особливості його джерела. Прикладами джерел, чиї особливості вирішальним чином впливають на характер звуку, є людський мовний апарат і музичні інструменти. Для них ефективним способом стиснення звукової інформації є моделювання, Коли передаються не характеристика звуку, а параметри моделі його джерела.

Що стосується методів стиснення звуку від довільного джерела, ми розглянемо їх нижче.

Кодування відеоінформації. | Ефективне посимвольного кодування для стиснення даних.


Лекція № 17 | Пропускна здатність дискретного каналу з перешкодами | Пропускна здатність безперервного каналу з перешкодами | Лекція № 18 | Методи підвищення завадостійкості | Лекція № 19 | Лекція № 20 | Кодування текстової інформації | Лекція № 21 | Кодування звукової інформацію |

© 2016-2022  um.co.ua - учбові матеріали та реферати