Головна |
А тепер познайомимося з іншим способом вимірювання інформації. Цей спосіб не пов'язує кількість інформації з вмістом повідомлення, і називається він алфавітним підходом.
При алфавітному підході до визначення кількості інформації розглядають інформаційне повідомлення як послідовність знаків певної знакової системи.
Найпростіше розібратися в цьому на прикладі тексту, написаного на якомусь мові. Для нас зручніше, щоб це була російська мова.
Всі безліч використовуваних в мові символів будемо традиційно називати алфавітом.
Загальна кількість символів алфавіту прийнято називати потужністю алфавіту. Будемо позначати цю величину буквою N. Наприклад, потужність алфавіту з російських букв та зазначених додаткових символів дорівнює 54.
Уявіть собі, що текст до вас надходить послідовно, по одному знаку, немов паперова стрічка, виповзає з телеграфного апарату. Припустимо, що кожен з'являється на стрічці символ з однаковою ймовірністю може бути будь-яким символом алфавіту. Насправді це не зовсім так, але для спрощення приймемо таке припущення.
У кожній черговій позиції тексту може з'явитися будь-який з N символів. Тоді, згідно з відомим нам формулою, кожен такий символ несе I біт інформації, яке можна визначити з рішення рівняння: 2I = 54. Отримуємо: I = 5.755 біт.
Ось скільки інформації несе один символ в російській тексті! А тепер для того, щоб знайти кількість інформації у всьому тексті, потрібно порахувати число символів в ньому і помножити на I.
Порахуємо кількість інформації на одній сторінці книги. Нехай сторінка містить 50 рядків. У кожному рядку - 60 символів. Значить, на сторінці вміщується 50x60 = 3000 знаків. Тоді обсяг інформації буде дорівнює: 5,755 х 3000 = 17265 біт.
При алфавітному підході до вимірювання інформації кількість інформації залежить не від змісту, а від розміру тексту і потужності алфавіту.
При використанні двійкової системи (алфавіт складається з двох знаків: 0 та 1) кожен двійковий знак несе 1 біт інформації. Цікаво, що сама одиниця вимірювання інформації «біт» отримала свою назву від англійського сполучення «binary digit»-« Двійкова цифра ».
Застосування алфавітного підходу зручно перш за все при використанні технічних засобів роботи з інформацією.
Найзручніше вимірювати інформацію, коли розмір алфавіту N дорівнює цілій степені двійки. Наприклад, якщо N = 16, то кожен символ несе 4 біти інформації тому, що 24 = 16. А якщо N = 32, то один символ «важить» 5 біт.
Обмеження на максимальний розмір алфавіту теоретично не існує. Однак є алфавіт, який можна назвати достатнім. З ним ми скоро зустрінемося при роботі з комп'ютером. Це алфавіт потужністю 256 символів. В алфавіт такого розміру можна помістити все практично необхідні символи: латинські і російські літери, цифри, знаки арифметичних операцій, всілякі дужки, знаки пунктуації ...
Оскільки 256 = 28, То один символ цього алфавіту «важить» 8 біт. Причому 8 біт інформації - це настільки характерна величина, що їй навіть присвоїли свою назву - байт.
1 байт = 8 біт.
Сьогодні дуже багато людей для підготовки листів, документів, статей, книг та ін. Використовують комп'ютерні текстові редактори. Комп'ютерні редактори, в основному, працюють з алфавітом розміром 256 символів.
У цьому випадку легко підрахувати обсяг інформації в тексті. Якщо 1 символ алфавіту несе 1 байт інформації, то треба просто порахувати кількість символів; отримане число дасть інформаційний обсяг тексту в байтах.
Нехай невелика книжка, зроблена за допомогою комп'ютера, містить 150 сторінок; на кожній сторінці - 40 рядків, в кожному рядку - 60 символів. Значить сторінка містить 40x60 = 2400 байт інформації. Обсяг всієї інформації в книзі 2400 х 150 = 360 000 байт ..
Для вимірювання великих обсягів інформації використовуються наступні похідні від байта одиниці:
1 кілобайт = 1Кб = 210 байт = 1024 байта.
1 мегабайт = 1 Мб = 210 КБ = 1024 КБ.
1 гігабайт = 1Гб = 210 Мб = 1024 Мб.
Прийом-передача інформації можуть відбуватися з різною швидкістю. Кількість інформації, що передається за одиницю часу, є швидкість передачі інформації або швидкість інформаційного потоку.
Очевидно, ця швидкість виражається в таких одиницях, як біт в секунду (біт / с), байт в секунду (байт / с), кілобайт в секунду (Кбайт / с) і т. Д.
Змістовний підхід до вимірювання інформації. | Дискретне представлення інформації: двійкові числа; двійкове кодування тексту в пам'яті комп'ютера. Інформаційний обсяг тексту.
Квиток № 2 | Подання (кодування) чисел | Дискретне представлення інформації: кодування кольорового зображення в комп'ютері (растровий підхід). Подання та обробка звуку і відеозображення. Поняття мультимедіа. | кодування зображень | Двійкове кодування звуку | подання відеоінформації | Процес передачі інформації, джерело і приймач інформації, канал передачі інформації. Швидкість передачі інформації. | Квиток № 6 | циклічний алгоритм | розгалужується алгоритм |