Головна

Алфавітний підхід до вимірювання інформації.

  1. Present Simple Виберіть підходящого змісту слово
  2. SNW-підхід до аналізу сильних і слабких сторін фірми
  3. А) Соціологічні підходи до соціальних класів
  4. Автоматизація ділових процесів. Основні підходи до аналізу ділових процесів.
  5. Аксіологічний підхід.
  6. Алгоритм, види алгоритмів. Алгоритмізація пошуку правової інформації.
  7. алфавітний підхід

При алфавітному підході до визначення кількості інформації відволікаються від змісту інформації і розглядають інформаційне повідомлення як послідовність знаків певної знакової системи.

Найпростіше розібратися в цьому на прикладі тексту, написаного на якомусь мові. Для нас зручніше, щоб це була російська мова.

Всі безліч використовуваних в мові символів будемо традиційно називати алфавітом. Зазвичай під алфавітом розуміють тільки букви, але оскільки в тексті можуть зустрічатися знаки пунктуації, цифри, дужки, то ми їх теж включимо в алфавіт. В алфавіт також слід включити і пробіл, тобто пропуск між словами.

Загальна кількість символів алфавіту прийнято називати потужністю алфавіту. Будемо позначати цю величину буквою N. Наприклад, потужність алфавіту з російських букв та зазначених додаткових символів дорівнює 54.

Уявіть собі, що текст до вас надходить послідовно, по одному знаку, немов паперова стрічка, виповзає з телеграфного апарату. Припустимо, що кожен з'являється на стрічці символ з однаковою ймовірністю може бути будь-яким символом алфавіту. Насправді це не зовсім так, але для спрощення приймемо таке припущення.

У кожній черговій позиції тексту може з'явитися будь-який з N символів. Тоді, згідно з відомим нам формулою, кожен такий символ несе I біт інформації, яке можна визначити з рішення рівняння: 2I = 54. Отримуємо: I = 5.755 біт.

Ось скільки інформації несе один символ в російській тексті! А тепер для того, щоб знайти кількість інформації у всьому тексті, потрібно порахувати число символів в ньому і помножити на I.

Порахуємо кількість інформації на одній сторінці книги. Нехай сторінка містить 50 рядків. У кожному рядку - 60 символів. Значить, на сторінці вміщується 50x60 = 3000 знаків. Тоді обсяг інформації буде дорівнює: 5,755 х 3000 = 17265 біт.

При алфавітному підході до вимірювання інформації кількість інформації залежить не від змісту, а від розміру тексту і потужності алфавіту.

При використанні двійкової системи (алфавіт складається з двох знаків: 0 та 1) кожен двійковий знак несе 1 біт інформації. Цікаво, що сама одиниця вимірювання інформації «біт» отримала свою назву від англійського сполучення «binary digit»-« Двійкова цифра ».

Застосування алфавітного підходу зручно перш за все при використанні технічних засобів роботи з інформацією. В цьому випадку втрачають сенс поняття «нові - старі», «зрозумілі - незрозумілі» відомості. Алфавітний підхід є об'єктивним способом вимірювання інформації на відміну від суб'єктивного змістовного підходу.

Найзручніше вимірювати інформацію, коли розмір алфавіту N дорівнює цілій степені двійки. Наприклад, якщо N = 16, то кожен символ несе 4 біти інформації тому, що 24 = 16. А якщо N = 32, то один символ «важить» 5 біт.

Обмеження на максимальний розмір алфавіту теоретично не існує. Однак є алфавіт, який можна назвати достатнім. З ним ми скоро зустрінемося при роботі з комп'ютером. Це алфавіт потужністю 256 символів. В алфавіт такого розміру можна помістити все практично необхідні символи: латинські і російські літери, цифри, знаки арифметичних операцій, всілякі дужки, знаки пунктуації ...

Оскільки 256 = 28, То один символ цього алфавіту «важить» 8 біт. Причому 8 біт інформації - це настільки характерна величина, що їй навіть присвоїли свою назву - байт.

1 байт = 8 біт.

Сьогодні дуже багато людей для підготовки листів, документів, статей, книг та ін. Використовують комп'ютерні текстові редактори. Комп'ютерні редактори, в основному, працюють з алфавітом розміром 256 символів.

У цьому випадку легко підрахувати обсяг інформації в тексті. Якщо 1 символ алфавіту несе 1 байт інформації, то треба просто порахувати кількість символів; отримане число дасть інформаційний обсяг тексту в байтах.

Нехай невелика книжка, зроблена за допомогою комп'ютера, містить 150 сторінок; на кожній сторінці - 40 рядків, в кожному рядку - 60 символів. Значить сторінка містить 40x60 = 2400 байт інформації. Обсяг всієї інформації в книзі 2400 х 150 = 360 000 байт.

У будь-якій системі одиниць виміру існують основні одиниці і похідні від них.

Для вимірювання великих обсягів інформації використовуються наступні похідні від байта одиниці:

1 кілобайт = 1Кб = 210 байт = 1024 байта.

1 мегабайт = 1 Мб = 210 КБ = 1024 КБ.

1 гігабайт = 1Гб = 210 Мб = 1024 Мб.

 Назва  Умовне позначення  Співвідношення з іншими одиницями
 кілобіт  Кбіт  1 Кбіт = 1024 біт = 210 біт ? 1000 біт
 мегабіт  Мбіт  1 Мбіт = 1024 Кбіт = 220 біт ? 1 000 000 біт
 гігабіт  Гбіт  1 Гбіт = 1024 Мбіт = 230 біт ? 1 000 000 000 біт
 кілобайт  Кбайт (КБ)  1 Кбайт = 1024 байт = 210 байт ? 1 000 байт
 мегабайт  Мбайт (Мб)  1 Мбайт = 1024 Кбайт = 220 байт ? 1 000 000 байт
 гігабайт  Гбайт (Гб)  1 Гбайт = 1024 Мбайт = 230 байт ? 1 000 000 000 байт


квиток 5 | квиток 7

квиток 2 | Імовірнісний підхід до вимірювання інформації. | квиток 4 | виконавці алгоритмів | циклічний алгоритм | розгалужується алгоритм | квиток 8 | квиток 9 | Алфавіт мови Паскаль | Реалізація алгоритмічної структури «цикл з параметром» на мові програмування. |

© um.co.ua - учбові матеріали та реферати