загрузка...
загрузка...
На головну

Символьне кодування інформації.

  1. Базові властивості безпеки інформації. Канали реалізації загроз
  2. Біполярний кодування AMI
  3. Питання 1 Поняття системи маркетингової інформації.
  4. ГЛАВА 9. Кодування і мультиплексування даних
  5. Декодування (розуміння) значень пропозиції
  6. Декодування (розуміння) змісту слів
  7. Декодування художнього тексту за допомогою лексичного аналізу. тематична сітка

3.1. коди символів

У кожного комп'ютера є набір символів, який він використовує. Як мінімум цей набір включає 26 великих і 26 малих літер, цифри від 0 до 9, а також деякі спеціальні символи: пробіл, точка, кома, мінус, символ повернення каретки і т. Д.

Для того щоб передавати ці символи в комп'ютер, кожному з них пріпі-

Сива номер: наприклад, а = 1, Ь = 2, ..., z = 26, + = 27, - = 28. Відображення символів в цілі числа називається кодом символів. Важливо відзначити, що пов'язані між собою комп'ютери повинні мати один і той же код, інакше вони не зможуть обмінюватися інформацією. З цієї причини були розроблені стандарти. Нижче ми розглянемо два найбільш важливих з них.

3.2.ASCII

Один широко поширений код називається ASCII (American Standard Code for Information Interchange - американський стандартний код для обміну інформацією) Кожен символ ASCII-коду містить 7 бітів, таким чином, всього може бути 128 символів (табл. 2 5) Коди від 0 до 1F ( в шестіадцатерічной системі числення) відповідають керуючим символам, що не друкуються.

Багато недруковані символи ASCII призначені для передачі даних. Наприклад, послання може складатися з символу початку заголовка SOH (Start of Header), самого заголовка, символу початку тексту STX (Start of Text), самого тексту, символу кінця тексту ЕТХ (End of Text) і, нарешті, символу кінця передачі EOT ( End of Transmission). Однак на практиці послання, що відправляються по телефонних лініях і мережах, форматуються по-іншому, так що недруковані символи передачі ASCII практично не використовуються.

Друковані символи ASCII наочні, вони включають великі та маленькі літери регістрів, цифри, знаки пунктуації та деякі математичні символи.

3.3.UNICODE

Комп'ютерна промисловість розвивалася переважно в США, що призвело до появи коду ASCII. Цей код підходить для англійської мови, але не дуже зручний для інших мов. У французькій мові є надрядкові знаки (наприклад, systeme), в німецькому - умляути (наприклад, far) і т. Д. У деяких європейських мовах є кілька букв, яких немає в ASCII, наприклад, німецьке 3 або данське 0. Деякі мови мають зовсім інший алфавіт (наприклад, російська або арабська), а у деяких взагалі немає алфавіту (наприклад, китайський). Комп'ютери поширилися по всьому світу, і постачальники програмного забезпечення хочуть реалізовувати свою продукцію не тільки в англомовних, а й в тих країнах, де більшість користувачів не говорять по-англійськи і де

потрібен інший набір символів.

Першою спробою розширення ASCII був IS 646, який додавав до ASCII

ще 128 символів, в результаті чого вийшов 8-бітний код під назвою Latin-1.

Додані були в основному латинські букви зі штрихами і умляутами. Наступною спробою був IS 8859, який ввів поняття кодова сторінка. Кодова сторінка - набір з 256 символів для певної мови або групи мов. IS 8859-1 - це Latin-1. IS 8859-2 включає слов'янські мови з латинським алфавітом (наприклад, чеська, польська та угорська). IS 8859-3 містить символи турецького, мальтійського, есперанто і галісійської мов і т. Д. Головним недоліком такого підходу є те, що програмне забезпечення має стежити, з якою саме кодовою сторінкою воно має справу в даний момент, і при цьому неможливо змішувати мови . До того ж ця система не охоплює японська і китайська мови.

Група комп'ютерних компаній дозволила цю проблему, створивши нову систему під назвою UNICODE, і оголосила цю систему міжнародного стандарту (IS 10646). UNICODE підтримується деякими мовами програмування (наприклад, Java), деякими операційними системами (наприклад, Windows NT) і багатьма додатками. Ймовірно, ця система буде поширюватися по всьому світу.

Основна ідея UNICODE - приписувати кожному символу єдине постійне 16-бітове значення, яке називається покажчиком коду. Багатобайтові символи і escape-послідовності не використовуються. Оскільки кожен символ складається з 16 бітів, писати програмне забезпечення набагато простіше. Так як символи UNICODE складаються з 16 бітів, всього виходить 65 536 кодових покажчиків. Оскільки у всіх мовах світу в цілому близько 200 000 символів, кодові покажчики є дуже мізерним ресурсом, який потрібно розподіляти з великою обережністю. Близько половини кодів вже розподілено, і консорціум, який розробив UNICODE, постійно розглядає пропозиції щодо розподілу решти. Щоб прискорити прийняття UNICODE, консорціум використовував Latin-1 в якості кодів від 0 до 255, легко перетворюючи ASCII в UNICODE.

З метою уникнення надмірної розтрати кодів кожен діакритичний знак має

свій власний код. А поєднання діакритичних знаків з буквами - завдання програмного забезпечення. Вся сукупність кодів розділена на блоки, кожен блок містить 16 кодів. Кожен алфавіт в UNICODE має ряд послідовних зон. Наведемо деякі приклади (в дужках вказано число задіяних кодів): латинь (336), грецький (144), російська (256), вірменський (96), іврит (112), деванагарі (128), гурмукі (128), орія (128 ), телугу (128) іканнада (128). Відзначимо, що кожному з цих мов приписано більше кодів, ніж в ньому є літер. Це було зроблено частково тому, що в багатьох мовах у кожної букви є кілька варіантів. Наприклад, кожна буква в англійській мові представлена ??в двох варіантах: там є малі та великі літери. У деяких мовах букви мають три або більше форм, вибір яких залежить від того, де знаходиться буква: на початку, кінці або середині слова.

Крім того, деякі коди були приписані діакритичним знакам (112),

знакам пунктуації (112), підстрочним і наголосами знакам (48), знакам валют (48), математичним символам (256), геометричних фігур (96) і малюнків (192). Потім йдуть символи для китайського, японського та корейського мов. Спочатку йдуть 1024 фонетичних символу (наприклад, катакана і бопомофо), потім ієрогліфи, які використовуються в китайській і японській мовах (20 992), а потім склади корейської мови (11 156).

Щоб користувачі могли створювати нові символи для особливих цілей, існує ще 6400 кодів.

Хоча UNICODE дозволив багато проблем, пов'язаних з інтернаціоналіза-

єю, він все ж не міг дозволити абсолютно всі проблеми. Наприклад, латинський алфавіт впорядкований, а ієрогліфи - немає, тому програма для англійської мови може розташувати слова «cat? і «dog» за алфавітом, порівнявши значення кодів перших букв, а програмі для японської мови потрібні додаткові таблиці, щоб можна було обчислювати, в якому порядку розташовані символи в словнику.

Ще одна проблема полягає в тому, що постійно з'являються нові слова. 50 років тому ніхто не говорив про апплетах, кіберпросторі, гігабайти, лазерах, модеми, «смайликах» або відеоплівках. З появою нових слів в англійській мові нові коди не потрібні. А ось в японському потрібні. Крім нових термінів, необхідно також додати, принаймні, 20 000 нових імен власних і географічних назв (в основному китайських). Шрифт Брайля, яким користуються сліпі, ймовірно, теж повинен бути задіяний. Представники різних професійних кіл також зацікавлені в наявності будь-яких спеціальних знаків. Консорціум по створенню UNICODE розглядає всі нові пропозиції та виносить по ним рішення.

UNICODE використовує один і той же код для символів, які виглядають майже однаково, але мають кілька значень або пишуться трохи по-різному в китайській і японській мовах (як якби англійські текстові процесори завжди писали слово «blue» як «blew», тому що вони вимовляються однаково).

Одні вважають такий підхід оптимальним для економії мізерного запасу кодів, інші розглядають його як англо-саксонський культурний імперіалізм (а ви думали, що приписування символам 16-бітних значень не носить політичного характеру?). Справа ускладнюється тим, що повний японський словник містить 50 000 ієрогліфічних знаків (крім своїх імен), тому при наявності 20 992 кодів доводиться робити вибір і чимось жертвувати. Далеко не всі японці вважають, що консорціум комп'ютерних компаній, навіть якщо деякі з них японські, є ідеальним форумом, щоб приймати рішення, ніж саме потрібно жертвувати.

лекція 6. Основні цифрові логічні схеми.

1. Інтегральні схеми.

2. Комбінаційні схеми.

3. Арифметичні схеми.

У попередніх розділах ми побачили, як реалізувати найпростіші схеми з використанням окремих вентилів. На практиці в даний час схеми дуже рідко конструюються вентиль за вентилем, хоча колись це було поширене. Зараз стандартні блоки представляють собою модулі, які містять ряд вентилів. У наступних розділах ми розглянемо ці стандартні блоки більш докладно і побачимо, як вони використовуються і як їх можна побудувати з окремих вентилів.

 



Попередня   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   Наступна

Мови і сучасні багаторівневі машини | Сучасні багаторівневі машини | Основні принципи розробки сучасних комп'ютерів | Паралелізм на рівні команд | Осередки пам'яті і їх адреси. | Модульне ОЗУ. | Шини інформаційного обміну. | комбінаційні схеми | арифметичні схеми | Засувки, тригери. |

загрузка...
© um.co.ua - учбові матеріали та реферати