Читайте также:
|
|
Через безумовний пріоритет двійкової системи числення при внутрішньому представленні інформації в комп’ютері кодування “зовнішніх” символів ґрунтується на зіставленні кожному з них певної групи двійкових знаків. При цьому з технічних міркувань і з міркувань зручності кодування-декодування слід користуватися рівномірними кодами, тобто двійковими групами рівної довжини.
Спробуємо підрахувати найбільш коротку довжину такої комбінації з погляду людини, зацікавленої у використанні лише одного природного алфавіту – скажімо, англійської: 26 букв слід помножити на 2 (прописні і рядкові) – разом 52; 10 цифр; 10 роздільних знаків (три види дужок, пропуск і ін.), знаки звичних математичних дій, декілька спеціальних символів (типу #, $, & і ін.) – разом ~ 100. Точний підрахунок тут не потрібний, оскільки нам належить вирішити просту задачу: маючи, скажімо, рівномірний код з груп по N двійкових знаків, скільки можна утворити різних кодових комбінацій. Відповідь очевидна К = 2N. Отже, при N = 6 – К = 64 – явно мало, при N = 7 – К = 128 – цілком достатньо.
Проте, для кодування декількох (хоч би двох) природних алфавітів (плюс всі відмічені вище знаки) і цього недостатньо. Мінімальне достатнє значення N в цьому випадку 8; маючи 256 комбінацій двійкових символів, цілком можна вирішити вказану задачу. Оскільки 8 двійкових символів складають 1 байт, то говорять про системи “байтового” кодування.
Найбільш поширені дві такі системи: Розширений двійково-десятковий код обмінну чисел – EBCDIC (Extended Binary Coded Decimal Interchange) і Американський стандарт кодів інформаційного обміну ASCII (American Standard Code Information Interchange).
Перша – історично тяжіє до “великих” машин, друга частіше використовується на міні- і МІКРО-ЕОМ (включаючи персональні комп’ютери). Ознайомимося докладніше саме з ASCII, створеною в 1963 р.
У своїй первинній версії це – система семибітового кодування. Вона обмежувалася одним природним алфавітом (англійським), цифрами і набором різних символів, включаючи “символи машинки”, що пише, (звичні розділові знаки, знаки математичних дій і ін.) і символи, що “управляють”. Приклади останніх легко знайти на клавіатурі комп’ютера: для МІКРО-ЕОМ, наприклад, DEL – знак видалення символу.
У наступній версії фірма IBM перейшла на розширене 8-бітове кодування. У ній перші 128 символів співпадають з початковими і мають коди із старшим бітом рівним нулю, а решта кодів віддана під букви деяких європейських мов, в основі яких лежить латиниця, грецькі букви, математичні символи (скажімо, знак квадратного кореня) і символи псевдографіки. За допомогою останніх можна створювати таблиці, нескладні схеми і ін.
У табл. кодування ASCII та її більш поширеному в комп’ютеризованих системах варіанті Windows – 1251 використовується застосовне в наший країні модифіковане альтернативне кодування. У одну частину входять початкові коди ASCII; у другу частину (розширення ASCII) вставлені букви кирилиці (не співпадаючі по написанню з англійськими), грецькі букви, деякі спецсимволи.
Знакам алфавіту ПК ставляться у відповідність шістьнадцатькові числа за правилом: перша – номер стовпця, друга – номер рядка. Наприклад: англійська ‘А’ – код 41, українська ‘и’ – код А8. Звернемо увагу, що тут А – шістьнадцатькове число.
Дата добавления: 2015-04-12; просмотров: 78 | Поможем написать вашу работу | Нарушение авторских прав |