Двійкове кодування
Представлення інформації в двійковій системі використовувалося людиною з давніх часів. Так, жителі островів Полінезії передавали необхідну інформацію за допомогою барабанів: чергування дзвінких і глухих ударів. Звук над поверхнею води поширювався на досить велику відстань, таким чином В«працювавВ» полінезійський телеграф. У телеграфі в XIX-XX століттях інформація передавалася за допомогою азбуки Морзе - у вигляді послідовності з точок і тире. Часто ми домовляємося відкривати вхідні двері тільки по В«умовному сигналуВ» - комбінації коротких і довгих дзвінків. Самюел Морзе в 1838 р. винайшов код - телеграфну абетку - систему кодування символів короткими і довгими посилками для передачі їх по лініях зв'язку, відому як В«код МорзеВ» або В«морзянкаВ». Сучасний варіант міжнародного В«коду МорзеВ» (International Morse) з'явився порівняно недавно - в 1939 році, коли було проведене останнє коректування. Своя система існує і в обчислювальній техніці - вона називається двійковим кодуванням і заснована на представленні даних послідовністю всього двох знаків: 0 та 1. Ці знаки називаються двійковими цифрами, по-англійськи - binary digit або скорочено bit (біт). Одним бітом можуть бути виражені два поняття: 0 або 1 (так чи ні, чорне або біле, істина чи брехня і т.п.).
Кодування чисел
Питання про кодування чисел виникає з тієї причини, що в машину можна або нераціонально вводити числа в тому вигляді, в якому вони зображаються людиною на папері. По-перше, потрібно кодувати знак числа. По-друге, з різних причин, які будуть розглянуті нижче, доводиться іноді кодувати і іншу частину числа. Кодування цілих чисел проводитися через їх представлення в двійковій системі числення: саме в цьому вигляді вони і поміщаються в комірці. Один біт відводитися при цьому для представлення знака числа (нулем кодується знак "плюс", одиницею - "Мінус"). Для кодування дійсних чисел існує спеціальний формат чисел з плаваючою комою. Число при цьому представляється у вигляді: N = M * q p , де M - мантиса, p - порядок числа N, q - основа системи числення. Якщо при цьому мантиса M задовольняє умову 0,1 <= | M | <= 1 то число N називають нормалізованим.
Кодування тексту
Для кодування букв і інших символів, що використовуються в друкованих документах, необхідно закріпити за кожним символом числовий номер - код. В англомовних країнах використовуються 26 прописних і 26 рядкових букв (A ... Z, a ... z), 9 розділових знаків (.,:! ";? ()), Пробіл, 10 цифр, 5 знаків арифметичних дій (+, -, *, /, ^) І спеціальні символи (№,%, _, #, $, &,>, <, |, ) - всього трохи більше 100 символів. Таким чином, для кодування цих символів можна обмежитися максимальним 7-розрядним двійковим числом (від 0 до 1111111, в десятковій системі числення - від 0 до 127).
Кодування графічної інформації
У відеопам'яті знаходиться двійкова інформація про зображення, що виводиться на екран. Майже всі створювані, оброблювані або переглядаються за допомогою комп'ютера зображення можна розділити на дві великі частини - растрову і векторну графіку. Растрові зображення являють собою одношарову сітку точок, званих пікселями (Pixel, від англ. Picture element). Код піксела містить інформації про його кольорі. На противагу растровій графіці векторне зображення багатошарово. Кожен елемент векторного зображення - лінія. Кожен елемент векторного зображення є об'єктом, який описується за допомогою математичних рівнянні. Складні об'єкти (ламані лінії, різні геометричні фігури) представляються у вигляді сукупності елементарних графічних об'єктів.
Кодування звуку
На комп'ютері працювати зі звуковими файлами почали в 90-х роках. В основі цифрового кодування звуку лежить - процес перетворення коливань повітря в коливання електричного струму і подальша дискретизація аналогового електричного сигналу. Кодування і відтворення звукової інформації здійснюється за допомогою спеціальних програм (редактор звукозапису).
Тимчасова дискретизація - спосіб перетворення звуку в цифрову форму шляхом розбивання звукової хвилі на окремі маленькі тимчасові ділянки де амплітуди цих ділянок квантуються (Їм присвоюється певне значення). Це здійснюється за допомогою аналого-цифрового перетворювача, розміщеного на звуковій платі. Таким чином, безперервна залежність амплітуди сигналу від часу замінюється дискретної послідовністю рівнів гучності. Сучасні 16-бітові звукові карти кодують 65536 різних рівнів гучності або 16-бітну глибину звуку (кожному значенню амплітуди звук. сигналу присвоюється 16-бітний код) Якість кодування звуку залежить від:
1. глибини кодування звуку - кількість рівнів звуку
2. частоти дискретизації - кількість змін рівня сигналу в одиницю
У чому різниця між кодуванням і шифруванням?
Шифрування - це спосіб зміни повідомлення, яке забезпечує приховування його вмісту. Кодування - це перетворення звичайного, зрозумілого, тексту в код. При цьому мається на увазі, що існує взаємно однозначна відповідність між символами тексту і символьного коду - в цьому принципова відмінність кодування від шифрування.
Теорія кодування - це розділ теорії інформації , пов'язаний із завданнями кодування та декодування повідомлень, що надходять до споживачів і посилаються з джерел інформації.
Теорія кодування близька до найдавнішого мистецтва тайнопису - криптографії. Над розробкою різних шифрів трудилися багато відомі вчені: філософ Ф. Бекон, математики Д. Кардано, Д. Валліс. Одночасно з розвитком методів шифровки розвивалися прийоми розшифровки, або криптоаналізу. В середині ХIХ в. ситуація змінилася. Винахід телефону і іскрового телеграфу поставило перед вченими та інженерами проблему створення нової теорії кодування. Першою орієнтованої на техніку системою кодування виявилася азбука Морзе, в якої прийнято троїчну кодування (крапка, тире, пауза).
Двійкове кодування - один із поширених способів подання інформації. В обчислювальних машинах, в роботах і верстатах з числовим програмним управлінням, як правило, вся інформація, з якою має справу пристрій, кодується у вигляді слів двійкового алфавіту.
Двійковий алфавіт складається з двох цифр 0 та 1.
Цифрові ЕОМ (Персональні комп'ютери відносяться до класу цифрових) використовують двійкове кодування будь-якої інформації. В основному це пояснюється тим, що побудувати технічний пристрій, безпомилково розрізняє 2 різних стану сигналу, технічно виявилося простіше, ніж те, яке б безпомилково розрізняло 5 або 10 різних станів.
До недоліків двійкового кодування відносять дуже довгі записи двійкових кодів, що ускладнює роботу з ними.
Двійкове кодування символьної (текстової) інформації
Основна операція, вироблена над окремими символами тексту - порівняння символів. При порівнянні символів найбільш важливими аспектами є унікальність коду для кожного символу і довжина цього коду, а сам вибір принципу кодування практично не має значення. Для кодування текстів використовуються різні таблиці перекодування. Важливо, щоб при кодуванні і декодуванні одного і того ж тексту використовувалася одна і та ж таблиця. Таблиця перекодування - таблиця, що містить впорядкований певним чином перелік кодованих символів, відповідно до якої відбувається перетворення символу в його двійковий код і назад. Найбільш популярні таблиці перекодування: ДКОИ-8, ASCII, CP1251, Unicode. Історично склалося, що в якості довжини коду для кодування символів було вибрано 8 біт або 1 байт. Тому найчастіше одному символу тексту, що зберігається в комп'ютері, відповідає один байт пам'яті. Р...