Двійкове кодування текстової. Двійкове кодування текстової інформації

Починаючи з кінця 60-х років, комп'ютери все більше стали використовуватися для обробки текстової інформації і в даний час велика частина персональних комп'ютерів в світі (і найбільший час) зайнято обробкою саме текстової інформації.

Традиційно для кодування одного символу використовується кількість інформації, рівне 1 байту, тобто I = 1 байт = 8 бітів.

Для кодування одного символу потрібно 1 байт інформації.

Якщо розглядати символи як можливі події, то можна обчислити, скільки різних символів можна закодувати:
N = 2 I = 2 8 = 256.

Така кількість символів цілком достатньо для представлення текстової інформації, включаючи великі та малі літери російського і латинського алфавіту, цифри, знаки, графічні символи та ін.

Кодування полягає в тому, що кожному символу ставиться у відповідність унікальний десятковий код від 0 до 255 або відповідний йому двійковий код від 00000000 до 11111111. Таким чином, людина розрізняє символи за їх накресленням, а комп'ютер - за їх кодами.

При введенні в комп'ютер текстової інформації відбувається її двійкове кодування, зображення символу перетворюється в його двійковий код. Користувач натискає на клавіатурі клавішу з символом, і в комп'ютер надходить певна послідовність з восьми електричних імпульсів (двійковий код символу). Код символу зберігається в оперативній пам'яті комп'ютера, де займає один байт.

У процесі виведення символу на екран комп'ютера проводиться зворотний процес - декодування, тобто перетворення коду символу в його зображення.

Важливо, що присвоєння символу конкретного коду - це питання угоди, яке фіксується в кодової таблиці. Перші 33 коду (з 0 по 32) відповідають не символ, а операціями (переклад рядка, введення прогалини і так далі).
Коди з 33 по 127 є інтернаціональними і відповідають символам латинського алфавіту, цифрам, знакам арифметичних операцій та знаків пунктуації.
Коди з 128 по 255 є національними, тобто в національних кодуваннях одного й того ж коду відповідають різні символи.

На жаль, в даний час існують п'ять різних кодових таблиць для російських букв (КОІ8, СР1251, ср866, Mac, ISO), тому тексти, створені в одному кодуванні, що не будуть правильно відображатися в іншій.

В даний час широке поширення отримав новий міжнародний стандарт Unicode, який відводить на кожен символ не один байт, а два, тому з його допомогою можна закодувати НЕ 256 символів, а N = 2 16 = 65536 різних символів.

З розвитком IBM PC міжнародним стандартом стала таблиця кодів ASCII:

Сьогодні дуже багато людей для підготовки листів, документів, статей, книг та ін. Використовують комп'ютерні текстові редактори. Комп'ютерні редактори, в основному, працюють з алфавітом розміром 256 символів.

Нехай невелика книжка, зроблена за допомогою комп'ютера, содердітся 150 страни; на кожній сторінці - 40 рядків, в кожному рядку - 60 символів. Значить сторінка містить 40 х 60 = 2400 байт інформації. Обсяг всієї інформації в книзі 2400 х 150 = 360 000 байт.

Зверніть увагу! Цифри кодуються за стандартом ASCII в двох випадках - при введенні-виведенні і коли вони зустрічаються в тексті. Якщо цифри беруть участь в висіленіях, то здійснюється їх перетворення в інший двійковий код.

Візьмемо число 57.

При використанні в тексті кожна буква буде представлена своїм кодом у відповідності з таблицею ASCII. У двійковій системі - це 00110101 00110111.

При використанні в обчисленнях, код цього числа буде отримано за правилами перекладу в двійкову систему і отримаємо - 00111001.

Присвоєння символу конкретного коду - це питання угоди, яке фіксується в кодової таблиці.

При введенні в комп'ютер текстової інформації відбувається її двійкове кодування. Користувач натискає на клавіатурі клавішу з символом, а в комп'ютер надходить його двійковий код (послідовність з восьми електричних імпульсів). Код символу зберігається в оперативній пам'яті комп'ютера, де займає 1 байт.

При виведенні символу на екран відбувається зворотний процес - декодування, тобто перетворення коду символу в його зображення.

7. Аналоговий і дискретний способи вистави зображень і звуку

Інформація, в тому числі графічна і звукова, може бути представлена в аналогової і дискретної формі. при аналоговому поданні фізична величина приймає безліч значень, причому її значення змінюються безперервно. при дискретно поданні фізична величина приймає кінцеве безліч значень, причому величина змінюється стрибкоподібно. Приклади аналогового і дискретного уявлень інформації поміщені в таблиці 3.

Таблиця 3. Приклади аналогового і дискретного уявлень інформації

Перетворення графічної і звукової інформації з аналогової форми в дискретну проводиться шляхом дискретизації, Тобто розбиття безперервного графічного зображення (звукового сигналу) на окремі елементи. В процесі дискретизації проводиться кодування, тобто присвоєння кожному елементу конкретного значення в формі коду.

дискретизація - це перетворення безперервних зображень і звуку в набір дискретних значень у формі коду.

8. Двійкове кодування графічної інформації.

У процесі кодування зображення проводиться просторова дискретизація. Просторову дискретизацію зображення можна порівняти з побудовою зображення з мозаїки. Зображення розбивається на окремі дрібні фрагменти (точки), кожному з яких присвоюється код кольору.

Якість кодування залежить від розміру точки (чим менше розмір точки, тим якість вища) і від кольорової палітри - кількості квітів (чим більше кількість, тим вище якість зображення).

Формування растрового зображення.

Графічна інформація на екрані монітора являє собою растрове зображення, Яке формується з певної кількості рядків, що містять певну кількість точок - пікселів.

Якість зображення визначається роздільною здатністю монітора, наприклад, 800 * 600, 1280 * 1024. Чим більше роздільна здатність, тим вище якість зображення.

Розглянемо формування на екрані монітора растрового зображення з роздільною здатністю 800 * 600 (800 точок на 600 рядків, разом 480 000 точок на екрані). У найпростішому випадку (чорно-біле зображення без градацій сірого кольору) - кожна точка може мати одне з двох станів - "чорна" або "біла", тобто для зберігання її стану необхідно 1 біт. Таким чином, обсяг чорно-білого зображення (кількість інформації) дорівнює:

<Количество информации> = <Разрешающая способность>* 1 (біт)

Кольорові зображення формуються відповідно до двійковим кодом кольору кожної точки (зберігається в відеопам'яті). Кольорові зображення можуть мати різну глибину кольору, яка задається кількістю бітів, використовуваних для кодування кольору, наприклад: 8, 16, 24 або 32 біта.

Якість двійкового кодування зображення визначається роздільною здатністю і глибиною кольору (Див. таблицю 4).

Кількість квітів N може бути обчислено за формулою: N=2 i , Де i - глибина кольору.

Таблиця 4. Глибина кольору і кількість кольорів.

Кольорове зображення на екрані монітора формується за рахунок змішування базових кольорів: червоного, зеленого і синього. Для отримання багатої палітри кольорів базових кольорів можуть бути задані різні інтенсивності. Наприклад, при глибині кольору в 24 біта на кожен з кольорів виділяється по 8 біт, тобто для кожного з квітів можливі N = 2 8 = 256 рівнів інтенсивності, задані двійковими кодами від мінімальної 00000000 до максимальної 11111111 (Див. таблицю 5).

Таблиця 5. Формування деяких квітів при глибині кольору 24 біта.

Назва	інтенсивність

завдання2 1. (Завдання A20 демоверсії 2005 року, А17 демоверсії 2006 року)

Для зберігання растрових зображень розміром 128 * 128 пікселів відвели 4 кілобайти пам'яті. Яке максимально можливе число квітів в палітрі зображення?

У нашому випадку:

Підставивши значення (8) і (9) в (5), отримаємо, що: 2 15 = 2 14 * i, звідки i = 2.

Тоді за формулою (6):<Количество цветов> = N = 2 i = 2 2 = 4, що відповідає відповіді №4.

В якості міжнародного стандарту прийнята кодова таблиця ASCII (American Standard Code for Information Interchange), що кодує першу половину символів з числовими кодами від 0 до 127 (коди від 0 до 32 відведені не символ, а функціональних клавіш) .кодовая таблиця ASCII

У другій половині містяться коди національних алфавітів, символи псевдографіки і деякі математичні знаки. На жаль, в даний час існують п'ять різних кодувань кирилиці (КОІ8-Р, Windows, MS-DOS, Macintosh і ISO), що викликає додаткові труднощі при роботі з російськомовними документами.

Хронологічно одним з перших стандартів кодування російських букв на комп'ютерах був КОІ8.КОІ8 Це кодування застосовувалася ще в 70-ті роки на комп'ютерах серії ЄС ЕОМ, а з середини 80-х стала використовуватися в перших русифікованих версіях операційної системи UNIX.

Не один байт, а два Наприкінці 90-их років з'явився новий міжнародний стандарт Unicode, який відводить під один символ не один байт, а два, і тому з його допомогою можна закодувати НЕ 256, а різних символів. Повна специфікація стандарту Unicode включає в себе всі існуючі, вимерлі і штучно створені алфавіти світу, а також безліч математичних, музичних, хімічних та інших символів.

Комп'ютерна графіка - розділ інформатики, предметом якого є робота на комп'ютері з графічними зображеннями. Створення і зберігання графічних зображень можливо в декількох видах - у вигляді растрового, векторного або фрактального зображення.

Растрові зображення представляються у вигляді сітки (растра), осередки якої називаються пікселями. Кожен піксель (осередок сітки) має певне положення і колір (колірне значення). РастровиеВекторние Векторне зображення формується з математичних ліній (прямих і кривих), які називаються векторами. Зовнішній вигляд зображення визначається геометричними характеристиками векторів. Векторні зображення кодуються математичними формулами.

Роздільна здатність екрану - розмір сітки растра, що задається у вигляді твору M x N, де M - число точок по горизонталі, N - число точок по вертикалі. Чим роздільна здатність вище, тим вище якість зображення. Число кольорів, відтворених на екрані і число біт, що відводяться в відеопам'яті під кожен піксель (глибина кольору) пов'язані формулою: 2 a = K де a - глибина кольору K - кількість квітів

Відеопам'ять - оперативна пам'ять, що зберігає відеоінформацію під час її відтворення на екрані. Обсяг займаної відеопам'яті обчислюється за формулою: V = M × N × a де V - об'єм відеопам'яті M - число точок по горизонталі N - число точок по вертикалі a - глибина кольору