Види кодування інформації. Лекція: Кодування інформації. способи кодування

22. Кодування ІНФОРМАЦІЇ

22.1. Загальні відомості

кодування  - подання інформації в альтернативному виді. За своєю суттю кодові системи (або просто коди) аналогічні, в яких елементів кодируемой інформації відповідають кодові позначення. Відмінність полягає в тому, що в шифри присутній змінна частина (ключ), яка для певного вихідного повідомлення при одному і тому ж алгоритмі шифрування може видавати різні шифртекст. У кодових системах змінної частини немає. Тому один і той же вихідне повідомлення при кодуванні, як правило, завжди виглядає однаково 1. Іншою відмінною рисою кодування є застосування кодових позначень (замін) цілком для слів, фраз або чисел (сукупності цифр). Заміна елементів кодируемой інформації кодовими позначеннями може бути виконана на основі відповідної таблиці (на зразок таблиці шіфрозамен) або визначена за допомогою функції або алгоритму кодування.

В якості елементів кодируемой інформації  можуть виступати:

Букви, слова і фрази природної мови;

Різні символи, такі як знаки пунктуації, арифметичні і логічні операції, оператори порівняння і т.д. Слід зазначити, що самі знаки операцій і оператори порівняння - це кодові позначення;

Аудіовізуальні образи;

Ситуації і явища;

Спадкова інформація;

кодові позначення  можуть являти собою:

Букви і поєднання букв природної мови;

Графічні позначення;

Електромагнітні імпульси;

Світлові і звукові сигнали;

Набір і поєднання хімічних молекул;

Кодування може виконуватися в цілях:

Зручності зберігання, обробки і передачі інформації (як правило, закодована інформація може надаватися більш компактно, а також придатна для обробки і передачі автоматичними програмно-технічними засобами);

Зручності інформаційного обміну між суб'єктами;

Наочності відображення;

Ідентифікації об'єктів і суб'єктів;

Приховування секретної інформації;

Кодування інформації буває одно-  і багаторівневим. Прикладом одноуровневого кодування служать світлові сигнали, що подаються світлофором (червоний - стій, жовтий - приготуватися, зелений - вперед). Як багаторівневого кодування можна привести уявлення візуального (графічного) образу як файл фотографії. Спочатку візуальна картинка розбивається на складові елементарні елементи (пікселі), тобто кожна окрема частина візуальної картинки кодується елементарним елементом. Кожен елемент представляється (кодується) у вигляді набору елементарних кольорів (RGB: англ. Red - червоний, green - зелений, blue - синій) відповідною інтенсивністю, яка в свою чергу представляється у вигляді числового значення. Згодом набори чисел, як правило, перетворюються (кодуються) з метою більш компактного представлення інформації (наприклад, в форматах jpeg, png і т.д.). І нарешті, підсумкові числа представляються (кодуються) у вигляді електромагнітних сигналів для передачі по каналах зв'язку або областей на носії інформації. Слід зазначити, що самі числа при програмній обробці надаються згідно з прийнятою системою кодування чисел.

Кодування інформації може бути оборотним  і незворотним. При оборотному кодуванні на основі закодованого повідомлення можна однозначно (без втрати якості) відновити кодуються повідомлення (вихідний образ). Наприклад, кодування за допомогою азбуки Морзе або штрих-коду. При незворотному кодуванні однозначне відновлення вихідного образу неможливо. Наприклад, кодування аудіовізуальної інформації (формати jpg, mp3 або avi) або.

Азбука Морзе  - спосіб кодування символів (букв алфавіту, цифр, знаків пунктуації та ін.) За допомогою послідовності «точок» і «тире». За одиницю часу приймається тривалість однієї точки. Тривалість тире дорівнює трьом точкам. Пауза між елементами одного знака - одна точка (близько 1/25 частки секунди), між знаками в слові - 3 точки, між словами - 7 точок. Названий на честь американського винахідника і художника Семюеля Морзе.

Російська
  літера
Латинська
  літера
код Морзе Російська
  літера
Латинська
  літера
код Морзе символ код Морзе
A A · − Р R · − · 1 · − − − −
Б B − · · · З S · · · 2 · · − − −
В W · − − Т T 3 · · · − −
Г G − − · У U · · − 4 · · · · −
Д D − · · Ф F · · − · 5 · · · · ·
Е (Е) E · Х H · · · · 6 − · · · ·
Ж V · · · − Ц C − · − · 7 − − · · ·
З Z − − · · Ч Ö − − − · 8 − − − · ·
І I · · Ш CH − − − − 9 − − − − ·
Й J · − − − Щ Q − − · − 0 − − − − −
До K − · − ред Ñ − − · − − Крапка · · · · · ·
Л L · − · · И Y − · − − кома · − · − · −
М M − − Ь (ред) X − · · − ? · · − − · ·
Н N − · Е É · · − · · ! − − · · − −
Про O − − − Ю Ü · · − − @ · − − · − ·
П P · − − · Я Ä · − · − Кінець зв'язку (end contact) · · − · −

Ріс.22.1. Фрагмент азбуки Морзе

Спочатку азбука Морзе застосовувалася для передачі повідомлень в телеграфі. При цьому точки і тире передавалися у вигляді електричних сигналів, що проходять по дротах. На даний момент азбуку Морзе, як правило, використовують в місцях, де інші засоби обміну інформацією недоступні (наприклад, в тюрмах).

Цікавий факт пов'язаний з винахідником першої лампочки Томасом Альвою Едісоном (1847-1931 рр.). Він погано чув і спілкувався зі своєю дружиною, Мері Стіуелл, за допомогою азбуки Морзе. Під час залицяння Едісон зробив пропозицію, відстукати слова рукою, і вона відповіла тим же способом. Телеграфний код став звичайним засобом спілкування для подружжя. Навіть коли вони ходили в театр, Едісон клав руку Мері собі на коліно, щоб вона могла «телеграфувати» йому діалоги акторів.

код Бодо  - цифровий 5-бітний код. Був розроблений Емілем Бодо в 1870 р для свого телеграфу. Код вводився прямо клавіатурою, що складається з п'яти клавіш, натискання або ненажатом клавіші відповідало передачі або непередачі одного біта в пятібітном коді. Існує кілька різновидів (стандартів) даного коду (CCITT-1, CCITT-2, МТК-2 та ін.) Зокрема МТК-2 є модифікацією міжнародного стандарту CCITT-2 з додавання букв кирилиці.

керуючі символи
двійковий
  код
десятковий
  код
призначення
01000 8 повернення каретки
00010 2 Переклад рядка
11111 31 букви латинські
11011 27 цифри
00100 4 пропуск
00000 0 букви російські
двійковий
  код
десятковий
  код
Латинська
  літера
Російська
  літера
цифри і
  інші символи
00011 3 A А -
11001 25 B Б ?
01110 14 C Ц :
01001 9 D Д Хто там?
00001 1 E Е З
01101 13 F Ф Е
11010 26 G Г Ш
10100 20 H Х Щ
00110 6 I І 8
01011 11 J Й Ю
01111 15 K До (
10010 18 L Л )
11100 28 M М .
01100 12 N Н ,
11000 24 O Про 9
10110 22 P П 0
10111 23 Q Я 1
01010 10 R Р 4
00101 5 S З "
10000 16 T Т 5
00111 7 U У 7
11110 30 V Ж =
10011 19 W В 2
11101 29 X Ь /
10101 21 Y И 6
10001 17 Z З +

Ріс.22.2. Стандарт коду Бодо МТК-2

На наступному малюнку показана телетайпна перфолента з повідомленням, переданим за допомогою коду Бодо.

Мал. 22.3. Перфолента з кодом Бодо

Слід зазначити два цікаві факти, пов'язані з кодом Бодо.

1. Співробітники телеграфної компанії AT & T Гільберта Вернам і Мейджор Джозеф Моборн в 1917 р запропонували ідею автоматичного шифрування телеграфних повідомлень на основі коду Бодо. Шифрування виконувалося.

2. Відповідність між англійською та російською алфавітами, прийняте в МТК-2, було використано при створенні комп'ютерних кодувань КОИ-7 і КОИ-8.

ASCII і Unicode.

ASCII (англ. American Standard Code for Information Interchange) - американська стандартна кодировочная таблиця для друкованих та керуючих символів. Спочатку була розроблена як 7-бітна для подання 128 символів, при використанні в комп'ютерах на символ виділялося 8 біт (1 байт), де 8-ий біт служив для контролю цілісності (біт парності). Пізніше, із задіянням 8 біта для подання додаткових символів (всього 256 символів), наприклад букв національних алфавітів, стала сприйматися як половина 8-бітної. Зокрема на основі ASCII були розроблені кодування, що містять букви російського алфавіту: для операційної системи MS-DOS - cp866 (англ. Code page - кодова сторінка), для операційної системи MS Windows - Windows 1251, для різних операційних систем - ЯКІ-8 ( код обміну інформацією, 8 бітів), ISO 8859-5 та інші.

Кодування ASCII додаткові символи
двійковий
  код
десятковий
  код
символ двійковий
  код
десятковий
  код
символ двійковий
  код
десятковий
  код
символ двійковий
  код
десятковий
  код
символ
00000000 0 NUL 01000000 64 @ 10000000 128 Ђ 11000000 192 А
00000001 1 SOH 01000001 65 A 10000001 129 Ѓ 11000001 193 Б
00000010 2 STX 01000010 66 B 10000010 130 11000010 194 В
00000011 3 ETX 01000011 67 C 10000011 131 ѓ 11000011 195 Г
00000100 4 EOT 01000100 68 D 10000100 132 11000100 196 Д
00000101 5 ENQ 01000101 69 E 10000101 133 11000101 197 Е
00000110 6 ACK 01000110 70 F 10000110 134 11000110 198 Ж
00000111 7 BEL 01000111 71 G 10000111 135 11000111 199 З
00001000 8 BS 01001000 72 H 10001000 136 11001000 200 І
00001001 9 HT 01001001 73 I 10001001 137 11001001 201 Й
00001010 10 LF 01001010 74 J 10001010 138 Љ 11001010 202 До
00001011 11 VT 01001011 75 K 10001011 139 11001011 203 Л
00001100 12 FF 01001100 76 L 10001100 140 Њ 11001100 204 М
00001101 13 CR 01001101 77 M 10001101 141 Ќ 11001101 205 Н
00001110 14 SO 01001110 78 N 10001110 142 Ћ 11001110 206 Про
00001111 15 SI 01001111 79 O 10001111 143 Џ 11001111 207 П
00010000 16 DLE 01010000 80 P 10010000 144 ђ 11010000 208 Р
00010001 17 DC1 01010001 81 Q 10010001 145 11010001 209 З
00010010 18 DC2 01010010 82 R 10010010 146 11010010 210 Т
00010011 19 DC3 01010011 83 S 10010011 147 11010011 211 У
00010100 20 DC4 01010100 84 T 10010100 148 11010100 212 Ф
00010101 21 NAK 01010101 85 U 10010101 149 11010101 213 Х
00010110 22 SYN 01010110 86 V 10010110 150 11010110 214 Ц
00010111 23 ETB 01010111 87 W 10010111 151 - 11010111 215 Ч
00011000 24 CAN 01011000 88 X 10011000 152
11011000 216 Ш
00011001 25 EM 01011001 89 Y 10011001 153 11011001 217 Щ
00011010 26 SUB 01011010 90 Z 10011010 154 љ 11011010 218 ред
00011011 27 ESC 01011011 91 [ 10011011 155 11011011 219 И
00011100 28 FS 01011100 92 \ 10011100 156 њ 11011100 220 Ь
00011101 29 GS 01011101 93 ] 10011101 157 ќ 11011101 221 Е
00011110 30 RS 01011110 94 ^ 10011110 158 ћ 11011110 222 Ю
00011111 31 US 01011111 95 _ 10011111 159 џ 11011111 223 Я
00100000 32
01100000 96 ` 10100000 160
11100000 224 а
00100001 33 ! 01100001 97 a 10100001 161 Ў 11100001 225 б
00100010 34 " 01100010 98 b 10100010 162 ў 11100010 226 в
00100011 35 # 01100011 99 c 10100011 163 Ј 11100011 227 г
00100100 36 $ 01100100 100 d 10100100 164 ¤ 11100100 228 д
00100101 37 % 01100101 101 e 10100101 165 Ґ 11100101 229 е
00100110 38 & 01100110 102 f 10100110 166 ¦ 11100110 230 ж
00100111 39 " 01100111 103 g 10100111 167 § 11100111 231 з
00101000 40 ( 01101000 104 h 10101000 168 Е 11101000 232 і
00101001 41 ) 01101001 105 i 10101001 169 © 11101001 233 й
00101010 42 * 01101010 106 j 10101010 170 Є 11101010 234 до
00101011 43 + 01101011 107 k 10101011 171 « 11101011 235 л
00101100 44 , 01101100 108 l 10101100 172 ¬ 11101100 236 м
00101101 45 - 01101101 109 m 10101101 173 ¬ 11101101 237 н
00101110 46 . 01101110 110 n 10101110 174 ® 11101110 238 про
00101111 47 / 01101111 111 o 10101111 175 Ї 11101111 239 п
00110000 48 0 01110000 112 p 10110000 176 ° 11110000 240 р
00110001 49 1 01110001 113 q 10110001 177 ± 11110001 241 з
00110010 50 2 01110010 114 r 10110010 178 І 11110010 242 т
00110011 51 3 01110011 115 s 10110011 179 і 11110011 243 у
00110100 52 4 01110100 116 t 10110100 180 ґ 11110100 244 ф
00110101 53 5 01110101 117 u 10110101 181 µ 11110101 245 х
00110110 54 6 01110110 118 v 10110110 182 11110110 246 ц
00110111 55 7 01110111 119 w 10110111 183 · 11110111 247 ч
00111000 56 8 01111000 120 x 10111000 184 е 11111000 248 ш
00111001 57 9 01111001 121 y 10111001 185 11111001 249 щ
00111010 58 : 01111010 122 z 10111010 186 є 11111010 250 ь
00111011 59 ; 01111011 123 { 10111011 187 » 11111011 251 и
00111100 60 < 01111100 124 | 10111100 188 ј 11111100 252 ь
00111101 61 = 01111101 125 } 10111101 189 Ѕ 11111101 253 е
00111110 62 > 01111110 126 ~ 10111110 190 ѕ 11111110 254 ю
00111111 63 ? 01111111 127 DEL 10111111 191 ї 11111111 255 я

Мал. 22.4. Кодова сторінка Windows-1251

Unicode - стандарт кодування символів, що дозволяє представити знаки майже всіх письмових мов. Стандарт був запропонований в 1991 р некомерційною організацією «Консорціум Юнікоду» (англ. Unicode Consortium, Unicode Inc.). Застосування цього стандарту дозволяє закодувати більше число символів (чим в ASCII і інших кодуваннях) за рахунок двухбайтового кодування символів (всього 65536 символів). У документах Unicode можуть сусідити китайські ієрогліфи, математичні символи, букви грецького алфавіту, латиниці і кирилиці.

Коди в стандарті Unicode розділені на кілька розділів. Перші 128 кодів відповідають кодуванні ASCII. Далі розташовані розділи букв різних писемностей, знаки пунктуації та технічні символи. Зокрема прописних і рядкових букв російського алфавіту відповідають коди 1025 (Е), 1040-1103 (А-я) і 1105 (е).

шрифт Брайля - рельєфно-крапковий тактильний шрифт, призначений для письма і читання незрячими людьми. Був розроблений в 1824 р французом Луї Брайлем (Louis Braille), сином шевця. Луї у віці трьох років втратив зір, в результаті запалення очей, що почався від того, що хлопчик поранився шорний ножем (подобу шила) в майстерні батька. У віці 15 років він створив свій рельєфно-крапковий шрифт, надихнувшись простотою «нічного шрифту» капітана артилерії Шарля Барб'є (Charles Barbier), який використовувався військовими того часу для читання повідомлень у темряві.

Для зображення символів (в основному букв і цифр) в шрифті Брайля використовуються 6 точок, розташованих у два стовпці, по 3 в кожному.

Мал. 22.5. нумерація точок

Кожному символу відповідає свій унікальний набір опуклих точок. Т.ч. шрифт Брайля являє собою систему для кодування 2 6 = 64 символів. Але присутність в шрифті керуючих символів (наприклад, перехід до букв або цифр) дозволяє збільшити кількість кодованих символів.

керуючі символи
символ
  шрифту
  Брайля
призначення
букви
цифри
Букви, цифри і інші символи
символ
  шрифту
  Брайля
латинські
  літери
Російські
  літери
цифри
A А 1
B Б 2
C Ц 3
D Д 4
E Е 5
F Ф 6
G Г 7
H Х 8
I І 9
J Ж 0
K До
L Л
M М
N Н
O Про
P П
Q Ч
R Р
S З
T Т
U У
V

W В
X Щ
Y

Z З

Е

Й

Ш

ред

И

Ь

Е

Ю

Я
Крапка
кома
Знак питання
Крапка з комою
дефіс

пропуск

Мал. 22.6. шрифт Брайля

Шрифт Брайля, останнім часом, став широко застосовуватися в суспільному житті і побуті в зв'язку з ростом уваги до людей з обмеженими можливостями.


Мал. 22.7. Напис "Sochi 2014" шрифтом Брайля на золоту медаль Паралімпійських ігор 2014.

Штрих код  - графічна інформація, що наноситься на поверхню, маркування або упаковку виробів, що представляє собою послідовність чорних і білих смуг або інших геометричних фігур з метою її зчитування технічними засобами.

У 1948 р Бернард Сільвер (Bernard Silver), аспірант Інституту Технології Університету Дрекселя в Філадельфії, почув, як президент місцевої продовольчої мережі просив одного з деканів розробити систему, автоматично зчитує інформацію про продукт при його контролі. Сільвер розповів про це друзям - Норману Джозефу Вудланд (Norman Joseph Woodland) і Джордін Джохенсону (Jordin Johanson). Утрьох вони почали досліджувати різні системи маркування. Їх перша працююча система використовувала ультрафіолетові чорнило, але вони були досить дороги, а крім того, з часом вицвітають.

Переконаний в тому, що система реалізована, Вудланд покинув Філадельфію і перебрався до Флориди в квартиру свого батька для продовження роботи. 20 жовтня 1949 р Вудланд і Сільвер подали заявку на винахід, яка була задоволена 7 жовтня 1952 р Замість звичних нам ліній патент містив опис штрихкодового системи у вигляді концентричних кіл.

Мал. 22.8. Патент системи Вудланд і Сільвера з концентричними колами, попередниками сучасних штрихкодів

Вперше штрих-коди почали офіційно використовуватися в 1974 р в магазинах м Трой, штат Огайо. Системи штрихового кодування знайшли широке застосування в суспільному житті: торгівля, поштові відправлення, фінансові та судові повідомлення, облік одиниць зберігання, ідентифікація осіб, контактна інформація (веб-посилання, адреси електронної пошти, номери телефонів) і т.д.

Розрізняють лінійні (читаються в одному напрямку) і двовимірні штрих-коди. Кожна з різновидів різниться як розмірами графічного зображення, так і обсягами представленої інформації. У наступній таблиці наведено приклади деяких різновидів штрих-коду.

Таблиця 22.1. різновиди штрихкодів

Найменування Приклад штрих-коду Примітки
лінійні
Universal Product Code, UPC
  (Універсальний код товару)

  (UPC-A)
Американський стандарт штрихкоду, призначений для кодування ідентифікатора товару і виробника.
  Є різновиди:
  - UPC-E - кодуються 8 цифр;
  - UPC-A - кодується 13 цифр.
European Article Number, EAN
  (Європейський номер товару)

  (EAN-13)
Європейський стандарт штрихкоду, призначений для кодування ідентифікатора товару і виробника.
  Є різновиди:
  - EAN-8 - кодуються 8 цифр;
  - EAN 13 - кодується 13 цифр;
  - EAN-128 - кодується будь-яку кількість букв і цифр, об'єднаних в регламентовані групи.
  ДСТУ ISO / IEC 15420-2001 «Автоматична ідентифікація. Кодування штрихове. Специфікація символіки EAN / UPC (ЄАН / ЮПіСі) ».
Code 128
  (Код 128)
Включає в себе 107 символів. З яких 103 символу даних, 3 стартових, і 1 зупинний символ. Для кодування всіх 128-ми символів ASCII передбачено три комплекти символів - A, B і C, які можуть використовуватися всередині одного штрих-коду.
  EAN-128 кодує інформацію за алфавітом Code 128
  ГОСТ 30743-2001 (ISO / IEC 15417-2000) «Автоматична ідентифікація. Кодування штрихове. Специфікація символіки Code 128 (Код 128) ».
двовимірні
DataMatrix
  (Матричні дані)
Максимальна кількість символів, які поміщаються в один код - 2048 байт.
ДСТУ ISO / IEC 16022-2008 «Автоматична ідентифікація. Кодування штрихове. Специфікація символіки Data Matrix ».
QR-код
  (Англ. Quick response - швидкий відгук)
Квадрати в кутах зображення дозволяють нормалізувати розмір зображення і його орієнтацію, а також кут, під яким сенсор відноситься до поверхні зображення. Точки переводяться в двійкові числа з перевіркою контрольної суми.
  Максимальна кількість символів, які поміщаються в один QR-код:
  - цифри - 7089;
  - цифри і букви (латиниця) - 4296;
  - двійковий код - 2953 байт;
  - ієрогліфи - 1817.
MaxiCode
  (Максікод)
Розмір - дюйм на дюйм (1 дюйм = 2.54 см).
  Використовується для грузоотправітельних і вантажоприймальних систем.
  ГОСТ Р 51294.6-2000 «Автоматична ідентифікація. Кодування штрихове. Специфікація символіки MaxiCode (Максікод) ».
PDF147
  (Англ. Portable Data File -
  стерпний файл даних)
Застосовується при ідентифікації особистості, обліку товарів, при здачі звітності до контролюючих органів та інших областях.
  Підтримує кодування до 2710 символів і може містити до 90 рядків.
Microsoft Tag
  (Мітка Microsoft)
Розроблено для розпізнавання за допомогою фотокамер, вбудованих в мобільні телефони.
  Може вмістити в себе стільки ж символів, що Code128.
  Призначений для швидкої ідентифікації та отримання на пристрій заздалегідь підготовленої інформації (веб-посилання, довільного тексту довжиною до 1000 символів, телефонного номера і т.п.), прив'язаною до коду і зберігається на сервері компанії Microsoft.
  Містить 13 байт плюс один додатковий біт для контролю парності.

Подання чисел в двійковому вигляді (в комп'ютері). Як відомо, інформація, що зберігається і обробляється в комп'ютерах, представлена ​​в двійковому вигляді. біт  (Англ. binary digi t  - двійкове число; також гра слів: англ. bit - шматочок, частка) - одиниця вимірювання кількості інформації, що дорівнює одному розряду в двійковій системі числення. За допомогою біта можна закодувати (уявити, розрізняти) два стани (0 або 1; так чи ні). Збільшуючи кількість бітів (розрядів), можна збільшити кількість кодованих станів. Наприклад, для байта (англ. Byte), що складається з 8 бітів, кількість кодованих станів становить 2 8 = 256.

Числа кодуються в т.зв. форматах з фіксованою і плаваючою комою.

1. Формат з фіксованою комою, В основному, застосовується для цілих чисел, але може застосовуватися і для дійсних чисел, у яких фіксоване кількість десяткових знаків після коми. Для цілих чисел мається на увазі, що «кома» знаходиться праворуч після молодшого біта (розряду), тобто поза розрядної сітки. В даному форматі існують два подання: беззнаковое (для невід'ємних чисел) і зі знаком.

для беззнакового  уявлення все розряди відводяться під уявлення самого числа. Наприклад, за допомогою байта можна уявити беззнакові цілі числа від 0 10 до 255 10 (00000000 2 - 11111111 2) або речові числа з одним десятковим знаком від 0.0 10 до 25.5 10 (00000000 2 - 11111111 2). для знакового  уявлення, тобто позитивних і негативних чисел, старший розряд відводиться під знак (0 - позитивне число, 1 - негативне).

Розрізняють прямий, зворотний і додатковий коди записи знакових чисел.

В прямому  коді запис позитивного і негативного числа виконується так само, як і в беззнакову уявлення (за виключення того, що старший розряд відводиться під знак). Таким чином, числа 5 10 і -5 10 записуються, як 00000101 2 і 10000101 2. У прямому коді є два коду числа 0: «позитивний нуль» 00000000 2 і «негативний нуль» 10000000 2.

При використанні зворотного  коду негативне число записується у вигляді інвертованого позитивного числа (0 змінюються на 1 і навпаки). Наприклад, числа 5 10 і -5 10 записуються, як 00000101 2 і 11111010 2. Слід зазначити, що в зворотному коді, як і в прямому, є «позитивний нуль» 00000000 2 і «негативний нуль» 11111111 2. Застосування зворотного коду дозволяє відняти одне число з іншого, використовуючи операцію складання, тобто віднімання двох чисел X - Y замінюється їх сумою X + (-Y). При цьому використовуються два додаткових правила:

Від'ємник число інвертується (подається у вигляді зворотного коду);

Якщо кількість розрядів результату виходить більше, ніж відведено на уявлення чисел, то крайній лівий розряд (старший) відкидається, а до результату додається 1 2.

У наступній таблиці наведено приклади вирахування.

Таблиця 22.2. Приклади віднімання двох чисел з використанням зворотного коду

X - Y 5 – 5 6 – 5 5 – 6 5 – (-6)
X 2 00000101 00000110 00000101 00000101
Y 2 00000101 00000101 00000110 11111001
заміна складанням 5 + (-5) 6 + (-5) 5 + (-6) 5 + 6
Зворотний код для від'ємника (-Y 2) 11111010 11111010 11111001 00000110
додавання 00000101
+
11111010
11111111
00000110
+
11111010
100000000
00000101
+
11111001
11111110
00000101
+
00000110
00001011
не вимагається 00000000
+
00000001
00000001
не вимагається не вимагається
результат -0 1 -1 11

Незважаючи на те, що зворотний код значно спрощує обчислювальні процедури, а відповідно і швидкодію комп'ютерів, наявність двох «нулів» та інші умовності привели до появи додаткового коду. При поданні негативного числа його модуль спочатку інвертується, як в зворотному коді, а потім до інверсії відразу додається 1 2.

У наступній таблиці наведено деякі числа в різному кодовому поданні.

Таблиця 22.3. Подання чисел в різних кодах

десяткове
  уявлення
Код двійкового представлення (8 біт)
прямий зворотний додатковий
127 01111111 01111111 01111111
6 00000110 00000110 00000110
5 00000101 00000101 00000101
1 00000001 00000001 00000001
0 00000000 00000000 00000000
-0 10000000 11111111 ---
-1 10000001 11111110 11111111
-5 10000101 11111010 11111011
-6 10000110 11111001 11111010
-127 11111111 10000000 10000001
-128 --- --- 10000000

При поданні негативних чисел в додаткових кодах друге правило дещо спрощується - якщо кількість розрядів результату виходить більше, ніж відведено на уявлення чисел, то тільки відкидається крайній лівий розряд (старший).

Таблиця 22.4. Приклади віднімання двох чисел з використанням додаткового коду

X - Y 5 – 5 6 – 5 5 – 6 5 – (-6)
X 2 00000101 00000110 00000101 00000101
Y 2 00000101 00000101 00000110 11111010
заміна складанням 5 + (-5) 6 + (-5) 5 + (-6) 5 + 6
Додатковий код для від'ємника (-Y 2) 11111011 11111011 11111010 00000110
додавання 00000101
+
11111011
00000000
00000110
+
11111011
100000001
00000101
+
11111010
11111111
00000101
+
00000110
00001011
Відкидання старшого розряду і додавання 1 2 не вимагається 00000001 не вимагається не вимагається
результат -0 1 -1 11

Можна заперечити, що уявлення чисел в додаткових кодах вимагає на одну операцію більше (після інверсії завжди потрібно складання з 1 2), що може і не знадобитися в подальшому, як в прикладах із зворотними кодами. В даному випадку спрацьовує відомий «принцип чайника». Краще зробити процедуру лінійної, ніж застосовувати в ній правила «Якщо A то B» (навіть якщо воно одне). Те, що з людської точки зору здається збільшенням трудовитрат (обчислювальної та тимчасової складності), з точки зору програмно-технічної реалізації може виявитися ефективніше.

Ще одна з переваг додаткового коду перед зворотним полягає в можливості подання до одиниці інформації на одне число (стан) більше, за рахунок виключення «негативного нуля». Тому, як правило, діапазон представлення (зберігання) для знакових цілих чисел довжиною один байт становить від +127 до -128.

2. Формат з плаваючою комою, В основному, використовується для дійсних чисел. Число в даному форматі представляється в експоненційному вигляді

X = e n * m, (22.1)

де e - підстава показовою функції;
  n - порядок заснування;
  e n - характеристика числа;
  m - мантиса (лат. mantissa - надбавка) - множник, на який треба помножити характеристику числа, щоб отримати саме число.

Наприклад, число десяткове число 350 може бути записано, як 3.5 * 10 2, 35 * 10 1, 350 * 10 0 і т.д. В нормализованной наукової записи, порядок n  вибирається такий, щоб абсолютна величина m  залишалася менше одиниці, але строго менше десяти (1? | m |< 10). Таким образом, в нормализованной научной записи число 350 выглядит, как 3.5 * 10 2 . При отображении чисел в программах, учитывая, что основание равно 10, их записывают в виде m E ± n, Де Е означає «* 10 ^» ( «... помножити на десять в ступені ...»). Наприклад, число 350 - 3.5Е + 2, а число 0.035 - 3.5Е-2.

Так як числа зберігається і обробляється в комп'ютерах в двійковому вигляді, то для цих цілей приймається e = 2. Однією з можливих форм двійкового представлення чисел з плаваючою комою є наступна.

Мал. 22.9. Двійковий формат уявлення чисел з плаваючою комою

Біти bn ± і bm ±, які означають знак порядку та мантиси, кодуються аналогічно числах з фіксованою комою: для позитивних чисел «0», для негативних - «1». Значення порядку вибирається таким чином, щоб величина цілої частини мантиси в десятковому (і відповідно в довічним) поданні дорівнювала «1», що буде відповідати нормализованной записи для двійкових чисел. Наприклад, для числа 350 10 порядок n = 8 10 = 001000 2 (350 = 1.3671875 * 2 8), а для 576 10 - n = 9 10 = 001001 2 (576 = 1.125 * 2 9). Бітове представлення величини порядку може бути виконано в прямому, зворотному або додатковому коді (наприклад, для n = 8 10 бінарний вигляд 001000 2). Величина мантиси відображає дробову частину. Для її перетворення в двійковий вигляд, вона послідовно множиться на 2, поки не стане рівною 0. Наприклад,

Мал. 22.10. Приклад отримання дробової частини в бінарному вигляді

Цілі частини, одержувані в результаті послідовного множення, і являють собою двійковий вид дробової частини (0.3671875 10 = 0101111 2). Частина, що залишилася розрядів величини мантиси заповнюється 0. Таким чином, підсумковий вид числа 350 в форматі з плаваючою комою з врахуванням думки мантиси в нормалізованої записи

Мал. 22.11. Двійковий вид числа 350

У програмно-апаратних реалізаціях арифметичних дій широко поширений стандарт представлення чисел з плаваючою точкою IEEE 2 754  (Остання редакція «754-2008 - IEEE Standard for Floating-Point Arithmetic»). Даний стандарт визначає формати з плаваючими комами для подання чисел одинарної  (Англ. Single, float) і подвійний  (Англ. Double) точності. Загальна структура форматів

Мал. 22.12. Загальний формат уявлення двійкових чисел в стандарті IEEE 754

Формати подання відрізняються кількістю біт (байт), що відводиться для представлення чисел, і, відповідно, точністю подання самих чисел.

Таблиця 22.5. Характеристики форматів представлення двійкових чисел в стандарті IEEE 754

формат single double
Загальний розмір, біт (байт) 32 (4) 64 (8)
Число біт для порядку 8 11
Число біт для мантиси
  (Без урахування знакового біта)
23 52
величина порядку 2 128 .. 2 -127
  (± 3.4 * 10 38 .. 1.7 * 10 -38)
2 1024 .. 2 -1023
  (± 1.8 * 10 308 .. 9.0 * 10 -307)
зсув порядку 127 1023
Діапазон представлення чисел
(Без урахування знака)
± 1.4 * 10 -45 .. 3.4 * 10 38 ± 4.9 * 10 -324 .. 1.8 * 10 308
Кількість значущих цифр числа
  (не більше)
8 16

Особливістю представлення чисел за стандартом IEEE є відсутність біта під знак порядку. Незважаючи на це, величина порядку може приймати як позитивні значення, так і негативні. Цей момент враховується т.зв. «Зміщенням порядку». Після перетворення двійкового виду порядку (записаного в прямому коді) в десятковий від отриманої величини віднімається «зсув порядку». В результаті виходить «справжнє» значення порядку числа. Наприклад, якщо для числа одинарної точності зазначений порядок 11111111 2 (= 25510), то величина порядку насправді 128 10 (= 255 10 - 127 10), а якщо 00000000 2 (= 0 10), то -127 10 (= 0 10 - 127 10).

Величина мантиси вказується, як і в попередньому випадку, в нормалізованому вигляді.

C урахуванням вищевикладеного, число 350 10 в форматі одинарної точності стандарту IEEE 754 записується в такий спосіб.

Мал. 22.13. Двійковий вид числа 350 за стандартом IEEE

До інших особливостей стандарту IEEE відноситься можливість подання спеціальних чисел. До них відносяться значення NaN (англ. Not a Number - не числом) і +/- INF (англ. Infinity - нескінченність), які утворюються в результаті операцій типу поділу на нуль. Також сюди потрапляють денормалізовані числа, у яких мантиса менше одиниці.

На закінчення по числах з плаваючою комою кілька слів про горезвісну « помилку округлення». Оскільки в двійковій формі уявлення числа зберігається тільки декілька значущих цифр, вона не може «покрити» все різноманіття дійсних чисел в заданому діапазоні. В результаті, якщо число неможливо точно уявити в двійковій формі, воно представляється найближчим можливим. Наприклад, якщо до числа типу double «0.0» послідовно додавати «1.7», то можна виявити наступну «картину» зміни значень.

0.0
1.7
3.4
5.1
6.8
8.5
10.2
11.899999999999999
13.599999999999998
15.299999999999997
16.999999999999996
18.699999999999996
20.399999999999995
22.099999999999994
23.799999999999994
25.499999999999993
27.199999999999992
28.89999999999999
30.59999999999999
32.29999999999999
33.99999999999999
35.699999999999996
37.4
39.1
40.800000000000004
42.50000000000001
44.20000000000001
45.90000000000001
47.600000000000016

Мал. 22.14. Результат послідовного додавання числа 1.7 (Java 7)

Інший нюанс виявляється при складанні двох чисел, у яких значно відрізняється порядок. Наприклад, результатом складання 10 10 + 10 -10 буде 10 10. Навіть якщо послідовно трильйон (10 12) раз додавати 10 -10 до 10 10, то результат залишиться тим самим 10 10. Якщо ж до 10 10 додати твір 10 -10 * 10 12, що з математичної точки зору одне і те ж, результат стане 10000000100 (1.0000000100 * 10 10).

генетичний код - властива всім живим організмам кодированная амінокислотна послідовність білків. Кодування виконується за допомогою нуклеотидів 3, що входять до складу ДНК (дезоксирибонуклеїнової кислоти). ДКН - макромолекула, що забезпечує зберігання, передачу з покоління в покоління і реалізацію генетичної програми розвитку і функціонування живих організмів. Мабуть, найголовніший код в історії людства.

У ДНК використовується чотири азотистих підстави - аденін (А), гуанін (G), цитозин (С), тимін (T), які в російськомовній літературі позначаються буквами А, Г, Ц і Т. Ці букви складають алфавіт генетичного коду. У молекулах ДНК нуклеотиди шикуються в ланцюжки і, таким чином, виходять послідовності генетичних букв.

Білки практично всіх живих організмів побудовані з амінокислот всього 20 видів. Ці амінокислоти називають канонічними. Кожен білок є ланцюжком або кілька ланцюжків амінокислот, з'єднаних в строго визначеної послідовності. Ця послідовність визначає будову білка, а, отже, все його біологічні властивості. Синтез білків (тобто реалізація генетичної інформації в живих клітинах) здійснюється на основі інформації, закладеної в ДНК. Для кодування кожної з 20 амінокислот, а також сигналу «стоп», що означає кінець білкової послідовності, достатньо трьох послідовних нуклеотидів (триплетів).


Мал. 22.15. фрагмент ДНК

2 IEEE (англ. Institute of Electrical and Electronics Engineers) - інститут інженерів з електротехніки та електроніки.

3 Містить азотистих основ, поєднане з цукром, і фосфорну кислоту.

22.3. Секретні кодові системи

Секретні коди, як і шифри, призначені для забезпечення конфіденційності інформації. Спочатку секретні кодові системи представляли собою систему, в основі якої лежало подобу жаргонного коду. Вони виникли з метою приховування імен реальних людей, згадуваних в листуванні. Це були невеликі списки, в яких в були записані приховувані імена, а навпроти них - кодові заміни (підстановки). Офіційні коди для приховування змісту повідомлень, якими користувалися папські емісари і посли середземноморських міст-держав, знайдені в ранніх архівах Ватикану, датуються XIV в. У міру зростання потреби в безпеці листування, у представників міст-держав з'явилися більш великі переліки, які включали в себе не тільки кодові заміни імен людей, а й країн, міст, видів зброї, провіанту і т.д. З метою підвищення захищеності інформації до переліків були додані шіфралфавіти для кодування слів, що не увійшли до переліку, а також правила їх використання, що базуються на різних стеганографічних та криптографічних методах. Такі збірники отримали назву « номенклатора». З XV і до середини XIX ст. вони були основною формою забезпечення конфіденційності інформації.

Аж до XVII століття в номенклатора слова відкритого тексту і їх кодові заміни йшли в алфавітному порядку, поки французький криптолог Антуан Россиньоло не запропонував використовувати більш стійкі номенклатора, що складаються з двох частин. У них існувало два розділи: в одному перераховувалися в алфавітному порядку елементи відкритого тексту, а кодові елементи були перемішані. У другій частині в алфавітному порядку йшли переліки кодів, а перемішані були вже елементи відкритого тексту.

Винахід телеграфу і абетки Морзе, а також прокладка трансатлантичного кабелю в середині XIX в. значно розширило сфери застосування секретних кодів. Крім традиційних областей їх використання (в дипломатичному листуванні і в військових цілях) вони стали широко використовуватися в комерції і на транспорті. Секретні кодові системи того часу в своїй назві містили слово « код»(« Код Держдепартаменту (1867 г.) »,« Американський код для окопів »,« Річкові коди: Потомак »,« Чорний код ») або« шифр»(« Шифр ​​Держдепартаменту (1876 г.) »,« Зелений шифр »). Слід зазначити, що, незважаючи на наявність у назві слова «шифр», в основу цих систем було покладено кодування.

Розробники кодів, як і укладачі шифрів, нерідко додавали додаткові ступені захисту, щоб утруднити злом своїх кодів. Такий процес називається перешіфрованіем. В результаті секретні кодові системи поєднували в собі, як стеганографічні, так і криптографічні способи забезпечення конфіденційності інформації. Найбільш популярні з них наведені в таблиці нижче.

Таблиця 22.6. Способи забезпечення конфіденційності інформації в секретних кодових системах

спосіб Тип Примітки приклади
  (Кодуються слово - кодове позначення)
Заміна слова (словосполучення) іншим словом довільної довжини стеганографічний Аналог -.
1. номенклатора міста Сієни (XV ст.): Cardinales (кардинал) - Florenus; Antonello da Furli (Антолло та Фурла) - Forte.

2. Шифр ​​Держдепартаменту 1899 р .: Russia (Росія) - Promotes; Cabinet of Russia (Уряд Росії) - Promptings.

3. Код керівника служби зв'язку (1871 г.): 10:30 - Anna, Ida; 13th (тринадцятий) - Charles, Mason.

Заміна слова (словосполучення) символьним рядком фіксованої довжини стеганографічний Аналог -. 1. Американський код для окопів (1918 р): Patrol (патруль) - RAL; Attack (атака) - DIT.

2. Код Держдепартаменту А-1 (1919 р): Diplomat (дипломат) - BUJOH; Diplomatic corps (дипломатичний корпус) - BEDAC.

Заміна слова (словосполучення) числом стеганографічний Аналог -.
  Для одного кодованого слова могли використовуватися кілька кодових позначень.
1. номенклатора Бенджаміна Толмадж (1779 г.): Defense (оборона) - 143; Attack (атака) - 38.

2. Код мовлення для торгових суден союзників у Другій світовій війні (BAMS): острів - 36979; порт - 985.

Заміна слова (словосполучення) набором цифр фіксованої довжини стеганографічний Аналог -. 1. Американський код для окопів (1918 р): Patrol (патруль) - 2307; Attack (атака) - 1447.

2. Американський службовий радіокод № 1 (1918 р): Oil (масло) - 001; Bad (поганий) - 642.

заміна букв криптографічний Аналоги - шифр,.
  Застосовувалася для слів, відсутніх у списку кодованих.
1. номенклатора міста Сієни (XV ст.): Q -; s -.

2. номенклатора Джеймса Медісона (1781 г.): o - 527; p - 941.

3. Американський код для окопів (1918 р): a - 1 332 .. 2795 або CEW .. ZYR. Містив також 30 алфавітів шіфрозамен для перешіфрованія кодових позначень.

Заміна поєднання букв криптографічний Аналог -.
  Як кодового позначення могли використовуватися літери, числа, графічні позначення.
1. номенклатора міста Сієни (XV ст.): Bb -; tt -.

2. номенклатора X-Y-Z (1737 г.): ce - 493; ab - 1 194.

Використання порожніх знаків стеганографічний Аналог -.
Нічого котрі призначали (лат. Nihil importantes) символи використовувалися для заплутування криптоаналітиків.
1. номенклатора міста Сієни (XV ст.):,.

2. Річкові коди: Потомак (1918 р): ASY.

Використання адитивних чисел криптографічний Аналог -.
  Аддитивное число, яке додається до числовому кодовому позначенню, служило в якості змінної частини коду (ключа).
Шифр Держдепартаменту 1876 р .: правило «Horse» (кінь) на початку повідомлення означало, що при кодуванні наступних кодових позначень використовувалося аддитивное число 203; «Hawk» (яструб) - 100.
Перестановка букв (цифр) в кодових позначеннях криптографічний Аналог -. Телеграфний код для забезпечення секретності при передачі телеграм (1870 г.): одне з правил наказувало перестановку останніх трьох цифр в цифровому кодовому позначенні, що складається з п'яти цифр.
Перестановка кодових позначень криптографічний Аналог -. Шифр Держдепартаменту 1876 р .: правило «Tiger» (тигр) на початку повідомлення означало, що розкодувати повідомлення треба читати з останнього слова по перше (задом-наперед); «Tapir» (тапір) - міняючи місцями кожну пару слів (тобто перше і друге, третє і четверте і т.д.).

Поєднання різних способів кодування і перешифровки в кодової системі було звичайною практикою у розробників кодів і стало застосовуватися практично з самого початку їх появи. Так, ще в номенклаторі, використовувався в м Сієна в XV в., Крім кодових замін слів, застосовувалися для заміни букв, їх і порожніх знаків. Найбільшого розквіту ця практика отримала в кінці XIX - початку XX ст. Зокрема в «шифр Держдепартаменту 1876 г.» (англ. Red Book - Червона книга), що складається з 1200 сторінок, і його додатку «не піддаються декодуванню код: додаток до шифру Держдепартаменту» застосовувалися:

Кодові позначення у вигляді слів і чисел;

10. Види кодування інформації.

Код - умовне позначення об'єкта знаком або групою знаків за певними правилами. Після присвоєння кодів створюється класифікатор - систематизований звід однорідних найменувань та їх кодових позначень. Класифікатори мають подвійне застосування. Перше - для ручного проставлення кодів в документах. У другому випадку застосування кодів передбачається зберігання всіх класифікаторів в пам'яті машини, на машинних носіях. Коди можуть бути цифровими, літерними, буквено-цифровими і складатися з одного або декількох знаків.

кодування інформації - подання відомостей в стандартній формі. Одні і ті ж відомості можуть бути представлені в декількох різних формах, і навпаки, різні відомості можна уявити в схожій формі. Наприклад, можна використовувати словесний опис нової марки автомобіля, а можна уявити його вигляд в декількох детальних фотографіях. Інший приклад - медичні довідки однієї форми мають однаковий зовнішній вигляд, але описують різні хвороби, так як видані різним людям.

З появою комп'ютерів виникла необхідність кодування всіх видів інформації, з якою має справу і окрема людина і все людство в цілому. Але вирішувати завдання кодування інформації людство почало задовго до появи комп'ютерів: грандіозні досягнення людства - писемність і арифметика - не що інше, як системи кодування мови і числовий інформації.

кодування чисел

Щоб використовувати числа, потрібно їх якось називати і записувати, потрібна система нумерації. Різні системи рахунку і записи чисел тисячоліттями співіснували і змагалися між собою, але до кінця "докомпьютерной епохи" особливу роль при рахунку стало грати число "десять", а найпопулярнішою системою кодування виявилася   позиційна десяткова система.  У цій системі значення цифри в числі залежить від її місця (позиції) всередині числа. Десяткова система числення прийшла з Індії (не пізніше VI століття нашої ери). Алфавіт цієї системи: (0, 1, 2, 3, 4, 5, 6, 7, 8, 9) - всього 10 цифр, таким чином, підстава системи числення - 10. Число записується як комбінація одиниць, десятків, сотень, тисяч і так далі. Приклад: 1998 = 8 * 10 0 + 9 * 10 1 + 9 * 10 2 + 1 * 10 3.

У Вавилоні, наприклад, використовувалася 60-річної системі числення, алфавіт містив цифри від 1 до 59, числа 0 не було, таблиці множення були дуже громіздкими, тому дуже скоро вона була забута, але відгомони її колишньої поширеності можна спостерігати і зараз - розподіл години на 60 хвилин, розподіл кола на 360 градусів.

Двійкова система числення

Двійкова система числення була придумана математиками і філософами ще до появи комп'ютерів (XVII - XIX ст.). Пізніше двійкова система була забута, і тільки в 1936 - 1938 роках американський інженер і математик Клод Шеннон знайшов чудові застосування двійкової системи при конструюванні електронних схем.

Існують системи числення, споріднені двійковій. При роботі з комп'ютерами іноді доводиться мати справу з двійковими числами, так як двійкові числа закладені в конструкцію комп'ютера. Двійкова система зручна для комп'ютера, але незручна для людини - занадто довгі числа незручно записувати і запам'ятовувати. На допомогу приходять системи числення, споріднені двійковій - восьмерична і шістнадцяткова.

Наприклад, в шістнадцятковій системі для запису чисел призначені 10 арабських цифр і букви латинського алфавіту (А, В, С, D, Е, F). Щоб записати число в цій системі числення, зручно скористатися двійковим поданням числа. Візьмемо для прикладу той же число - 2000 або 11111010000 в двійковій системі. Розіб'ємо його на четвірки знаків, рухаючись справа наліво, в останній четвірці зліва пріпішем незначний 0, щоб кількість знаків в тріади було по чотири: 0111 тисячі сто один 0000. Почнемо переклад - числу 0111 в двійковій системі відповідає число 7 в десяткового (7 +10 = 1 * 2 0 + 1 * 2 1 + 1 * 2 2), в шістнадцятковій системі числення цифра 7 є; числу +1101 в двійковій системі відповідає число 13 в десяткового (13 = 1 * 2 0 + 0 * 2 1 + 1 * 2 2 + 1 * 2 3), в шістнадцятковій системі цього числа відповідає цифра D, і, нарешті, число 0000 - в будь-якій системі числення 0. Запишемо тепер результат:

11111010000 2 = 7D0 16.

кодування координат

Закодувати можна не тільки числа, а й іншу інформацію. Наприклад, інформацію про те, де знаходиться певний об'єкт. Величини, що визначають положення об'єкта в просторі, називаються координатами.  В будь-який   системі координат  є початок відліку, одиниця виміру, масштаб, напрям відліку, або осі координат. Приклади систем координат - декартові координати, полярна система координат, шахи, географічні координати.

кодування тексту

Текст закодувати досить просто. Для цього достатньо як-небудь перенумерувати всі букви, цифри, знаки пунктуації та інші, які використовуються при листі символи. Для зберігання одного символу найчастіше використовується восьмирозрядна осередок - один байт, іноді два байта (ієрогліфи, наприклад). В байт можна записати 256 різних чисел, значить, це дозволить закодувати 256 різних символів. Відповідність символів та їх кодів задається в спеціальній таблиці. Коди записуються в шістнадцятковій системі, так як для запису числа з восьми розрядів потрібно всього дві шістнадцятирічних цифри.

кодування зображень

Цифрові персональні комп'ютери добре працюють з числами, але не вміють обробляти безперервні величини. Але людське око можна обдурити: зображення, складене з великого числа окремих дрібних деталей, сприймається як безперервне. Якщо розбити картинку вертикальними і горизонтальними лініями на маленькі мозаїчні квадратики, отримаємо так званий   растр  - двовимірний масив квадратиків. Самі квадратики -   елементи растра або пікселі  (Picture "s element) - елементи картинки. Колір кожного пікселя кодується числом.

   Урок "Кодування інфомація".

Інформацію один одному ми передаємо в усній і письмовій формі, а також у формі жестів і знаків.

Знаки можуть мати різну фізичну природу . Наприклад, для представлення інформації з використанням мови в письмовій формі використовуються знаки, які є зображеннями на папері    або інших носіях, в усному мовленні як знаки мови використовуються різні звуки (фонеми),   а при обробці тексту на комп'ютері знаки представлені у формі послідовностей електричних імпульсів ( комп'ютерних кодів ).

види інформації

Інформація, як об'єкт класифікується за видами. Таких класифікацій кілька. Кожна наука вводить свою класифікацію. Для інформатики головним є те, яким чином інформація вводиться / виводиться, обробляється, зберігається, використовуючи засоби обчислювальної техніки. Тому в інформатиці прийнято таку класифікацію видів інформації:

Аналогова - безперервна

(Сприймається людиною)

Дискретна - стрибкоподібне

(Сприймається ВТ)

  • візуальна
  • аудиальная
  • тактильна
  • нюхова
  • смакова

приклади:

    скрипка

    телевізор

    телефон

    картина в музеї

    графіки функцій

приклади:

    фортепіано

    монітор

    музичний центр

    мобільний телефон


Форми подання інформації

Так як аналогову інформацію людина сприймає за допомогою своїх органів почуттів, то він прагне зафіксувати її таким чином, щоб вона стала зрозуміла іншим. При цьому одна і та ж інформація може бути представлена ​​в різних формах.

У будь-якому вигляді інформація для нас висловлює відомості про кого-то або про щось. Вона відображає те, що відбувається або те, що сталося в нашому світі, наприклад: що ми робили вчора або будемо робити завтра, як буде виглядати випускну сукню або місце майбутньої роботи. Але при цьому інформація обов'язково повинна отримати деяку форму, найбільш зручну для сприйняття:

· текстів, малюнків, фотографій, креслень;

· жестів і міміки;

· запахів і смакових відчуттів;

· Радіохвиль;

· електричних і нервових імпульсів;

· магнітних записів;

· хромосом

Отримання інформації - це, в кінцевому рахунку, отримання фактів, відомостей і даних про властивості, структуру або взаємодії об'єктів і явищ навколишнього нас світу.

Мова як знакова система

У процесі розвитку людського суспільства люди виробили велику кількість мов. Серед них мову жестів і міміки, мова малюнків і креслень, мова музики і мову математики, розмовна мова, алгоритмічний мову і т. Д.

Для обміну інформацією з іншими людьми людина використовує природні мови   (Російська, англійська, китайська та ін.), Тобто інформація може надаватися за допомогою природних мов.

  Приклади алфавітів: В основі російської мови лежить    кирилиця, Що містить 33 знака, англійська мова використовує    латиницю  (26 знаків), китайську мову використовує алфавіт з десятків тисяч знаків ( ієрогліфів).

Послідовності символів алфавіту відповідно до правил граматики    утворюють основні об'єкти мови  - слова. Правила, за якими утворюються пропозиції з слів даної мови, називаються    синтаксисом . Необхідно відзначити, що в природних мовах граматика і синтаксис мови формулюються за допомогою великої кількості правил, з яких існують винятки, так як такі правила складалися історично.

Схема передачі інформації через писемність

УСНЕ МОВЛЕННЯ

Þ

  лист

Þ

  ТЕКСТ

Þ

читання

Þ

УСНЕ МОВЛЕННЯ

КОДИРОВАНИЕ ДЕКОДУВАННЯ

кодування інформації

Загальна схема обміну інформацією

Джерело інформації

Þ

кодує пристрій

Þ

Передача інформації

Þ

декодер

Þ

одержувач інформації

Кодування текстової інформації

Мови представлення інформації

природні:

Англійська, французька, ...

формальні:

Математики, програмування, ноти, ...

кодування інформації

цілі кодування

засекречування

інформації

швидкий спосіб запису

передача по технічних каналах зв'язку

виконання математичних обчислень

шифрування

стенографія

телеграфний код

системи числення

алгоритми криптографії

Один знак - слово або поєднання букв

код Морзе

грец. στενός   - вузький, тісний і γράφειν   - писати) - спосіб письма за допомогою особливих знаків і цілого ряду скорочень, що дає можливість швидко записувати усне мовлення. Швидкість стенографічного листа перевершує швидкість звичайного в 4-7 разів.

Так як вибір значків для стенографії в основному довільний, то з поєднань різних значків утворилося безліч стенографічних систем, кожна з яких має свої переваги і недоліки.

Мистецтво стенографії існувало вже, як можна зробити висновок за деякими даними, у    древніх єгиптян , Де умовним знаком записувалися мови    фараонів ; від єгиптян це мистецтво перейшло до    грекам і римлянам , У яких були скорописця. 5 грудня 63 р. До н.е. е. в Стародавньому Римі відбулося перше відоме в історії застосування стенографії.

У деяких випадках виникає потреба засекречування документа або тексту. В цьому випадку текст шифрується. У давні часи зашифрований текст називався тайнописом.

шифрування   - спосіб перетворення відкритої    інформації    в закриту і назад. Застосовується для зберігання важливої ​​інформації в ненадійних джерелах або передачі її по незахищеним каналам    зв'язку.

Шифрування - це теж кодування, але із засекреченим методом, відомим тільки адресату і джерела. Методами шифрування займається наука криптографія .

Розглянемо як приклад кодування відповідність цифрового і штрихового кодів товару. Такі коди є на кожному товарі і дозволяють повністю ідентифікувати товар (країну і фірму виробника, тип товару і штриховий коди товару.

Знаків цифрового коду (цифрам) відповідають групи знаків штрихового коду (вузькі і широкі штрихи, а також розміри проміжків між ними).

Для людини зручний цифровий код, а для автоматизованого обліку і штриховий код, який зчитується за допомогою вузького світлового променя і піддається подальшій обробці в комп'ютерних бухгалтерських системах обліку.

Домашнє завдання -    придумайте або згадайте будь-яку інформацію і уявіть її в різних формах, створити схему:

Створення нової мелодії

Þ

Þ

Þ

Þ


Одна і та ж інформація може бути представлена ​​(закодована) в декількох формах. C появою комп'ютерів виникла необхідність кодування всіх видів інформації, з якими має справу і окрема людина, і людство в цілому. Але вирішувати завдання кодування інформації людство почало задовго до появи комп'ютерів. Грандіозні досягнення людства - писемність і арифметика - є не що інше, як система кодування мови і числовий інформації. Інформація ніколи не з'являється в чистому вигляді, вона завжди якось представлена, як-то закодована.

Двійкове кодування - один з найпоширеніших способів подання інформації. В обчислювальних машинах, в роботах і верстатах з числовим програмним управлінням, як правило, вся інформація, з якою має справу пристрій, кодується у вигляді слів двійкового алфавіту.

Кодування символьної (текстової) інформації.

Основна операція, вироблена над окремими символами тексту - порівняння символів.

При порівнянні символів найбільш важливими аспектами є унікальність коду для кожного символу і довжина цього коду, а сам вибір принципу кодування практично не має значення.

Для кодування текстів використовуються різні таблиці перекодування. Важливо, щоб при кодуванні і декодуванні одного і того ж тексту використовувалася одна і та ж таблиця.

Таблиця перекодування - таблиця, яка містить упорядкований певним чином перелік кодованих символів, відповідно до якої відбувається перетворення символу в його двійковий код і назад.

Найбільш популярні таблиці перекодування: ДКОИ-8, ASCII, CP1251, Unicode.

Історично склалося, що в якості довжини коду для кодування символів було обрано 8 біт або 1 байт. Тому найчастіше одному символу тексту, що зберігається в комп'ютері, відповідає один байт пам'яті.

Різних комбінацій з 0 і 1 при довжині коду 8 біт може бути 28 = 256, тому за допомогою однієї таблиці перекодування можна закодувати не більше 256 символів. При довжині коду в 2 байти (16 біт) можна закодувати 65536 символів.

Кодування числової інформації

Подібність в кодуванні числової і текстової інформації полягає в наступному: щоб можна було порівнювати дані цього типу, у різних чисел (як і у різних символів) повинен бути різний код. Основна відмінність числових даних від символьних полягає в тому, що над числами крім операції порівняння виробляються різноманітні математичні операції: додавання, множення, добування кореня, обчислення логарифма та ін. Правила виконання цих операцій в математиці детально розроблені для чисел, представлених в позиційній системі числення.


Для кодування одного символу клавіатури використовують 8 біт - один байт.
   Байт - це найменша одиниця обробки інформації. За допомогою одного байта можна закодувати 2 8 = 256 символів.
Існує таблиця кодів клавіатури. Перші коди з 32 по 127 є стандартними і обов'язковими для всіх країн і всіх комп'ютерів, а в другій половині (128-255) кожна країна може створювати свій стандарт - національний. Першу половину називають таблицею ASCII (Американський стандартний код для обміну інформацією).
  Є й інші таблиці кодування KOI8-U, Wsndows-1251, Unicode. З перерахованих таблиць особливою є таблиця Unicode, оскільки кожен символ цієї таблиці кодується двома байтами.


поняття файлу
У комп'ютері будь-яка інформація (тексти, числа, малюнки, звуки) представлена ​​у вигляді послідовності байтів. Для того, щоб комп'ютер розрізняв всі види інформації, вводиться таке поняття як формат. Кожна група байтів, що представляє певну закодовану інформацію, називається файлом. Файл повинен мати унікальне ім'я певного формату. На ім'я файлу комп'ютер визначає, де файл знаходиться, яка інформація в ньому міститься, в якому форматі вона записана і якими програмами її можна обробити. Файл - найменша одиниця зберігання інформації. Файл може зберігати десятки, сотні байтів.

gastroguru © 2017