Види кодування інформації. Лекція: Кодування інформації. способи кодування

22. Кодування ІНФОРМАЦІЇ

22.1. Загальні відомості

кодування - подання інформації в альтернативному виді. За своєю суттю кодові системи (або просто коди) аналогічні, в яких елементів кодируемой інформації відповідають кодові позначення. Відмінність полягає в тому, що в шифри присутній змінна частина (ключ), яка для певного вихідного повідомлення при одному і тому ж алгоритмі шифрування може видавати різні шифртекст. У кодових системах змінної частини немає. Тому один і той же вихідне повідомлення при кодуванні, як правило, завжди виглядає однаково 1. Іншою відмінною рисою кодування є застосування кодових позначень (замін) цілком для слів, фраз або чисел (сукупності цифр). Заміна елементів кодируемой інформації кодовими позначеннями може бути виконана на основі відповідної таблиці (на зразок таблиці шіфрозамен) або визначена за допомогою функції або алгоритму кодування.

В якості елементів кодируемой інформації можуть виступати:

Букви, слова і фрази природної мови;

Різні символи, такі як знаки пунктуації, арифметичні і логічні операції, оператори порівняння і т.д. Слід зазначити, що самі знаки операцій і оператори порівняння - це кодові позначення;

Аудіовізуальні образи;

Ситуації і явища;

Спадкова інформація;

кодові позначення можуть являти собою:

Букви і поєднання букв природної мови;

Графічні позначення;

Електромагнітні імпульси;

Світлові і звукові сигнали;

Набір і поєднання хімічних молекул;

Кодування може виконуватися в цілях:

Зручності зберігання, обробки і передачі інформації (як правило, закодована інформація може надаватися більш компактно, а також придатна для обробки і передачі автоматичними програмно-технічними засобами);

Зручності інформаційного обміну між суб'єктами;

Наочності відображення;

Ідентифікації об'єктів і суб'єктів;

Приховування секретної інформації;

Кодування інформації буває одно- і багаторівневим. Прикладом одноуровневого кодування служать світлові сигнали, що подаються світлофором (червоний - стій, жовтий - приготуватися, зелений - вперед). Як багаторівневого кодування можна привести уявлення візуального (графічного) образу як файл фотографії. Спочатку візуальна картинка розбивається на складові елементарні елементи (пікселі), тобто кожна окрема частина візуальної картинки кодується елементарним елементом. Кожен елемент представляється (кодується) у вигляді набору елементарних кольорів (RGB: англ. Red - червоний, green - зелений, blue - синій) відповідною інтенсивністю, яка в свою чергу представляється у вигляді числового значення. Згодом набори чисел, як правило, перетворюються (кодуються) з метою більш компактного представлення інформації (наприклад, в форматах jpeg, png і т.д.). І нарешті, підсумкові числа представляються (кодуються) у вигляді електромагнітних сигналів для передачі по каналах зв'язку або областей на носії інформації. Слід зазначити, що самі числа при програмній обробці надаються згідно з прийнятою системою кодування чисел.

Кодування інформації може бути оборотним і незворотним. При оборотному кодуванні на основі закодованого повідомлення можна однозначно (без втрати якості) відновити кодуються повідомлення (вихідний образ). Наприклад, кодування за допомогою азбуки Морзе або штрих-коду. При незворотному кодуванні однозначне відновлення вихідного образу неможливо. Наприклад, кодування аудіовізуальної інформації (формати jpg, mp3 або avi) або.

Азбука Морзе - спосіб кодування символів (букв алфавіту, цифр, знаків пунктуації та ін.) За допомогою послідовності «точок» і «тире». За одиницю часу приймається тривалість однієї точки. Тривалість тире дорівнює трьом точкам. Пауза між елементами одного знака - одна точка (близько 1/25 частки секунди), між знаками в слові - 3 точки, між словами - 7 точок. Названий на честь американського винахідника і художника Семюеля Морзе.

Російська літера	Латинська літера	код Морзе	Російська літера	Латинська літера	код Морзе	символ	код Морзе
A	A	· −	Р	R	· − ·	1	· − − − −
Б	B	− · · ·	З	S	· · ·	2	· · − − −
В	W	· − −	Т	T	−	3	· · · − −
Г	G	− − ·	У	U	· · −	4	· · · · −
Д	D	− · ·	Ф	F	· · − ·	5	· · · · ·
Е (Е)	E	·	Х	H	· · · ·	6	− · · · ·
Ж	V	· · · −	Ц	C	− · − ·	7	− − · · ·
З	Z	− − · ·	Ч	Ö	− − − ·	8	− − − · ·
І	I	· ·	Ш	CH	− − − −	9	− − − − ·
Й	J	· − − −	Щ	Q	− − · −	0	− − − − −
До	K	− · −	ред	Ñ	− − · − −	Крапка	· · · · · ·
Л	L	· − · ·	И	Y	− · − −	кома	· − · − · −
М	M	− −	Ь (ред)	X	− · · −	?	· · − − · ·
Н	N	− ·	Е	É	· · − · ·	!	− − · · − −
Про	O	− − −	Ю	Ü	· · − −	@	· − − · − ·
П	P	· − − ·	Я	Ä	· − · −	Кінець зв'язку (end contact)	· · − · −

Ріс.22.1. Фрагмент азбуки Морзе

Спочатку азбука Морзе застосовувалася для передачі повідомлень в телеграфі. При цьому точки і тире передавалися у вигляді електричних сигналів, що проходять по дротах. На даний момент азбуку Морзе, як правило, використовують в місцях, де інші засоби обміну інформацією недоступні (наприклад, в тюрмах).

Цікавий факт пов'язаний з винахідником першої лампочки Томасом Альвою Едісоном (1847-1931 рр.). Він погано чув і спілкувався зі своєю дружиною, Мері Стіуелл, за допомогою азбуки Морзе. Під час залицяння Едісон зробив пропозицію, відстукати слова рукою, і вона відповіла тим же способом. Телеграфний код став звичайним засобом спілкування для подружжя. Навіть коли вони ходили в театр, Едісон клав руку Мері собі на коліно, щоб вона могла «телеграфувати» йому діалоги акторів.

код Бодо - цифровий 5-бітний код. Був розроблений Емілем Бодо в 1870 р для свого телеграфу. Код вводився прямо клавіатурою, що складається з п'яти клавіш, натискання або ненажатом клавіші відповідало передачі або непередачі одного біта в пятібітном коді. Існує кілька різновидів (стандартів) даного коду (CCITT-1, CCITT-2, МТК-2 та ін.) Зокрема МТК-2 є модифікацією міжнародного стандарту CCITT-2 з додавання букв кирилиці.

керуючі символи
двійковий код	десятковий код	призначення
01000	8	повернення каретки
00010	2	Переклад рядка
11111	31	букви латинські
11011	27	цифри
00100	4	пропуск
00000	0	букви російські

двійковий код	десятковий код	Латинська літера	Російська літера	цифри і інші символи
00011	3	A	А	-
11001	25	B	Б	?
01110	14	C	Ц	:
01001	9	D	Д	Хто там?
00001	1	E	Е	З
01101	13	F	Ф	Е
11010	26	G	Г	Ш
10100	20	H	Х	Щ
00110	6	I	І	8
01011	11	J	Й	Ю
01111	15	K	До	(
10010	18	L	Л	)
11100	28	M	М	.
01100	12	N	Н	,
11000	24	O	Про	9
10110	22	P	П	0
10111	23	Q	Я	1
01010	10	R	Р	4
00101	5	S	З	"
10000	16	T	Т	5
00111	7	U	У	7
11110	30	V	Ж	=
10011	19	W	В	2
11101	29	X	Ь	/
10101	21	Y	И	6
10001	17	Z	З	+

Ріс.22.2. Стандарт коду Бодо МТК-2

На наступному малюнку показана телетайпна перфолента з повідомленням, переданим за допомогою коду Бодо.

Мал. 22.3. Перфолента з кодом Бодо

Слід зазначити два цікаві факти, пов'язані з кодом Бодо.

1. Співробітники телеграфної компанії AT & T Гільберта Вернам і Мейджор Джозеф Моборн в 1917 р запропонували ідею автоматичного шифрування телеграфних повідомлень на основі коду Бодо. Шифрування виконувалося.

2. Відповідність між англійською та російською алфавітами, прийняте в МТК-2, було використано при створенні комп'ютерних кодувань КОИ-7 і КОИ-8.

ASCII і Unicode.

ASCII (англ. American Standard Code for Information Interchange) - американська стандартна кодировочная таблиця для друкованих та керуючих символів. Спочатку була розроблена як 7-бітна для подання 128 символів, при використанні в комп'ютерах на символ виділялося 8 біт (1 байт), де 8-ий біт служив для контролю цілісності (біт парності). Пізніше, із задіянням 8 біта для подання додаткових символів (всього 256 символів), наприклад букв національних алфавітів, стала сприйматися як половина 8-бітної. Зокрема на основі ASCII були розроблені кодування, що містять букви російського алфавіту: для операційної системи MS-DOS - cp866 (англ. Code page - кодова сторінка), для операційної системи MS Windows - Windows 1251, для різних операційних систем - ЯКІ-8 ( код обміну інформацією, 8 бітів), ISO 8859-5 та інші.

Кодування ASCII						додаткові символи
двійковий код	десятковий код	символ	двійковий код	десятковий код	символ	двійковий код	десятковий код	символ	двійковий код	десятковий код	символ
00000000	0	NUL	01000000	64	@	10000000	128	Ђ	11000000	192	А
00000001	1	SOH	01000001	65	A	10000001	129	Ѓ	11000001	193	Б
00000010	2	STX	01000010	66	B	10000010	130	‚	11000010	194	В
00000011	3	ETX	01000011	67	C	10000011	131	ѓ	11000011	195	Г
00000100	4	EOT	01000100	68	D	10000100	132	„	11000100	196	Д
00000101	5	ENQ	01000101	69	E	10000101	133	…	11000101	197	Е
00000110	6	ACK	01000110	70	F	10000110	134	†	11000110	198	Ж
00000111	7	BEL	01000111	71	G	10000111	135	‡	11000111	199	З
00001000	8	BS	01001000	72	H	10001000	136	€	11001000	200	І
00001001	9	HT	01001001	73	I	10001001	137	‰	11001001	201	Й
00001010	10	LF	01001010	74	J	10001010	138	Љ	11001010	202	До
00001011	11	VT	01001011	75	K	10001011	139	‹	11001011	203	Л
00001100	12	FF	01001100	76	L	10001100	140	Њ	11001100	204	М
00001101	13	CR	01001101	77	M	10001101	141	Ќ	11001101	205	Н
00001110	14	SO	01001110	78	N	10001110	142	Ћ	11001110	206	Про
00001111	15	SI	01001111	79	O	10001111	143	Џ	11001111	207	П
00010000	16	DLE	01010000	80	P	10010000	144	ђ	11010000	208	Р
00010001	17	DC1	01010001	81	Q	10010001	145	‘	11010001	209	З
00010010	18	DC2	01010010	82	R	10010010	146	’	11010010	210	Т
00010011	19	DC3	01010011	83	S	10010011	147	“	11010011	211	У
00010100	20	DC4	01010100	84	T	10010100	148	”	11010100	212	Ф
00010101	21	NAK	01010101	85	U	10010101	149		11010101	213	Х
00010110	22	SYN	01010110	86	V	10010110	150	–	11010110	214	Ц
00010111	23	ETB	01010111	87	W	10010111	151	-	11010111	215	Ч
00011000	24	CAN	01011000	88	X	10011000	152		11011000	216	Ш
00011001	25	EM	01011001	89	Y	10011001	153	™	11011001	217	Щ
00011010	26	SUB	01011010	90	Z	10011010	154	љ	11011010	218	ред
00011011	27	ESC	01011011	91	[	10011011	155	›	11011011	219	И
00011100	28	FS	01011100	92	\	10011100	156	њ	11011100	220	Ь
00011101	29	GS	01011101	93	]	10011101	157	ќ	11011101	221	Е
00011110	30	RS	01011110	94	^	10011110	158	ћ	11011110	222	Ю
00011111	31	US	01011111	95	_	10011111	159	џ	11011111	223	Я
00100000	32		01100000	96	`	10100000	160		11100000	224	а
00100001	33	!	01100001	97	a	10100001	161	Ў	11100001	225	б
00100010	34	"	01100010	98	b	10100010	162	ў	11100010	226	в
00100011	35	#	01100011	99	c	10100011	163	Ј	11100011	227	г
00100100	36	$	01100100	100	d	10100100	164	¤	11100100	228	д
00100101	37	%	01100101	101	e	10100101	165	Ґ	11100101	229	е
00100110	38	&	01100110	102	f	10100110	166	¦	11100110	230	ж
00100111	39	"	01100111	103	g	10100111	167	§	11100111	231	з
00101000	40	(	01101000	104	h	10101000	168	Е	11101000	232	і
00101001	41	)	01101001	105	i	10101001	169	©	11101001	233	й
00101010	42	*	01101010	106	j	10101010	170	Є	11101010	234	до
00101011	43	+	01101011	107	k	10101011	171	«	11101011	235	л
00101100	44	,	01101100	108	l	10101100	172	¬	11101100	236	м
00101101	45	-	01101101	109	m	10101101	173	¬	11101101	237	н
00101110	46	.	01101110	110	n	10101110	174	®	11101110	238	про
00101111	47	/	01101111	111	o	10101111	175	Ї	11101111	239	п
00110000	48	0	01110000	112	p	10110000	176	°	11110000	240	р
00110001	49	1	01110001	113	q	10110001	177	±	11110001	241	з
00110010	50	2	01110010	114	r	10110010	178	І	11110010	242	т
00110011	51	3	01110011	115	s	10110011	179	і	11110011	243	у
00110100	52	4	01110100	116	t	10110100	180	ґ	11110100	244	ф
00110101	53	5	01110101	117	u	10110101	181	µ	11110101	245	х
00110110	54	6	01110110	118	v	10110110	182	¶	11110110	246	ц
00110111	55	7	01110111	119	w	10110111	183	·	11110111	247	ч
00111000	56	8	01111000	120	x	10111000	184	е	11111000	248	ш
00111001	57	9	01111001	121	y	10111001	185	№	11111001	249	щ
00111010	58	:	01111010	122	z	10111010	186	є	11111010	250	ь
00111011	59	;	01111011	123	{	10111011	187	»	11111011	251	и
00111100	60	<	01111100	124	\|	10111100	188	ј	11111100	252	ь
00111101	61	=	01111101	125	}	10111101	189	Ѕ	11111101	253	е
00111110	62	>	01111110	126	~	10111110	190	ѕ	11111110	254	ю
00111111	63	?	01111111	127	DEL	10111111	191	ї	11111111	255	я

Мал. 22.4. Кодова сторінка Windows-1251

Unicode - стандарт кодування символів, що дозволяє представити знаки майже всіх письмових мов. Стандарт був запропонований в 1991 р некомерційною організацією «Консорціум Юнікоду» (англ. Unicode Consortium, Unicode Inc.). Застосування цього стандарту дозволяє закодувати більше число символів (чим в ASCII і інших кодуваннях) за рахунок двухбайтового кодування символів (всього 65536 символів). У документах Unicode можуть сусідити китайські ієрогліфи, математичні символи, букви грецького алфавіту, латиниці і кирилиці.

Коди в стандарті Unicode розділені на кілька розділів. Перші 128 кодів відповідають кодуванні ASCII. Далі розташовані розділи букв різних писемностей, знаки пунктуації та технічні символи. Зокрема прописних і рядкових букв російського алфавіту відповідають коди 1025 (Е), 1040-1103 (А-я) і 1105 (е).

шрифт Брайля - рельєфно-крапковий тактильний шрифт, призначений для письма і читання незрячими людьми. Був розроблений в 1824 р французом Луї Брайлем (Louis Braille), сином шевця. Луї у віці трьох років втратив зір, в результаті запалення очей, що почався від того, що хлопчик поранився шорний ножем (подобу шила) в майстерні батька. У віці 15 років він створив свій рельєфно-крапковий шрифт, надихнувшись простотою «нічного шрифту» капітана артилерії Шарля Барб'є (Charles Barbier), який використовувався військовими того часу для читання повідомлень у темряві.

Для зображення символів (в основному букв і цифр) в шрифті Брайля використовуються 6 точок, розташованих у два стовпці, по 3 в кожному.

Мал. 22.5. нумерація точок

Кожному символу відповідає свій унікальний набір опуклих точок. Т.ч. шрифт Брайля являє собою систему для кодування 2 6 = 64 символів. Але присутність в шрифті керуючих символів (наприклад, перехід до букв або цифр) дозволяє збільшити кількість кодованих символів.

керуючі символи
символ шрифту Брайля	призначення
⠠	букви
⠼	цифри
Букви, цифри і інші символи
символ шрифту Брайля	латинські літери	Російські літери	цифри
⠁	A	А	1
⠃	B	Б	2
⠉	C	Ц	3
⠙	D	Д	4
⠑	E	Е	5
⠋	F	Ф	6
⠛	G	Г	7
⠓	H	Х	8
⠊	I	І	9
⠚	J	Ж	0
⠅	K	До
⠇	L	Л
⠍	M	М
⠝	N	Н
⠕	O	Про
⠏	P	П
⠟	Q	Ч
⠗	R	Р
⠎	S	З
⠞	T	Т
⠥	U	У
⠧	V
⠺	W	В
⠭	X	Щ
⠽	Y
⠵	Z	З
⠡		Е
⠯		Й
⠱		Ш
⠷		ред
⠮		И
⠾		Ь
⠪		Е
⠳		Ю
⠫		Я
⠲	Крапка
⠂	кома
⠢	Знак питання
⠆	Крапка з комою
⠤	дефіс
	пропуск

Мал. 22.6. шрифт Брайля

Шрифт Брайля, останнім часом, став широко застосовуватися в суспільному житті і побуті в зв'язку з ростом уваги до людей з обмеженими можливостями.

Мал. 22.7. Напис "Sochi 2014" шрифтом Брайля на золоту медаль Паралімпійських ігор 2014.

Штрих код - графічна інформація, що наноситься на поверхню, маркування або упаковку виробів, що представляє собою послідовність чорних і білих смуг або інших геометричних фігур з метою її зчитування технічними засобами.

У 1948 р Бернард Сільвер (Bernard Silver), аспірант Інституту Технології Університету Дрекселя в Філадельфії, почув, як президент місцевої продовольчої мережі просив одного з деканів розробити систему, автоматично зчитує інформацію про продукт при його контролі. Сільвер розповів про це друзям - Норману Джозефу Вудланд (Norman Joseph Woodland) і Джордін Джохенсону (Jordin Johanson). Утрьох вони почали досліджувати різні системи маркування. Їх перша працююча система використовувала ультрафіолетові чорнило, але вони були досить дороги, а крім того, з часом вицвітають.

Переконаний в тому, що система реалізована, Вудланд покинув Філадельфію і перебрався до Флориди в квартиру свого батька для продовження роботи. 20 жовтня 1949 р Вудланд і Сільвер подали заявку на винахід, яка була задоволена 7 жовтня 1952 р Замість звичних нам ліній патент містив опис штрихкодового системи у вигляді концентричних кіл.

Мал. 22.8. Патент системи Вудланд і Сільвера з концентричними колами, попередниками сучасних штрихкодів

Вперше штрих-коди почали офіційно використовуватися в 1974 р в магазинах м Трой, штат Огайо. Системи штрихового кодування знайшли широке застосування в суспільному житті: торгівля, поштові відправлення, фінансові та судові повідомлення, облік одиниць зберігання, ідентифікація осіб, контактна інформація (веб-посилання, адреси електронної пошти, номери телефонів) і т.д.

Розрізняють лінійні (читаються в одному напрямку) і двовимірні штрих-коди. Кожна з різновидів різниться як розмірами графічного зображення, так і обсягами представленої інформації. У наступній таблиці наведено приклади деяких різновидів штрих-коду.

Таблиця 22.1. різновиди штрихкодів

Найменування	Приклад штрих-коду	Примітки
лінійні
Universal Product Code, UPC (Універсальний код товару)	(UPC-A)	Американський стандарт штрихкоду, призначений для кодування ідентифікатора товару і виробника. Є різновиди: - UPC-E - кодуються 8 цифр; - UPC-A - кодується 13 цифр.
European Article Number, EAN (Європейський номер товару)	(EAN-13)	Європейський стандарт штрихкоду, призначений для кодування ідентифікатора товару і виробника. Є різновиди: - EAN-8 - кодуються 8 цифр; - EAN 13 - кодується 13 цифр; - EAN-128 - кодується будь-яку кількість букв і цифр, об'єднаних в регламентовані групи. ДСТУ ISO / IEC 15420-2001 «Автоматична ідентифікація. Кодування штрихове. Специфікація символіки EAN / UPC (ЄАН / ЮПіСі) ».
Code 128 (Код 128)		Включає в себе 107 символів. З яких 103 символу даних, 3 стартових, і 1 зупинний символ. Для кодування всіх 128-ми символів ASCII передбачено три комплекти символів - A, B і C, які можуть використовуватися всередині одного штрих-коду. EAN-128 кодує інформацію за алфавітом Code 128 ГОСТ 30743-2001 (ISO / IEC 15417-2000) «Автоматична ідентифікація. Кодування штрихове. Специфікація символіки Code 128 (Код 128) ».
двовимірні
DataMatrix (Матричні дані)		Максимальна кількість символів, які поміщаються в один код - 2048 байт. ДСТУ ISO / IEC 16022-2008 «Автоматична ідентифікація. Кодування штрихове. Специфікація символіки Data Matrix ».
QR-код (Англ. Quick response - швидкий відгук)		Квадрати в кутах зображення дозволяють нормалізувати розмір зображення і його орієнтацію, а також кут, під яким сенсор відноситься до поверхні зображення. Точки переводяться в двійкові числа з перевіркою контрольної суми. Максимальна кількість символів, які поміщаються в один QR-код: - цифри - 7089; - цифри і букви (латиниця) - 4296; - двійковий код - 2953 байт; - ієрогліфи - 1817.
MaxiCode (Максікод)		Розмір - дюйм на дюйм (1 дюйм = 2.54 см). Використовується для грузоотправітельних і вантажоприймальних систем. ГОСТ Р 51294.6-2000 «Автоматична ідентифікація. Кодування штрихове. Специфікація символіки MaxiCode (Максікод) ».
PDF147 (Англ. Portable Data File - стерпний файл даних)		Застосовується при ідентифікації особистості, обліку товарів, при здачі звітності до контролюючих органів та інших областях. Підтримує кодування до 2710 символів і може містити до 90 рядків.
Microsoft Tag (Мітка Microsoft)		Розроблено для розпізнавання за допомогою фотокамер, вбудованих в мобільні телефони. Може вмістити в себе стільки ж символів, що Code128. Призначений для швидкої ідентифікації та отримання на пристрій заздалегідь підготовленої інформації (веб-посилання, довільного тексту довжиною до 1000 символів, телефонного номера і т.п.), прив'язаною до коду і зберігається на сервері компанії Microsoft. Містить 13 байт плюс один додатковий біт для контролю парності.

Подання чисел в двійковому вигляді (в комп'ютері). Як відомо, інформація, що зберігається і обробляється в комп'ютерах, представлена в двійковому вигляді. біт (Англ. binary digi t - двійкове число; також гра слів: англ. bit - шматочок, частка) - одиниця вимірювання кількості інформації, що дорівнює одному розряду в двійковій системі числення. За допомогою біта можна закодувати (уявити, розрізняти) два стани (0 або 1; так чи ні). Збільшуючи кількість бітів (розрядів), можна збільшити кількість кодованих станів. Наприклад, для байта (англ. Byte), що складається з 8 бітів, кількість кодованих станів становить 2 8 = 256.

Числа кодуються в т.зв. форматах з фіксованою і плаваючою комою.

1. Формат з фіксованою комою, В основному, застосовується для цілих чисел, але може застосовуватися і для дійсних чисел, у яких фіксоване кількість десяткових знаків після коми. Для цілих чисел мається на увазі, що «кома» знаходиться праворуч після молодшого біта (розряду), тобто поза розрядної сітки. В даному форматі існують два подання: беззнаковое (для невід'ємних чисел) і зі знаком.

для беззнакового уявлення все розряди відводяться під уявлення самого числа. Наприклад, за допомогою байта можна уявити беззнакові цілі числа від 0 10 до 255 10 (00000000 2 - 11111111 2) або речові числа з одним десятковим знаком від 0.0 10 до 25.5 10 (00000000 2 - 11111111 2). для знакового уявлення, тобто позитивних і негативних чисел, старший розряд відводиться під знак (0 - позитивне число, 1 - негативне).

Розрізняють прямий, зворотний і додатковий коди записи знакових чисел.

В прямому коді запис позитивного і негативного числа виконується так само, як і в беззнакову уявлення (за виключення того, що старший розряд відводиться під знак). Таким чином, числа 5 10 і -5 10 записуються, як 00000101 2 і 10000101 2. У прямому коді є два коду числа 0: «позитивний нуль» 00000000 2 і «негативний нуль» 10000000 2.

При використанні зворотного коду негативне число записується у вигляді інвертованого позитивного числа (0 змінюються на 1 і навпаки). Наприклад, числа 5 10 і -5 10 записуються, як 00000101 2 і 11111010 2. Слід зазначити, що в зворотному коді, як і в прямому, є «позитивний нуль» 00000000 2 і «негативний нуль» 11111111 2. Застосування зворотного коду дозволяє відняти одне число з іншого, використовуючи операцію складання, тобто віднімання двох чисел X - Y замінюється їх сумою X + (-Y). При цьому використовуються два додаткових правила:

Від'ємник число інвертується (подається у вигляді зворотного коду);

Якщо кількість розрядів результату виходить більше, ніж відведено на уявлення чисел, то крайній лівий розряд (старший) відкидається, а до результату додається 1 2.

У наступній таблиці наведено приклади вирахування.

Таблиця 22.2. Приклади віднімання двох чисел з використанням зворотного коду

X - Y	5 – 5	6 – 5	5 – 6	5 – (-6)
X 2	00000101	00000110	00000101	00000101
Y 2	00000101	00000101	00000110	11111001
заміна складанням	5 + (-5)	6 + (-5)	5 + (-6)	5 + 6
Зворотний код для від'ємника (-Y 2)	11111010	11111010	11111001	00000110
додавання	00000101 + 11111010 11111111	00000110 + 11111010 100000000	00000101 + 11111001 11111110	00000101 + 00000110 00001011
	не вимагається	00000000 + 00000001 00000001	не вимагається	не вимагається
результат	-0	1	-1	11

Незважаючи на те, що зворотний код значно спрощує обчислювальні процедури, а відповідно і швидкодію комп'ютерів, наявність двох «нулів» та інші умовності привели до появи додаткового коду. При поданні негативного числа його модуль спочатку інвертується, як в зворотному коді, а потім до інверсії відразу додається 1 2.

У наступній таблиці наведено деякі числа в різному кодовому поданні.

Таблиця 22.3. Подання чисел в різних кодах

десяткове уявлення	Код двійкового представлення (8 біт)
десяткове уявлення	прямий	зворотний	додатковий
127	01111111	01111111	01111111
6	00000110	00000110	00000110
5	00000101	00000101	00000101
1	00000001	00000001	00000001
0	00000000	00000000	00000000
-0	10000000	11111111	---
-1	10000001	11111110	11111111
-5	10000101	11111010	11111011
-6	10000110	11111001	11111010
-127	11111111	10000000	10000001
-128	---	---	10000000

При поданні негативних чисел в додаткових кодах друге правило дещо спрощується - якщо кількість розрядів результату виходить більше, ніж відведено на уявлення чисел, то тільки відкидається крайній лівий розряд (старший).

Таблиця 22.4. Приклади віднімання двох чисел з використанням додаткового коду

X - Y	5 – 5	6 – 5	5 – 6	5 – (-6)
X 2	00000101	00000110	00000101	00000101
Y 2	00000101	00000101	00000110	11111010
заміна складанням	5 + (-5)	6 + (-5)	5 + (-6)	5 + 6
Додатковий код для від'ємника (-Y 2)	11111011	11111011	11111010	00000110
додавання	00000101 + 11111011 00000000	00000110 + 11111011 100000001	00000101 + 11111010 11111111	00000101 + 00000110 00001011
Відкидання старшого розряду і додавання 1 2	не вимагається	00000001	не вимагається	не вимагається
результат	-0	1	-1	11

Можна заперечити, що уявлення чисел в додаткових кодах вимагає на одну операцію більше (після інверсії завжди потрібно складання з 1 2), що може і не знадобитися в подальшому, як в прикладах із зворотними кодами. В даному випадку спрацьовує відомий «принцип чайника». Краще зробити процедуру лінійної, ніж застосовувати в ній правила «Якщо A то B» (навіть якщо воно одне). Те, що з людської точки зору здається збільшенням трудовитрат (обчислювальної та тимчасової складності), з точки зору програмно-технічної реалізації може виявитися ефективніше.

Ще одна з переваг додаткового коду перед зворотним полягає в можливості подання до одиниці інформації на одне число (стан) більше, за рахунок виключення «негативного нуля». Тому, як правило, діапазон представлення (зберігання) для знакових цілих чисел довжиною один байт становить від +127 до -128.

2. Формат з плаваючою комою, В основному, використовується для дійсних чисел. Число в даному форматі представляється в експоненційному вигляді

X = e n * m, (22.1)

де e - підстава показовою функції;
n - порядок заснування;
e n - характеристика числа;
m - мантиса (лат. mantissa - надбавка) - множник, на який треба помножити характеристику числа, щоб отримати саме число.

Наприклад, число десяткове число 350 може бути записано, як 3.5 * 10 2, 35 * 10 1, 350 * 10 0 і т.д. В нормализованной наукової записи, порядок n вибирається такий, щоб абсолютна величина m залишалася менше одиниці, але строго менше десяти (1? | m |< 10). Таким образом, в нормализованной научной записи число 350 выглядит, как 3.5 * 10 2 . При отображении чисел в программах, учитывая, что основание равно 10, их записывают в виде m E ± n, Де Е означає «* 10 ^» ( «... помножити на десять в ступені ...»). Наприклад, число 350 - 3.5Е + 2, а число 0.035 - 3.5Е-2.

Так як числа зберігається і обробляється в комп'ютерах в двійковому вигляді, то для цих цілей приймається e = 2. Однією з можливих форм двійкового представлення чисел з плаваючою комою є наступна.

Мал. 22.9. Двійковий формат уявлення чисел з плаваючою комою

Біти bn ± і bm ±, які означають знак порядку та мантиси, кодуються аналогічно числах з фіксованою комою: для позитивних чисел «0», для негативних - «1». Значення порядку вибирається таким чином, щоб величина цілої частини мантиси в десятковому (і відповідно в довічним) поданні дорівнювала «1», що буде відповідати нормализованной записи для двійкових чисел. Наприклад, для числа 350 10 порядок n = 8 10 = 001000 2 (350 = 1.3671875 * 2 8), а для 576 10 - n = 9 10 = 001001 2 (576 = 1.125 * 2 9). Бітове представлення величини порядку може бути виконано в прямому, зворотному або додатковому коді (наприклад, для n = 8 10 бінарний вигляд 001000 2). Величина мантиси відображає дробову частину. Для її перетворення в двійковий вигляд, вона послідовно множиться на 2, поки не стане рівною 0. Наприклад,

Мал. 22.10. Приклад отримання дробової частини в бінарному вигляді

Цілі частини, одержувані в результаті послідовного множення, і являють собою двійковий вид дробової частини (0.3671875 10 = 0101111 2). Частина, що залишилася розрядів величини мантиси заповнюється 0. Таким чином, підсумковий вид числа 350 в форматі з плаваючою комою з врахуванням думки мантиси в нормалізованої записи

Мал. 22.11. Двійковий вид числа 350

У програмно-апаратних реалізаціях арифметичних дій широко поширений стандарт представлення чисел з плаваючою точкою IEEE 2 754 (Остання редакція «754-2008 - IEEE Standard for Floating-Point Arithmetic»). Даний стандарт визначає формати з плаваючими комами для подання чисел одинарної (Англ. Single, float) і подвійний (Англ. Double) точності. Загальна структура форматів

Мал. 22.12. Загальний формат уявлення двійкових чисел в стандарті IEEE 754

Формати подання відрізняються кількістю біт (байт), що відводиться для представлення чисел, і, відповідно, точністю подання самих чисел.

Таблиця 22.5. Характеристики форматів представлення двійкових чисел в стандарті IEEE 754

формат	single	double
Загальний розмір, біт (байт)	32 (4)	64 (8)
Число біт для порядку	8	11
Число біт для мантиси (Без урахування знакового біта)	23	52
величина порядку	2 128 .. 2 -127 (± 3.4 * 10 38 .. 1.7 * 10 -38)	2 1024 .. 2 -1023 (± 1.8 * 10 308 .. 9.0 * 10 -307)
зсув порядку	127	1023
Діапазон представлення чисел (Без урахування знака)	± 1.4 * 10 -45 .. 3.4 * 10 38	± 4.9 * 10 -324 .. 1.8 * 10 308
Кількість значущих цифр числа (не більше)	8	16

Особливістю представлення чисел за стандартом IEEE є відсутність біта під знак порядку. Незважаючи на це, величина порядку може приймати як позитивні значення, так і негативні. Цей момент враховується т.зв. «Зміщенням порядку». Після перетворення двійкового виду порядку (записаного в прямому коді) в десятковий від отриманої величини віднімається «зсув порядку». В результаті виходить «справжнє» значення порядку числа. Наприклад, якщо для числа одинарної точності зазначений порядок 11111111 2 (= 25510), то величина порядку насправді 128 10 (= 255 10 - 127 10), а якщо 00000000 2 (= 0 10), то -127 10 (= 0 10 - 127 10).

Величина мантиси вказується, як і в попередньому випадку, в нормалізованому вигляді.

C урахуванням вищевикладеного, число 350 10 в форматі одинарної точності стандарту IEEE 754 записується в такий спосіб.

Мал. 22.13. Двійковий вид числа 350 за стандартом IEEE

До інших особливостей стандарту IEEE відноситься можливість подання спеціальних чисел. До них відносяться значення NaN (англ. Not a Number - не числом) і +/- INF (англ. Infinity - нескінченність), які утворюються в результаті операцій типу поділу на нуль. Також сюди потрапляють денормалізовані числа, у яких мантиса менше одиниці.

На закінчення по числах з плаваючою комою кілька слів про горезвісну « помилку округлення». Оскільки в двійковій формі уявлення числа зберігається тільки декілька значущих цифр, вона не може «покрити» все різноманіття дійсних чисел в заданому діапазоні. В результаті, якщо число неможливо точно уявити в двійковій формі, воно представляється найближчим можливим. Наприклад, якщо до числа типу double «0.0» послідовно додавати «1.7», то можна виявити наступну «картину» зміни значень.

0.0
1.7
3.4
5.1
6.8
8.5
10.2
11.899999999999999
13.599999999999998
15.299999999999997
16.999999999999996
18.699999999999996
20.399999999999995
22.099999999999994
23.799999999999994
25.499999999999993
27.199999999999992
28.89999999999999
30.59999999999999
32.29999999999999
33.99999999999999
35.699999999999996
37.4
39.1
40.800000000000004
42.50000000000001
44.20000000000001
45.90000000000001
47.600000000000016
…

Мал. 22.14. Результат послідовного додавання числа 1.7 (Java 7)

Інший нюанс виявляється при складанні двох чисел, у яких значно відрізняється порядок. Наприклад, результатом складання 10 10 + 10 -10 буде 10 10. Навіть якщо послідовно трильйон (10 12) раз додавати 10 -10 до 10 10, то результат залишиться тим самим 10 10. Якщо ж до 10 10 додати твір 10 -10 * 10 12, що з математичної точки зору одне і те ж, результат стане 10000000100 (1.0000000100 * 10 10).

генетичний код - властива всім живим організмам кодированная амінокислотна послідовність білків. Кодування виконується за допомогою нуклеотидів 3, що входять до складу ДНК (дезоксирибонуклеїнової кислоти). ДКН - макромолекула, що забезпечує зберігання, передачу з покоління в покоління і реалізацію генетичної програми розвитку і функціонування живих організмів. Мабуть, найголовніший код в історії людства.

У ДНК використовується чотири азотистих підстави - аденін (А), гуанін (G), цитозин (С), тимін (T), які в російськомовній літературі позначаються буквами А, Г, Ц і Т. Ці букви складають алфавіт генетичного коду. У молекулах ДНК нуклеотиди шикуються в ланцюжки і, таким чином, виходять послідовності генетичних букв.

Білки практично всіх живих організмів побудовані з амінокислот всього 20 видів. Ці амінокислоти називають канонічними. Кожен білок є ланцюжком або кілька ланцюжків амінокислот, з'єднаних в строго визначеної послідовності. Ця послідовність визначає будову білка, а, отже, все його біологічні властивості. Синтез білків (тобто реалізація генетичної інформації в живих клітинах) здійснюється на основі інформації, закладеної в ДНК. Для кодування кожної з 20 амінокислот, а також сигналу «стоп», що означає кінець білкової послідовності, достатньо трьох послідовних нуклеотидів (триплетів).

Мал. 22.15. фрагмент ДНК

2 IEEE (англ. Institute of Electrical and Electronics Engineers) - інститут інженерів з електротехніки та електроніки.

3 Містить азотистих основ, поєднане з цукром, і фосфорну кислоту.

22.3. Секретні кодові системи

Секретні коди, як і шифри, призначені для забезпечення конфіденційності інформації. Спочатку секретні кодові системи представляли собою систему, в основі якої лежало подобу жаргонного коду. Вони виникли з метою приховування імен реальних людей, згадуваних в листуванні. Це були невеликі списки, в яких в були записані приховувані імена, а навпроти них - кодові заміни (підстановки). Офіційні коди для приховування змісту повідомлень, якими користувалися папські емісари і посли середземноморських міст-держав, знайдені в ранніх архівах Ватикану, датуються XIV в. У міру зростання потреби в безпеці листування, у представників міст-держав з'явилися більш великі переліки, які включали в себе не тільки кодові заміни імен людей, а й країн, міст, видів зброї, провіанту і т.д. З метою підвищення захищеності інформації до переліків були додані шіфралфавіти для кодування слів, що не увійшли до переліку, а також правила їх використання, що базуються на різних стеганографічних та криптографічних методах. Такі збірники отримали назву « номенклатора». З XV і до середини XIX ст. вони були основною формою забезпечення конфіденційності інформації.

Аж до XVII століття в номенклатора слова відкритого тексту і їх кодові заміни йшли в алфавітному порядку, поки французький криптолог Антуан Россиньоло не запропонував використовувати більш стійкі номенклатора, що складаються з двох частин. У них існувало два розділи: в одному перераховувалися в алфавітному порядку елементи відкритого тексту, а кодові елементи були перемішані. У другій частині в алфавітному порядку йшли переліки кодів, а перемішані були вже елементи відкритого тексту.

Винахід телеграфу і абетки Морзе, а також прокладка трансатлантичного кабелю в середині XIX в. значно розширило сфери застосування секретних кодів. Крім традиційних областей їх використання (в дипломатичному листуванні і в військових цілях) вони стали широко використовуватися в комерції і на транспорті. Секретні кодові системи того часу в своїй назві містили слово « код»(« Код Держдепартаменту (1867 г.) »,« Американський код для окопів »,« Річкові коди: Потомак »,« Чорний код ») або« шифр»(« Шифр Держдепартаменту (1876 г.) »,« Зелений шифр »). Слід зазначити, що, незважаючи на наявність у назві слова «шифр», в основу цих систем було покладено кодування.

Розробники кодів, як і укладачі шифрів, нерідко додавали додаткові ступені захисту, щоб утруднити злом своїх кодів. Такий процес називається перешіфрованіем. В результаті секретні кодові системи поєднували в собі, як стеганографічні, так і криптографічні способи забезпечення конфіденційності інформації. Найбільш популярні з них наведені в таблиці нижче.

Таблиця 22.6. Способи забезпечення конфіденційності інформації в секретних кодових системах

спосіб	Тип	Примітки	приклади (Кодуються слово - кодове позначення)
Заміна слова (словосполучення) іншим словом довільної довжини	стеганографічний	Аналог -.	1. номенклатора міста Сієни (XV ст.): Cardinales (кардинал) - Florenus; Antonello da Furli (Антолло та Фурла) - Forte. 2. Шифр Держдепартаменту 1899 р .: Russia (Росія) - Promotes; Cabinet of Russia (Уряд Росії) - Promptings. 3. Код керівника служби зв'язку (1871 г.): 10:30 - Anna, Ida; 13th (тринадцятий) - Charles, Mason.
Заміна слова (словосполучення) символьним рядком фіксованої довжини	стеганографічний	Аналог -.	1. Американський код для окопів (1918 р): Patrol (патруль) - RAL; Attack (атака) - DIT. 2. Код Держдепартаменту А-1 (1919 р): Diplomat (дипломат) - BUJOH; Diplomatic corps (дипломатичний корпус) - BEDAC.
Заміна слова (словосполучення) числом	стеганографічний	Аналог -. Для одного кодованого слова могли використовуватися кілька кодових позначень.	1. номенклатора Бенджаміна Толмадж (1779 г.): Defense (оборона) - 143; Attack (атака) - 38. 2. Код мовлення для торгових суден союзників у Другій світовій війні (BAMS): острів - 36979; порт - 985.
Заміна слова (словосполучення) набором цифр фіксованої довжини	стеганографічний	Аналог -.	1. Американський код для окопів (1918 р): Patrol (патруль) - 2307; Attack (атака) - 1447. 2. Американський службовий радіокод № 1 (1918 р): Oil (масло) - 001; Bad (поганий) - 642.
заміна букв	криптографічний	Аналоги - шифр,. Застосовувалася для слів, відсутніх у списку кодованих.	1. номенклатора міста Сієни (XV ст.): Q -; s -. 2. номенклатора Джеймса Медісона (1781 г.): o - 527; p - 941. 3. Американський код для окопів (1918 р): a - 1 332 .. 2795 або CEW .. ZYR. Містив також 30 алфавітів шіфрозамен для перешіфрованія кодових позначень.
Заміна поєднання букв	криптографічний	Аналог -. Як кодового позначення могли використовуватися літери, числа, графічні позначення.	1. номенклатора міста Сієни (XV ст.): Bb -; tt -. 2. номенклатора X-Y-Z (1737 г.): ce - 493; ab - 1 194.
Використання порожніх знаків	стеганографічний	Аналог -. Нічого котрі призначали (лат. Nihil importantes) символи використовувалися для заплутування криптоаналітиків.	1. номенклатора міста Сієни (XV ст.):,. 2. Річкові коди: Потомак (1918 р): ASY.
Використання адитивних чисел	криптографічний	Аналог -. Аддитивное число, яке додається до числовому кодовому позначенню, служило в якості змінної частини коду (ключа).	Шифр Держдепартаменту 1876 р .: правило «Horse» (кінь) на початку повідомлення означало, що при кодуванні наступних кодових позначень використовувалося аддитивное число 203; «Hawk» (яструб) - 100.
Перестановка букв (цифр) в кодових позначеннях	криптографічний	Аналог -.	Телеграфний код для забезпечення секретності при передачі телеграм (1870 г.): одне з правил наказувало перестановку останніх трьох цифр в цифровому кодовому позначенні, що складається з п'яти цифр.
Перестановка кодових позначень	криптографічний	Аналог -.	Шифр Держдепартаменту 1876 р .: правило «Tiger» (тигр) на початку повідомлення означало, що розкодувати повідомлення треба читати з останнього слова по перше (задом-наперед); «Tapir» (тапір) - міняючи місцями кожну пару слів (тобто перше і друге, третє і четверте і т.д.).

Поєднання різних способів кодування і перешифровки в кодової системі було звичайною практикою у розробників кодів і стало застосовуватися практично з самого початку їх появи. Так, ще в номенклаторі, використовувався в м Сієна в XV в., Крім кодових замін слів, застосовувалися для заміни букв, їх і порожніх знаків. Найбільшого розквіту ця практика отримала в кінці XIX - початку XX ст. Зокрема в «шифр Держдепартаменту 1876 г.» (англ. Red Book - Червона книга), що складається з 1200 сторінок, і його додатку «не піддаються декодуванню код: додаток до шифру Держдепартаменту» застосовувалися:

Кодові позначення у вигляді слів і чисел;

10. Види кодування інформації.

Код - умовне позначення об'єкта знаком або групою знаків за певними правилами. Після присвоєння кодів створюється класифікатор - систематизований звід однорідних найменувань та їх кодових позначень. Класифікатори мають подвійне застосування. Перше - для ручного проставлення кодів в документах. У другому випадку застосування кодів передбачається зберігання всіх класифікаторів в пам'яті машини, на машинних носіях. Коди можуть бути цифровими, літерними, буквено-цифровими і складатися з одного або декількох знаків.

кодування інформації - подання відомостей в стандартній формі. Одні і ті ж відомості можуть бути представлені в декількох різних формах, і навпаки, різні відомості можна уявити в схожій формі. Наприклад, можна використовувати словесний опис нової марки автомобіля, а можна уявити його вигляд в декількох детальних фотографіях. Інший приклад - медичні довідки однієї форми мають однаковий зовнішній вигляд, але описують різні хвороби, так як видані різним людям.

З появою комп'ютерів виникла необхідність кодування всіх видів інформації, з якою має справу і окрема людина і все людство в цілому. Але вирішувати завдання кодування інформації людство почало задовго до появи комп'ютерів: грандіозні досягнення людства - писемність і арифметика - не що інше, як системи кодування мови і числовий інформації.

кодування чисел

Щоб використовувати числа, потрібно їх якось називати і записувати, потрібна система нумерації. Різні системи рахунку і записи чисел тисячоліттями співіснували і змагалися між собою, але до кінця "докомпьютерной епохи" особливу роль при рахунку стало грати число "десять", а найпопулярнішою системою кодування виявилася позиційна десяткова система. У цій системі значення цифри в числі залежить від її місця (позиції) всередині числа. Десяткова система числення прийшла з Індії (не пізніше VI століття нашої ери). Алфавіт цієї системи: (0, 1, 2, 3, 4, 5, 6, 7, 8, 9) - всього 10 цифр, таким чином, підстава системи числення - 10. Число записується як комбінація одиниць, десятків, сотень, тисяч і так далі. Приклад: 1998 = 8 * 10 0 + 9 * 10 1 + 9 * 10 2 + 1 * 10 3.

У Вавилоні, наприклад, використовувалася 60-річної системі числення, алфавіт містив цифри від 1 до 59, числа 0 не було, таблиці множення були дуже громіздкими, тому дуже скоро вона була забута, але відгомони її колишньої поширеності можна спостерігати і зараз - розподіл години на 60 хвилин, розподіл кола на 360 градусів.

Двійкова система числення

Двійкова система числення була придумана математиками і філософами ще до появи комп'ютерів (XVII - XIX ст.). Пізніше двійкова система була забута, і тільки в 1936 - 1938 роках американський інженер і математик Клод Шеннон знайшов чудові застосування двійкової системи при конструюванні електронних схем.

Існують системи числення, споріднені двійковій. При роботі з комп'ютерами іноді доводиться мати справу з двійковими числами, так як двійкові числа закладені в конструкцію комп'ютера. Двійкова система зручна для комп'ютера, але незручна для людини - занадто довгі числа незручно записувати і запам'ятовувати. На допомогу приходять системи числення, споріднені двійковій - восьмерична і шістнадцяткова.

Наприклад, в шістнадцятковій системі для запису чисел призначені 10 арабських цифр і букви латинського алфавіту (А, В, С, D, Е, F). Щоб записати число в цій системі числення, зручно скористатися двійковим поданням числа. Візьмемо для прикладу той же число - 2000 або 11111010000 в двійковій системі. Розіб'ємо його на четвірки знаків, рухаючись справа наліво, в останній четвірці зліва пріпішем незначний 0, щоб кількість знаків в тріади було по чотири: 0111 тисячі сто один 0000. Почнемо переклад - числу 0111 в двійковій системі відповідає число 7 в десяткового (7 +10 = 1 * 2 0 + 1 * 2 1 + 1 * 2 2), в шістнадцятковій системі числення цифра 7 є; числу +1101 в двійковій системі відповідає число 13 в десяткового (13 = 1 * 2 0 + 0 * 2 1 + 1 * 2 2 + 1 * 2 3), в шістнадцятковій системі цього числа відповідає цифра D, і, нарешті, число 0000 - в будь-якій системі числення 0. Запишемо тепер результат:

11111010000 2 = 7D0 16.

кодування координат

Закодувати можна не тільки числа, а й іншу інформацію. Наприклад, інформацію про те, де знаходиться певний об'єкт. Величини, що визначають положення об'єкта в просторі, називаються координатами. В будь-який системі координат є початок відліку, одиниця виміру, масштаб, напрям відліку, або осі координат. Приклади систем координат - декартові координати, полярна система координат, шахи, географічні координати.

кодування тексту

Текст закодувати досить просто. Для цього достатньо як-небудь перенумерувати всі букви, цифри, знаки пунктуації та інші, які використовуються при листі символи. Для зберігання одного символу найчастіше використовується восьмирозрядна осередок - один байт, іноді два байта (ієрогліфи, наприклад). В байт можна записати 256 різних чисел, значить, це дозволить закодувати 256 різних символів. Відповідність символів та їх кодів задається в спеціальній таблиці. Коди записуються в шістнадцятковій системі, так як для запису числа з восьми розрядів потрібно всього дві шістнадцятирічних цифри.

кодування зображень

Цифрові персональні комп'ютери добре працюють з числами, але не вміють обробляти безперервні величини. Але людське око можна обдурити: зображення, складене з великого числа окремих дрібних деталей, сприймається як безперервне. Якщо розбити картинку вертикальними і горизонтальними лініями на маленькі мозаїчні квадратики, отримаємо так званий растр - двовимірний масив квадратиків. Самі квадратики - елементи растра або пікселі (Picture "s element) - елементи картинки. Колір кожного пікселя кодується числом.

Урок "Кодування інфомація".

Інформацію один одному ми передаємо в усній і письмовій формі, а також у формі жестів і знаків.

Знаки можуть мати різну фізичну природу . Наприклад, для представлення інформації з використанням мови в письмовій формі використовуються знаки, які є зображеннями на папері або інших носіях, в усному мовленні як знаки мови використовуються різні звуки (фонеми), а при обробці тексту на комп'ютері знаки представлені у формі послідовностей електричних імпульсів ( комп'ютерних кодів ).

види інформації

Інформація, як об'єкт класифікується за видами. Таких класифікацій кілька. Кожна наука вводить свою класифікацію. Для інформатики головним є те, яким чином інформація вводиться / виводиться, обробляється, зберігається, використовуючи засоби обчислювальної техніки. Тому в інформатиці прийнято таку класифікацію видів інформації:

Аналогова - безперервна (Сприймається людиною)		Дискретна - стрибкоподібне (Сприймається ВТ)

візуальна аудиальная тактильна нюхова смакова

*приклади:* скрипка телевізор телефон картина в музеї графіки функцій		*приклади:* фортепіано монітор музичний центр мобільний телефон

Форми подання інформації

Так як аналогову інформацію людина сприймає за допомогою своїх органів почуттів, то він прагне зафіксувати її таким чином, щоб вона стала зрозуміла іншим. При цьому одна і та ж інформація може бути представлена в різних формах.

У будь-якому вигляді інформація для нас висловлює відомості про кого-то або про щось. Вона відображає те, що відбувається або те, що сталося в нашому світі, наприклад: що ми робили вчора або будемо робити завтра, як буде виглядати випускну сукню або місце майбутньої роботи. Але при цьому інформація обов'язково повинна отримати деяку форму, найбільш зручну для сприйняття:

· текстів, малюнків, фотографій, креслень;

· жестів і міміки;

· запахів і смакових відчуттів;

· Радіохвиль;

· електричних і нервових імпульсів;

· магнітних записів;

· хромосом

Отримання інформації - це, в кінцевому рахунку, отримання фактів, відомостей і даних про властивості, структуру або взаємодії об'єктів і явищ навколишнього нас світу.

Мова як знакова система

У процесі розвитку людського суспільства люди виробили велику кількість мов. Серед них мову жестів і міміки, мова малюнків і креслень, мова музики і мову математики, розмовна мова, алгоритмічний мову і т. Д.

Для обміну інформацією з іншими людьми людина використовує природні мови (Російська, англійська, китайська та ін.), Тобто інформація може надаватися за допомогою природних мов.

Приклади алфавітів: В основі російської мови лежить кирилиця, Що містить 33 знака, англійська мова використовує латиницю (26 знаків), китайську мову використовує алфавіт з десятків тисяч знаків ( ієрогліфів).

Послідовності символів алфавіту відповідно до правил граматики утворюють основні об'єкти мови - слова. Правила, за якими утворюються пропозиції з слів даної мови, називаються синтаксисом . Необхідно відзначити, що в природних мовах граматика і синтаксис мови формулюються за допомогою великої кількості правил, з яких існують винятки, так як такі правила складалися історично.

Схема передачі інформації через писемність

УСНЕ МОВЛЕННЯ

лист

ТЕКСТ

читання

УСНЕ МОВЛЕННЯ

КОДИРОВАНИЕ ДЕКОДУВАННЯ

кодування інформації

Загальна схема обміну інформацією

Джерело інформації

кодує пристрій

Передача інформації

декодер

одержувач інформації

Кодування текстової інформації

Мови представлення інформації

природні:

Англійська, французька, ...

формальні:

Математики, програмування, ноти, ...

кодування інформації

цілі кодування

засекречування

інформації

швидкий спосіб запису

передача по технічних каналах зв'язку

виконання математичних обчислень

шифрування

стенографія

телеграфний код

системи числення

алгоритми криптографії

Один знак - слово або поєднання букв

код Морзе

грец. στενός - вузький, тісний і γράφειν - писати) - спосіб письма за допомогою особливих знаків і цілого ряду скорочень, що дає можливість швидко записувати усне мовлення. Швидкість стенографічного листа перевершує швидкість звичайного в 4-7 разів.

Так як вибір значків для стенографії в основному довільний, то з поєднань різних значків утворилося безліч стенографічних систем, кожна з яких має свої переваги і недоліки.

Мистецтво стенографії існувало вже, як можна зробити висновок за деякими даними, у древніх єгиптян , Де умовним знаком записувалися мови фараонів ; від єгиптян це мистецтво перейшло до грекам і римлянам , У яких були скорописця. 5 грудня 63 р. До н.е. е. в Стародавньому Римі відбулося перше відоме в історії застосування стенографії.

У деяких випадках виникає потреба засекречування документа або тексту. В цьому випадку текст шифрується. У давні часи зашифрований текст називався тайнописом.

шифрування - спосіб перетворення відкритої інформації в закриту і назад. Застосовується для зберігання важливої інформації в ненадійних джерелах або передачі її по незахищеним каналам зв'язку.

Шифрування - це теж кодування, але із засекреченим методом, відомим тільки адресату і джерела. Методами шифрування займається наука криптографія .

Розглянемо як приклад кодування відповідність цифрового і штрихового кодів товару. Такі коди є на кожному товарі і дозволяють повністю ідентифікувати товар (країну і фірму виробника, тип товару і штриховий коди товару.

Знаків цифрового коду (цифрам) відповідають групи знаків штрихового коду (вузькі і широкі штрихи, а також розміри проміжків між ними).

Для людини зручний цифровий код, а для автоматизованого обліку і штриховий код, який зчитується за допомогою вузького світлового променя і піддається подальшій обробці в комп'ютерних бухгалтерських системах обліку.

Домашнє завдання - придумайте або згадайте будь-яку інформацію і уявіть її в різних формах, створити схему:

Створення нової мелодії

Одна і та ж інформація може бути представлена (закодована) в декількох формах. C появою комп'ютерів виникла необхідність кодування всіх видів інформації, з якими має справу і окрема людина, і людство в цілому. Але вирішувати завдання кодування інформації людство почало задовго до появи комп'ютерів. Грандіозні досягнення людства - писемність і арифметика - є не що інше, як система кодування мови і числовий інформації. Інформація ніколи не з'являється в чистому вигляді, вона завжди якось представлена, як-то закодована.

Двійкове кодування - один з найпоширеніших способів подання інформації. В обчислювальних машинах, в роботах і верстатах з числовим програмним управлінням, як правило, вся інформація, з якою має справу пристрій, кодується у вигляді слів двійкового алфавіту.

Кодування символьної (текстової) інформації.

Основна операція, вироблена над окремими символами тексту - порівняння символів.

При порівнянні символів найбільш важливими аспектами є унікальність коду для кожного символу і довжина цього коду, а сам вибір принципу кодування практично не має значення.

Для кодування текстів використовуються різні таблиці перекодування. Важливо, щоб при кодуванні і декодуванні одного і того ж тексту використовувалася одна і та ж таблиця.

Таблиця перекодування - таблиця, яка містить упорядкований певним чином перелік кодованих символів, відповідно до якої відбувається перетворення символу в його двійковий код і назад.

Найбільш популярні таблиці перекодування: ДКОИ-8, ASCII, CP1251, Unicode.

Історично склалося, що в якості довжини коду для кодування символів було обрано 8 біт або 1 байт. Тому найчастіше одному символу тексту, що зберігається в комп'ютері, відповідає один байт пам'яті.

Різних комбінацій з 0 і 1 при довжині коду 8 біт може бути 28 = 256, тому за допомогою однієї таблиці перекодування можна закодувати не більше 256 символів. При довжині коду в 2 байти (16 біт) можна закодувати 65536 символів.

Кодування числової інформації

Подібність в кодуванні числової і текстової інформації полягає в наступному: щоб можна було порівнювати дані цього типу, у різних чисел (як і у різних символів) повинен бути різний код. Основна відмінність числових даних від символьних полягає в тому, що над числами крім операції порівняння виробляються різноманітні математичні операції: додавання, множення, добування кореня, обчислення логарифма та ін. Правила виконання цих операцій в математиці детально розроблені для чисел, представлених в позиційній системі числення.

Для кодування одного символу клавіатури використовують 8 біт - один байт.
Байт - це найменша одиниця обробки інформації. За допомогою одного байта можна закодувати 2 8 = 256 символів.
Існує таблиця кодів клавіатури. Перші коди з 32 по 127 є стандартними і обов'язковими для всіх країн і всіх комп'ютерів, а в другій половині (128-255) кожна країна може створювати свій стандарт - національний. Першу половину називають таблицею ASCII (Американський стандартний код для обміну інформацією).
Є й інші таблиці кодування KOI8-U, Wsndows-1251, Unicode. З перерахованих таблиць особливою є таблиця Unicode, оскільки кожен символ цієї таблиці кодується двома байтами.

поняття файлу
У комп'ютері будь-яка інформація (тексти, числа, малюнки, звуки) представлена у вигляді послідовності байтів. Для того, щоб комп'ютер розрізняв всі види інформації, вводиться таке поняття як формат. Кожна група байтів, що представляє певну закодовану інформацію, називається файлом. Файл повинен мати унікальне ім'я певного формату. На ім'я файлу комп'ютер визначає, де файл знаходиться, яка інформація в ньому міститься, в якому форматі вона записана і якими програмами її можна обробити. Файл - найменша одиниця зберігання інформації. Файл може зберігати десятки, сотні байтів.