КОДИРОВАНИЕ ИНФОРМАЦИИ
Информация делится на 2 вида:
!) Аналоговая (непрерывная) воспринимается человеком 2) Дискретная (скачкообразная) воспринимается вычислительной техникой
Код-это система условных
знаков для представления информации.
Кодирование –это операция
преобразования символов или группы символов одного кода в символы другого кода.
Человек кодирует информацию с
помощью языка.
Язык-это знаковая форма
представления информации.
Языки делятся на формальные
(язык математики, химии, программирования.) и естественные (русский язык, английский язык)
В вычислительной технике
используется двоичное кодирование информации. (1-есть сигнал, 0 нет сигнала).
1 бит кодирует 2 сообщения (0
или 1)
2 бита кодирует 4 разных сообщения (11, 10,01,00)
3 бита 8 разных сообщений.
4 бита 16 сообщений ….
Общая формула имеет вид: N=2I, где N –количество
значений информации, I-количество бит.
КОДИРОВАНИЕ ТЕКСТОВОЙ
ИНФОРМАЦИИ.
Каждому символу приведен в
соответствие уникальный двоичный код.
Сколько же бит необходимо для
кодирования символов?
Чтобы ответить на этот вопрос
необходимо подсчитать количество
символов. (русские, +английские буквы, +цифры, +специальные символы. ит.д
250)
Для кодирования такого
количества символов необходимо и достаточно 8 бит. 28=256.
Вот почему группа из 8 бит
получила специальное название байт.
С помощью 1 байта можно
закодировать 256 различных символов.
Для представления символов и
соответствующих им кодов используется кодовая таблица. В качестве стандарта во
всём мире принята таблица ASCII
В настоящее время существует
5 различных кодовых таблиц для русских
букв:
СP1251, CP866, KOI-8, MAS. , ISO
В настоящее время широкое распространение получил новый международный
стандарт Unicode, который отводит на каждый
символ не 1 бит, а два, поэтому с его помощью можно закодировать не 256
символов, а 216=65536
Сушествуют 2 подхода к измерению количества информации.
1) Содержательный или вероятностный подход .
2) Алфавитный подход.
|