Урок №7. Измерение информации.
Для количественного выражения любой величины необходима прежде всего единица измерения. Измерение осуществляется путём сопоставления измеряемой величины с единицей измерения. Сколько раз единица измерения «укладывается» в измеряемой величине, таков и результат измерения.
Вам известны единицы измерения длины — миллиметры, сантиметры, дециметры, метры, километры. Масса измеряется в граммах, килограммах, центнерах, тоннах. Углы измеряются в градусах. Время — в секундах, минутах, часах.
Бит (от англ, binary digit — «двоичная цифра») — единица измерения информации. Считается, что таков информационный вес символа двоичного алфавита; иначе говоря, бит — это одна двоичная цифра.
Вы уже знаете, что любую информацию, записанную на некотором естественном или формальном языке, можно представить с помощью двоичного кода. Другими словами, её можно представить как некий текст, состоящий из символов 0 и 1. Сколько в этом тексте 0 и 1, таков и его информационный объём в битах.
Путём подсчёта 0 и 1 нетрудно убедиться, что информационный объём сообщения 0011000110001111 составляет 16 бит. Используйте таблицу двоичных кодов из примера 2 предыдущего параграфа, чтобы декодировать это сообщение.
Чему будет равен информационный объём сообщения СТОЛ, если его перевести в двоичный код с помощью этой же таблицы?
Бит — слишком «мелкая» единица измерения информации. Следующая по величине единица измерения информации — байт.
Величина, равная восьми битам, называется байтом. 1 байт = 8 бит.
На практике для измерения информационных объёмов используются более крупные единицы:
1 Кбайт (один килобайт) = 1024 байт = 210 байт.
1 Мбайт (один мегабайт) = 1024 Кбайт = 210 Кбайт.
1 Гбайт (один гигабайт) = 1024 Мбайт = 210 Мбайт.
1 Тбайт (один терабайт) = 1024 Гбайт = 210 Гбайт.
Информационный объём двоичного текста равен количеству составляющих его 0 и 1. Но как вычислить информационный объём сообщения, записанного с помощью символов алфавита, отличного от двоичного?
Ранее мы выяснили, что алфавит любого естественного или формального языка можно закодировать равномерным двоичным кодом. При этом мощность исходного алфавита N связана с разрядностью двоичного кода i, требуемой для кодирования всех символов исходного алфавита, соотношением N ≤ 2i. Минимальную разрядность такого двоичного кода принято считать информационным весом символа исходного алфавита. Информационный вес символа алфавита выражается в битах.
Мощность произвольного алфавита N и информационный вес его символа i связаны между собой соотношением N ≤ 2i.
Задача 1
Алфавит племени Пульти содержит 8 символов. Каков информационный вес символа этого алфавита?
Решение
Составим краткую запись условия задачи.

Известно соотношение, связывающее величины i и N: N = 2i. С учётом исходных данных: 8 = 2i. Отсюда: i = 3.
Полная запись решения в тетради может выглядеть так:

Ответ: 3 бит.
Информационный объём сообщения (количество информации в сообщении), представленного символами естественного или формального языка, складывается из информационных весов составляющих его символов.
Информационный объём сообщения I равен произведению количества символов в сообщении К на информационный вес символа алфавита i: I = К • i.
Задача 2
Сообщение, записанное буквами 32-символьного алфавита, содержит 140 символов. Чему равен информационный объём этого сообщения?
Решение

Ответ: 700 бит.
Задача 3
Информационное сообщение объёмом 720 бит состоит из 180 символов. Какова максимально допустимая мощность алфавита, с помощью которого записано это сообщение?
Решение

Ответ: 16 символов.
Задача 4
Информационное сообщение объёмом 4 Кбайт состоит из 4096 символов. Каков информационный вес символа используемого алфавита? Какое наибольшее количество символов может содержать алфавит, с помощью которого записано это сообщение?
Решение

Ответ: 8 бит, 256 символов.
«Лесенка» на рис. 1.8 показывает действия, которые нужно выполнить для перевода количества информации из одних единиц в другие. Например, для того чтобы 2 Кбайт перевести в биты, нужно, двигаясь по верхней стрелке от ступеньки «1 Кбайт» к ступеньке «1 бит», сначала умножить число на 1024, а затем — ещё на 8:
2 Кбайт = 2 • (1 Кбайт) = 2 • 1024 байт = 2048 байт =
= 2048 • (1 байт) = 2048 • 8 бит = 16 384 бита.
Все коэффициенты для перевода количества информации в другие единицы — это степени двойки: 8 = 23, 1024 = 210.

Поэтому часто удобно выполнять расчёты, представляя все значения как степени числа 2:
2 Кбайт = 2 • 210 байт = 211 байт = 211 • 23 бит = 214 бит.