7-Lesson №19 — Сайт учителя информатики

Урок №19. Кодирование звука.

Звук — это колебания среды (воздуха, воды), которые воспринимает человеческое ухо. С помощью микрофона звук преобразуется в непрерывный (аналоговый) электрический сигнал, который в любой момент времени может принимать любое значение в некотором интервале (рис. 2.30).

Как вы знаете, современные компьютеры обрабатывают только дискретные сигналы (двоичные коды). Поэтому для работы со звуком необходима звуковая карта — специальное устройство, которое полученный с микрофона аналоговый сигнал превращает в двоичный код. Это называется оцифровкой звукового сигнала.

Оцифровка — это преобразование аналогового сигнала в цифровой код.

Ситуация напоминает ту, с которой мы столкнулись при кодировании рисунка — любая линия состоит из бесконечного числа точек, поэтому, чтобы её закодировать, нужна бесконечная память. Здесь тоже придётся использовать дискретизацию — представить аналоговый сигнал в виде набора чисел, т. е. записать в память только значения сигнала в отдельных точках, взятых с некоторым шагом Т по времени (рис. 2.31).

Число Т называется интервалом дискретизации, а обратная ему величина 1/Т — частотой дискретизации. Частота дискретизации обозначается буквой f и измеряется в герцах (Гц) и килогерцах (кГц). Это число показывает, сколько раз в секунду выполняются измерения.

Чем больше частота дискретизации, тем точнее мы записываем сигнал, тем меньше информации теряем и тем лучше будет качество звучания. Однако при этом возрастает количество данных и увеличивается объём файла, в котором хранится закодированный звук.

Как же выбрать оптимальную частоту при кодировании? Учёные установили, что частоту дискретизации нужно брать в два раза больше, чем максимальная частота колебаний сигнала, который мы хотим записывать.

Известно, что человек в среднем слышит только звуки (колебания воздуха или другой среды) с частотами от 16 Гц до 20 кГц, поэтому все частоты выше 20 кГц можно «потерять» практически без ухудшения качества звука (человек не почувствует разницу!). Поэтому достаточно использовать частоту дискретизации около 40 кГц, повышать её дальше нет смысла. Более низкие частоты дискретизации применяют тогда, когда важно всячески уменьшать объём звуковых данных (например, для трансляции радиопередач через Интернет), даже ценой ухудшения качества.

С помощью оцифровки можно закодировать любой звук, который принимает микрофон. Это единственный способ кодирования человеческого голоса и различных природных звуков (шума прибоя, шелеста листвы и т. п.).

Однако у этого метода есть и недостатки:

при оцифровке звука всегда есть потеря информации (из-за дискретизации);
звуковые файлы, полученные с помощью оцифровки, имеют, как правило, большой размер.

Используя дополнительные источники, выясните, какая частота дискретизации используется:

а) для того чтобы можно было распознать речь человека;
б) на звуковых компакт-дисках;
в) в фильмах формата DVD;
г) для высококачественного кодирования звука в формате DVD-audio.

2. ГЛУБИНА (разрядность) КОДИРОВАНИЯ.

Кроме того, что при кодировании звука выполняется дискретизация с потерей информации, нужно учитывать, что для хранения одного результата измерения в памяти отводится ограниченное место. При этом вносятся дополнительные ошибки.

Представим себе, например, что на одно измерение выделяется 3 бита. При этом код каждого сохранённого значения — это целое число от 0 до 7. Весь диапазон возможных значений сигнала делится на 8 полос, каждой из которых присваивается свой код. Все значения, попавшие в одну полосу, имеют одинаковый код (рис. 2.32).

Преобразование измеренного значения сигнала в целое число называется дискретизацией по уровню, или квантованием. Эту операцию выполняет АЦП — специальный блок звуковой карты.

Глубина кодирования (или разрядность кодирования) звука — это число бит, используемое для хранения одного отсчёта.

Используя дополнительные источники, найдите ответы на вопросы.

Как расшифровывается сокращение АЦП?
Сколько различных значений можно закодировать, если разрядность кодирования равна 8 бит; 16 бит; 24 бита?
Какую разрядность имеют современные звуковые карты?

3. ВЫВОД ЗВУКА.

Устройства вывода звука — наушники и звуковые колонки — это аналоговые (не цифровые) устройства, поэтому при проигрывании звука звуковая карта должна как-то восстановить аналоговый сигнал. Вспомним, что у нас есть только значения, измеренные с интервалом Т. В простейшем случае по ним можно восстановить ступенчатый сигнал, который будет существенно отличаться от исходного (до кодирования). В современных звуковых картах для повышения качества звука этот ступенчатый сигнал сглаживается с помощью специальных фильтров, однако восстановить точно исходный сигнал всё равно не удаётся, так как информация о значениях сигнала между моментами квантования была потеряна при оцифровке (рис. 2.33).

Для повышения качества звука, т. е. для большего соответствия между сигналом, принятым микрофоном, и сигналом, выведенным из компьютера на колонки, нужно увеличивать частоту дискретизации, однако при этом, как вы уже знаете, увеличивается и объём файла.

Используя дополнительные источники, найдите ответы на вопросы.

Что такое ЦАП?
Зачем нужен ЦАП в звуковой карте?
Что такое звуковой фильтр?

4. ОБЪЁМ ЗВУКОВЫХ ДАННЫХ.

Объём данных, полученный после оцифровки звука, зависит от разрядности кодирования и частоты дискретизации. Например, пусть частота оцифровки равна 44 кГц (за 1 с выполняется 44000 измерений сигнала), и используется 16-разрядное кодирование (каждое из измеренных значений занимает 16 бит = 2 байта). Тогда за 1 секунду накапливается 44 000 • 2 = 88 000 байт информации, а за 1 минуту:

88 000 • 60 = 5 280 000 байт = 5 Мбайт.

Если записывается стереозвук (левый и правый каналы), это число нужно удвоить.

Используя дополнительные источники, найдите ответы на вопросы.

Как называется одноканальный звук?
Что такое квадрофонический звук (квадрозвук)?
Что такое битрейт?

В целом, качество преобразования непрерывного звукового сигнала в дискретный сигнал зависит:

1. от того, сколько раз в секунду будет измерен исходный сигнал (частота дискретизации);
2. от количества бит, выделяемых для записи каждого результата измерений (глубина кодирования);
3. от количества каналов записи (моно — один канал, стерео — два канала и т. д.).

Чем больше частота дискретизации и глубина кодирования, тем точнее представляется звук в цифровой форме и тем больше размер файла, хранящего такую информацию.

Размер звукового файла вычисляется по формуле

I = v • i • k • t,

где:

v — частота дискретизации (Гц);

i — глубина кодирования (бит);

k — количество каналов (моно — 1, стерео — 2);

t — время звучания (с).

Пример 1

Вычислим размер в килобайтах стереоаудиофайла длительностью звучания 8 секунд при глубине кодирования звука 8 бит и частоте дискретизации 8000 Гц.

Решение

Ответ: 125 Кбайт

5. ДОМАШНЯЯ РАБОТА.

Выполнить домашнюю работу

6. КЛАССНАЯ РАБОТА.

Выполнить классную работу