 |
М о н а х |
 |
Зарегистрирован: Вт янв 20, 2009 9:20 pm
Сообщения: 231
|
Сжатие аудио
PCM — Pulse Code Modulation
Материал из Википедии — свободной энциклопедии
Импульсно-кодовая модуляция (или англ. PCM—Pulse Code Modulation) используется для оцифровки аналоговых сигналов. Все виды аналоговых данных (видео, голос, музыка, телеметрия, виртуальные миры) допускают применение PCM.
Чтобы получить на входе канала связи (передающий конец) ИКМ-сигнал из аналогового, мгновенное значение аналогового сигнала измеряется через равные промежутки времени. Количество оцифрованных значений в секунду (или частота дискретизации) должно быть не ниже 2-кратной максимальной частоты в спектре аналогового сигнала. Мгновенное измеренное значение аналогового сигнала округляется до ближайшего уровня из нескольких заранее определенных значений. Этот процесс называется квантованием, а количество уровней всегда берется кратным степени двойки, например, 8, 16, 32 или 64. Номер уровня может быть соответственно представлен 3, 4, 5 или 6 битами. Таким образом, на выходе модулятора получается набор битов (0 или 1).
На приёмном конце канала связи демодулятор преобразует последовательность битов в импульсы собственным генератором с тем же уровнем квантования, который использовал модулятор. Далее эти импульсы используются для восстановления аналогового сигнала в ЦАП.
Наиболее простым способом представления аудио информации для компьютера является формат PCM. Файлы PCM чаще всего называют WAV-файлами и широко используют для хранения коротких звуковых фрагментов. Например, системные звуки Windows хранятся в формате WAV. Также PCM используется для хранения музыки на аудио компакт-дисках. PCM-информация хранится в несжатом виде, каждая единица данных (sample) представляет собой просто точку на осциллограмме звукового потока. Основными параметрами WAV-файла (да и цифрового звука вообще) являются частота дискретизации и разрядность. Частота дискретизации – это количество единиц (квантов) информации в секунду, закодированных в потоке. Она определяет спектр частот, который может быть сохранен в звуковом файле. Разрядность – это количество значений, которые может принимать каждый квант. Для обоих параметров работает очень простое правило: чем больше – тем лучше. Для стандарта Audio CD были приняты значения частоты и разрядности, равные соответственно 44100 KHz / 16 Bit. Первое число определяет, что спектр хранимых частот ограничен пределами 0 – 22050 КГц. (Человеческое ухо не слышит более высоких звуков). Второе число определяет, что каждый квант потока может принимать 2^16 = 65536 различных значений. Этого в большинстве случаев вполне достаточно, чтобы слушатель не смог отличить цифровой звук от живого. Главной проблемой стандарта PCM является то, что файлы имеют большой размер. 74 минуты музыки занимают порядка 800Мб. Это слишком много, чтобы хранить коллекцию музыкальных записей на жестком диске домашнего компьютера.
Для решения этой проблемы было придумано несколько методов сжатия звукового потока. Как было выяснено, человеческое ухо воспринимает далеко не всю звуковую информацию, которую может хранить формат PCM, и большинство методов сжатия аудио используют это правило, которое имеет название «сжатие с потерями». К примеру, вы не расслышите шелест опадающих листьев на фоне рева турбин реактивного самолета, поэтому можно хранить только звук турбин (средне-высокие частоты), а тихий шелест удалить (средние частоты)
CBR
CBR-Constant Bit Rate, то есть Постоянный битрейт, который задается пользователем и не изменяется при кодирования произведения, таким образом каждой секунде произведения соответствует одинаковое количество закодированных бит данных (даже при кодировании тишины). Данный режим кодирования не является оптимальным, так как он не годится для большинства динамичных музыкальных произведений при битрейте ниже 256 кбит/c.
ABR
ABR-Average Bit Rate, Усредненый Битрейт, который является гибридом VBR и CBR: битрейт в кбит/c задается пользователем, а программа варьирует его, постоянно подгоняя под заданный битрейт. Таким образом, кодер будет с осторожностью использовать максимально и минимально возможные значения битрейта, так как рискует не вписаться в заданный пользователем битрейт. Это является явным минусом данного метода, так как сказывается на качестве выходного файла, которое будет немного лучше, чем при использовании CBR, но намного хуже, чем при использовании VBR. С другой стороны, этот метод позволяет наиболее гибко задавать битрейт (может быть любым числом между 8 и 320, против исключительно кратных 16 чисел метода CBR) и вычислять размер выходного файла.
VBR
Нетрудно себе представить, что некоторые участки исходного аудио-материала могут быть сложнее других, обладать более насыщенной амплитудно-частотной характеристикой (АЧХ) для компрессора. Разумнее было бы расходовать на описание этих участков больше данных для повышения качества полученного файла. VBR-Variable Bit Rate, Переменный Битрейт, который динамически изменяется программой-кодером при кодировании, в зависимости от насыщенности кодируемого аудиоматериала и установленного пользователем качества кодирования (тишина закодируется с минимальным битрейтом). Этот метод MP3-кодирования является самым прогрессивным и до сих пор развивается и улучшается, так как аудиоматериал разной насыщенности может быть закодирован с определенным качеством, которое обычно выше, чем при установке среднего значения в методе CBR. Плюс к тому, размер файла уменьшается за счет фрагментов, не требующих высокого битрейта. Минусом данного метода кодирования является полная невозможность предсказать размер выходного файла. Но этот недостаток VBR-кодирования незначителен в сравнение с его достоинствами. Также минусом является то, что VBR считает «незначительной» звуковой информацией более тихие фрагменты, таким образом получается, что если слушать очень громко, то эти фрагменты будут некачественными, в то время как CBR делает с одинаковым битрейтом и тихие, и громкие фрагменты. Формат VBR постоянно улучшается, благодаря постоянному совершенствованию математической модели кодеков, в частности после выхода обновленной версии свободного mp3-кодека lame (версия 3.98), кодирование с переменным битрейтом, по заявлению самих разработчиков, качественно лучше CBR и тем более ABR.
MPEG http://www.mpeg.org
MPEG – это организация, которая с начала 90-х годов занимается проблемами представления мультимедийной информации (аудио и видео) в цифровом виде. Наиболее известные из решений MPEG – это серия стандартов MPEG-1 (Video-CD) и MPEG-2 (DVD). Знаменитый формат MP3 – это один из стандартов серии MPEG-1. Его полное название – MPEG-1 Layer 3. Основным параметром потока MP3 является так битрейт (bitrate), который определяет количество информации, описывающее каждый временной промежуток звуковых данных. Легко вычислить битрейт для стерео файла PCM с параметрами 44100 / 16. Он будет равен 44,100 * 16 * 2 = 1,411,200 бит в секунду.
(На два нужно умножать, потому что стереозвук идет по двум каналам). Для того, чтобы было удобно представлять такие величины, используют понятия килобит (тысяча бит) и мегабит (миллион бит), соответственно, в секунду. Полученное нами значение примерно равно 1,4 мегабит в секунду (Мбит / Mbit).
Перед разработчиками стандарта MP3 была поставлена задача достичь качества звучания аудио компакт-диска при битрейте 128 кб/с (kbps), что соответствует степени сжатия более чем в 11 раз, и это им, с некоторыми оговорками, удалось. Дело в том, что алгоритму сжатия с потерями вместе с «мусором», при низких битрейтах, приходится удалять и полезную информацию, а это ведет к возникновению искажений при воспроизведении готового файла. Такие искажения принято называть артефактами. Для MP3 артефакты обычно представляют характерный звон на высоких частотах при битрейтах ниже 160 Кб/с, поэтому для хранения качественного аудиоматериала надо использовать более высокие битрейты, например 192Кб/с.
Стандарт MP3 является открытым. Это значит, что написать программу для сжатия аудио в этот формат имеет право каждый разработчик. Поэтому появилось великое множество программ для сжатия в MP3. Наиболее удачной из них является почтенного возраста проект Lame http://mp3dev.net.
Однако в вопросах распространения программного обеспечения, которое использует технологию сжатия и декомпрессии MP3, наблюдается некоторая юридическая путаница. С одной стороны, некоторая часть алгоритмов MP3 запатентована и разработчики обязаны покупать лицензию. С другой – никто не воспрепятствует, скажем, использованию бесплатного компрессора winLame и бесплатного проигрывателя WinAMP.
_________________

Не знаю я-кого благодарить?
Тебя открыв, как новую планету-
Я научился пламенно любить
И с гордой головой иду по свету!
|
|