Общие сведения | Энциклопедия | Научные публикации | Публицистика | Новости | Каталоги | Авторы |
| На главную | О проекте | Контакты | | |
![]() |
Статья в Энциклопедическом Фонде
Формат MP3![]()
Формат MP3 - кодек третьего уровня, разработанный рабочей группой MPEG, лицензируемый формат файла для хранения аудиоинформации.
Звук в цифровом виде стал неотъемлемой частью нашей жизни. Одним из самых распространенных и популярных форматов цифрового кодирования звуковой информации стал MP3. Более точно его название звучит как MPEG-1 Layer III. 1. Общая информация MPEG (Motion Pictures Expert Group) - рабочая группа, созданная при Международной организации по стандартизации (ISO) и Международном электрическом комитете (IEC) с целью разработки стандартов сжатия видео и аудио-информации. MPEG определяет аудио- и видео-форматы, использующие сжатие с частичной потерей информации, а также операции производимые кодерами MPEG. 2. Кодирование данных Для создания MP3 файла применяются программы-компрессоры, включающие сложные алгоритмы, которые основаны на так называемом перцептивном кодировании (от англ. Perception - восприятие). Все принципы сжатия основаны исключительно на нелинейности человеческого слуха. Также оценивается минимальный слышимый уровень. Целью является получение сигнала, который в результате последующего декодирования будет казаться человеку идентичным исходному сигналу. Применяется несколько основных приемов для достижения большого уровня компрессии:
2.1. Минимальный порог слышимости Для человека он нелинеен и представлен кривой зависимости громкости (дБ) от частоты (Гц) с максимумом чувствительности в диапазоне от 2КГц до 5КГц (в соответствии с законом Флетчера и Мансена). Звуки расположенные ниже этой кривой исключаются. 2.2. Эффект маскирования Также человеческое ухо не слышит тихих звуков на фоне более громких, следовательно, они также будут исключены в результате преобразования. 2.3. Битовый резерв Часто определенные фрагменты музыкального произведения не могут быть закодированны в рамках данного битового диапазона без потерь качества. В таком случае MP3 использует небольшой запас битов, как буфер, кодируя менее сложные фрагменты в меньший битовый диапазон. 2.4. Прием Joint Stereo В связи с невозможностью органов слуха распознать панораму низких частот - они записываются как монофонический сигнал с добавлением некоторых данных, позволяющих восстановить минимальную информацию о пространственной звуковой картине. 2.5. Кодирование Хаффмана Используется на последней стадии сжатия. На этом этапе создаются коды переменной длины. Символы с большей вероятностью появления имеют коды меньшего размера, что позволяет избежать избыточного количества байтов в результате. Прием помогает сжать данные еще на 20%. 3. Фреймовая модель файла Все результаты кодирования исходного сигнала записываются в файл с расширением *.MP3, состоящий из одного или нескольких фреймов. Все фреймы зависимы друг от друга (связано это с наличием приема битового резерва) и состоит из двух частей: заголовка и аудио-данных, которые мы получаем в процессе сжатия исходного материала. Заголовок длинной в 32 бита используется при декодировании, и имеет следующую структуру:
4. ID3 теги Формат метаданных содержащий информацию о названии, исполнителе, альбоме и т.д. называется ID3. Существуют две совершенно разных версии метаданных этого типа. ID3v1 находится в конце файла его размер составляет 128 байт и имеет следующую структуру:
4.1. ID3v2 Практически сразу возникла необходимость увеличить размер ID3-данных. Так появилась вторая версия ID3v2. Такой тип метаданных представляет собой фрейм, имеет переменную длину и размещается вначале файла, что дает возможность поддерживать потоковую передачу. Как любой фрейм имеет заголовок и информативную часть.
5. Заключение В данной статье рассматривались структурные особенности строения файла в формате MPEG-1, Layer III(MP3). Формат представления аудиоданных MP3 - это сложный, структурированный набор данных, позволяющий сократить размер исходного звукового материала в 10 - 12 раз, без значительного изменения качества с точки зрения восприятия человеком. Помимо проблем хранения данных, существенное уменьшение размера при кодировании снижает объем сетевого трафика, что достаточно удобно при использовании потоковой передачи мультимедиа. 6. Используемые источники |
|
|