Today is a free download without charge Download

Пособие для релизеров: Аудиоформаты

Reply to topic
 
Author
Message

RUGUI ®

Gender:

Longevity: 8 years 8 months

Posts: 451

Торрент-статистика

Post 11-May-2013 17:16

[Quote]

*Аудиоформаты*-Общая часть-Для начала хотелось бы привести основные определения:
  • Цифровой звук – это набор импульсных сигналов формирующих цифровой код, в котором закодировано текущее значение амплитуды аналогового сигнала.
  • Звуковой файл - файл, хранящий звуковую информацию в числовой двоичной форме.
  • Формат - расширение имени файла, (англ. filename extension, часто говорят просто расширение файла или расширение) — последовательность символов, добавляемых к имени файла и предназначенных для идентификации типа (формата) файла. Это один из распространённых способов, с помощью которых пользователь или программное обеспечение компьютера может определить тип данных, хранящихся в файле.
Говоря о аудио форматах нужно выделить два основных понятия, которые определяют качество звучания цифрового сигнала:

Битрейт (Единицы измерения - килобиты в секунду (Kbps))

Битрейт - Количество бит информации передано за секунду. Чем выше тем лучше качество звучания;
Различают следующие типы битрейтов:
CBR:Constant Bitrate— постоянный битрейт, в котором, проще говоря, каждая секунда аудио кодируется одинаковым числом бит;
ABR: Average Bitrate — усредненный битрейт;
VBR: Variable Bitrate — переменный битрейт, в которых битрейт варьируется, обеспечивая более высокое качество звучания;

Частота дискретизации (Единицы измерения - килогерц (KHz))

Частота дискретизации – это количество измерений входного сигнала за 1 секунду. (Частота измеряется в герцах (Гц).
Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду – 1 килогерц (кГц))

Дискретизация по времени означает, что сигнал представляется рядом своих отсчетов (семплов), взятых через равные промежутки времени. Например, когда мы говорим, что частота дискретизации 44,1 кГц, то это значит, что сигнал измеряется 44100 раз в течении секунды (в МО обычно применяется более доходчивый термин "частота семплирования", однако "частота дискретизации" правильнее - прим. ред.).-!!!чем больше частота - тем точнее соответствует цифровой сигнал аналоговому!!!-Сегодня самыми распространенными частотами дискретизации являются 44,1 кГц (CD) и 48 кГц (DAT). Впрочем, в последнее время идет немало разговоров о том, что обертоны, расположенные свыше 20 кГц, вносят немалый вклад в звучание и в результате появляются преобразователи, использующие частоты дискретизации 96 кГц и 192 кГц, а в недалеком будущем ожидается появление и систем с частотой 384 кГц.
Как и аналоговый, цифровые потоки делятся на одно и многоканальные.

Основные виды

Mono: Звук кодировался в один канал;
Double Mono: Звук кодировался в один канал, но оба канала идентичны;
Stereo: Звук кодировался в два канала;
Joint Stereo: сигналы левого и правого каналов кодируются вместе, а передается, например, левый и его отличие от правого. Режим используется, когда необходимо предельно снизить скорость передачи.
Quadro: Звук кодировался в четыре канала;
Surround: Звук кодировался в 5 или более каналов.
От того как будет выглядеть будущий цифровой аудио фаил напрямую зависит от кодека.

Что такое кодек

Слово кодек происходит от сочетания слов КОдер - ДЕКодер, КОмпрессор - ДЕКопрессор.
Кодек - это программа,предназначенная для кодирования (сжатия) и декодирования (воспроизведение) аудио и видео файлов.-Кодеки с потерями и кодеки без потерь
Конечная цель использования кодеков - сжатие медиа файлов, сохраняя при этом максимально хорошое качество. Большинство кодеков это, так называемые, кодеки с потерями, назначение которых - уменьшение (сжатие) размеров исходного аудио или видео файла. Существуют также кодеки без потерь, их цель - улучшение качества медиа файла, одновременно с этим не увеличивая исходный размер файла.
Примеры файловых форматов, создаваемые кодеками с потерями: AAC (Advanced Audio Coding), MP3, Vorbis (файлы формата *.OGG), Windows Media Audio с потерями ( *.WMA). Примеры файловых форматов, создаваемые кодеками без потерь: Apple Lossless ( *.m4a), FLAC, Monkey's Audio ( *.APE), Shorten, TTA, Windows Media Audio без потерь ( *.WMA), WavPack.
Основное предназначение кодеков - это уменьшение исходного размера медиа файла, "сжатие" аудио и видео файлов.
Конечно говорят о цифровом звуке нам не мешало бы упомянуть о таких вещах как разрядность, дизеринг, нойс шейпинг, джиттер, но это, скажем так, понятия которые больше подходят для профессионалов занимающиеся переводам звука из аналогового в цифровой. Цель же данного пособия ознакомить вас с наиболее основными моментами, для успешной работы с аудио форматами в рамках релизера и потребителя музыкального материала.-Аудио кодеки и форматы-В современном цифровом мире аудио данные используются совершенно в разных целях. Как звуковое сопровождение сайта или игры, в качестве реалтонов для мобильника, саунтреки для фильмов, музыка для портативных носителей, или же как качественные треки для мощных аудиосистем. В зависимости от направленности данных и формируются многочисленные кодеки, обрабатывающие информацию в зависимости от целей потребителя.
Первое, что мы сделаем это разделим кодеки на две категории.

Lossless (кодеки сжатия без потерь)

Сжатие без потерь — это технология компрессирования звуковых файлов без потерь, в результате которой сжатый файл при декодировании восстанавливается полностью бит-в-бит идентично оригинальному несжатому звуковому файлу.
Грубо говоря, эта технология подобна сжатию звукового файла архиваторами типа ZIP или RAR.
Но существует большая разница между сжатием файла архиваторами ZIP/RAR и сжатием звукового файла кодеками без потерь. Кодеки специально подстроены и изначально создавались под работу только с аудио, поэтому они «знают» как работать с особенностями звуковых файлов и обладают специальными алгоритмами, позволяющие им сжимать звук намного лучше, чем это сделали бы обычные программы-архиваторы.
Сжатие без потерь сохраняет всю информацию оригинального звукового файла; аудио сжатое без потерь будет иметь неизбежно больший размер на диске по сравнению с аудио, сжатым с потерями. Однако, несмотря на такое неудобство, сжатый без потерь звук приобретает возможность транскодирования в другие форматы без потерь, причем абсолютно без потерь.

Lossy (кодеки сжатия с потерями)

Сжатие с потерями — это технология сжатия звуковых файлов, которая значительно уменьшает размер кодированного файла по сравнению с оригинальным за счет удаления информации, невоспринимаемой человеком.
Люди не могут похвастать идеальным слухом. Технология сжатия с потерями этот человеческий недостаток для себя превращает в преимущество, отбрасывая выборочным путем «ненужную» информацию. В поисках компромисса между маленьким размером и высоким качеством, обычно, можно настраивать количество отбрасываемой информации.
Негативным моментом этой технологии является тот факт, что кодированный файл никогда не будет полностью идентичен оригиналу.
-Теперь рассмотрим поподробнее какие бывают кодеки в этих категориях:-Lossless несжатые:

CDDA

Звуковой компакт-диск (CDDA, также называемый англ. Audio CD и Red Book) — стандарт для компакт-дисков со звуковым содержимым.
Формат хранения звуковой информации — PCM 44 100 Гц, 16-бит стерео.
Название Red Book (красная книга) связано с вхождением стандарта в набор стандартов форматов компакт‐дисков, известных как цветные книги. Первая редакция стандарта издана в июне 1980 года компаниями Philips и Sony, она была доработана организацией Digital Audio Disc Committee, а затем ратифицирована как стандарт IEC 908. Он не является свободно доступным и подлежит лицензированию у Philips. На момент написания статьи стоимость формы заявки на лицензию составляла 5000 долларов США. Текст стандарта доступен для скачивания в формате PDF и сто́ит 242 доллара США.
CDDA не следует путать с CD-ROM, хотя они используют схожий физический носитель и одну систему канального кодирования.

WAV

WAV (WAVE) — формат файла-контейнера для хранения записи оцифрованного аудиопотока. Под Windows этот формат чаще всего используется в качестве оболочки для несжатого звука (PCM), когда для каждого отсчёта амплитуды сигнала выделяется определённое число бит. Однако, в контейнер WAV можно поместить звук, сжатый почти любым кодеком (но с воспроизведением таких файлов могут возникать проблемы).

Список других аудиоформатов из этой серии

  • AIFF
  • AU
  • IFF-8SVX — Interchange File Format
  • IFF-16SV
  • RAW — сырые замеры без какого-либо заголовка или синхронизации
Lossless сжатые:

FLAC

FLAC — это аббревиатура от Free Lossless Audio Codec (свободный аудио кодек сжатия без потерь). Грубо говоря, FLAC подобен MP3, но является кодером сжатия без потерь, т.е. сжатые этим кодером файлы в качестве ничего не теряют. Система подобна тому, как работает архиватор Zip, за исключением того, что с FLAC вы получите гораздо большую степень сжатия, поскольку кодер создан специально для сжатия аудио.-Основные аспекты формата FLAC
FLAC свободно распространяемый кодер, имеющий поддержку на большинстве операционных систем, включая Windows, UNIX (Linux, *BSD, Solaris, OS X, IRIX), BeOS, OS/2, и Amiga.
Когда мы говорим, что FLAC «свободный формат», то это значит нечто больше, чем просто отсутствие необходимости платить за его использование. Спецификация формата полностью открыта для всех людей и может использоваться для любых целей (проект FLAC оставляет за собой право устанавливать спецификацию), а сам формат и методы кодирования/декодирования не попадают ни под один известный патент. Свободный FLAC принимает лицензию Open Source, соответственно вы можете скачать его исходные коды. FLAC первый реально открытый и свободный формат сжатия аудиоданных без потерь.
FLAC-файлы также могут быть размещены внутри контейнера Ogg при помощи libOggFLAC и libOggFLAC++.
Характеристики
Без потерь: при кодировании аудиоданных (PCM) не допускаются никакие потери, то есть декодированное аудио идентично бит-в-бит оригиналу. Каждый фрейм данных содержит 16-битный CRC для детектирования ошибок при передаче. Целостность аудиоданных в дальнейшем также страхуется записью в заголовок файла MD5-сигнатуры, вычисленной на основе оригинальных некодированных аудиоданных, которую потом при декодировании или тестировании можно сравнить.
Скорость: FLAC декодирует только при помощи целочисленных алгоритмов, что гораздо менее ресурсоемко по сравнению с другими кодерами. Декодирование в реальном времени возможно даже на весьма «скромном» оборудовании.
Аппаратная поддержка: поскольку FLAC открытый формат и обладает весьма скромными запросами по части декодирования, то он на данный момент единственный кодер без потерь, у которого есть аппаратная поддержка.
Поточность: каждый фрейм в файлах FLAC полностью содержит всю необходимую информацию для декодирования. FLAC не будет ссылаться на предыдущий или последующий фрейм; FLAC использует коды синхронизации и CRC (подобно MPEG), которые позволяют декодеру перейти на середину потока с минимальной задержкой.
Поиск: FLAC поддерживает быстрый сэмпло-аккуратный (sample-accurate) поиск. Эта характеристика полезна не только для воспроизведения, но и для разного рода программ-редакторов.
Гибкость метаданных: новые блоки метаданных могут быть определены и добавлены в следующих версиях кодера без какого-либо нарушения для старых версий декодеров. На данный момент существуют типы метаданных для тегов, cue sheets, таблиц поиска. Сторонние приложения могут записывать собственный тип метаданных APPLICATION, зарегистрировав свой идентификатор
Плюсы
  • Перенес на многие системы
  • Open Source и свободная лицензия
  • Аппаратная поддержка (PhatBox, Kenwood MusicKeg, Rio Karma, и т.п. См. ниже)
  • Потоковая поддержка
  • Очень быстрое декодирование
  • Многоканальная поддержка и высокая разрешающая способность потоков
  • Поддержка ReplayGain
  • Поддежка cue-sheet (с небольшими ограничениями)
  • Широкое распространие в качестве наследника формата Shorten
Минусы
  • Эффективность сжатия немногим меньше, чем у других популярных кодеров (MonkeyAudio, OptimFROG)
  • Режим максимальной компрессии достаточно медленен

Apple Lossless (ALAC)

Apple Lossless (также известен как Apple Lossless Encoder, ALE, или Apple Lossless Audio Codec, ALAC) — это кодер сжатия аудио без потерь, разработанный компанией Apple Computer.-Apple Lossless хранит данные в контейнерах MP4 или MOV в файлах с расширением .m4a или .mov. Этот кодер не вариант AAC, но совершенно новая разработка. Apple iPod c dock connector и последней прошивкой может воспроизводить файлы, закодированные с помощью Apple Lossless.-ALAC не использует никаких схем защиты авторского контента DRM, но подобные схемы может использовать контейнер, то есть DRM может применяться к ALAC также, как и к другим файлам в контейнерах QuickTime.
Apple утверждает, что файлы, сжатые этим кодером освободят «около половины своего оригинального занимаемого места».
Впервые кодер Apple Lossless был представлен публике в качестве компонента QuickTime 6.5.1 28-го апреля 2004 года и как часть Apple iTunes 4.5. Этот кодек также использовался в AirPort Express's AirTunes.-David Hammerton и Cody Brocious провели анализ и «вскрыли» этот кодек без какой-то либо документации по формату. 5-го марта 2005 года, Hammerton опубликовал простой декодер на принципах open source, созданный на языке C.

APE

Monkey's Audio (APE) это бесплатный формат сжатия звука без потерь с высококонкурентным алгоритмом сжатия, в основном используемый пользователями платформы Windows. Хотя программное обеспечение доступно и для операционной системы Linux, Monkey's Audio на этой платформе не популярен. Monkey's Audio страдает от низкой скорости декодирования, что видно из сравнений с другими кодеками сжатия без потерь.-Monkey's Audio использует комбинацию традиционных тактик сжатия без потерь — linear_prediction, channel_coupling) и Neural_network. Для сохранения выходных значений на шаге предугадывания, кодер использует модифицированное Range_coding.-Monkey's Audio's главный конкурент формату FLAC, у которого больше функций (например, потоковая поддержка) и аппаратная поддержка, хотя у APE больше эффективность сжатия.-Monkey's Audio выпускается под собственной лицензией, по которой, после запроса к автору, можно работать с исходным кодом кодека.

WAVPack

WAVPack - это полностью открытый звуковой формат сжатия, обеспечивающий сжатие без потерь, высококачественный режим с потерями, и уникальный гибридный режим сжатия. WAVPack практически ни в чём не уступает Monkey's Audio, а в некоторых аспектах даже превосходит его.

Список других аудиоформатов из этой серии

  • Lossless Audio (.la)
  • Lossless Predictive Audio Compression (LPAC; .pac)
  • OptimFROG (.ofr)
  • RKAU (.rka)
  • Shorten (.shn)
  • TTA — True Audio, свободный кодек
  • TAK (.tak) — (T)om’s lossless (A)udio (K)ompressor
    [*]Windows Media Audio 9 Lossless (.wma)
  • ADX — формат звука с максимальным битрейтом в 1 Гбит/с
Lossless форматы и их утилиты являются пожалуй сейчас одной из самых обсуждаемых тем, поэтому подробнее эти кодеки мы рассмотрим в отдельной теме.-Lossy:

MP3

MP3(более точно, англ. MPEG-1/2/2.5 Layer 3 (но не MPEG-3) — третий формат кодирования звуковой дорожки MPEG — лицензируемый формат файла для хранения аудио-информации.-На данный момент MP3 является самым известным и популярным из распространённых форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Формат может проигрываться практически в любой популярной операционной системе, на практически любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.-В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения очень близкого к оригинальному (по мнению большинства слушателей), хотя меломаны говорят об ощутимом различии. При создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/10 от оригинального файла с аудио CD. MP3 файлы могут создаваться с высоким или низким битрейтом, который влияет на качество файла-результата. Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Данный метод называют кодированием восприятия.[1] При этом на первом этапе строится диаграмма звука в виде последовательности коротких промежутков времени, затем на ней удаляется информация не различимая человеческим ухом, а оставшаяся информация сохраняется в компактном виде. Данный подход похож на метод сжатия, используемый при сжатии картинок в формат JPEG.-Существует три версии MP3 формата для различных нужд: MPEG-1, MPEG-2 и MPEG-2.5. Отличаются они возможными диапазонами битрейта и частоты дискретизации:
32 — 320 кбит/c при частотах дискретизации 32000 Гц, 44100 Гц и 48000 Гц для MPEG-1 Layer 3;
16 — 160 кбит/c при частотах дискретизации 16000 Гц, 22050 Гц и 24000 Гц для MPEG-2 Layer 3;
8 — 160 кбит/c при частотах дискретизации 8000 Гц и 11025 Гц для MPEG-2.5 Layer 3
.-В этом формате звуки кодируются частотным образом (без дискретных партий); есть поддержка стерео, причём в двух форматах (подробности — ниже). MP3 является форматом сжатия с потерями, то есть часть звуковой информации, которую (согласно психоакустической модели) ухо человека воспринять не может или воспринимается не всеми людьми, из записи удаляется безвозвратно. Степень сжатия можно варьировать, в том числе в пределах одного файла. Интервал возможных значений битрейта составляет 8 — 320 кбит/c. Для сравнения, поток данных с обычного компакт-диска формата Audio-CD равен 1411,2 кбит/c при частоте дискретизации 44100 Гц.-Структура файла
MP3 файл состоит из нескольких фрагментов (фреймов) MP3, которые в свою очередь состоят из заголовка и блока данных. Такая последовательность фрагментов называется элементарным потоком. Фрагменты не являются независимыми элементами («резервуар байт») и поэтому не могут быть извлечены произвольно. Блок данных MP3 файла содержит сжатую аудио информацию в виде частот и амплитуд. На приведенной диаграмме показано, что заголовок MP3 состоит из маркера, который служит для нахождения верного MP3 фрагмента. За ним следует бит, показывающий что используется стандарт MPEG и два бита, показывающие использование layer 3; другими словами это определяет MPEG-1 Audio Layer 3 или MP3. Последующие значение могут варьироваться в зависимости от типа MP3 файла. Стандарт ISO/IEC 11172-3 определяет диапазон значений для каждой секции заголовка, вместе с общей его спецификацией. Большинство MP3 файлов в настоящий момент содержат ID3 метаданные, которые предшествуют или следуют за MP3 фрагментом; они также отображены на диаграмме.-Теги
Теги (от англ. tag — ярлык, метка, бирка) — метки в границах mp3-файла (в начале и/или в конце). В них могут быть записана информация об авторстве, альбоме, годе выпуска и прочая информация о треке. В более поздних версиях тегов возможно хранение обложек альбомов и тексты песни. Существуют различные версии тегов.-Недостатки
  • Технические недостатки. Количество каналов звука ограничено двумя.
  • Юридические ограничения. Патентом на MP3 владеет компания Alcatel-Lucent, что позволяет ей предъявлять претензии ко всем незаконно использующим её собственность.

AAC

AAC (расшифровывается как «Advanced Audio Coding») — является частью последней спецификации комитета MPEG и является официальным приемником популярного формата MP3. Как и MP3, формат AAC является международным стандартом, и его используют крупные компании с широкоизвестными именами, такими как Dolby, Sony и Nokia.-Существует несколько доступных кодеров AAC, реализуемых такими известными именами как (Apple iTunes), Real Networks и Nero AG (создатели программы Nero Burning Rom), или open source проектом FAAC, который по сути является аналогичным проекту кодера LAME. AAC поддерживается портативными плеерами — например, Apple iPod, и некоторыми моделями сотовых телефонов. Треки в формате AAC доступны в онлайн-магазине Apple's online store.-По заявленному качеству формат AAC конкурирует с форматами Ogg Vorbis, LAME MP3, WMA Pro и другими своременными кодеками, а с добавленным кодированием SBR (HE AAC) может показывать отличные результаты на низких битрейтах.-Недавние разработки привели к созданию AACplus, который субъективно показывает лучшие результаты на низких битрейтах. На сайте tuner2 есть несколько интернет-радиостанций, которые вещают низкобитрейтными потоками — около 40 kbps — и часть из них показывает удивительно хороший результат для такого битрета.-Плюсы
  • Международный стандарт, одобренный ISO.
  • Гибкость: поддерживает несколько частот дискредитации (8000-96000 Hz), bit depths, и многоканальность (до 48 каналов).
  • Имеет несколько реализаций, включая бесплатный и высококачественный Apple Apple iTunes или Nero Digital.
  • На слух, для большинства пользователей, битрейт порядка 150kbps кажется уже достаточно качественным.
  • Является частью спецификаций MPEG-4.
  • Любой человек может создавать свою собственную реализацию (доступны спецификации и демо-примеры).
  • Поддерживается некоторыми портативными плеерами (Philips Expanium, Apple iPod, сотовыми телефонами Nokia и Motorola, Sony Jukebox).
Минусы
  • Имеет те же проблемы, что и у всех подобных кодеров.
  • Патентован.
  • Слишком сложен.
  • AAC имеет несколько разных профилей (AAC LC, AAC HE, AAC PS и т.д). Большинство (особенно портативных) плееров поддерживают только LC (на данный момент), поэтому у вас могут быть вполне стандарно закодированные файлы, но ваш плеер не сможет их воспроизвести.

Ogg Vorbis

Ogg Vorbis — свободный формат сжатия звука с потерями, официально появившийся летом 2002 года. Психоакустическая модель, используемая в Ogg Vorbis, по принципам действия близка к MP3 и подобным, однако математическая обработка и практическая реализация этой модели существенно отличаются, что позволило авторам объявить свой формат совершенно независимым от всех предшественников.-Этот формат распространён существенно меньше, чем MP3. По различным оценкам, Ogg Vorbis является вторым по популярности форматом компрессии звука с потерями. Он широко используется в компьютерных играх и в файлообменных сетях для передачи музыкальных произведений.-Ogg Vorbis применяет более качественную психоакустическую модель, чем его конкуренты, и представляет более лучшее качество воспроизведения при сопоставимых битрейтах.-Формат не ограничивает пользователя только двумя аудиоканалами (стерео — левый и правый). Ogg Vorbis поддерживает до 255-ти отдельных каналов с частотой дискретизации до 192 кГц и разрядностью до 32 бит (чего не позволяет ни один другой формат сжатия с потерями), поэтому Ogg Vorbis великолепно подходит для кодирования 6-канального звука DVD-Audio.-К тому же, формат Ogg Vorbis — «sample accurate». Это гарантирует, что звуковые данные перед кодированием и после декодирования не будут иметь смещений, дополнительных или потерянных сэмплов. Это легко оценить, когда вы кодируете non-stop музыку (когда один трек постепенно входит в другой) — в итоге сохраняется целостность звука.-Возможностью потокового вещания сейчас никого не удивишь, но у этого формата она заложена с самых основ. Это даёт формату достаточно полезный побочный эффект — в одном файле можно хранить несколько композиций с собственными тегами. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов.-Отдельно стоит упомянуть достаточно гибкую систему тегов. Заголовок тегов легко расширяется и позволяет включать тексты любой длины и сложности (например, текст песни), перемежающиеся изображениями (например, фотография обложки альбома). Текстовые теги хранятся в кодировке UTF-8, что позволяет писать на нескольких языках одновременно и исключает возможные проблемы с кодировками. Это значительно удобнее различных ухищрений типа id3-тегов.-Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жёсткими значениями, и он может варьироваться даже на 1 kbps. При этом стоит заметить, что форматом жёстко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьироваться от 400 kbps до 700 kbps. Такой же гибкостью обладает частота дискретизации — пользователям предоставляется любой выбор в пределах от 2 кГц до 192 кГц.-Ogg Vorbis был разработан сообществом «Xiphophorus» для того, чтобы заменить все платные запатентованные аудио форматы. Несмотря на то что это самый молодой формат из всех конкурентов МР3, Ogg Vorbis имеет полную поддержку на всех известных платформах (Windows, Linux, MacOS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS и др.), а также большое количество аппаратных реализаций. Популярность на сегодняшний день значительно превосходит все альтернативные решения.-Стоит заметить, что Ogg Vorbis является всего лишь небольшой частью мультимедиа проекта Squish, в который также входят свободные кодировщики: Speex — для сжатия голоса; FLAC — для сжатия звука без потерь; Theora — для сжатия видео.-Преимущества Ogg Vorbis
  • Отсутствие патентных ограничений.
  • До 255 каналов.
  • Частота дискретизации до 192 кГц.
  • Разрядность до 32 бит.
  • «Sample accurate» — звуковые данные не будут иметь смещений, дополнительных или потерянных сэмплов относительно друг друга.
  • Значительно более эффективные алгоритмы переменного битрейта.
  • Более гибкий Joint stereo.
  • Более мощная и гибкая психоакустическая модель.
  • Теги хранятся в юникоде, а не национальной кодировке.

WMA

WMA — это формат сжатия аудио, созданный компанией Microsoft. Под названием «WMA» скрывается целое семейство кодеков:-Windows Media Audio
Также известен как WMA Standard или WMA Std. Создан Microsoft для противостояния популярному кодеку MP3 (который де-факто является стандартом сжатия аудио с потерями).
По утверждениям Microsoft, с помощью WMA якобы можно достичь уровня MP3 на битрейтах вдвое ниже — то есть на 64kbps WMA такое же качество, как на 128kbps MP3, что безусловно является неправдой. Более реалистичные данные — это приблизительно 25% и только на низких битрейтах. На 128kbps LAME легко обходит WMA.
Благодаря агрессивной маркетинговой тактике Microsoft, стандарт WMA стал вторым по распространенности форматом кодирования с потерями (проигрывая вездесущему MP3).-Windows Media Audio Professional
Кодек Windows Media Audio Professional (WMA Pro) появился на свет недавно в качестве компенсирования недостатков WMA Standard. WMA Pro поддерживает многоканальность и высокие разрешения (24bit, высокая частота дискредитации).
При потере обратной своместимости WMA Std, у Microsoft появилась возможность для выпуска высококачественного кодека. WMA Std проигрывал MP3 в неформальных публичных тестированиях, но WMA Pro был высоко оценен.
На сегодняшний день Microsoft пытается продвинуть свой Pro-кодек как аудиостандарт в следующем поколении DVD.1)-Windows Media Audio Lossless
Кодек сжатия без потерь в семействе Windows Media. По сжатию данных равен WavPack high и где-то между Monkey's Audio fast и normal.-Windows Media Audio Voice
Голосовой кодек. Один из первых, появившихся в семье Windows Media. Предоставляет весьма приемлемое голосовое качество на битрейтах около 4 и 20kbps.-

Apple AIFF

Этот тип файлов является стандартным для систем Apple Macintosh и систем обработки звука, построенных на его основе. Apple AIFF расшифровывается как Audio Interchange File Format - формат файла обмена звуком, он в чем-то схож с WAV. Его особенностью является то, что он позволяет размещать вместе со звуковой волной дополнительную информацию, в частности, самплы WaveTable (примеры звучания инструментов вместе с параметрами синтезатора), что улучшает качество итогового результата. Хотя в настоящее время компьютеры Apple способны воспроизводить файлы практически любых форматов, в том числе и МР3.

RAW

Да, это не только формат изображения, в котором пишут фотографии некоторые цифровые камеры. На самом деле, RAW является т.н. «чистой оцифровкой», в которой не содержится заголовка и находится лишь последовательность отсчетов звуковой волны. Обычно оцифровка хранится в 16-разрядном формате.

MP3 Pro

Появившийся в 2001 году кодек MP3 Pro был создан компанией Coding Technologies совместно с Thomson Multimedia. В его основе лежит МР3, и в результате он получился полностью совместимым с MP3 назад и лишь частично вперед. В нем используется технология SBR (Spectral Band Replication), за счет чего кодек обеспечивает хорошее качество на низких битрейтах. Однако качество кодирования на средних и высоких скоростях передачи данных уступает качеству почти всех других кодеков. В итоге MP3 Pro применяется больше для трансляций в интернете и демонстраций фрагментов новых музыкальных композиций.

ATRAC

ATRAC (Adaptive TRansform Acoustic Coding - акустическое кодирование адаптивным преобразованием) базируется на стереофоническом звуковом формате с 16-разрядным квантованием и частотой дискретизации 44.1 кГц. При сжатии каждый кадр делится на 52 частотные полосы, результирующая скорость потока - 292 кбит/с (сжатие 1:5). Применяется в системе MiniDisk.

Список других аудиоформатов из этой серии

  • MP2 — MPEG Layer 2
  • Speex — проект Ogg, сжатие голоса, низкий битрейт
  • GSM-FR — GSM Full Rate, изначально для сотовых телефонов
  • Musepack — Musepack (MPC)
  • TwinVQ — Yamaha TwinVQ (VQF)
  • RealAudio (RA, RM)
  • OTS Audio File — похож на MP3
  • SWA — Macromedia Shockwave Audio. Сжатие как в MP3 с дополнительными заголовками для Macromedia Director.[3]
  • AC3
-Конечно цифровых аудиоформатов огромное множество, мы попытались познакомить вас только с самыми популярными, но для любопытных ниже публикyем еще скромный списочек звуковых форматов.

Другие форматы

  • CUST (DeliPlayer custom sofile format)
  • MID, MIDI (Musical Instrument Digital Interface) — обычно просто ноты и управляющие инструкции, но изредка и дампы семплов)
  • GYM лог чипа Genesis YM2612
  • VGM (Video Game Music) лог нескольких чипов
  • PSF Portable Sound Format
  • NSF (NES music)
  • MOD (Soundtracker и Protracker модули для семплов и мелодии)
  • PTB (Power Tab Editor tab)
  • S3M (модуль ScreamTracker 3, чуть больше эффектов и отдельной колонкой громкости)
  • XM (модуль Fast Tracker, добавлены инструменты)
  • IT (модуль Impulse Tracker, добавлены сжатые инструменты, действия на отпускание ноты, и др.)
  • MT2 (модуль MadTracker комбинирует свойства IT и XM)
  • MNG (BGM для игр серии Creatures, начиная с Creatures 2; доступен редактор и плеер)
  • PSF PlayStation sound format.
  • SPC Super Nintendo Entertainment System sound file format.
  • STF StudioFactory project file. It contains all necessary patches, samples, tracks and settings to play the file.
  • SYN SynFactory project file. It contains all necessary patches, samples, tracks and settings to play the file.
  • NIFF
  • MusicXML
  • YM (Atari ST/Amstrad CPC YM2149 sound chip format)

Форматы плейлистов

  • Advanced Stream Redirector (.asx)
  • M3U
  • PLS
  • Real Audio Metafile — только для файлов формата Real Audio.
-Работа с форматами-Хорошо. Теперь мы имеем элементарные представления об аудио форматах и их особенностях. Давайте же немного научимся с ними работать.
Как определить формат и его характеристики
Вариант 1: Можно посмотреть свойства файла, в Windows это делается нажатием правой кнопки мышки и в открывшемся контекстном меню выбираем Свойства.

Смотрим

Вариант 2: Можно использовать проигрыватель Winamp.

Смотрим


Вариант 3: Воспользоваться утилитой Media Info, которая обычно идет в комплекте популярных в сети пакетов кодеков K-Lite Codec Pack.

Смотрим

Вообще каждый уважающий себя мультимедиа плеер должен предоставлять такую информацию. Мы вам рассказали лишь о самых распространенных.-По оценке независимых экспертов более 81 процента оцифровок представленных в сети являются апконвертом (от английской фразы up convert) Т.е. путем обратной конвертации из файла с битрейтом 128 Kbps, делается файл с битрейтом 320 Kbps, или чего еще хуже Lossless формат, например FLAC. Порой апконверты бывают настолько искусны, что сразу и не поймешь, что перед тобой подделка. А если у вас стоят примитивные 5 ваттные колонки пищалки, то вам будет и вовсе все равно. Но все же истинные ценители музыки с хорошей акустикой предпочитаю качество. Поэтому мы хотим научить вас как отличить качественный трек от апконверта.

Аудиоредактор Adobe Audition - спектральный анализ

Есть много программ для определения качества аудиофайла одна из них Аудиоредактор Adobe Audition-Для начала как и что.

1. Добавляем файл
2. Два раза кликаем и выходим на =>
3. Рабочий спектр
4. Этой кнопочкой мы переключаем вид спектра и получаем картинку (в дальнейшем для экономии места будут скрины только самого спектра)

Ну а теперь приступим. Вот как выглядит спектр WAVE-файла на компакт диске.
-Держим в уме табличку
320 kbps - 20500 Hz
256 kbps - 19000 Hz
192 kbps - 18000-19000 Hz
160 kbps - 16500-17500 Hz
128 kbps - 16000 Hz
112 kbps - 14000-15000 Hz
-Начинаем проверку файлов
128 kbps

192 kbps

256 kbps

320 kbps

А теперь... мы возьмём файл 128 kbps и сделаем из него 320 kbps... Смотрим...

Что собственно и требовалось доказать. Не смотря на одинаковый размер, файлы значительно отличаются по содержанию.
-Заключение-Думаю, теперь у вас сложилось определенное представление об аудиоформатах и работы с ними. Конечно, нам многое пришлось опустить, так как формат пособия подразумевает собой сжатое и самое основное изложение материала. Надеюсь данный труд был для вас полезен.-
Other forum [Profile] [PM]

Dracula

Longevity: 6 years 1 month

Posts: 10710

Торрент-статистика

Post 08-Sep-2015 14:21 (after 2 years 3 months)

Топик был перенесен из форума Правила и FAQ в форум Предложения по улучшению раздела "Музыка"


Геннадич
 
Display posts from previous:    
Reply to topic

The time now is: Today 18:36

All times are GMT + 3 Hours



You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum
You cannot attach files in this forum
You cannot download files in this forum