5 советов по оптимизации размеров аудиофайлов

Каждый должен в тот или иной момент узнать, как работают аудиофайлы. Это знание может показаться тривиальным или неважным, но оно действительно может пригодиться — например, при записи музыки

, создавая подкаст

или оптимизация вашей музыкальной библиотеки

,

В этом посте мы рассмотрим различные факторы, влияющие на качество звука и размер аудиофайла. Конечно, найти идеальный баланс между ними непросто, но к концу вы должны знать достаточно, чтобы чувствовать себя комфортно и экспериментировать для себя.

Примечание. Чтобы применить эти знания на практике, вам понадобится бесплатный аудиоредактор, такой как Audacity.

или одна из многих альтернатив Audacity там

, Изучение этих инструментов выходит за рамки этой части.

1. Частота дискретизации

В реальной жизни звук — это волна. Когда кто-то говорит или хлопает в ладоши, то, что вы на самом деле слышите, — это изменение давления, которое распространяется по воздуху и в конечном итоге попадает в ваши барабанные перепонки.

Но как нам захватить этот звук и преобразовать его в цифровые данные? Мы не можем просто записать полную звуковую волну, как она есть; вместо этого мы должны периодически делать «снимки» звука. Когда вы воспроизводите все это последовательно, вы получаете приблизительное воссоздание оригинального звука.

аудио-файл размером выборки скорости

Каждый снимок называется образец и интервал, используемый между каждым снимком, называется частота дискретизации. Чем короче интервал, тем выше частота. Более быстрые частоты дают более точные записи, но также требуют больше данных для хранения каждой секунды записанного звука.

Например, для аудио с качеством CD используется частота дискретизации 44,1 кГц (или 44 100 сэмплов в секунду), тогда как для аудио с качеством телевизора и DVD используется частота дискретизации 48 кГц. Учитывая 10-минутную несжатую монофоническую аудиозапись, первая может быть 51,7 МБ, а вторая — 56,3 МБ.

Вы можете снизить частоту до 32 кГц для записи только с речью и не испытывать значительных потерь в качестве, но придерживайтесь 44,1 кГц, если речь идет о музыке или если вам нужно максимальное качество. Падение до 22,05 кГц будет звучать ближе к AM-радио.

2. Битрейт

Битрейт это не то же самое, что частота дискретизации. Многие люди склонны объединять их, но важно, чтобы вы этого не делали. Прежде всего, если частота дискретизации — это то, как часто делаются снимки звука, то глубина в битах — это количество данных, записываемых во время каждого снимка.

Для иллюстрации представьте звуковую волну в виде потока воды, и вы пытаетесь захватить (т.е. записать) эту воду с помощью ведра. Частота дискретизации будет показывать, как часто вы погружаете свое ведро в поток, в то время как глубина в битах будет размером с ваше ведро.

аудио-файлов, размер битовой глубины

Чем выше битовая глубина, тем больше данных захватывается на выборку. Это приводит к более точной записи за счет большего пространства, необходимого для хранения этих данных. Но если вы слишком сильно уменьшите битовую глубину, звуковые данные будут потеряны.

Bitrate сколько фактических звуковых данных обрабатывается в секунду; в этом случае вы умножаете частоту дискретизации на битовую глубину. Аудиофайл CD с частотой дискретизации 44,1 кГц и глубиной 16 бит будет иметь несжатый битрейт 705,6 кбит / с.

Подробнее об оптимальных битрейтах читайте в последнем разделе этой статьи о форматах файлов.

Иногда полный битрейт не требуется в данном снимке, например, когда есть тишина. В этом случае вы можете использовать переменный битрейт (VBR), который поддерживается MP3, OGG, AAC и WMA. В прошлом VBR не получал широкой поддержки, но в настоящее время это не большая проблема.

3. Стерео против Моно

Этот момент довольно прост, поэтому я буду кратким. Моно означает один канал в то время как стерео означает два канала. Два канала в стереофоническом аудиофайле могут называться «левым» и «правым» каналами.

С парой наушников вы сможете услышать один из стереоканалов в одном ухе, а другой стереоканал — в другом ухе. При прослушивании монофонического аудиофайла вы услышите один и тот же канал в обоих ушах.

аудио-файл размером стерео-против-моно

В некотором смысле стереофонические аудиофайлы, по сути, представляют собой два монофонических аудиофайла в одном — это означает, что стереофонический аудиофайл всегда в два раза больше монофонического аудиофайла, при условии, что частота дискретизации, битовая глубина, исходный звук и т. Д. Одинаковы. между двумя.

Поэтому самый простой способ мгновенно сократить размер аудиофайла вдвое — это преобразовать его из стерео в моно.. По этой причине для записи голоса только моно почти всегда предпочтительнее.

Обратите внимание, что стерео — это то, что заставляет большую часть музыки звучать более трехмерно, как если бы музыка играла вокруг вас, а не у вас (то есть моно звуки более плоские). Но многие люди не могут заметить разницу, поэтому вы можете быть в порядке с этим. Только вы можете решить, стоит ли это сокращать.

4. Сжатие

Если вы работаете с файлами WAV, единственный способ уменьшить размер файла — изменить один из указанных выше параметров (частоту дискретизации, битовую глубину или количество каналов). Для всего остального, сжатие является самым большим фактором в размере аудио файла.

Существует два вида сжатия:

  • Сжатие с потерями удаляет «лишние» данные из аудио, такие как звуки, которые находятся за пределами слышимости большинства людей. После сжатия эти удаленные данные не могут быть восстановлены.
  • Сжатие без потерь берет аудиофайл и упаковывает его как можно больше, используя математические алгоритмы, но они должны быть распакованы во время воспроизведения, что требует большей вычислительной мощности. Фактические данные не теряются.

Сжатие без потерь обеспечивает то же качество, что и несжатый звук, но даже в лучшем случае сжатие без потерь приводит к размерам файлов, которые как минимум вдвое больше, чем сжатие с потерями. Для оптимальных размеров файлов используйте сжатие с потерями.

Если вы никогда ранее не сжимали аудиофайл или ищете хороший инструмент для выполнения работы, подумайте об использовании одного из этих простых и эффективных способов сжатия аудио.

,

5. Формат файла

После того, как вы решили использовать сжатие с потерями, вы должны решить, какой формат файла лучше для вас. На момент написания статьи три наиболее популярных варианта MP3, OGG, а также AAC. Узнайте больше в нашем сравнении форматов аудио файлов

,

MP3 является самым популярным на сегодняшний день, главным образом потому, что он был первым из трех, кто появился на сцене. AAC технически лучше, чем MP3, но не имеет такого же уровня использования. OGG тоже хорош, но не многие устройства поддерживают его, поэтому придерживайтесь MP3 или AAC.

Независимо от того, какой из них вы используете, вы в конечном итоге сжимаете до целевого битрейта. Если мы предполагаем, что вы собираетесь использовать формат MP3, то это пять наиболее распространенных битрейтов, которые используются в настоящее время:

  • 64 кбит / с качество радио AM. Идеально подходит для подкастов только для разговоров, потому что голоса не так сложны, как музыка.
  • 96 кбит / с качество FM-радио Музыка будет звучать хорошо, но вы сможете сказать, что она не насыщенная, в основном из-за удаления определенных слышимых частот.
  • 128 кбит / с это качество звука CD. Это настолько стандартно, насколько это возможно. Музыка звучит «достаточно хорошо» для большинства людей на этом битрейте.
  • 256 кбит / с это высокое качество звука. Вы можете заметить определенные звуки и инструменты, которые не были обнаружены на низких битрейтах.
  • 320 кбит / с лучшее качество звука. Вы можете пойти выше, но вы, вероятно, не сможете заметить разницу — даже если вы считаете себя аудиофилом

    ,

С точки зрения уменьшения размера файла, MP3, сжатый до 128 кбит / с, теряет приблизительно 90% исходных звуковых данных, тогда как MP3, сжатый до 320 кбит / с, теряет только около 60%.

Кроме того, если у вас есть MP3 и AAC, сжатые с одинаковым битрейтом, AAC часто будет звучать лучше, поскольку использует более продвинутый алгоритм сжатия. Это означает, что с AAC вы можете получить больше «качества на мегабайт», чем MP3.

Понимание этих пяти факторов не только поможет вам выбрать лучший способ записи и сжатия музыки и / или подкастов.

что вы создали, но также можете помочь вам решить, какие музыкальные форматы покупать или какие потоковые сервисы использовать.

Как слушатель, какой формат файла вы предпочитаете и битрейт для музыки? Как создатель, какие настройки вы используете для своей музыки или подкастов? Дайте нам знать с комментарием ниже!

Кредиты изображений: частота дискретизации через Викимедиа, битовая глубина через Викимедиа, стерео трек через Audacity Manual

Ссылка на основную публикацию