Преглед на аудио кодеците и форматите

Като краен потребител вие сте особено запознат с един тип програма: програмите за възпроизвеждане (или „плейъри“). Те възпроизвеждат аудио или видео файлове и по този начин са софтуерен еквивалент на касетофони, видео рекордери или CD/DVD плейъри. Интерфейсът на програмата е най-вече подобен на дистанционното управление на стерео система: има бутони за възпроизвеждане, бързо превъртане напред, пренавиване, пауза и др. Известни представители са напр. Б. Windows Media Player, Quicktime Player или Apple iTunes. Вместо да поставяте CD в слота за CD, файловете трябва да се отварят на софтуерните плейъри. Аудио и видео файлове могат да бъдат отворени от плейър само ако може да направи нещо с използвания файлов формат.
Цифровите данни, с които са представени аналогови аудио или видео сигнали, могат да бъдат организирани в различни формати. Това може да се обясни най-добре за едно изображение: Има различни опции за съхраняване на отделните пиксели във файл. Например, дали точките на изображението се съхраняват една след друга отляво надясно или първо отгоре надолу във файла, разбира се е конвенция, която трябва да бъде посочена. Начинът, по който се съхранява стойността на цвета, също трябва да бъде ясно дефиниран. Тези и много други дефиниции се определят от спецификация, която след това се изпълнява в съответния файлов формат. За да се съхраняват данните, винаги се спазва предварително дефинирано правило за кодиране, което в крайна сметка е решаващо за гарантиране, че данните могат да бъдат интерпретирани правилно. Можете да мислите за отделните формати като различни носители на данни: компактдискове, големи и малки видеокасети, аудиокасети и др. Могат да съдържат аудио данни - но все още не можете да поставите касета в CD плейъра. Файловите формати WAV, MP4, WMA или MP3 са също толкова различни.
Много файлови формати всъщност са Формати на контейнери. Терминът има за цел да изясни, че в рамките на конвенцията могат да се използват различни формати. Напр. MP4 файл съдържа различни аудио и видео формати, които също могат да се появят в един и същ файл едновременно.
Ако искате да запазите различни формати във файлове, имате нужда от контейнер. Контейнерите вземат аудио материала във файлове с разширения като ".mp3", ".wav", ".m4a", ".ogg" или ".wma" и му предоставят метаданни. Ето някои важни контейнери за съхранение на аудио файлове:
ВЪЛНА
Контейнерът с окончание ".wav" обикновено съдържа некомпресирани цифрови данни, кодирани с помощта на метода PCM. Използвайте WAVE файлове, за да ги запазите, ако искате да обработите (изрежете, редактирате) аудио материала си по-късно.
MP3
MP3 контейнерът (.mp3) се използва за запис на MPEG-1 аудио слой 3 или MPEG-2 аудио слой 3 потоци от данни. Разговорно тези потоци от данни се наричат още MP3.
MP4/M4A
Контейнерът MP4 е получен от файловия формат на Apple Quicktime. За разлика от MP3 или WAVE файловете, където можете да бъдете относително сигурни какъв вид данни са скрити във файловете, трудно можете да направите някакви заключения относно кодеците, използвани с MP4 файлове. MP4 файловете могат да съдържат различни видео и аудио формати, снимки и дори графики и текст. Поради това се препоръчва да се използва разширението на файла ".m4a" в аудио сектора и само да се използва методът на кодиране AAC.
OGG/OGA
Контейнерът OGG е безплатен формат за мултимедийно съдържание, който не е ограничен от софтуерните патенти. Както при MP4, разширението на файла не показва по какъв начин са кодирани съдържащите се в него данни. В аудио сектора аудио кодекът Vorbis обикновено се използва за кодиране и се използва разширението на файла .oga.
ASF/WMA
В допълнение към безплатния OGG формат и MP4 на Apple, Microsoft е посочила и формат на контейнер за мултимедийни файлове. ASF файловете могат също да съдържат метаданни, звукови и видео записи. За по-добра диференциация файловете, които съдържат аудио данни, са маркирани с окончанието ".wma" според едноименния процес на кодиране.
В зависимост от това дали искате да запишете аудио файла си на CD, да го направите достъпен в Интернет или да го редактирате с аудио редактор, са възможни различни аудио формати. Кодеците са отговорни за конвертиране от и в различни формати:
PCM (импулсна кодова модулация)
Модулацията на импулсния код е метод на кодиране, при който аналогов сигнал може да се дигитализира почти без загуби. Кодираният по този начин аудио материал е идеално подходящ за по-нататъшна обработка, тъй като е некомпресиран. Данните, генерирани с този метод, обикновено се записват като вълнови файлове с разширение ".wav".
MP3 (MPEG-1 Audio Layer 3)
Процесът на кодиране всъщност се нарича MPEG-1 Audio Layer 3 или MPEG-2 Audio Layer 3 и е разработен от Института за интегрални схеми на Fraunhofer. Името е получено от свързаното с файла разширение MP3 на формата. Това е един от първите процеси на компресиране със загуби, които разчитат на психоакустични ефекти във възприятието, за да се намали количеството данни. В допълнение към оригиналния кодек от института Fraunhofer има и LAME енкодер с отворен код. Файловете, които съдържат потоци от данни, кодирани по този начин, обикновено завършват на ".mp3". Съществуват и други формати на контейнери, които могат да съдържат MP3 потоци от данни, като например AVI или MP4.
AAC (Разширено аудио кодиране)
AAC е метод за кодиране със загуби, който може да компресира аудио данни (от CD) до една шестнадесета от оригиналния размер. В сравнение с MP3, процесът може да демонстрира по-голяма компресия и подобрено качество на звука. Затова различни онлайн музикални магазини и онлайн радиостанции разчитат на този формат. MP4 е предназначен като формат на контейнера за съхранение на компресирани аудио сигнали. Файловете, които съдържат такава аудиозапис, обикновено завършват на ".mp4" или ".m4a".
Ворбис
Този формат с отворен код е без патент и следователно може да се използва от разработчиците на софтуер без лицензионни такси. Форматът е подходящ и за поточно предаване. Компресията е със загуби и по-добра от MP3. Въпреки че многобройни устройства за възпроизвеждане на хардуер вече поддържат този формат, той не е толкова широко разпространен като MP3. Потокът от данни обикновено е вграден в контейнер на OGG. Свързаните файлове завършват на ".ogg" или ".oga".
WMA (Windows Media Audio)
WMA е метод за кодиране, разработен от Microsoft и предлага компресиране със загуби. Много устройства за възпроизвеждане на хардуер вече поддържат този формат, тъй като той е много популярен в музикалната индустрия поради вградената си защита срещу копиране (Digital Rights Management (DRM)). Ако файлът съдържа само аудио данни, той завършва с ".wma". ASF се използва като формат на контейнера.
Ако искате да сте сигурни, че всички мултимедийни файлове могат да се възпроизвеждат, трябва да имате възможно най-много кодеци, готови за вашия плейър. За щастие, повечето кодеци - или поне декодерите - са достъпни безплатно. Настоящите медийни плейъри обикновено носят със себе си необходимите кодеци. Помага винаги да търсите най-новия кодек в интернет и да го инсталирате, защото те обикновено са обратно съвместими, т.е. те могат да интерпретират и по-стари формати.
Общото между всички формати е, че аудио и видео данните се записват във файловете в компресирана форма. Количеството данни, които възникват, е много голямо, така че кодеците се опитват да намалят количеството данни при кодиране. Следователно измисленият кодек с думи често се използва като кратка форма за компресор/декомпресор. Методите за компресиране на данните са много разнообразни. Прави се общо разграничение между компресия без загуби и загуба.

Компресия без загуби
При компресия без загуби оригиналните данни се запазват; те се записват само по-компактно във файл. В случай на изображения, например, вместо да запазвате всеки отделен пиксел във файл, само промените могат да бъдат взети под внимание. Ако например е показано синьо море, файлът не трябва да съдържа „синьо-синьо-синьо. -синьо-синьо ", но индикацията" 123 сини пиксела "е достатъчна - информационното съдържание не се променя. Дори при видео данни често не се запазват отделните изображения, а само разликите между изображенията. Така че, ако камерата показва неподвижен пейзаж за няколко секунди, тогава това пейзажно изображение трябва да бъде записано във файла само веднъж. В случай на аудио данни, приликите между различните канали (левият и десният стерео канал често са идентични) могат да се използват за съхраняване на данни по по-компактен начин. И в трите примера едни и същи или само незначителни промени са предпоставка за компресиране на данни. За съжаление, тъй като тези прилики не винаги присъстват в аудио и видео данните, компресирането без загуби не е толкова ефективно, колкото компресирането със загуби.

Компресия на загуба с използване на AAC кодек съгласно MPEG-4 стандарта във формат MP4/M4a.