MP3 формат; мултимедиен експерт
Въведение

Като взехме предвид теоретичните ограничения на възстановяването на аналогов сигнал с добро качество (за човешкото ухо) от дискретизиран сигнал (теорема на Шанън), ние наложихме на аудио компактдисковете формат за съхранение на звук, съдържащ следните данни:
Честота на вземане на проби = 44,1 kHz
16-битови кодирани данни
Стерео звук
Това означава, че пробите, взети от музикалното произведение, което ще се дигитализира, се вземат със скорост 44,1 kHz, че са кодирани на 16 бита (т.е. 65 536 различни възможни нива) и че звукът е стерео, т.е. за дадена проба, необходимостта от съхраняване на десния и левия канал.
С този стандарт колко място отнема минута музика? ?
Имаме 44 100 проби за 1 секунда (44,1 kHz). Всяка проба е кодирана на 16 бита или 2 байта, а звукът е стерео. Следователно имаме ((44100 * 2) * 2 * 60) байта за една минута стерео музика, т.е. 10.584x10 6 байта !
Отнема около 10MB, за да съхраните минута музика.
Виждаме, че аудио сигналът, съхраняван на цифров носител, заема много място, откъдето идва и идеята да се опитаме да го компресираме и появата на MP3 стандарта.
MP3 компресия
Какво представлява техниката за компресиране на MP3 ?
Всъщност по-скоро трябва да говорим за набор от техники, използвани за достигане на крайния резултат. Сред тези техники се казва, че някои са разрушителни, други не.
Разрушителна компресия, това е компресия, която се извършва чрез загуба на информация. Това означава, че ако декомпресираме компресирания сигнал, използвайки такава техника, няма да намерим оригиналния сигнал.
Сред деструктивните техники на компресия, ние по същество имаме методи, които използват свойствата на човешкото ухо. Последният чува честоти в диапазона от 20Hz до 20kHz. Ако песента съдържа честоти извън този диапазон, следователно можем да ги изтрием чисто и просто, без да губим качеството на звука, тъй като ухото не ги чува. Всъщност правилно чуваме честотите в диапазона от 2kHz до 5kHz. Всъщност са необходими по-малко от 5dB, за да чуете честотите на тази лента, докато са необходими повече от 20dB, за да чуете честотите, разположени под 100Hz или над 10kHZ. Тези открития могат да бъдат използвани за намаляване на размера на файла. Например можем да решим, че всички честоти над 15kHz ще бъдат изтрити.
MP3 също използва принцип на честотите маскиран. Ако в група честоти някои имат много по-високо ниво на звука от други, не е необходимо да се запазват ниските честоти на нивото на звука: те няма да бъдат чути. За да използвате по-убедително сравнение, представете си, че сте във вашата градина и чувате чуруликане на птици. Съгласието преминава над главата ви (дори много високо). Вече няма да чувате птиците, защото звукът, който те издават, е много по-нисък от звука, генериран от самолета. Сякаш птиците вече не съществуват или са спрели да пеят. Виждаме, че не е необходимо да се кодират всички честоти, присъстващи в дадено парче, така че човешкото ухо да го възприеме правилно така или иначе. И накрая, ако двата канала на стерео звук представят подобни последователности, вместо да дублираме тези последователности, ние очевидно съхраняваме един и информацията, че в този момент десният и левият канал са идентични.