Алгоритми за аудио компресия

       Звукът, който възприемаме представлява промяна на въздушното налягане в ухото. Както повечето ни възприятия и това отчита промени, а не абсолютни нива. Променливото налягане, довело до възприемане на звук, се нарича звукова вълна. С други думи, звуковата вълна е механична вълна (разпространявана най-често през въздуха). За да бъде възприета от човешкото ухо, вълната трябва да е в честотен диапазон от 16Hz до 20kHz. Чувствителността към промяната в налягането зависи от честотата и се дава с емпирична диаграма - т.нар. Диаграма на звука. Скоростта на разпространение на звуковите вълни през атмосферата зависи от температурата на въздуха.

Ако желаете да изчислите скоростта на звуковите вълни в атмосферата - ето една примерна формула:
,
където T е температурата на въздуха в °C.
За 20°C скоростта на звуковите вълни е 343 m/s, а за 0°C - 331 m/s.

За повече информация - вижте презентацията Основи на акустиката (1 929 KB).

       В една звуковъзпроизвеждаща система има определен брой озвучителни тела. Звуков канал се определя от едно озвучително тяло, към което е подаден независим източник на напрежение. Източникът на напрежение може да е микрофон или синтезиран / записан звук от звуково устройство.

Едно озвучително тяло може да има повече от един говорител - нарича се тонколона (колона от говорители за различни тонове). Подадения сигнал на тонколоната се разделя с филтри на честотни ленти, като всяка лента се подава на отделен говорител. Така се постига максимално качество на възпроизвеждания звук, тъй като обемните резонатори трябва да са с различни размери и форми в зависимост от честотата на звука. Важното тук е, че независимото напрежение, което усилвателят подава на входа на тонколоната е едно. Така тонколоната представлява само едно озвучително тяло, което образува с източника на напрежение (усилвателя) само един канал.

       Запис и съответно възпроизвеждане на звук може да е с 1 канал (моно), 2 канала (стерео), 4 (квадрофоничен), 5 (квадрофоничен със суб-баси) и 10 канала. Напрежението в един канал представлява по същество аналогов сигнал, който трябва с Аналого-Цифров Преобразувател (АЦП) да се превърне в цифров.

АЦП извършва две операции: дискретизация по време и квантуване по ниво. Първата определя колко често се "снема" големината на входното напрежение. Снетата големина се нарича "проба" (на английски - sample), а броят снемания за една секунда - честота на дискретизация. Втората операция определя число, което отговаря максимално точно на напрежението на снетата "проба". Колкото повече битове се отделят за числото, толкова по-фини са зоните, които се определят с две последователни числа и съответно информацията в цифровия сигнал е толкова по-близка до оригиналната аналогова информация.

       Стандартни честоти на дискретизация са 8kHz (с производни 16kHz, 32kHz и 48kHz) и 44.1kHz (с производни 22.05 kHz и 11.025 kHz), но освен тях се използват и доста нестандартни честоти... Стандартни обхвати на квантуване са 8-bit и 16-bit, но се използват и по-нестандартние 12-bit, 24-bit и 32-bit.

       За алгоритмите за аудио компресия един входен канал представлява поредица от числа с размерност определена от степента на квантуване на АЦП. Типичен висококачествен канал (например за музика) се представя с 16-bit сигнал при 44.1kHz честота на дискретизация, а нискокачествен (например за говор) - 8-bit при 8kHz честота на дискретизация.