Metody kompresji sygnałów wizyjnych i dźwiękowych

Kompresja Wideo
Obecnie istnieje kilka metod kompresji obrazu. Najstarsze z nich (JPEG, H-261, MPEG-2) do realizacji kompresji biorą pod uwagę grupę pixeli ( pewien obszar np. 8bitów na 8bitów). Metody te nie analizują tego co faktycznie znajduje się na obrazie. Ta generacja kompresorów może być wykorzystywana w przypadku, gdy przepływność kanału transmisyjnego nie jest mniejsza niż 64kbit/s.
Bardziej efektywną kompresję umożliwiają algorytmy drugiej generacji. Algorytmy te ( np. MPEG-4) przed realizacją właściwej procedury pakowania dokonują pewnej analizy sceny. Dostrzegają fakt, iż obraz można podzielić na fragmenty w sposób dużo bardziej efektywny. Obraz składający się z pikseli o takich samych cechach można połączyć w jedną grupę, a przez to znacznie uefektywnić proces pakowania. Aby zrealizować taką procedurę analizy wykorzystano sposób postrzegania człowieka (HVS – Human Vision System).
Typowy koder drugiej generacji zawiera moduły: segmentacji, estymacji ruchu, kodowania konturów i kodowania tekstur. System taki umożliwia kompromisowy wybór pomiędzy stopniem kompresji, a jakością po dekompresji.
Standardy kompresji wideo: H-261, H263
System H-261 został stworzony z myślą o sieciach ISDN o przepustowości 64 kbit/s. Standard H- 261 pozwala na uzyskanie kompresji rzędu od 100:1 do 2000:1, przy czym w miarę wzrostu stopnia kompresji ulega pogorszeniu jakość dekompresowanego obrazu. Koder działa w dwóch trybach: wewnątrz ramkowym - INTRA i międzyramkowym - INTER.
Podczas kompresji w trybie INTRA następuje podział klatki (jednego obrazu), na bloki o rozmiarze 8x8 pikseli. Następnie poddaje się je kompresji za pomocą Dyskretnej Transformaty Kosinusowej (podobnie jak w JPEG).
Podczas kompresji w trybie INTER zapisywane są jedynie zmiany jakie zaszły pomiędzy kolejnymi klatkami. Należy tutaj zaznaczyć, iż przynajmniej raz na 132 klatki musi zostać przeprowadzona kompresja w trybie INTRA.
Opracowanie standardu H.263 miało zapewnić kompresję sygnału video dla potrzeb sieci o niewielkich przepływnościach w zakresie od 28.8 do 33.6 kbit/s.
H-263 jest unowocześnioną wersja standardu H-261. W porównaniu z poprzednią wersją wprowadzono półpikselową kompensację ruchu, zamiast pikselowej, zmniejszono nagłówek, zrezygnowano z detekcji i korekcji błędów transmisji i wprowadzono nowe opcjonalne tryby pracy.
Więcej informacj na temat H-261, oraz H-263
Kompresja MPEG-4
MPEG-4 jest najnowszym standardem kompresji wideo, który szybko zdobywa popularność, także przy przesyłaniu strumieniowym. W porównaniu do poprzednio przedstawionych standardów wprowadzono w nim efektywne metody reprezentacji danych multimedialnych.
Nowe podejście polega na powiązaniu zawartości danych z ich znaczeniem dla percepcji człowieka i wyodrębnieniu tzw. obiektów audiowizualnych AVO (ang. Audio-Visual Objects). Zostały tutaj wprowadzone rozwiązania pozwalające na skalowalność reprezentacji danych w wielu wymiarach tj. przestrzeń, czas, jakość i złożoność obliczeniowa.
Standard został dopasowany do różnych sieci telekomunikacyjnych i może pracować z przepływnościami od 64 do 1024 kb/s.
Koncepcja MPEG-4 umożliwia przesyłanie jednego, lub kilku obiektów audiowizualnych AV od nadawcy do odbiorcy, przy czym przed rozpoczęciem transmisji dokonuje się wymiany informacji pomiędzy dekoderem i koderem. W ten sposób można ustalić dogodne klasy algorytmów i narzędzi niezbędnych do efektywnego wykorzystania łącza. Koder dokonuje oczywiście zabezpieczenia obiektów audiowizualnych przed błędami.
Kompresja dźwięku
Strumień danych pochodzących z zakodowania dźwięku jest znacznie mniejszy od strumienia danych wideo. Jednak pomimo tego nieopłacalne jest przesyłanie dźwięku w postaci nieskompresowanej.
Proste zmniejszenie zapotrzebowania na pasmo transmisyjne można uzyskać poprzez redukcję częstotliwości próbkowania, oraz zmniejszenie rozdzielczości kwantowania amplitudy.
W zależności od rodzaju transmisji stosuje się próbkowanie:

Częstotliwość próbkowania

Zastosowania

8,00 kHz

Telefonia

16 kHz

Komunikacja multimedialna

22,05 kHz

Komputery osobiste

32,00 kHz

Cyfrowe radio i telewizja

44,10 kHz

Płyty CD – Audio

48,00 kHz

Magnetofony DAT, HDTV

96,00 kHz

Płyty DVD

Tabela. Popularne częstotliwości próbkowania
W telkomunikacji do kodowania mowy stosuje się kwantyzację równomierną z rozdzielczością 12 do 14 bitów.
Obok metod polegających na pogarszaniu parametrów opisujących dźwięk stosuje się także właściwe metody kompresji.
Przykładem takiej kompresji jest metoda predykcji adaptacyjnej ADPCM ( ang. Adaptive Differetial Pulse Code Modulation), polegająca na estymacji bieżącej próbki na podstawie próbki ją poprzedzającej, z uwagi na fakt, iż w sygnale dźwiękowym występuje silna korelacja pomiędzy kolejnymi próbkami. ADPCM jest metodą bezstratną.
Kompresja Wavelet. Jest to kompresja oparta na wykorzystaniu algorytmów falkowych. Falki są to funkcje macierzyste przyjmujące wartości różne od zera tylko w pewnym skończonym przedziale. Poprzez odpowiednie przekształcenia matematyczne można przedstawić każdą funkcje za pomocą funkcji macierzystej.
Sygnał wejściowy, który chcemy skompresować filtrujemy z elementów niezauważalnych przez oko ludzkie, następnie dzielimy na fragmenty, każdy taki fragment zostanie przedstawiony za pomocą odpowiedniej funkcji.
Metoda należy do metod stratnych, obrazy kompresowane tą metodą charakteryzują się zamazaniem brzegów i ogólnym wygładzeniem. W porównaniu z metodami JPEG i MPEG metoda falkowa nie powoduje powstawania zniekształceń struktury przedmiotu na obrazie. Metody falkowe są ciągle w fazie rozwoju i prawdopodobnie będą fundamentem dla nowych kompresorów. Ciekawostką może być fakt, iż metoda ta została wykorzystana przez FBI do realizacji systemu rozpoznawania odcisków palców, ponieważ lepiej zdała egzamin w porównaniu do metody JPEG.
Metoda kompresji Wavelet jest obok MJPEG możliwa do wyboru przez użytkowników kart cyfrowego zapisu wizji Hicap. Producent kart podaje, że stosując kompresję MJPEG na 10 GB dysku można zapisać 4,5 godz, zaś Wavelet 9 godzin, jednak dla wymagań lepszej jakości zaleca stosowanie MJPEG.