Optimization of inter-prediction in encoding video data

Maciej Trochimiuk

Abstract

Despite great development of video compression standards, inter-frame prediction with block-based motion estimation remains the basis of every state-of-the-art video codec. It is also a part, which is the most responsible for their computational complexity. With the development of video compression technology, many fast suboptimal inter-frame prediction algorithms have been proposed. Growing resolutions of digital video signals create the demand for continual search for more and more efficient algorithms. In this dissertation motion estimation algorithms for inter frame prediction have been reviewed. Furthermore, a proprietary solution for block based motion estimation which reduces computational complexity of inter-frame prediction at slight cost on compression efficiency has been proposed. The proposed solution reuses the results of integer motion search in 8×8 blocks in larger blocks. Moreover, fractional motion estimation is performed only for square blocks. The usage of both partial results and separate ranking lists allowed the simultaneous search of motion vectors in partitions. The impact of proposed solution on compression efficiency, software and hardware implementations on ASIC and FPGA devices have been inspected.
Rodzaj dyplomuPraca doktorska
Autor Maciej Trochimiuk (WEiTI / IRTM)
Maciej Trochimiuk
- Instytut Radioelektroniki i Technik Multimedialnych
Tytuł w języku polskimOptymalizacja predykcji międzyobrazowej w kodowaniu danych wizyjnych
Językpl polski
Jednostka dyplomującaWydział Elektroniki i Technik Informacyjnych (WEiTI)
Dyscyplina naukiinformatyka / dziedzina nauk technicznych / obszar nauk technicznych
Data obrony12-12-2017
Data zakończenia 19-12-2017
Promotor Władysław Skarbek (WEiTI / IRTM)
Władysław Skarbek
- Instytut Radioelektroniki i Technik Multimedialnych
Recenzenci zewnętrzni Gorgoń Marek - Akademia Górniczo-Hutnicza (AGH)
Gorgoń Marek
-

Marek Parfieniuk
Marek Parfieniuk
-
Paginacja 169
Identyfikator wewnętrznyhttps://s3.eu-central-1.amazonaws.com/mt-publiczne/mtrochimiuk_phd.pdf
Słowa kluczowe w języku polskimestymacja ruchu, H.265, HEVC, predykcja międzyobrazowa
Słowa kluczowe w języku angielskimmotion estimation, H.265, HEVC, interframe prediction
Streszczenie w języku polskimPomimo olbrzymiego rozwoju algorytmów kompresji danych wizyjnych, podstawową wykorzystywaną ̨przez nie techniką pozostaje predykcja międzyobrazowa oparta na blokowej estymacji ruchu. Jest ona także elementem kodera, który w największym stopniu odpowiada za jego złożoność obliczeniową. Wraz z rozwojem technik kompresji danych wizyjnych zaproponowano wiele szybkich algorytmów predykcji międzyobrazowej, które w pewnych warunkach osiągają suboptymalne wyniki. Rosnące ̨rozdzielczości cyfrowych sygnałów wizyjnych wymagają jednak ustawicznego poszukiwania coraz skuteczniejszych algorytmów. W niniejszej rozprawie przedstawiono szereg algorytmów wyszukiwania wektorów ruchu dla potrzeb predykcji miedzyobrazowej. Poza przedstawieniem istniejących metod autor pracy zaproponował własne rozwiązanie mające ̨na celu redukcję złożoności obliczeniowej predykcji międzyobrazowej przy niewielkim zmniejszeniu efektywności kompresji. Zaproponowane rozwiązanie wykorzystuje w całkowitoliczbowej estymacji ruchu wyniki wyszukiwania wektorów ruchu dla bloków o rozmiarze 8×8 w blokach o większych rozmiarach. Ponadto w estymacji z ułamkową dokładnością ograniczono obliczenia do bloków kwadratowych, a zastosowanie oddzielnych list rankingowych oraz wyników cząstkowych pozwoliło na jednoczesne wyszukiwanie wektorów ruchu w pozostałych blokach. Zaproponowane rozwiązania przebadano pod kątem wpływu na efektywność kompresji, implementacji programowej oraz sprzętowej z wykorzystaniem układów typu ASIC i FPGA.
Plik pracy
Trochimiuk.pdf 10.92 MB

Pobierz odnośnik do tego rekordu

Powrót