Knowledge base: Warsaw University of Technology

Settings and your account

Back

Wideband LD-CELP Coder

Namgyu Kim

Abstract

In today‟s audio compression technology, users request much better quality of audio signals. Especially in real time communication, audio codecs must operate both high quality and low delay. Decreasing the noise and delay increases the quality of speech communication and improves satisfaction of the user of telecommunication services. This thesis proposes a procedure to make the quality of speech signals better using wideband speech (bandwidth 8 kHz) with Low Delay Code Excited Linear Predictive coder (LD-CELP). The proposed coder stems from narrowband (bandwidth 4 kHz) LD-CELP ITU-T standard G.728. Compared with narrowband, wideband speech has much higher frequency components and high speech quality. Speech quality is measured using SNR (Signal to quantization Noise Ratio) and MOS-LQO (Mean Opinion Score with Listening Quality Objective) obtained with PESQ (Perceptual Evaluation of Speech Quality) algorithm. All simulations are performed in MATLAB system with 4 different audio files. In order to obtain good quality of wideband speech, LD-CELP coder is modified. Firstly, an adaptive codebook is added to be commonly used non-adaptive codebook, consisting of pseudorandom sequences. In this way LTP (Long Term Prediction) is implemented in the proposed coder (in narrowband LDCELP there is no LTP). The adaptive codebook contains previous speech segments. A specific speech segment can be used to predict waveform of the future segment. LTP is useful in compression of voiced speech. Then the mixed codebook is proposed, consisting of previous segments (adaptive part), pseudorandom segments (stochastic, non-adaptive part) and pulses, useful in compression of plosive sounds. For modeling of one speech segment (vector), I use only one codebook vector, in order not to increase the bit rate too much. The selected vector is multiplied by the gain. Thus only the index of selected vector and quantized gain are transmitted to the receiver. Three gain quantizers are needed for the adaptive, non-adaptive and pulse-like codebook vectors. Different gain quantizers are tested: uniform, non-uniform obtained with Lloyd-Max algorithm and non-uniform obtained with LBG algorithm. Finally, LBG quantizer is applied. The proposed coder offers good speech quality at the bit rates 24 -30 kbit/s. Algorithmic delay of the coder is less than 1 ms.
Diploma type
Engineer's / Bachelor of Science
Diploma type
Engineer's thesis
Author
Namgyu Kim (FEIT) Namgyu Kim,, The Institute of Telecommunications (FEIT)Faculty of Electronics and Information Technology (FEIT)
Title in Polish
Szerokopasmowy koder LD-CELP
Supervisor
Przemysław Dymarski (FEIT) Przemysław Dymarski,, The Institute of Telecommunications (FEIT)Faculty of Electronics and Information Technology (FEIT)
Certifying unit
Faculty of Electronics and Information Technology (FEIT)
Affiliation unit
The Institute of Telecommunications (FEIT)
Study subject / specialization
, Telekomunikacja (Telecommunications)
Language
(en) English
Status
Finished
Defense Date
05-02-2019
Issue date (year)
2019
Reviewers
Jarosław Domaszewicz (FEIT) Jarosław Domaszewicz,, The Institute of Telecommunications (FEIT)Faculty of Electronics and Information Technology (FEIT) Przemysław Dymarski (FEIT) Przemysław Dymarski,, The Institute of Telecommunications (FEIT)Faculty of Electronics and Information Technology (FEIT)
Keywords in Polish
LD CELP, SNR, MOS-LQO, PESQ, LTP, kwantyzacja
Keywords in English
Low-delay CELP, SNR, MOS-LQO, PESQ, LTP, quantization
Abstract in Polish
W obecnym stadium rozwoju telekomunikacji rosną wymagania użytkowników co do jakości sygnałów akustycznych. Komunikacja w czasie rzeczywistym wymaga nie tylko dobrej jakości ale także małego opóznienia. Zmniejszenie szumu i redukcja opóznienia poprawia jakość usługi i wpływa korzystnie na zadowolenie użytkowników. Niniejsza praca ma na celu poprawę jakości transmitowanej mowy poprzez poszerzenie pasma do 8 kHz i zmniejszenie opóznienia. Zastosowano zmodyfikowany koder LD-CELP, oparty na wąskopasmowym standardzie ITU-T G.728. Uzyskano w ten sposób poszerzenie pasma akustycznego z 4 kHz do 8 kHz. Jakość mowy badano z wykorzystaniem obiektywnych miar, jak SNR oraz MOSLQO mierzonej metodą PESQ. Koder i dekoder został oprogramowany w języku MATLAB i przetestowany symulacyjnie na 4 frazach mowy. W celu uzyskania dobrej jakości sygnału mowy, w koderze LD-CELP przeprowadzono istotne modyfikacje. Do słownika zawierającego sekwencje pseudo-przypadkowe dołączono słownik adaptacyjny, zawierający sekwencje próbek sygnału wykorzystane w nieodległej przeszłości. W ten sposób zrealizowano predykcję długookresową, niestosowaną w standardzie G.728. Predykcja długookresowa poprawiła kompresję mowy dzwięcznej. W następnym etapie wprowadzono słownik mieszany, złożony z części adapracyjnej, sekwencji pseudo-losowych i impulsów. Te ostatnie dołączono ze względu na głoski plozyjne. Wekror próbek mowy jest kodowany z wykorzystaniem jednego wektora ze słownika, pomnożonego przez współczynnik wzmocnienia i przepuszczonego przez filtr predykcyjny. Przesyłany do odbiornika jest indeks wektora ze słownika i skwantowane wzmocnienie. Opracowano równomierne i nierównomierne kwantyzatory wzmocnienia. Do ich projektowania wykorzystano algorytm LloydaMaxa i algorytm LBG. Otrzymano dobrą jakość mowy przy szybkościach transmisji 24 – 30 kbit/s. Opóznienie algorytmiczne w koderze nie przekracza 1 ms.
File
  • File: 1
    Wideband_LD-CELP_Coder_NamgyuKim_296255.pdf
Request a WCAG compliant version
Local fields
Identyfikator pracy APD: 31289

Uniform Resource Identifier
https://repo.pw.edu.pl/info/bachelor/WUT5dd164642c2e498ab963095cde42c32c/
URN
urn:pw-repo:WUT5dd164642c2e498ab963095cde42c32c

Confirmation
Are you sure?
Report incorrect data on this page