Low delay coder (< 25 ms) of wideband audio (20 Hz-15 kHz) scalable from 64 to 32 kbit/s

Nicolas Moreau , Przemysław Dymarski

Abstract

A low delay coder for speech and music signals sampled at 32kHz is described. Its algorithmic delay does not exceed 25 ms which enables audioconferencing applications without echo cancellation. Its bit rate is scalable between 64 and 32 kbit/s by steps of 8 kbit/s. The transmitter issues the binary code at 64 kbit/s with lower bit rate codes embedded in it. The receiver may operate at lower bit rates with gradual loss of quality. The proposed coder is based on a mixed scheme: the adopted solution contains elements from the CELP speech coder and frequency domain music coders. The perceptual signal is obtained in the time domain, then transformed to the frequency domain where bit allocation is calculated and transform coefficients are quantized. A first solution based on the dft is discussed, then a second solution based on a mdct with small overlap is applied. The quantization of these coefficients is done in the following way. First, a prediction of the whole spectrum is applied. Then, a mean- removed gain- shape split vq is used for amplitude spectrum quantization and a hierarchical 2- dimensional vq is used for phase spectrum quantization with amplitude correction. At the phase quantization stage, each codeword describing the selected vector index is split into parts corresponding to different bit rates. Due to the hierarchical codebook structure, truncated indices may be used, without much affecting the signal quality. Simulation results are presented and the robustness of the proposed coder is examined. On décrit un codeur à faible retard adapté à des signaux de parole et de musique échantillonnés à 32 kHz. Le retard algorithmique ne dépasse pas 25 ms ce qui permet des applications de type audioconférence sans procedure d’annulation d’écho. Le debit binaire est hiérarchique entre 64 et 32 kbit/s par pas de 8 kbit/s. L’émetteur engendre un code binaire a 64 kbit/s dans lequel sont inclus les codes correspondant à des débits plus faibles. Le récepteur peut fonctionner à débit plus faible avec une perte progressive de la qualité. Le schéma de principe du codeur propose realise un compromis entre le codeur celp adapté aux signaux de parole et des codeurs par transformée adaptes aux signaux de musique. Le signal perceptuel est obtenu dans le domaine temporel. II est ensuite transforme dans le domaine fréquentiel où une allocation de bits est faite puis les coefficients de la transformee sont quantifiés. Une première solution basee sur la ted est analysee. On présente ensuite une solution basée sur la mdct avec faible recouvrement. La quantification des coefficients a les caracteristiques suivantes. D’abord on effectue une prediction de tout le spectre. Pour quantifier le spectre d’amplitude, on utilise une quantification variable (qv) gain- forme apres exploitation de la moyenne. Pour quantifier le spectre de phase, on utilise une QV hiérarchique bidimensionnelle. Les mots de code associés à cette qv sont partitionnés pour les différents débits. Grâce à la structure hiérarchique du dictionnaire, des indices tronqués peuvent être utilisés sans trop affecter la qualité du signal reconstruit. Des résultats de simulation sont présentés et le problàme de la robustesse est examine.
Author Nicolas Moreau
Nicolas Moreau,,
-
, Przemysław Dymarski (FEIT / IT)
Przemysław Dymarski,,
- The Institute of Telecommunications
Journal seriesAnnales des Telecommunications-Annals of Telecommunications, ISSN 0003-4347
Issue year2000
Vol55
No9-10
Pages493-506
Keywords in EnglishCodage hiérarchique, Codage parole, Codage son, Coder, Codeur, Communications Engineering, Networks, Compression bande passante, Computer Communication Networks, Hierarchical coding, Hiérarchie, Information and Communication, Circuits, Information Systems and Communication Service, music, Musique, Passband compression, Perception, Qualité sonore, Quantification signal, R \& D/Technology Policy, Scability, Signal, Image and Speech Processing, Signal quantizing, Signal spectrum, Sound coding, Sound Quality, Spectre signal, speech coding
ASJC Classification2208 Electrical and Electronic Engineering
DOIDOI:10.1007/BF02995204
URL http://link.springer.com/article/10.1007/BF02995204
Languageen angielski , fr francuski
File
2000 Moreau Dymarski Low delay coder.pdf 1.63 MB
Score (nominal)20
Score sourcejournalList
Publication indicators GS Citations = 1.0; Scopus SNIP (Source Normalised Impact per Paper): 2000 = 0.298; WoS Impact Factor: 2006 = 0.168 (2) - 2007=0.195 (5)
Citation count*1 (2020-08-29)
Cite
Share Share

Get link to the record


* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back
Confirmation
Are you sure?