Knowledge base: Warsaw University of Technology

Settings and your account

Back

Speaker verification application using GMM/UBM

Krzysztof Adam Dziurlikowski

Abstract

This thesis presents a project of application used for speaker verification. The purpose of this project is allowing Linux/Ubuntu user to become acquainted with speaker recognition subject and do own experiments in this area. Created program use Gaussian Mixture Model and Universal Background Model to perform speaker verification algorithm described in this thesis. Thesis tells about pre-processing of records to mel-cepstrach features, essence of GMM and UBM, moreover shows author’s implementation of user interface (graphical and console), allowing use of designed functionalities. In order to evaluate speaker recognition efficiency thesis also presents result of tests carried out in this area.
Diploma type
Engineer's / Bachelor of Science
Diploma type
Engineer's thesis
Author
Krzysztof Adam Dziurlikowski (FEIT/AK) Krzysztof Adam Dziurlikowski,, The Institute of Control and Computation Engineering (FEIT/AK)Faculty of Electronics and Information Technology (FEIT)
Title in Polish
Aplikacja do weryfikacji mówcy za pomocą modelu GMM/UBM
Supervisor
Włodzimierz Kasprzak (FEIT/AK) Włodzimierz Kasprzak,, The Institute of Control and Computation Engineering (FEIT/AK)Faculty of Electronics and Information Technology (FEIT)
Certifying unit
Faculty of Electronics and Information Technology (FEIT)
Affiliation unit
The Institute of Control and Computation Engineering (FEIT/AK)
Study subject / specialization
, Informatyka (Computer Science)
Language
(pl) Polish
Status
Finished
Defense Date
25-09-2019
Issue date (year)
2019
Reviewers
Włodzimierz Kasprzak (FEIT/AK) Włodzimierz Kasprzak,, The Institute of Control and Computation Engineering (FEIT/AK)Faculty of Electronics and Information Technology (FEIT) Artur Wilkowski (FEIT/AK) Artur Wilkowski,, The Institute of Control and Computation Engineering (FEIT/AK)Faculty of Electronics and Information Technology (FEIT)
Keywords in Polish
GMM, model mieszanin gaussowskich, UBM, model tła, MFCC, cechy mel-cepstralne, rozpoznawanie mówcy, weryfikacja mówcy
Keywords in English
GMM, gaussian mixture model, UBM, universal background model, MFCC, mel- cepstral features, speaker recognition, speaker verification.
Abstract in Polish
Niniejsza praca prezentuje projekt aplikacji służącej do weryfikacji mówcy. Jej przeznaczeniem jest umożliwienie użytkownikowi systemu Linux/Ubuntu zapoznania się z tematyką rozpoznawania mówcy i przeprowadzenie własnych doświadczeń w tym zakresie. Utworzony program korzysta z modelu mieszanin gaussowskich (ang. Gaussian Mixture Model, w skrócie GMM) oraz uniwersalnego modelu tła (ang. Universal Background Model, w skrócie UBM). Na nich opiera się algorytm weryfikacji mówcy tu opisywany. Praca opowiada o przetwarzaniu wstępnym nagrania do postaci cech mel-cepstralnych, istocie GMM i UBM, a także pokazuje implementacje interfejsu użytkownika (graficznego oraz konsolowego), umożliwiającego korzystanie z projektowanych funkcjonalności. W celu oceny sprawności, z jaką aplikacja rozpoznaje mówców, prezentuje się tutaj również wyniki testów, jakie zostały przeprowadzone w tym zakresie.
File
  • File: 1
    praca-dyplomowa.pdf
Request a WCAG compliant version
Local fields
Identyfikator pracy APD: 35828

Uniform Resource Identifier
https://repo.pw.edu.pl/info/bachelor/WUTdc62d9cfa73b44249ee0a33f2decc89a/
URN
urn:pw-repo:WUTdc62d9cfa73b44249ee0a33f2decc89a

Confirmation
Are you sure?
Report incorrect data on this page