Knowledge base: Warsaw University of Technology

Settings and your account

Back

Usage of neural networks in detecting spoken phrases

Karol Chęciński

Abstract

This article presents an attempt to create voice searching engine based on the Siamese Neural Network. This model is used to determine similarity of two objects. Is composed of two convolutional branches with shared weights. They are connected by dense layer. The process of gathering data and neural network training has been described. The elements and the parameters of the architecture used in this article have been presented. The implementation system of the voice searching engine based on the previously trained model has been proposed. The results of the experiments have been presented and functioning of the trained model has been analyzed. There was also made sensitivity analysis of the architecture used in this work.
Diploma type
Engineer's / Bachelor of Science
Diploma type
Engineer's thesis
Author
Karol Chęciński (FEIT/ICS) Karol Chęciński,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Title in Polish
Wykrywanie wypowiadanych haseł z wykorzystaniem sieci neuronowych - wyróżnienie w II Konkursie prac dyplomowych pod patronatem IEEE
Supervisor
Paweł Wawrzyński (FEIT/ICS) Paweł Wawrzyński,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Certifying unit
Faculty of Electronics and Information Technology (FEIT)
Affiliation unit
The Institute of Computer Science (FEIT/ICS)
Study subject / specialization
, Informatyka (Computer Science)
Language
(pl) Polish
Status
Finished
Defense Date
13-02-2019
Issue date (year)
2019
Internal identifier
26/19 (2619)
Reviewers
Paweł Wawrzyński (FEIT/ICS) Paweł Wawrzyński,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT) Bartłomiej Twardowski (FEIT/ICS) Bartłomiej Twardowski,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Keywords in Polish
wyszukiwarka głosowa, analiza mowy, sieć neuronowa, uczenie maszynowe, sieć konwolucyjna, sieć syjamska
Keywords in English
speech search, voice analysis, neural network, machine learning, convolutionalnetwork, siamese network
Abstract in Polish
Niniejsza praca opisuje próbę stworzenia wyszukiwarki głosowej w oparciu o syjamską sieć neuronową. Jest to model wykorzystywany do określania podobieństwa między dwoma obiektami. Zbudowany jest z dwóch gałęzi sieci konwolucyjnych ze wspólnymi wagami, które połączone są warstwą gęstą. Opisano proces pozyskania zbioru danych i trenowania sieci neuronowej. Przedstawiono elementy i parametry zastosowanej architektury Zaproponowano sposób implementacji wyszukiwarki głosowej w oparciu o wytrenowany model. Zaprezentowano wyniki eksperymentów i przeanalizowano działanie wytrenowanego modelu. Wykonano także analizę wrażliwości przyjętej architektury.
File
  • File: 1
    thesis.pdf
Request a WCAG compliant version
Local fields
Identyfikator pracy APD: 32024

Uniform Resource Identifier
https://repo.pw.edu.pl/info/bachelor/WUTdb2f67ae010044138e5e5b707c56f17d/
URN
urn:pw-repo:WUTdb2f67ae010044138e5e5b707c56f17d

Confirmation
Are you sure?
Report incorrect data on this page