Knowledge base: Warsaw University of Technology

Settings and your account

Back

Implementation of speech interface for website

Kacper Waluch

Abstract

This thesis presents the implementation of speech-enabled website. The first chapter describes the main theoretical issues related to automatic speech recognition, in particular: language modeling, parameterization of speech, speech recognition using Markov models and decoding. There is also described the speech synthesis and its different types. The next chapter describes the Google Speech API interface and its most important elements and functions. The fourth chapter concerns the implementation of the major tasks of this study - the implementation of voice interface to a web page. This chapter describes used technologies and stages of execution this implementation. The next chapter presents the results of tests of the created web site and discussion of the results obtained after carrying out the survey. Chapter 6 describes problems that occurred during the implementation and possible ways to resolve them. The summary includes development opportunities of a web site with the voice interface and the future of this type of websites.
Diploma type
Engineer's / Bachelor of Science
Diploma type
Engineer's thesis
Author
Kacper Waluch (FEIT) Kacper Waluch,, Faculty of Electronics and Information Technology (FEIT)
Title in Polish
Opracowanie interfejsu głosowego dla strony internetowej
Supervisor
Artur Janicki (FEIT) Artur Janicki,, The Institute of Telecommunications (FEIT)Faculty of Electronics and Information Technology (FEIT)
Certifying unit
Faculty of Electronics and Information Technology (FEIT)
Affiliation unit
The Institute of Telecommunications (FEIT)
Study subject / specialization
, Telekomunikacja (Telecommunications)
Language
(pl) Polish
Status
Finished
Defense Date
17-02-2016
Issue date (year)
2016
Reviewers
Artur Janicki (FEIT) Artur Janicki,, The Institute of Telecommunications (FEIT)Faculty of Electronics and Information Technology (FEIT)
Keywords in Polish
Rozpoznawanie mowy, synteza mowy, Google Speech API, interfejs głosowy, interfejs głosowy dla strony internetowej
Keywords in English
Speech recognition, speech synthesis, Google Speech API, speech enabled website, voice interface
Abstract in Polish
Niniejsza praca przedstawia implementację strony internetowej z wykorzystaniem interfejsu głosowego. W pierwszym rozdziale przedstawione zostały najważniejsze zagadnienia teoretyczne związane z automatycznym rozpoznawaniem mowy, a w szczególności: modelowanie języka, parametryzacja mowy, rozpoznawanie mowy przy użyciu Modeli Markowa oraz dekodowanie. Poruszono także temat syntezy mowy i przedstawiono jej różne rodzaje. W kolejnym rozdziale został opisany interfejs Google Speech API, przedstawiono jego najważniejsze elementy i funkcje. Rozdział czwarty dotyczy realizacji głównego zadania pracy inżynierskiej - implementacji interfejsu głosowego do strony WWW. W tym rozdziale zostały opisane użyte technologie oraz etapy wykonywania implementacji. Kolejny rozdział przedstawia wyniki testów stworzonej strony internetowej oraz dyskusję wyników otrzymanych po przeprowadzeniu ankiety. W rozdziale 6 opisane są problemy, które wystąpiły podczas realizacji zadania oraz możliwe sposoby ich rozwiązania. W podsumowaniu zostały zawarte możliwości rozwoju danej strony internetowej z interfejsem głosowym oraz przyszłość tego typu stron.
File
  • File: 1
    Kacper Waluch - praca inżynierska.pdf
Request a WCAG compliant version
Local fields
Identyfikator pracy APD: 9848

Uniform Resource Identifier
https://repo.pw.edu.pl/info/bachelor/WUT532b781183584993a20a589d93861918/
URN
urn:pw-repo:WUT532b781183584993a20a589d93861918

Confirmation
Are you sure?
Report incorrect data on this page