The algorithms of automation of the process of creating acoustic units databases in the Polish speech synthesis

Janusz Rafałko

Abstract

This paper presents the new approach of creating the database of acoustic units in concatenative TTS synthesis. Nowadays databases like this are created manually, which is very time-consuming and takes at least several months of work. Creation such base in automatic way shortens this time to hours. One of the next problem in the concatenative synthesis is the problem of reproduction any text using a voice and a way of speaking of particular man. Presented algorithms allow to create the allophone units database of particular man after receiving a sample of his voice and as a result synthetizer speaking with exactly this voice.
Author Janusz Rafałko (FMIS / DSMKP)
Janusz Rafałko,,
- Department of Structural Methods for Knowledge Processing
Pages373-383
Publication size in sheets0.5
Book Atanassov Krassimir T., Castillo Oscar, Kacprzyk Janusz, Krawczak Maciej, Melin Patricia, Sotirov Sotir, Sotirova Evdokia, Szmidt Eulalia, Tré Guy De, Zadrożny Sławomir (eds.): Novel Developments in Uncertainty Representation and Processing, Advances in Intelligent Systems and Computing, vol. 401, 2016, BERLIN, HEIDELBERGER PLATZ 3, D-14197 BERLIN, GERMANY, Springer International Publishing, ISBN 978-3-319-26210-9, [978-3-319-26211-6], 400 p., DOI:10.1007/978-3-319-26211-6
Abstract in PolishArtykuł przedstawia nowe podejście do tworzenia baz jednostek akustycznych w konkatenacyjnej syntezie mowy Text-To-Speech. Obecnie bazy te są przygotowywane ręcznie co jest bardzo pracochłonne, wymaga specjalistycznej wiedzy i zajmuje co najmniej kilka miesięcy. Tworzenie tych baz w sposób zautomatyzowany skraca ten czas do kilku godzin. Kolejnym problemem konkatenacyjnej syntezy mowy jest odtworzenie tekstu za pomocą głosu i sposobu mówienia dowolnego człowieka. Prezentowane algorytmy pozwalają na przygotowanie baz alofonowych dowolnego mówcy na podstawie nagranej próbki jego głosu i w rezultacie otrzymanie syntezatora mówiącego dokładnie jego głosem.
DOIDOI:10.1007/978-3-319-26211-6_32
URL http://link.springer.com/chapter/10.1007/978-3-319-26211-6_32
Languageen angielski
Score (nominal)15
Citation count*
Cite
Share Share

Get link to the record


* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back
Confirmation
Are you sure?