Knowledge base: Warsaw University of Technology

Settings and your account

Back

Use of artificial intelligence for generating musical contents

Mateusz Waldemar Dorobek

Abstract

This thesis is presenting a method for generating short musical phrases using a deep convolutional generative adversarial network (DCGAN). To train neural network were used datasets of classical and jazz music MIDI recordings. Our approach introduces translating the MIDI data into graphical images in a piano roll format suitable for the network input size, using the RGB channels as additional information carriers for improved performance. The network has learned to generate images that are indistinguishable from the input data and, when translated back to MIDI and played back, include several musically interesting rhythmic and harmonic structures. The results of the conducted experiments are described and discussed, with conclusions for further work and a short comparison with selected existing solutions.
Diploma type
Engineer's / Bachelor of Science
Diploma type
Engineer's thesis
Author
Mateusz Waldemar Dorobek (FEIT/ICS) Mateusz Waldemar Dorobek,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Title in Polish
Wykorzystanie sztucznej inteligencji do generowania treści muzycznych
Supervisor
Przemysław Rokita (FEIT/ICS) Przemysław Rokita,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Certifying unit
Faculty of Electronics and Information Technology (FEIT)
Affiliation unit
The Institute of Computer Science (FEIT/ICS)
Study subject / specialization
, Informatyka (Computer Science)
Language
(pl) Polish
Status
Finished
Defense Date
12-02-2019
Issue date (year)
2019
Internal identifier
31/19 (2624)
Reviewers
Krzysztof Gracki (FEIT/ICS) Krzysztof Gracki,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT) Przemysław Rokita (FEIT/ICS) Przemysław Rokita,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Keywords in Polish
generowanie muzyki, splotowe sieci neuronowe, generatywne sieci przeciwstawne, przetwarzanie obrazów, uczenie głębokie, sztuczna inteligencja, uczenie maszynowe, sieci neuronowe, muzyka, jazz, midi.
Keywords in English
music generation, convolutional neural networks, generative adversarial networks, image processing, deep learning, artificial intelligence, machine learning, neural networks, music, jazz, midi.
Abstract in Polish
Praca omawia zagadnienie generowania muzyki z wykorzystaniem głębokich splotowych generatywnych sieci przeciwstawnych (DCGAN). Do nauki sieci zostały użyte muzyczne bazy nagrań MIDI, zawierające muzykę klasyczną i jazzową. Opisany jest algorytm przetwarzania pliku MIDI do obrazu w formacie taśmy pianoli (ang. piano roll) zgodnym z rozmiarem wejściowym sieci, używając kanałów RGB obrazu jako dodatkowych nośników informacji, a także algorytm dekompresji z obrazu do pliku muzycznego. Sieć neuronowa nauczyła się generować obrazy nierozróżnialne od danych wejściowych. Muzyka uzyskana z tak wygenerowanych obrazów charakteryzuje się występowaniem struktur harmonicznych i rytmicznych. Podsumowane są wnioski z kilku przeprowadzonych eksperymentów. Poddane dyskusji zostały możliwe kierunki rozwoju i porównanie z wybranymi istniejącymi rozwiązaniami.
File
  • File: 1
    Praca_Inżynierska.pdf
Request a WCAG compliant version
Local fields
Identyfikator pracy APD: 31959

Uniform Resource Identifier
https://repo.pw.edu.pl/info/bachelor/WUT97d57e681c504b3fb24c7f3c352f1052/
URN
urn:pw-repo:WUT97d57e681c504b3fb24c7f3c352f1052

Confirmation
Are you sure?
Report incorrect data on this page