Baza wiedzy: Politechnika Warszawska

Ustawienia i Twoje konto

Powrót

Wykorzystanie sztucznej inteligencji do generowania treści muzycznych

Mateusz Waldemar Dorobek

Abstract

This thesis is presenting a method for generating short musical phrases using a deep convolutional generative adversarial network (DCGAN). To train neural network were used datasets of classical and jazz music MIDI recordings. Our approach introduces translating the MIDI data into graphical images in a piano roll format suitable for the network input size, using the RGB channels as additional information carriers for improved performance. The network has learned to generate images that are indistinguishable from the input data and, when translated back to MIDI and played back, include several musically interesting rhythmic and harmonic structures. The results of the conducted experiments are described and discussed, with conclusions for further work and a short comparison with selected existing solutions.
Rodzaj dyplomu
Praca inżynierska / licencjacka
Typ dyplomu
Praca inżynierska
Autor
Mateusz Waldemar Dorobek (WEiTI/II) Mateusz Waldemar Dorobek Instytut Informatyki (WEiTI/II)Wydział Elektroniki i Technik Informacyjnych (WEiTI)
Tytuł w języku polskim
Wykorzystanie sztucznej inteligencji do generowania treści muzycznych
Promotor
Przemysław Rokita (WEiTI/II) Przemysław Rokita Instytut Informatyki (WEiTI/II)Wydział Elektroniki i Technik Informacyjnych (WEiTI)
Jednostka dyplomująca
Wydział Elektroniki i Technik Informacyjnych (WEiTI)
Jednostka prowadząca
Instytut Informatyki (WEiTI/II)
Kierunek / specjalność studiów
, Informatyka (Computer Science)
Język
(pl) polski
Status pracy
Obroniona
Data obrony
12-02-2019
Data (rok) wydania
2019
Identyfikator wewnętrzny
31/19 (2624)
Recenzenci
Krzysztof Gracki (WEiTI/II) Krzysztof Gracki Instytut Informatyki (WEiTI/II)Wydział Elektroniki i Technik Informacyjnych (WEiTI) Przemysław Rokita (WEiTI/II) Przemysław Rokita Instytut Informatyki (WEiTI/II)Wydział Elektroniki i Technik Informacyjnych (WEiTI)
Słowa kluczowe w języku polskim
generowanie muzyki, splotowe sieci neuronowe, generatywne sieci przeciwstawne, przetwarzanie obrazów, uczenie głębokie, sztuczna inteligencja, uczenie maszynowe, sieci neuronowe, muzyka, jazz, midi.
Słowa kluczowe w języku angielskim
music generation, convolutional neural networks, generative adversarial networks, image processing, deep learning, artificial intelligence, machine learning, neural networks, music, jazz, midi.
Streszczenie w języku polskim
Praca omawia zagadnienie generowania muzyki z wykorzystaniem głębokich splotowych generatywnych sieci przeciwstawnych (DCGAN). Do nauki sieci zostały użyte muzyczne bazy nagrań MIDI, zawierające muzykę klasyczną i jazzową. Opisany jest algorytm przetwarzania pliku MIDI do obrazu w formacie taśmy pianoli (ang. piano roll) zgodnym z rozmiarem wejściowym sieci, używając kanałów RGB obrazu jako dodatkowych nośników informacji, a także algorytm dekompresji z obrazu do pliku muzycznego. Sieć neuronowa nauczyła się generować obrazy nierozróżnialne od danych wejściowych. Muzyka uzyskana z tak wygenerowanych obrazów charakteryzuje się występowaniem struktur harmonicznych i rytmicznych. Podsumowane są wnioski z kilku przeprowadzonych eksperymentów. Poddane dyskusji zostały możliwe kierunki rozwoju i porównanie z wybranymi istniejącymi rozwiązaniami.
Plik pracy
  • Plik: 1
    Praca_Inżynierska.pdf
Poproś o plik WCAG
Pola lokalne
Identyfikator pracy APD: 31959

Jednolity identyfikator zasobu
https://repo.pw.edu.pl/info/bachelor/WUT97d57e681c504b3fb24c7f3c352f1052/
URN
urn:pw-repo:WUT97d57e681c504b3fb24c7f3c352f1052

Potwierdzenie
Czy jesteś pewien?
Zgłoszenie uwag dotyczących tej strony