Knowledge base: Warsaw University of Technology

Settings and your account

Back

Classification of sequential data

Rafał Marcin Surowiecki

Abstract

The main subject of the thesis is supervised classification of sequential data. The thesis defines the classification problem. Basic real-world applications for sequence classification have been presented. The thesis includes review of modern sequence classification techniques. Three main groups of sequence classification have been presented: classification based on features extracted from training data, classification based on sequence similarity and dissimilarity measures, classification based on statistical models. The review includes: hidden Markov models, artificial neural networks, nearest neighbors method and classification emerging substrings. In the thesis two data classification algorithms have been presented and examined. The first of them is based on sequential pattern mining. Classification accuracy has been tested for different pattern types. Frequent sequences, closed sequences, discriminating sequences and minimal distinguish sequence patterns have been tested. The second described algorithm is based on wavelet representation of sequential data.
Record ID
WUT307776
Diploma type
Master of Science
Author
Rafał Marcin Surowiecki (FEIT/ICS) Rafał Marcin Surowiecki,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Title in Polish
Klasyfikacja danych sekwencyjnych
Supervisor
Krzysztof Walczak (FEIT/ICS) Krzysztof Walczak,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Certifying unit
Faculty of Electronics and Information Technology (FEIT)
Affiliation unit
The Institute of Computer Science (FEIT/ICS)
Language
(pl) Polish
Status
Finished
Issue date (year)
2012
Internal identifier
ENII-PM.001658
Keywords in Polish
klasyfikacja, dane sekwencyjne, wzorce sekwencyjne
Keywords in English
classification, sequences, frequent sequence mining
Abstract in Polish
Przedmiotem pracy jest klasyfikacja danych sekwencyjnych. W jej treści przedstawiono definicje, niezbędne do zrozumienia opisywanego zagadnienia oraz wskazano podstawowe zastosowania klasyfikacji danych sekwencyjnych. Ponadto w pracy zawarty jest przegląd technik służących klasyfikacji danych sekwencyjnych. Przedstawione zostały trzy grupy klasyfikatorów, bazujące na: rachunku prawdopodobieństwa, dystansie między sekwencjami oraz cechach odkrywanych na podstawie danych trenujących. Wśród opisanych technik klasyfikacji zaprezentowano między innymi: ukryty model Markowa, sieci neuronowe, metodę najbliższych sąsiadów i klasyfikację opartą o wzorce wyłaniające. Praca zawiera również opis i przedstawia badania dwóch algorytmów. Pierwszy z nich opiera swoje działanie na wzorcach sekwencyjnych. W przypadku tego algorytmu zbadana została jakość klasyfikacji dla kilku jego modyfikacji, które polegały na zmianie odkrywanego wzorca. Zbadane zostały: wzorce sekwencyjne, domknięte wzorce sekwencyjne, wzorce reprezentujące oraz minimalne wzorce wyróżniające. Drugi badany algorytm bazuje na reprezentacji falkowej sekwencji.
File
Request a WCAG compliant version

Uniform Resource Identifier
https://repo.pw.edu.pl/info/master/WUT307776/
URN
urn:pw-repo:WUT307776

Confirmation
Are you sure?
Report incorrect data on this page