Knowledge base: Warsaw University of Technology

Settings and your account

Back

Building a tool comparing selected classification algorithms

Piotr Andrzej Walędziak

Abstract

This thesis describes the issue of data classifications and reviews some classification algorithms such as: decision trees, random forest, k-nearest neighbors, support vector machines, neural networks. This paper presents web application that was build for the purposes of this thesis (available via https://inz-porownanie-klasyfikatorow.shinyapps.io/aplikacjaINZ/). The program might be used for gauging the accuracy of particular classifiers based on given dataset. User is able to import CSV file and set chosen algorithm’s parameters. The paper is divided into three main parts. In the first one a brief description of classification issue is presented. Then basic information concerning particular algorithms is introduced. The second part consists of a description of application background (i.e.: R language and Shiny package) and explains its interface. The last part of this paper is a summary of a classification analysis that take advantage of mentioned program to find the best classifiers for three datasets concerning three different tasks related with electronics and telecommunications. Presented results of data classification analysis show the high accuracy of random forests and artificial neural networks methods compared to the other algorithms discussed in this paper.
Diploma type
Engineer's / Bachelor of Science
Diploma type
Engineer's thesis
Author
Piotr Andrzej Walędziak (FEIT) Piotr Andrzej Walędziak,, Faculty of Electronics and Information Technology (FEIT)
Title in Polish
Stworzenie narzędzia do porównywania wybranych algorytmów klasyfikujących
Supervisor
Mikołaj Baszun (FEIT/MO) Mikołaj Baszun,, The Institute of Microelectronics and Optoelectronics (FEIT/MO)Faculty of Electronics and Information Technology (FEIT)
Certifying unit
Faculty of Electronics and Information Technology (FEIT)
Affiliation unit
The Institute of Microelectronics and Optoelectronics (FEIT/MO)
Study subject / specialization
, Elektronika i Telekomunikacja
Language
(pl) Polish
Status
Finished
Defense Date
20-09-2016
Issue date (year)
2016
Reviewers
Mateusz Żotkiewicz (FEIT) Mateusz Żotkiewicz,, The Institute of Telecommunications (FEIT)Faculty of Electronics and Information Technology (FEIT) Mikołaj Baszun (FEIT/MO) Mikołaj Baszun,, The Institute of Microelectronics and Optoelectronics (FEIT/MO)Faculty of Electronics and Information Technology (FEIT)
Keywords in Polish
algorytmy klsyfikacji, język R, eksploracja danych, uczenie maszynowe
Keywords in English
classification algorithms, R, data mining, machine learning
Abstract in Polish
Niniejsza praca opisuje zagadnienie klasyfikacji oraz przedstawia wybrane algorytmy klasyfikujące, takie jak: drzewa decyzyjne, lasy losowe, metodę k-najbliższych sąsiadów, metodę wektorów nośnych, sztuczne sieci neuronowe. Opracowanie zawiera także opis aplikacji, która została zbudowana na cele niniejszej pracy dyplomowej (dostępna poprzez: https://inz-porownanie-klasyfikatorow.shinyapps.io/aplikacjaINZ/). Dzięki temu programowi można mierzyć dokładność poszczególnych klasyfikatorów na zadanych zbiorach danych. Wystarczy, że użytkownik zaimportuje plik w formacie CSV oraz ustawi parametry wybranych algorytmów. Praca jest podzielona na trzy główne części. W pierwszej znajduje się krótki opis problematyki klasyfikacji danych. Następnie przedstawione zostały podstawowe informacje na temat poszczególnych algorytmów. Druga część pracy składa się z opisu budowy aplikacji (tj. języka R oraz pakietu Shiny) oraz wyjaśnienia interfejsu użytkownika. Ostatnie rozdziały to zapis wyników analizy klasyfikującej, która została przeprowadzona za pomocą stworzonego programu. Celem analizy było znalezienie najlepszych klasyfikatorów dla trzech zbiorów danych dotyczących trzech różnych zadań związanych tematycznie z elektroniką i telekomunikacją. Zaprezentowane wyniki analizy pokazują dużą dokładność algorytmów lasów losowych oraz sztucznych sieci neuronowych w porównaniu z pozostałymi klasyfikatorami przedstawionymi w tej pracy.
File
  • File: 1
    P_Waledziak_pdi.pdf
Request a WCAG compliant version
Local fields
Identyfikator pracy APD: 13969

Uniform Resource Identifier
https://repo.pw.edu.pl/info/bachelor/WUT5d259b95e6034ea291ffa399a2cbc34a/
URN
urn:pw-repo:WUT5d259b95e6034ea291ffa399a2cbc34a

Confirmation
Are you sure?
Report incorrect data on this page