Knowledge base: Warsaw University of Technology

Settings and your account

Back

Tourist routes search engine

Aleksander Mateusz Piotrowski

Abstract

The main components of this thesis are Internet crawler which is able to automatically gather content from the Internet. Content is then classified based on its subject. Conducted research contains examination of the quality of classified content based on its sentiment and opinions on tourist facilities. There is a design of an application which is able to help to choose tourist routes based on collected opinions and their automatically determined sentiment. For simplicity, the implementation was limited only to area of polish part of Tatra Mountains. The biggest Internet forum about such subject is [forum.turystyka-gorska.pl]. Thanks to more than half a million posts in more than ten thousands threads, I was able to retrieve enough data to analyze it in terms of emotional features and to compare filtering data by two classifiers - naive Bayes classifier and own classifier based on stemming.
Diploma type
Engineer's / Bachelor of Science
Diploma type
Engineer's thesis
Author
Aleksander Mateusz Piotrowski (FEIT/AK) Aleksander Mateusz Piotrowski,, The Institute of Control and Computation Engineering (FEIT/AK)Faculty of Electronics and Information Technology (FEIT)
Title in Polish
Wyszukiwarka tras turystycznych
Supervisor
Piotr Przemyslaw Arabas (FEIT/AK) Piotr Przemyslaw Arabas,, The Institute of Control and Computation Engineering (FEIT/AK)Faculty of Electronics and Information Technology (FEIT)
Certifying unit
Faculty of Electronics and Information Technology (FEIT)
Affiliation unit
The Institute of Control and Computation Engineering (FEIT/AK)
Study subject / specialization
, Automatyka i Robotyka (Automation and Robotics)
Language
(pl) Polish
Status
Finished
Defense Date
17-09-2019
Issue date (year)
2019
Reviewers
Mariusz Kamola (FEIT/AK) Mariusz Kamola,, The Institute of Control and Computation Engineering (FEIT/AK)Faculty of Electronics and Information Technology (FEIT) Piotr Przemyslaw Arabas (FEIT/AK) Piotr Przemyslaw Arabas,, The Institute of Control and Computation Engineering (FEIT/AK)Faculty of Electronics and Information Technology (FEIT)
Keywords in Polish
Automatyczne przeszukiwanie Internetu, klasyfikacja tekstu, crawling, stemming
Keywords in English
Automatic search of the Internet, text classification, crawling, stemming
Abstract in Polish
Opisywana praca w głównym stopniu składa się z systemu automatycznego przeszukiwania Internetu oraz klasyfikacji znalezionych treści na podstawie zawartej treści. Przeprowadzone zostały badania jakości klasyfikacji treści, ze względu na zawartość opinii o obiektach turystycznych oraz ze względu na wydźwięk emocjonalny. Zaprojektowana została także aplikacja pomagająca wybierać trasy turystyczne, na podstawie zebranych opinii i ich automatycznie wyznaczonego sentymentu. Dla uproszczenia implementacja objęła poszukiwanie informacji jedynie o punktach turystycznych polskich Tatr. Największym polskim forum o tematyce taterniczej jest [forum.turystyka-gorska.pl]. Dzięki temu, że forum to posiada ponad pół miliona postów (pojedynczych wpisów) w ponad 10 tysiącach wątków, można było otrzymać wystarczająco dużo danych do analizy pod względem zabarwienia emocjonalnego oraz porównania działania filtrowania treści na podstawie dwóch klasyfikatorów - naiwnego klasyfikatora Bayesa oraz autorskiego klasyfikatora bazującego na wzorcach gramatycznych (ang. stemming).
File
  • File: 1
    AleksanderPiotrowskiPracaDyplomowaInzynierska.pdf
Request a WCAG compliant version
Local fields
Identyfikator pracy APD: 35824

Uniform Resource Identifier
https://repo.pw.edu.pl/info/bachelor/WUTf23ee10ab2984a27ac8bf643355196f2/
URN
urn:pw-repo:WUTf23ee10ab2984a27ac8bf643355196f2

Confirmation
Are you sure?
Report incorrect data on this page