Knowledge base: Warsaw University of Technology

Settings and your account

Back

Data mining for preventing obesity in children

Magdalena Anna Rusiecka

Abstract

The purpose of this thesis, carried out in cooperation with the Children Memorial Health Institute is discovering new relationships between lifestyle and weight via data mining from Toybox dataset. The data was collected during a multidisciplinary study that was conducted in numerous European countries. The primary goal of the study was to find ways to prevent obesity in children. The following work describes the process of data analysis, exploration and a summary of the results. It also includes study of classification methods and implementation algorithms available in RStudio and CRAN repository fit to use with the data and description of implementation techniques used. From our considerations it follows that the obtained results can neither prove nor disprove the hypothesis of usefulness of classification algorithms in predicting weight abnormalities such as underweight or obesity in children. Two of the used methods: random forest classification and naive Bayes classifier seem promising. Therefore, further studies are required to reach a conclusion.
Diploma type
Engineer's / Bachelor of Science
Diploma type
Engineer's thesis
Author
Magdalena Anna Rusiecka (FEIT/IRMT) Magdalena Anna Rusiecka,, The Institute of Radioelectronics and Multimedia Technology (FEIT/IRMT)Faculty of Electronics and Information Technology (FEIT)
Title in Polish
Odkrywanie wiedzy dla celów profilaktyki otyłości wśród dzieci
Supervisor
Jan Mulawka (FEIT/ICS) Jan Mulawka,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Certifying unit
Faculty of Electronics and Information Technology (FEIT)
Affiliation unit
The Institute of Radioelectronics and Multimedia Technology (FEIT/IRMT)
Study subject / specialization
, Inżynieria Biomedyczna (Biomedical Engineering)
Language
(pl) Polish
Status
Finished
Defense Date
06-02-2019
Issue date (year)
2019
Reviewers
Jan Mulawka (FEIT/ICS) Jan Mulawka,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT) Piotr Bogorodzki (FEIT/IRMT) Piotr Bogorodzki,, The Institute of Radioelectronics and Multimedia Technology (FEIT/IRMT)Faculty of Electronics and Information Technology (FEIT)
Keywords in Polish
odkrywanie wiedzy, dane, otyłość, klasyfikacja, analiza
Keywords in English
data mining, data, obesity, classification, analysis
Abstract in Polish
Celem niniejszej pracy wykonywanej we współpracy z Instytutem Pomnik – Centrum Zdrowia Dziecka w Warszawie jest poszukiwanie zależności między stylem życia rodziny, a wagą dzieci poprzez metody odkrywania wiedzy. Dane użyte w badaniach zostały zebrane podczas ogólnoeuropejskiego projektu ToyBox, mającego na celu zapobieganie otyłości. Praca opisuje proces przygotowania danych, ich eksplorację oraz wizualizację i ocenę wyników. W pracy zamieszczono również opis i analizę metod klasyfikacji oraz badania dotyczące przydatności istniejących w programie RStudio i repozytorium CRAN. Metod eksploracji danych rozważone są pod względem zastosowania do eksploracji danych pochodzących z projektu ToyBox. Chociaż otrzymane wyniki nie przesądzają jednoznacznie o przydatności użytych metod klasyfikacji do przewidywania występowania lub nie nieprawidłowości wagi wśród dzieci, takich jak niedowaga czy otyłość, to jednak wyniki osiągane przez dwie z analizowanych funkcji klasyfikacji, lasy losowe i naiwny klasyfikator bayesowski, wydają się być obiecujące. Wskazuje to na celowość przeprowadzenia dalszych badań.
File
  • File: 1
    Magdalena_Rusiecka.pdf
Request a WCAG compliant version
Local fields
Identyfikator pracy APD: 31946

Uniform Resource Identifier
https://repo.pw.edu.pl/info/bachelor/WUTcdedf6ccd23d437e9c7499097d98e705/
URN
urn:pw-repo:WUTcdedf6ccd23d437e9c7499097d98e705

Confirmation
Are you sure?
Report incorrect data on this page