Detection of mathematical formulas on images

Radosław Załuska

Abstract

This thesis contains a description of the method for automatic detection and the position determination of mathematical equations on images. Segmentation of the picture into parts that are containing mathematical equations and other fragments was performed using a deep fully convolutional neural network. This thesis contains a description of the process of ground truth data preparation which had to be prepared by an author by himself because there is no similar data available. Next chapters describe the topic of deep convolutional neural networks. One of that type of structures was presented - a deep convolutional encoder-decoder - that was used by the author to prepare his solution. Subsequently, the author describes proposed ways of results evaluation and acquired outcomes. In the end, the author presents examples of results that his solution is producing. He also describes plans for the further development and possible practical usages.
Diploma typeMaster of Science
Author Radosław Załuska (FEIT)
Radosław Załuska,,
- Faculty of Electronics and Information Technology
Title in PolishDetekcja równań matematycznych na obrazach
Supervisor Rajmund Kożuszek (FEIT / IN)
Rajmund Kożuszek,,
- The Institute of Computer Science
Certifying unitFaculty of Electronics and Information Technology (FEIT)
Affiliation unitThe Institute of Computer Science (FEIT / IN)
Study subject / specializationInformatyka (Computer Science)
Languagepl polski
StatusFinished
Defense Date12-10-2018
Issue date (year)2018
Internal identifier159/18 (2570)
Reviewers Rajmund Kożuszek (FEIT / IN)
Rajmund Kożuszek,,
- The Institute of Computer Science
, Jacek Komorowski (FEIT / ICS)
Jacek Komorowski,,
- The Institute of Computer Science
Keywords in Polishdetekcja obiektów na obrazach, segmentacja obrazów, uczenie maszynowe, głębokie splotowe sieci neuronowe, Python, Keras
Keywords in Englishobjects detection on images, images segmentation, machine learning, deep convolutional neural networks, Python, Keras
Abstract in PolishW pracy opisano metodę automatycznego wykrywania oraz określania położenia równań matematycznych na obrazach. W celu przeprowadzenia segmentacji ilustracji na obszary zawierające równania oraz pozostałe fragmenty, na których nie ma formuł matematycznych, wykorzystano głębokie pełno-splotowe sieci neuronowe. Praca zawiera opis przygotowywania danych uczących, które musiały być opracowane przez autora własnoręcznie ze względu na brak dostępnych tego typu gotowych zbiorów. W kolejnych rozdziałach przedstawiano zagadnienie głębokich splotowych sieci neuronowych. Zaprezentowana została jedna ze struktur tego typu modeli, głęboki pełno-splotowy koder-dekoder, wykorzystany przez autora do realizacji pracy. W dalszej kolejności przedstawiono zaproponowane sposoby ewaluacji rezultatów oraz uzyskane wyniki. Na koniec autor prezentuje przykładowe efekty swojej pracy oraz opisuje plan dalszego rozwoju wraz z potencjalnymi praktycznymi zastosowaniami.
File
Załuska-Radosław-Praca-Dyplomowa-Magisterska.pdf 5.69 MB
Local fieldsIdentyfikator pracy APD: 29166

Get link to the record

Back