Finding Similar Shapes in Trajectories Recovered from Handwritten Documents

Józef Michał Marek

Abstract

The following thesis presents a new approach for finding specific shapes in handwritten documents. Basing on existing solutions, important aspects of trajectory recovery from document images are shown and the new approach for such recovery is introduced. Stroke points are determined using gray scale images. This allows to avoid artefacts of binarization and enables to use information about image gray scale in further analysis. Finding of the Shortest Hamiltonian Path in the graph representing poly lines leads to the most probable trajectory. The shape analysis allows to find characteristic letter variants and specific trajectory parts. In order to achieve this, the Dynamic Time Warping algorithm is implemented, using angle-based representation of the trajectory. It finds possible shape matches and their costs. The algorithms used for calculating costs in matching process allow the matching process to be invulnerable to transitions. The presented method was tested using UNIPEN database with accuracy over 70%.
Diploma typeMaster of Science
Author Józef Michał Marek (FEIT)
Józef Michał Marek,,
- Faculty of Electronics and Information Technology
Title in PolishWyszukiwanie podobnych kształtów w trajektoriach odzyskanych z obrazów pisma odręcznego
Supervisor Rajmund Kożuszek (FEIT / IN)
Rajmund Kożuszek,,
- The Institute of Computer Science
Certifying unitFaculty of Electronics and Information Technology (FEIT)
Affiliation unitThe Institute of Computer Science (FEIT / IN)
Study subject / specializationInformatyka (Computer Science)
Languagepl polski
StatusFinished
Defense Date19-03-2018
Issue date (year)2018
Internal identifier54/18 (2465)
Reviewers Michał Rudowski (FEIT / IN)
Michał Rudowski,,
- The Institute of Computer Science
, Rajmund Kożuszek (FEIT / IN)
Rajmund Kożuszek,,
- The Institute of Computer Science
Keywords in Polishanaliza pisma odręcznie pisanego, odzyskiwanie trajektorii, porównywanie kształtów
Keywords in Englishoffline handwritten analysis, trajectory recovery, shapes comparison
Abstract in PolishNiniejsza praca przedstawia autorską metodę wyszukiwania kształtów w odręcznie pisanych dokumentach. Na przykładzie istniejących metod przedstawia istotne aspekty odzyskiwania trajektorii tekstu z obrazów i prezentuje nowe, autorskie podejście do tego problemu. Punkty trajektorii wyznaczane są na podstawie obrazu w skali szarości, co pozwala uniknąć artefaktów związanych z binaryzacją i umożliwia wykorzystanie informacji o jasności w dalszej analizie. Poszukiwanie najkrótszej ścieżki Hamiltona w grafie złożonym z łamanych prowadzi do znalezienia najbardziej prawdopodobnej trajektorii tekstu. Analiza kształtów umożliwia znalezienie charakterystycznych wariantów liter oraz ich specyficznych fragmentów w trajektorii tekstu. W tym celu zastosowany został zmodyfikowany algorytm Dynamic Time Warping, który na podstawie kątowej reprezentacji trajektorii znajduje możliwe dopasowania kształtów oraz wyznacza koszty ich występowania. Algorytmy wyznaczające optymalny koszt dopasowania punktów trajektorii pozwalają na uniezależnienie porównywanych kształtów od podstawowych przekształceń takich jak zmienne nachylenie, czy obrót. Przedstawiona metoda została przetestowana na danych z bazy UNIPEN umożliwiając klasyfikację liter z dokładnością powyżej 70%.
File
jmarek_praca_magisterska.pdf 2.78 MB
Local fieldsIdentyfikator pracy APD: 25359

Get link to the record

Back