Knowledge base: Warsaw University of Technology

Settings and your account

Back

Duplicates and Near Duplicates Management of Graphic Files

Mateusz Mielnicki

Abstract

This work is a development of engineering thesis dedicated to managing duplicate files. Added functionality is the ability to compare images. This work focuses on methods for comparing the images and possibility to use them for the automated search of duplicated image files. It consists of the comparison of several image description methods such as; average color, number of colors, histogram, similar areas or characteristic points. These methods have been tested for their ability to detect modified images and implemented in the created application. Work also includes a comparison of several popular tools for finding duplicate images. The program “Doplicates terrninatoť’ created in this work through its expanded configuration matches tested programs both in speed and accuracy of results. It is possible also thanks to its built-in multi-threaded algorithms and a cache that stores the results of compared images. Developed application allows to quickly and easily find duplicate photos treated by many typical modifications.
Record ID
WUT374d0bfed64e43fc87d23750307e41e3
Diploma type
Master of Science
Author
Mateusz Mielnicki (FEIT/ICS) Mateusz Mielnicki,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Title in Polish
Zarządzanie duplikatami i prawie duplikatami plików graficznych
Supervisor
Jerzy Chrząszcz (FEIT/ICS) Jerzy Chrząszcz,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Certifying unit
Faculty of Electronics and Information Technology (FEIT)
Affiliation unit
The Institute of Computer Science (FEIT/ICS)
Language
(pl) Polish
Status
Finished
Issue date (year)
2012
Internal identifier
ENII-PM.001564
Keywords in Polish
duplikat, duplikacja, zarządzanie duplikatami, duplikacja obrazu, porównywanie obrazu, terminator duplikatów
Keywords in English
duplicate, duplication, duplicates management, graphics duplication, graphics comparison, duplicates terminator
Abstract in Polish
Niniejsza praca jest rozwinięciem pracy inżynierskiej poświęconej zarządzaniu duplikatami plików. Dodaną funkcj onalnością jest możliwość porównywania obrazów zawartych w badanych plikach. Praca ta koncentruje się na metodach porównywania obrazu oraz możliwości ich wykorzystania w celu zautomatyzowanego wyszukiwania duplikatów plików graficznych. Znajduje się w niej porównanie takich metod opisu obrazu jak; średni kolor, liczba kolorów, histogram, obszary jednorodne czy punkty charakterystyczne. Metody te zostały przetestowane pod kątem zdolności do wykrywania zmodyfikowanych obrazów i zaimplementowane w stworzonej aplikacji. Praca zawiera również porównanie kilku popularnych narzędzi służących wyszukiwaniu zduplikowanych obrazów. Stworzony program “Terminator duplikatów” dzięki rozbudowanym możliwościom konfiguracji dor6wnuje badanym aplikacjom zarówno szybkością działania jak i dokładnością otrzymywanych wyników. Jest to mozliwe także dzięki jego wielowątkowej implementacji oraz wbudowanemu mechanizmowi pamięci podręcznej, która przechowuje wyniki porównywanych obrazów. Stworzona aplikacja umożliwia w szybki i wygodny sposób znaleźć duplikaty zdjęć poddanych wielu typowym modyfikacjom.

Uniform Resource Identifier
https://repo.pw.edu.pl/info/master/WUT374d0bfed64e43fc87d23750307e41e3/
URN
urn:pw-repo:WUT374d0bfed64e43fc87d23750307e41e3

Confirmation
Are you sure?
Report incorrect data on this page