Combining Classifiers for Foreign Pattern Rejection

Władysław Homenda , Agnieszka Jastrzębska , Witold Pedrycz , Fusheng Yu

Abstract

In this paper, we look closely at the issue of contaminated data sets, where apart from legitimate (proper) patterns we encounter erroneous patterns. In a typical scenario, the classification of a contaminated data set is always negatively influenced by garbage patterns (referred to as foreign patterns). Ideally, we would like to remove them from the data set entirely. The paper is devoted to comparison and analysis of three different models capable to perform classification of proper patterns with rejection of foreign patterns. It should be stressed that the studied models are constructed using proper patterns only, and no knowledge about the characteristics of foreign patterns is needed. The methods are illustrated with a case study of handwritten digits recognition, but the proposed approach itself is formulated in a general manner. Therefore, it can be applied to different problems. We have distinguished three structures: global, local, and embedded, all capable to eliminate foreign patterns while performing classification of proper patterns at the same time. A comparison of the proposed models shows that the embedded structure provides the best results but at the cost of a relatively high model complexity. The local architecture provides satisfying results and at the same time is relatively simple.
Author Władysław Homenda (FMIS / DSMKP)
Władysław Homenda,,
- Department of Structural Methods for Knowledge Processing
, Agnieszka Jastrzębska (FMIS / DSMKP)
Agnieszka Jastrzębska,,
- Department of Structural Methods for Knowledge Processing
, Witold Pedrycz
Witold Pedrycz,,
-
, Fusheng Yu
Fusheng Yu,,
-
Journal seriesJournal of Artificial Intelligence and Soft Computing Research, ISSN 2083-2567, e-ISSN 2449-6499
Issue year2020
Vol10
No2
Pages75-94
Publication size in sheets0.95
Keywords in Polishanaliza danych, inżynieria wiedzy
Keywords in Englishdata mining, knowledge engineering
ASJC Classification1702 Artificial Intelligence; 1707 Computer Vision and Pattern Recognition; 1708 Hardware and Architecture; 1710 Information Systems; 2611 Modelling and Simulation
Abstract in PolishArtykuł został poświęcony problematyce zaszumionych zbiorów danych, w których oprócz prawidłowych wzorców spotykamy błędne wzorce. Przy przetwarzaniu takiego zbioru danych wzorce błędne, będące “śmieciami”, zawsze wpływają negatywnie na efektywność klasyfikacji. Stąd chcielibyśmy je całkowicie usunąć z zestawu danych. Artykuł poświęcony jest porównaniu i analizie trzech modeli zdolnych do przeprowadzania klasyfikacji prawidłowych wzorców z równoczesnym odrzuceniem błędnych wzorców. Należy podkreślić, że badane modele konstruowane są wyłącznie przy użyciu wzorców poprawnych i nie jest potrzebna wiedza o spodziewanym typie wzorców błędnych. Wyróżniliśmy trzy schematy przetwarzania: “globalny”, “lokalny” i “wbudowany”, wszystkie zdolne do eliminacji błędnych wzorców przy jednoczesnej klasyfikacji poprawnych wzorców. Porównanie zaproponowanych modeli wykazało, że model typu “wbudowanego” zapewnia najlepsze wyniki, ale kosztem stosunkowo dużej złożoności modelu. “Lokalna” architektura zapewnia satysfakcjonujące wyniki, a jednocześnie jest stosunkowo prosta. Opracowane metody zostały użyte do przetwarzania zbiorów danych z ręcznie pisanymi symbolami.
DOIDOI:10.2478/jaiscr-2020-0006
URL https://content.sciendo.com/view/journals/jaiscr/10/2/article-p75.xml
Languageen angielski
Score (nominal)140
Score sourcejournalList
ScoreMinisterial score = 140.0, 08-07-2020, ArticleFromJournal
Publication indicators Scopus Citations = 0; Scopus SNIP (Source Normalised Impact per Paper): 2018 = 4.066
Citation count*
Cite
Share Share

Get link to the record


* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back
Confirmation
Are you sure?