Distance-based linear discriminant analysis for interval-valued data

Przemysław Grzegorzewski , Ana Ramos-Guajardo

Abstract

Interval-valued observations arise in many real-life situations as either the precise representation of the objective entity or the representation of incomplete knowledge. Thus given p features observed over a sample of objects belonging to one of two possible classes, each observation can be perceived as a non-empty closed and bounded hyperrectangle on R^p . The aim of the paper is to suggest a p-dimensional classification method for random inter- vals when two or more classes are considered, by the generalization of Fisher’s procedure for linear discriminant analysis. The idea consists of finding a directional vector which maximizes the ratio of the dispersion between the classes and within the classes of the observed hyperrectangles. A classification rule for new observations is also provided and some simulations are carried out to compare the behavior of the proposed classification procedure with respect to other methods known from the literature. Finally, the suggested methodology are applied on a real-life situation example.
Author Przemysław Grzegorzewski ZPSMF
Przemysław Grzegorzewski,,
- Department of Stochastic Processes and Financial Mathematics
, Ana Ramos-Guajardo
Ana Ramos-Guajardo,,
-
Journal seriesInformation Sciences, ISSN 0020-0255
Issue year2016
Vol372
Pages591-607
Publication size in sheets0.8
Keywords in EnglishClassification, Discriminant analysis, Interval data, LDA, Random intervals
Abstract in PolishDane przedziałowe pojawiają się często w badaniach statystycznych tam, gdzie interesujące nas wielkości nie mogą być (z różnych przyczyn) mierzone w sposób precyzyjny lub też są z definicji przedziałami. Tym samym dane przedziałowe dotyczące p cech przybierają postać niepustych p-wymiarowych domkniętych kostek w p-wymiarowej przestrzenie rzeczywistej. W artykule zaproponowano uogólnienie metody dyskryminacji Fishera na przypadek takich właśnie danych. Oprócz podania konstrukcji metody klasyfikacyjnej przedstawiono wyniki badań tą metodą na danych symulacyjnych oraz danych rzeczywistych.
DOIDOI:10.1016/j.ins.2016.08.068
URL http://www.sciencedirect.com/science/article/pii/S0020025516306545
Languageen angielski
Score (nominal)45
ScoreMinisterial score = 45.0, 28-11-2017, ArticleFromJournal
Ministerial score (2013-2016) = 45.0, 28-11-2017, ArticleFromJournal
Publication indicators WoS Impact Factor: 2016 = 4.832 (2) - 2016=4.732 (5)
Citation count*0
Cite
Share Share



* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back