Distance-based linear discriminant analysis for interval-valued data
Przemysław Grzegorzewski , Ana Ramos-Guajardo
Abstract
Interval-valued observations arise in many real-life situations as either the precise representation of the objective entity or the representation of incomplete knowledge. Thus given p features observed over a sample of objects belonging to one of two possible classes, each observation can be perceived as a non-empty closed and bounded hyperrectangle on R^p . The aim of the paper is to suggest a p-dimensional classification method for random inter- vals when two or more classes are considered, by the generalization of Fisher’s procedure for linear discriminant analysis. The idea consists of finding a directional vector which maximizes the ratio of the dispersion between the classes and within the classes of the observed hyperrectangles. A classification rule for new observations is also provided and some simulations are carried out to compare the behavior of the proposed classification procedure with respect to other methods known from the literature. Finally, the suggested methodology are applied on a real-life situation example.Author | |
Journal series | Information Sciences, ISSN 0020-0255, (A 45 pkt) |
Issue year | 2016 |
Vol | 372 |
Pages | 591-607 |
Publication size in sheets | 0.8 |
Keywords in English | Classification, Discriminant analysis, Interval data, LDA, Random intervals |
ASJC Classification | ; ; ; ; ; |
Abstract in Polish | Dane przedziałowe pojawiają się często w badaniach statystycznych tam, gdzie interesujące nas wielkości nie mogą być (z różnych przyczyn) mierzone w sposób precyzyjny lub też są z definicji przedziałami. Tym samym dane przedziałowe dotyczące p cech przybierają postać niepustych p-wymiarowych domkniętych kostek w p-wymiarowej przestrzenie rzeczywistej. W artykule zaproponowano uogólnienie metody dyskryminacji Fishera na przypadek takich właśnie danych. Oprócz podania konstrukcji metody klasyfikacyjnej przedstawiono wyniki badań tą metodą na danych symulacyjnych oraz danych rzeczywistych. |
DOI | DOI:10.1016/j.ins.2016.08.068 |
URL | http://www.sciencedirect.com/science/article/pii/S0020025516306545 |
Language | en angielski |
Score (nominal) | 45 |
Score | = 45.0, 05-09-2019, ArticleFromJournal = 45.0, 05-09-2019, ArticleFromJournal |
Publication indicators | = 3; = 6; : 2016 = 2.537; : 2016 = 4.832 (2) - 2016=4.732 (5) |
Citation count* |
* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back