Asymptotic Distributions of Empirical Interaction Information
Authors:
- Mariusz Kubkowski,
- Jan Mielniczuk
Abstract
Interaction Information is one of the most promising interaction strength measures with many desirable properties. However, its use for interaction detection was hindered by the fact that apart from the simple case of overall independence, asymptotic distribution of its estimate has not been known. In the paper we provide asymptotic distributions of its empirical versions which are needed for formal testing of interactions. We prove that for three-dimensional nominal vector normalized empirical interaction information converges to the normal law unless the distribution coincides with its Kirkwood approximation. In the opposite case the convergence is to the distribution of weighted centered chi square random variables. This case is of special importance as it roughly corresponds to interaction information being zero and the asymptotic distribution can be used for construction of formal tests for interaction detection. The result generalizes result in Han (1980) for the case when all coordinate random variables are independent. The derivation relies on studying structure of covariance matrix of asymptotic distribution and its eigenvalues. For the case of 3x3x2 contingency table corresponding to study of two interacting Single Nucleotide Polymorphisms (SNPs) for prediction of binary outcome, we provide complete description of the asymptotic law and construct approximate critical regions for testing of interactions when two SNPs are possibly dependent. We show in numerical experiments that the test based on the derived asymptotic distribution is easy to implement and yields actual significance levels consistently closer to the nominal ones than the test based on chi square reference distribution.
- Record ID
- WUT64f4cac204624afd909475e30f13a151
- Author
- Journal series
- Methodology and Computing in Applied Probability, ISSN 1387-5841, e-ISSN 1573-7713
- Issue year
- 2021
- Vol
- 23
- Pages
- 291-315
- Publication size in sheets
- 1.20
- Keywords in Polish
- informacja interakcyjna, asymptotyczny ważony rozkład chi kwadrat, metoda delta, detekcja interakcji
- Keywords in English
- interaction information, asymptotic weighted chi square distribution, delta method, interaction detection
- ASJC Classification
- ;
- Abstract in Polish
- Informacja Interakcyjna jest jedną z najbardziej obiecujących miar siły interakcji o wielu pożądanych własnościach. Jednakże, jej wykorzystanie do detekcji interakcji było utrudnione z powodu faktu, że poza przypadkiem całkowitej niezależności, asymptotyczny rozkład jej estymatora pozostawał nieznany. W artykule podajemy rozkład asymptotyczny empirycznej wersji tej miary, który jest potrzebny do formalnego testowania interakcji. Dowodzimy, że dla trójwymiarowego wektora o wartościach nominalnych znormalizowana empiryczna informacja interakcyjna zbiega do rozkładu normalnego, jeśli rozkład tego wektora nie jest równy jego aproksymacji Kirkwooda. W przeciwnym przypadku zbieżność jest do rozkładu sumy ważonych scentrowanych zmiennych o rozkładzie chi kwadrat. Ten przypadek ma szczególne znaczenie, jako że odpowiada informacji interakcyjnej równej 0 i rozkład asymptotyczny może być wykorzystany do konstrukcji formalnych testów do detekcji interakcji. Wynik ten jest uogólnieniem rezultatu w Han (1980), gdzie wszystkie zmienne były niezależne. Obliczenie polega na badaniu struktury macierzy kowariancji rozkładu asymptotycznego i jej wartości własnych. Dla przypadku tablicy kontyngencji 3x3x2 odpowadającej badaniu 2 SNPów (Single Nucleotide Polymorphisms) będących w interakcji dla predykcji odpowiedzi binarnej, dostarczamy kompletny opis rozkładu asymptotycznego i konstruujemy przybliżone obszary krytyczne dla testowania interakcji, gdy 2 SNPy mogą być zależne. Pokazujemy w eksperymentach numerycznych, że test oparty o wyliczony rozkład asymptotyczny jest łatwy w implementacji i daje poziomy istotności bliższe nominalnym niż test oparty o referencyjny rozkład chi kwadrat.
- DOI
- DOI:10.1007/s11009-020-09783-0 Opening in a new tab
- URL
- https://link.springer.com/article/10.1007/s11009-020-09783-0 Opening in a new tab
- Language
- eng (en) English
- License
- File
-
- File: 1
- Asymptotic Distributions of Empirical Interaction Information, File WUT64f4cac204624afd909475e30f13a151.pdf / 1 MB
- WUT64f4cac204624afd909475e30f13a151.pdf
- publication date: 25-03-2022
- Asymptotic Distributions of Empirical Interaction Information, File WUT64f4cac204624afd909475e30f13a151.pdf / 1 MB
-
- Score (nominal)
- 70
- Score source
- journalList
- Score
- = 70.0, 25-03-2022, ArticleFromJournal
- Publication indicators
- : 2016 = 1.157; : 2020 (2 years) = 1.147 - 2020 (5 years) =1.031
- Uniform Resource Identifier
- https://repo.pw.edu.pl/info/article/WUT64f4cac204624afd909475e30f13a151/
- URN
urn:pw-repo:WUT64f4cac204624afd909475e30f13a151
* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or PerishOpening in a new tab system.