Limit theorems for empirical Renyi entropy and divergence with applications to molecular diversity analysis

Pietrzak Maciej , Grzegorz Rempała , Michał Seweryn , Jacek Wesołowski

Abstract

Quantitative methods for studying biodiversity have been traditionally rooted in the classical theory of finite frequency tables analysis. Motivated by the molecular diversity studies, we propose here a frequency-based framework for biodiversity analysis in the asymptotic regime where the number of categories grows with sample size (an infinite contingency table). Our approach is rooted in information theory and based on the Gaussian limit results for the effective number of species (the Hill numbers) and the empirical Renyi entropy and divergence.
Author Pietrzak Maciej
Pietrzak Maciej,,
-
, Grzegorz Rempała
Grzegorz Rempała,,
-
, Michał Seweryn
Michał Seweryn,,
-
, Jacek Wesołowski ZRPSM
Jacek Wesołowski,,
- Department of Probability and Mathematical Statistics
Journal seriesTest, ISSN 1133-0686
Issue year2016
Vol25
No4
Pages654-673
Publication size in sheets0.95
Keywords in EnglishHill number, Central limit theorem, Next-generation sequencing, Triangular arrays, T-cell receptors
Abstract in PolishMatematyczne wyniki pracy dotyczą dowodów asymptotycznej normalności kilku statystyk mierzących “różnorodność” obserwowanej populacji. Reżim asymptotyczny polega na równoczesnym przechodzeniu do nieskończoności z liczebnością próbki oraz z liczbą różnorodnych klas. Wykorzystano asymptotyczną reprezentację badanych ciągów zmiennych losowych za pomocą tzw. U-statystyk. Wydzielono dwa istotnie różne przypadki tzw. zdegenerowanych i niezdegenerowanych projekcji.
DOIDOI:10.1007/s11749-016-0489-z
URL http://link.springer.com/article/10.1007/s11749-016-0489-z
Languageen angielski
Score (nominal)30
ScoreMinisterial score = 30.0, 28-11-2017, ArticleFromJournal
Ministerial score (2013-2016) = 30.0, 28-11-2017, ArticleFromJournal
Publication indicators WoS Impact Factor: 2016 = 1.269 (2) - 2016=1.37 (5)
Citation count*0
Cite
Share Share

Get link to the record
msginfo.png


* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back