Hybrid short term prediction to address limited timeliness of public transport data streams

Maciej Grzenda , Karolina Kwasiborska , Tomasz Zaremba

Abstract

In spite of the diversity of solutions developed in the Internet of Things (IoT) domain, some features are shared by numerous IoT deployments and the data they process. These include incompleteness and latency in data transmission from multiple distributed objects. Among others, the systems tracking the location of vehicles are affected by these problems. The primary objective of this work is to address the way the latency in location data acquisition, referred to also as timeliness, can be dealt with. We propose a hybrid method combining machine learning models such as multilayer perceptrons trained in batch mode and online learning methods to perform short-term prediction of vehicle delay data. In this way, stream instances that have not arrived yet from the sensors can be temporarily replaced with predicted values. The method we propose successfully integrates stream mining methods developed for stationary and non-stationary conditions i.e. also the methods developed for concept drifting data streams. For all examined reference data sets and hybridised stream methods, the method reduced prediction error and addressed the risk of using static prediction models not matching or no longer matching the evolving process for which the prediction is performed.

Author Maciej Grzenda (FMIS / DIPS)
Maciej Grzenda,,
- Department of Information Processing Systems
, Karolina Kwasiborska (FMIS)
Karolina Kwasiborska,,
- Faculty of Mathematics and Information Science
, Tomasz Zaremba (FMIS)
Tomasz Zaremba,,
- Faculty of Mathematics and Information Science
Journal seriesNeurocomputing, ISSN 0925-2312, e-ISSN 1872-8286
Issue year2020
Vol391
Pages305-317
Publication size in sheets0.6
Keywords in Polishstrumienie danych IoT, metody hybrydowe, metody analizy strumieni danych, wielowarstwowy perceptron, architektury przetwarzania strumieni danych
Keywords in EnglishIoT data streams, hybrid algorithms, stream mining, multilayer perceptron, stream processing architectures
ASJC Classification2805 Cognitive Neuroscience; 1702 Artificial Intelligence; 1706 Computer Science Applications
Abstract in PolishPomimo różnorodności rozwiązań opracowanych w obszarze Internetu rzeczy (IoT), niektóre problemy są wspólne dla wielu wdrożeń IoT i przetwarzanych przez nie danych. Należą do nich braki w danych i opóźnienia w transmisji danych z wielu rozproszonych obiektów. Problemy te dotyczą między innymi systemów monitoringu położenia pojazdów. Głównym celem niniejszej pracy jest określenie metod obsługi opóźnień w pozyskiwaniu danych lokalizacyjnych. Proponujemy metodę hybrydową łączącą modele uczenia maszynowego, takie jak wielowarstwowe perceptrony uczone w trybie wsadowym i metody uczenia online w celu krótkoterminowego przewidywania danych dotyczących opóźnienia pojazdów. W ten sposób dane strumienia, które jeszcze nie dotarły z obiektów, można tymczasowo zastąpić przewidywanymi wartościami. Proponowana w pracy metoda z powodzeniem integruje metody analizy strumieni danych opracowane dla warunków stacjonarnych i niestacjonarnych, tj. również metody opracowane dla strumieni danych o charakterystyce zmiennej w czasie (tzw. zagadnienie concept drift). W przypadku wszystkich zbadanych zestawów danych referencyjnych i metod strumieniowych, proponowana metoda hybrydowa zmniejszyła błąd predykcji i wyeliminowała ryzyko zastosowania statycznych modeli predykcji nieadekwatnych lub już nieadekwatnych do ewoluującego procesu, dla którego przeprowadzana jest predykcja.
DOIDOI:10.1016/j.neucom.2019.08.100
URL https://www.sciencedirect.com/science/article/pii/S0925231219316182?via%3Dihub
Languageen angielski
Score (nominal)140
Score sourcejournalList
ScoreMinisterial score = 140.0, 08-07-2020, ArticleFromJournal
Publication indicators Scopus Citations = 0; Scopus SNIP (Source Normalised Impact per Paper): 2017 = 1.516; WoS Impact Factor: 2018 = 4.072 (2) - 2018=3.824 (5)
Citation count*
Cite
Share Share

Get link to the record


* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back
Confirmation
Are you sure?