Baza wiedzy: Politechnika Warszawska

Ustawienia i Twoje konto

Powrót

State abstraction in reinforcement learning

Bartosz Papis

Abstract

This work concerns state abstraction - one of commonly proposed solutions to the curse of dimensionality problem. A particular type of state abstraction - state space abstraction is analyzed as a variable selection issue. As an effect of this analysis, an incremental state abstraction algorithm is introduced, inspired by the notions of stimulus discrimination, ambiguity and closure from behavioral psychology. This algorithm correctly solves the variable selection problem by including or removing variables one by one. It is the first among existing solutions to work not only for discrete problems, but also continuous ones.
Identyfikator pozycji
WUT113e3e486cfe4a4f9971e1d0d5e4db00
Rodzaj dyplomu
Praca doktorska
Autor
Bartosz Papis Bartosz Papis Instytut Automatyki i Informatyki Stosowanej (WEiTI/IAiIS)Wydział Elektroniki i Technik Informacyjnych (WEiTI)
Tytuł w języku polskim
Abstrakcja stanu w uczeniu ze wzmacnianiem
Tytuł w języku angielskim
State abstraction in reinforcement learning
Język
(en) angielski
Jednostka dyplomująca
Wydział Elektroniki i Technik Informacyjnych (WEiTI)
Dyscyplina nauki
automatyka i robotyka / dziedzina nauk technicznych / obszar nauk technicznych
Status pracy
Obroniona
Data obrony
17-11-2015
Data nadania stopnia
24-11-2015
Promotor
Recenzenci wewnętrzni
Recenzenci zewnętrzni
Jacek Koronacki Jacek Koronacki Afiliacja nieokreślona
Wyróżnienie
tak
Paginacja
149
Słowa kluczowe w języku angielskim
state abstraction, Reinforcement Learning
Streszczenie w języku angielskim
This work concerns state abstraction - one of commonly proposed solutions to the curse of dimensionality problem. A particular type of state abstraction - state space abstraction is analyzed as a variable selection issue. As an effect of this analysis, an incremental state abstraction algorithm is introduced, inspired by the notions of stimulus discrimination, ambiguity and closure from behavioral psychology. This algorithm correctly solves the variable selection problem by including or removing variables one by one. It is the first among existing solutions to work not only for discrete problems, but also continuous ones.
Plik pracy
  • Plik: 1
    bpapis thesis.pdf
Poproś o plik WCAG

Jednolity identyfikator zasobu
https://repo.pw.edu.pl/info/phd/WUT113e3e486cfe4a4f9971e1d0d5e4db00/
URN
urn:pw-repo:WUT113e3e486cfe4a4f9971e1d0d5e4db00

Potwierdzenie
Czy jesteś pewien?
Zgłoszenie uwag dotyczących tej strony