Learning to control a simulated vehicle by imitation

Łukasz Pawełczak

Abstract

This paper presents a study of developing a simulated vehicle control system created by machine learning algorithms. The control system bases its action on classifier which is using information about the current situation on the road and determines what action should be performed. Learning is realized with imitation - method consisting of learning to imitate the strategy of another driver. Several methods were used to represent the classifier: decision trees, assembly of trees and random forest. Models are created to obtain the best possible accuracy of the classifications, while reducing the efect of over-fitting. Experiments were conducted using an advanced simulation environment TORCS. The studies examined how different machine learning algorithms affects artificial drivers abilities. Learning driving style required use of training method called retraining. This method generates additional training examples, when driver makes an error and then rebuilds used model. Experimental results show that combination of methods retraining and random forest creates controller that performs well on many different tracks.
Diploma typeMaster of Science
Author Łukasz Pawełczak ISE
Łukasz Pawełczak,,
- The Institute of Electronic Systems
Title in PolishUczenie się sterowania symulowanym pojazdem przez imitację
Supervisor Paweł Cichosz ISE
Paweł Cichosz,,
- The Institute of Electronic Systems
Certifying unitFaculty of Electronics and Information Technology (FEIT)
Affiliation unitThe Institute of Electronic Systems (PE)
Languagepl polski
StatusFinished
Issue date (year)2013
Keywords in Polish-
Keywords in English-
Abstract in PolishPraca zawiera analizę wykorzystania metod maszynowego uczenia się do sterowania symulowanym pojazdem. System sterowania opiera swoje działanie o klasyfikator, który dysponując informacją o aktualnej sytuacji na drodze określa, jaką należy wykonać akcję kierującą. Uczenie się jazdy realizowane jest za pomocą imitacji, czyli metody polegającej na uczeniu się naśladowania strategii innego kierowcy. Do reprezentacji klasyfikatora wykorzystane zostały drzewa decyzyjne, zespoły drzew oraz lasy losowe. Modele tworzone są w taki sposób, aby otrzymać, jak najlepszą poprawność klasyfikacji przy jednoczesnym ograniczeniu efektu nadmiernego dopasowania. W celu przeprowadzenia eksperymentów w pracy wykorzystano zaawansowane środowisko symulacyjne TORCS. W badaniach sprawdzono, jak reprezentacja klasyfikatora wpływa na umiejętności jazdy tworzonego kierowcy. Nauczenie stylu jazdy wymagało zastosowania metody douczania, polegającej na generowaniu dodatkowych przykładów trenujących oraz ponownej budowie modelu. Udane odwzorowanie stylu jazdy nauczyciela na trasie trenującej, pozwoliło stworzyć kierowcę zdolnego do jazdy na wielu trasach testowych.

Get link to the record
msginfo.png

Back