Knowledge base: Warsaw University of Technology

Settings and your account

Back

Lead conversion and deal closure prediction using machine learning

Łukasz Stanisław Jakubowski

Abstract

The main focus of this thesis is conduction of analysis of sales data and implementation of machine learning models. Machine learning is currently one of the most rapidly developing fields of study. Its practical applications can be found in any industry. Thanks to many available tools, it allows for a quick implementation of solutions, which makes working with these models very convenient. The aim of this thesis is primarily to support the company’s activities related to cooperation with clients by increasing work efficiency. Currently in the company, decisions about the chances of getting a project from a given potential customer is undertaken subjectively by employees. It is a demanding task, and employees must rely heavily on their own experience. The work aims to support the decision-making process by providing objective data based on the company’s history. Thanks to the created models, a tool was obtained that can predict in a reliable way whether there is a chance for the profitability of a given cooperation with a client. The first part of the work contains a description of the basic issues related to the sales process and machine learning. The most important concepts are explained and their use is given therein. It comprises as well of a description of how the problem under study is currently solved without the use of predictive models. It depicts briefly good practices related to the use of machine learning models that were used in this work. The next part of the thesis is devoted to the analysis of the data received from the company. To perform the analysis, and create the models, Python programming language and its libraries were incorporated. It was also decided to use Jupyter notebook, a very popular machine learning environment, thanks to which working with data was significantly more convenient. Provided data is related to projects that were to this date performed in the company. The data was collected directly from the company’s system. The first step was to understand the information contained therein, and then to analyze it statistically. Then a choice was made of which information can be used to prepare a predictive model. Eventually, unuseful and insignificant data was removed and the remaining part was prepared for further analysis. The third part of the thesis contains a description of the process of creating machine learning models. Four classifier models have been utilised: gradient boosting, decision trees, SVM support vector machine and ridge regression. For each of them, values for their characteristic coefficients were selected to obtain the best prediction results. As a result, models are able to predict whether collaboration with a given client will be successful or not with over 70% efficiency. It is a satisfactory result, allowing the application of this tool in practice. The last part of thesis contains a summary of the results obtained and conclusions. It comprises as well of ways to further improve the models so that greater efficiency can be achieved. The work is an attempt of conduction of an analysis using modern solutions in real application. Performing it required from the author to have a good knowledge of programming and implementation skills regarding machine learning models. It is also worth noting that the results of this thesis will be used to implement a predictive system in a company in cooperation with which it was established.
Diploma type
Engineer's / Bachelor of Science
Diploma type
Engineer's thesis
Author
Łukasz Stanisław Jakubowski (FM) Łukasz Stanisław Jakubowski,, Faculty of Mechatronics (FM)
Title in Polish
Przewidywanie konwersji w sprzedaży z użyciem technik uczenia maszynowego
Supervisor
Maciej Przybylski (FM/IACR) Maciej Przybylski,, The Institute of Automatic Control and Robotics (FM/IACR)Faculty of Mechatronics (FM)
Certifying unit
Faculty of Mechatronics (FM)
Affiliation unit
The Institute of Automatic Control and Robotics (FM/IACR)
Study subject / specialization
, Automatyka i Robotyka (Automation and Robotics)
Language
(pl) Polish
Status
Finished
Defense Date
05-02-2019
Issue date (year)
2019
Reviewers
Maciej Przybylski (FM/IACR) Maciej Przybylski,, The Institute of Automatic Control and Robotics (FM/IACR)Faculty of Mechatronics (FM) Anna Sztyber (FM/IACR) Anna Sztyber,, The Institute of Automatic Control and Robotics (FM/IACR)Faculty of Mechatronics (FM)
Keywords in Polish
uczenie maszynowe, predykcja, konwersja, sprzedaż
Keywords in English
machine learning, prediction, conversion, sales
Abstract in Polish
Głównym tematem pracy jest wykonanie analizy danych dotyczących sprzedaży i implementacja modeli uczenia maszynowego. Uczenie maszynowe to obecnie jedna z najdynamiczniej rozwijających się dziedzin nauki. Jej praktyczne zastosowania można znaleźć w każdej branży i przemyśle. Dzięki wielu dostępnym narzędziom możliwa jest szybka implementacja rozwiązań, co pozwala na wygodną pracę. Celem pracy jest przede wszystkim wsparcie działań firmy związanych ze współpracą z klientami, aby zwiększyć efektywność pracy. Obecnie w firmie, decyzje o tym, jaka jest szansa na uzyskanie projektu z danym potencjalnym klientem, jest podejmowana subiektywnie przez pracowników. Jest to wymagające zadanie, a pracownicy muszą opierać się w dużej mierze na własnym doświadczeniu. Praca ma na celu wsparcie procesu decyzyjnego poprzez dostarczenie obiektywnych danych opartych na historii firmy. Dzięki stworzonym modelom otrzymano narzędzie, które w wiarygodny sposób potrafi przewidzieć, jaka jest szansa na rentowność danej współpracy z klientem. Pierwsza część pracy zawiera opis podstawowych zagadnień związanych z procesem sprzedażowym oraz uczeniem maszynowym. Wyjaśniono w niej najważniejsze pojęcia oraz podano ich zastosowanie. Znalazł się w niej również opis, jak badany problem rozwiązywany jest obecnie bez użycia modeli predykcyjnych. Zawarto w niej pokrótce dobre praktyki związane z wykorzystaniem modeli uczenia maszynowego, które zostały wykorzystane w niniejszej pracy. Następna część pracy, poświęcona jest analizie otrzymanych danych firmy. Do wykonania analizy, jak i modeli wykorzystano język programowania Python oraz jego biblioteki. Zdecydowano również wykorzystać bardzo popularne w branży uczenia maszynowego środowisko Jupyter notebook dzięki któremu praca z danymi była znacząco wygodniejsza. Dostarczone dane dotyczyły projektów, jakie były do tej pory wykonywane w firmie. Dane pobrane były bezpośrednio z systemu firmy. Pierwszym krokiem było zrozumienie informacji w nich zawartych, a następnie przeanalizowano je statystycznie. Potem wybrano, które z informacji mogą zostać użyte do przygotowania modelu predykcyjnego. Ostatecznie, usunięto niepełne i nieznaczące dane oraz przygotowano pozostałe pod dalszą analizę. Trzecia część pracy zawiera opis procesu tworzenia modeli uczenia maszynowego. Zastosowano cztery modele klasyfikatorów: gradient boosting,drzewa decyzyjne,maszynę wektorów nośnych SVM oraz regresję grzbietową. Dla każdego z nich dobierano wartości dla ich charakterystycznych współczynników, aby uzyskać jak najlepsze wyniki predykcji. W wyniku otrzymano modele, które są w stanie przewidzieć fakt, czy rozmowy z danym klientem zakończą się sukcesem z ponad 70% skutecznością. Jest to zadowalający wynik, pozwalający na zastosowanie tego narzędzia w praktyce. Ostatnia część pracy zawiera podsumowanie osiągniętych wyników oraz wnioski. Podane zostały również sposoby dalszej poprawy modeli, aby możliwe było osiągnięcie większej skuteczności. Praca jest próbą przeprowadzenia analizy przy użyciu nowoczesnych rozwiązań w realnym zastosowaniu. Wykonanie jej wymagało od Autora dobrej znajomości programowania i umiejętności implementacji modeli uczenia maszynowego. Warto również zaznaczyć, iż wyniki niniejszej pracy zostaną wykorzystane do wdrożenia systemu predykcyjnego w firmie we współpracy, z którą powstała.
File
  • File: 1
    276727_inz.pdf
Request a WCAG compliant version
Local fields
Identyfikator pracy APD: 31630

Uniform Resource Identifier
https://repo.pw.edu.pl/info/bachelor/WUT6943f25c151f4295bfa0d689052f9743/
URN
urn:pw-repo:WUT6943f25c151f4295bfa0d689052f9743

Confirmation
Are you sure?
Report incorrect data on this page