Knowledge base: Warsaw University of Technology

Settings and your account

Back

Finding Motifs in DNA Sequences

Michał Bluj

Abstract

In this thesis I deal with a problem of finding motifs in DNA sequences and implementation of few algorithms which are used for this purpose. At the beginning of this thesis I present basic information &om biology, which can provide deeply understanding of problem described in this work. Next I introduce theoretical basics , which are used by informatics to study DNA sequences. At the main part of this work I focus on used algorithms and implementation of them. I describe Gibbs Sampling algorithm as a one of the most common stochastic approaches to the problem. Next I get on to also very widely used Projection algorithm which is the example of probabilistic approaches. This part of this thesis ends with the description of new method based on suffix trees. This thesis results in creation of a tool for finding fřequent motifs occurrence in DNA sequences which is based on algorithms mentioned earlier. In the continuation of this thesis I would like to focus on study existing associations between already found motifs.
Diploma type
Engineer's / Bachelor of Science
Diploma type
Engineer's thesis
Author
Michał Bluj (FEIT/ICS) Michał Bluj,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Title in Polish
Wykrywanie motywów w sekwencjach DNA
Supervisor
Krzysztof Walczak (FEIT/ICS) Krzysztof Walczak,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Certifying unit
Faculty of Electronics and Information Technology (FEIT)
Affiliation unit
The Institute of Computer Science (FEIT/ICS)
Language
(pl) Polish
Status
Finished
Issue date (year)
2007
Keywords in Polish
motyw, DNA, sekwencja, drzewo sufiksowe
Keywords in English
motif, DNA, sequence, suffix tree
Abstract in Polish
W niniejszej pracy zajmuję się problemem wykrywania powtarzających się motywów w sekwencjach DNA oraz implemcntacją kilku istniejących już algorytmów wykorzystywanych do tego celu. Na wstępie przestawiam podstawowe informacje z zakresu biologii, umożliwiające głębsze zrozumienie opisywanego w pracy problemu. Następnie wprowadzam teoretyczne podstawy służące wykorzystaniu informatyki w badaniach nad sekwencjami DNA. W głównej części pracy skupiam się nad wykorzystanymi algorytmami oraz ich implementacją Opisuję algorytm Gibbs’a jako jedno z najczęściej wykorzystywanych podejść stochastycznych. Następnie przechodzę do równie często stosowanego algorytmu Projekcji, będącego przykładem podejścia probabilistycznego. Część ta kończy się opisem nowej metody polegającej na wykorzystaniu drzew sufiksowych. Wynikiem prac nad implementacją wyżej wymienionych algorytmów stało się narzędzie umożliwiające znalezienie powtarzających się motywów w sekwencjach DNA. W kontynuacji pracy chciałbym skupić się na badaniu istniejących asocjacji między wykrytymi już powtarzającymi się motywami.

Uniform Resource Identifier
https://repo.pw.edu.pl/info/bachelor/WUT8101bcfd37c843fcb333b7348c1f48d3/
URN
urn:pw-repo:WUT8101bcfd37c843fcb333b7348c1f48d3

Confirmation
Are you sure?
Report incorrect data on this page