Knowledge base: Warsaw University of Technology

Settings and your account

Back

The Apache Nutch platform and searching for documents in the students’ network of the Warsaw University of Technology with the use of stemming

Ewa Bartosiewicz

Abstract

This thesis consists of a wide analysis of the Internet searching process — starting třom collecting the resources and their storage, up to searching for specific information. In particular, this analysis treats about using stemming to build up the efüciency of the search. Jn the further part of the thesis, I present my work on developing the needed software, built upon the Apache Nutch platform, and the results of research done.
Diploma type
Engineer's / Bachelor of Science
Diploma type
Engineer's thesis
Author
Ewa Bartosiewicz (FEIT/ICS) Ewa Bartosiewicz,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Title in Polish
Platforma Apache Nutch i wyszukiwanie z lematyzacją w zbiorze dokumentów sieci studenckiej Politechniki Warszawskiej
Supervisor
Damian Gajda (FEIT/ICS) Damian Gajda,, The Institute of Computer Science (FEIT/ICS)Faculty of Electronics and Information Technology (FEIT)
Certifying unit
Faculty of Electronics and Information Technology (FEIT)
Affiliation unit
The Institute of Computer Science (FEIT/ICS)
Language
(pl) Polish
Status
Finished
Issue date (year)
2007
Keywords in Polish
wyszukiwanie, lematyzacja, Nutch
Keywords in English
searching, stemming, Nutch
Abstract in Polish
Poniższa praca zawiera szeroką analizę procesu wyszukiwania w zasobach zgromadzonych w Internecie — od procesów ich pobierania i przechowywania, po ich przeszukiwanie w celu znalezienia konkretnych informacji. Szczególny nacisk w tej analizie położony został na zastosowanie lematyzaej i do zwiększenia efektywności wyszukiwania. W dalszej części pracy, przedstawiony został opis, stworzonego przeze mnie oprogramowania, opartego na platformie Apache Nutch oraz wyniki przeprowadzonych badań.

Uniform Resource Identifier
https://repo.pw.edu.pl/info/bachelor/WUTd9764eb7c6ba44a8932f2789ad2a2228/
URN
urn:pw-repo:WUTd9764eb7c6ba44a8932f2789ad2a2228

Confirmation
Are you sure?
Report incorrect data on this page