Intelligent Advertisement Detection in Www Based on Url Addresses

Adrian Wiśniewski

Abstract

Development of World Wide Web has caused growth of the advertising industry. Advertise ments are present on almost every web page and often their intensity is overwhelming for the user, especially if he has a mobile device and pays for every single byte of downloaded data. This thesis contains description of a system, that detects and blocks ads in WWW based on their URL addresses, without needing to download them. Proposed solution uses methods of artificial intelligence and machine learning to improve and fully automatize creation of rules, that discriminate between ads and legitimate content. Current products use special kind of regular expressions. Their list must be constantly updated on a regular basis. This results in high cost of system maintenance, which can be eliminated with use of intelligent methods.
Diploma typeMaster of Science
Author Adrian Wiśniewski II
Adrian Wiśniewski,,
- The Institute of Computer Science
Title in PolishInteligentne wykrywanie reklam w sieci WWW
Supervisor Mieczysław Muraszkiewicz II
Mieczysław Muraszkiewicz,,
- The Institute of Computer Science
Certifying unitFaculty of Electronics and Information Technology (FEIT)
Affiliation unitThe Institute of Computer Science (IN)
Languagepl polski
StatusFinished
Issue date (year)2013
Internal identifierENII-PM.001772
Keywords in PolishWykrywanie reklam, Sztuczna inteligencja, Uczenie maszynowe, Eksploracja danych
Keywords in EnglishAd detection, Artificial intelligence, Machine learning, Data mining
Abstract in PolishRozwój sieci WWW pociągał za sobą rozwój branży reklamowej. Materiały promocyjne można zobaczyć na prawie każdej stronie internetowej, a ich natężenie bywa przytłaczające, szczególnie dla posiadaczy urządzeń mobilnych, którzy płacą za pobierane dane. Praca za wiera opis systemu wykrywającego i blokującego reklamy w sieci WWW na podstawie adre sów URL, bez konieczności ich pobierania. Proponowane rozwiązanie wykorzystuje metody sztucznej inteligencji i uczenia maszynowego, aby usprawnić i w pełni zautomatyzować pro ces tworzenia reguł rozróżniających reklamy od treści. Obecnie funkcjonujące programy używają w tym celu specjalnych wyrażeń regularnych, których lista musi być stale i na bieżą co uaktualniania przez administratorów. Powoduje to powstanie dużych kosztów utrzymania systemu, które można wyeliminować poprzez zastosowanie metod inteligentnych.

Get link to the record
msginfo.png

Back