Flow-level spam modelling using separate data sources

Marcin Luckner , Robert Filasiak

Abstract

Detekcja spamu na podstawie cech niskiego poziomu jest nowym trendem w technikach antyspamowych. Takie podejście redukuje liczbę zbieranych danych, ale wciąż pozwala na osiągnięcie dobrych wyników w rozpoznawaniu spamu. Główne problemy związane z tym podejściem to selekcja cech opisujących spam i stworzenie reguł dyskryminacyjnych. W tej pracy przedstawiono podklasy spamu i wybrano cechy charakteryzujące spam. Detektor spamu opiera się na drzewie decyzyjnym uczonym na danych zebranych z różnych serwerów pocztowych co pozwoliło na budowę uniwersalnego modelu spamu. Model został wykorzystany do analizy danych zebranych na BRASie. Grupa klasyfikatorów pozwoliła na wykrycie głównych nadawców spamu w analizowanym zbiorze danych.
Author Marcin Luckner (FMIS / DACSCM)
Marcin Luckner,,
- Department of Applied Computer Science and Computation Methods
, Robert Filasiak
Robert Filasiak,,
-
Pages91-98
Publication size in sheets0.5
Book Ganzha Maria, Maciaszek Leszek A., Paprzycki Marcin (eds.): Proceedings of the Federated Conference on Computer Science and Information Systems - FedCSIS 2013, 2013, kraków, IEEE, ISBN 978-1-4673-4471-5, 1590 p.
FedCSIS_2013_raport_en.pdf / No licence information (file archived - login or check accessibility on faculty)
06643967.pdf / No licence information (file archived - login or check accessibility on faculty)
Languageen angielski
Score (nominal)15
ScoreMinisterial score = 10.0, 01-10-2019, BookChapterMatConfByIndicator
Ministerial score (2013-2016) = 15.0, 01-10-2019, BookChapterMatConfByIndicator
Publication indicators WoS Citations = 0
Citation count*
Cite
Share Share

Get link to the record


* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back
Confirmation
Are you sure?