Unsupervised Feature Selection for Outlier Detection on Streaming Data to Enhance Network Security

Date issued

2021

Journal Title

Journal ISSN

Volume Title

Publisher

MDPI

Abstract

V několika posledních letech se metody strojového učení (zvláště ty zabývající se detekcí odlehlých hodnot) v oblasti kyberbezpečnosti opíraly o zjišťování anomálií síťového provozu spočívajících v nových schématech útoků. Avšak všudypřítomnost masivních průběžně generovaných datových toků představuje ohromnou výzvu pro účinná detekční schémata a vyžaduje rychlé paměťově nenáročné online algoritmy schopné se potýkat se změnami konceptu. Volba vlastností hraje důležitou roli při zlepšování detekce odlehlých hodnot identifikací zašuměných dat, která obsahují nerelevantní nebo nadbytečné vlastnosti. Současný výzkum se zaměřuje buď na výběr vlastností bez učitele pro průběžně přicházející data nebo na (offline) detekci odlehlých hodnot. V této práci jsou zformulovány podstatné požadavky na kombinaci obou přístupů a dále jsou porovnány s existujícími řešeními. Obsáhlá rešerše odhalila mezeru ve výběru vlastností bez učitele pro zlepšování již hotových metod detekce odlehlých hodnot v datových tocích. Takže navrhujeme nový algoritmus volby vlastností bez učitele pro detekci odlehlých hodnot v průběžně přicházejících datech označovaný jako UFSSOD, který je schopen takové hodnoty automaticky odhalovat. Navíc umí zjišťovat množství nejlepších vlastností shlukováním jejich vypočítaných hodnot. Následně odvozujeme generický koncept, který ukazuje dva aplikační scénáře UFSSOD ve spojení s již hotovými online algoritmy detekce odlehlých hodnot. Rozsáhlé experimenty ukázaly, že slibný mechanismus volby vlastností pro průběžně přicházející data není v oblasti detekce odlehlých hodnot k dispozici. Nadto UFSSOD coby algoritmus schopný online zpracování vykazuje srovnatelné výsledky jako současná nejlepší offline metoda upravená pro detekci odlehlých hodnot.

Description

Subject(s)

výběr vlastností, detekce odlehlých hodnot, detekce vniknutí, síťová bezpečnost, strojové učení, online učení, učení bez učitele, průběžně přicházející data

Citation

HEIGL, M. WEIGELT, E. FIALA, D. SCHRAMM, M. Unsupervised Feature Selection for Outlier Detection on Streaming Data to Enhance Network Security. Applied Sciences, 2021, roč. 11, č. 24, s. 1-30. ISSN: 2076-3417
OPEN License Selector