Evaluating Feature Encodings for Unsupervised Machine Learning Classification in Automotive Ethernet Network

dc.contributor.authorAnand, Kumar Ashutosh
dc.contributor.authorMerz, Stefanie Angela
dc.contributor.authorHeigl, Michael
dc.contributor.authorFiala, Dalibor
dc.contributor.authorSchulz, Hannes
dc.contributor.authorKirmair, Wolfgang
dc.contributor.authorSchramm, Martin
dc.date.accessioned2026-04-23T18:05:55Z
dc.date.available2026-04-23T18:05:55Z
dc.date.issued2025
dc.date.updated2026-04-23T18:05:55Z
dc.description.abstractCategorical attributes such as MAC and IP addresses constitute an integral part of Ethernet network data, and play a crucial role in modern network infrastructure. Representing these intrinsic entities with high cardinality presents a considerable performance challenge pertaining to machine learning tasks. In order to better manage the representations of the categorical attributes found in network data, this work presents new methods for transforming them. Some of these encoding schemes are designed using domain knowledge to limit the number of dimensions introduced in data while performing transformations. This study uses two specific Autoencoder deep neural networks for the unsupervised classification task to help assess the classification performance for the proposed encoding schemes. These varied encodings used to transform Ethernet network data from a real vehicle serve as a novel contribution to the feature engineering for analyzing the network data using machine learning approaches. The evaluation results show that the proposed techniques have a key impact on the classification performance, and the encoding schemes IE and ISF performed reasonably well in all three attack scenarios for each model.en
dc.description.abstractKategorické atributy jako jsou MAC a IP adresy představují integrální část ethernetových síťových dat a hrají klíčovou roli v moderní síťové architektuře. Reprezentovat tyto intrinsické entity s vysokou kardinalitou představuje značnou výzvu pro výkonnost týkající se úkolů strojového učení. Abychom mohli lépe kontrolovat reprezentace kategorických atributů nalezených v síťových datech, jsou v tomto příspěvku ukázány nové metody jejich transformace. Některá z těchto kódovacích schémat jsou navržena tak, že se použijí doménové znalosti, aby se omezil počet dimenzí zavedených do dat během transformací. V této studii jsou použity dvě specifické samokódovací hluboké neuronové sítě pro klasifikační úkol (bez učitele), aby pomohly ohodnotit výkonnost klasifikace pro daná kódovací schémata. Tato různá kódování použitá ke transformaci ethernetových síťových dat z reálného vozu slouží jako nový příspěvek k inženýrství charakteristik pro analýzu síťových dat na bázi metod strojového učení. Dosažené výsledky dokládají, že navržené přístupy mají klíčový dopad na výkonnost klasifikace a že kódovací schémata IE a ISF obstála dostatečně dobře ve všech třech scénářích útoku pro každý model.cz
dc.format7
dc.identifier.document-number001699548500004
dc.identifier.doi10.1109/ISCMI67495.2025.11358553
dc.identifier.isbn979-8-3315-8691-1
dc.identifier.issn2640-0154
dc.identifier.obd43949390
dc.identifier.orcidAnand, Kumar Ashutosh 0000-0002-7440-1646
dc.identifier.orcidMerz, Stefanie Angela 0009-0004-3034-5322
dc.identifier.orcidFiala, Dalibor 0000-0002-2528-771X
dc.identifier.urihttp://hdl.handle.net/11025/67802
dc.language.isoen
dc.publisherInstitute of Electrical and Electronics Engineers, Inc.
dc.relation.ispartofseries12th International Conference on Soft Computing and Machine Intelligence, ISCMI 2025
dc.subjectfeature encodingen
dc.subjecthigh cardinalityen
dc.subjectanomaly detectionen
dc.subjectautomotive etherneten
dc.subjectcategorical attributesen
dc.subjectunsupervised machine learningen
dc.subjectkódování atributůcz
dc.subjectvysoká kardinalitacz
dc.subjectdetekce anomáliícz
dc.subjectautomotivní ethernetcz
dc.subjectkategorické atributycz
dc.subjectstrojové učení bez učitelecz
dc.titleEvaluating Feature Encodings for Unsupervised Machine Learning Classification in Automotive Ethernet Networken
dc.titleHodnocení kódování atributů pro klasifikaci strojovým učením bez učitele v ethernetové síti automobilového průmyslucz
dc.typeStať ve sborníku (D)
dc.typeSTAŤ VE SBORNÍKU
dc.type.statusPublished Version
local.files.count1*
local.files.size1590132*
local.has.filesyes*
local.identifier.eid2-s2.0-105033217700

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
Anand(2025).pdf
Size:
1.52 MB
Format:
Adobe Portable Document Format
License bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: