하이브리드 데이터셋을 이용한 악성코드 패밀리 분류

Vol. 33, No. 6, pp. 1067-1076, 12월. 2023
JKIISC.2023.33.6.1067, Full Text:
Keywords: Malware classification, Hybrid data, Feature selection
Abstract

최근 변종 악성코드가 증가하면서 사이버 해킹 침해사고 규모가 확대되고 있다. 그리고 지능형 사이버 해킹 공격에 대응하기 위해 악성코드 패밀리를 효과적으로 분류하기 위한 기계학습 기반 연구가 활발히 진행되고 있다. 그러나 기존의 분류 모델은 데이터셋이 난독화되거나, 희소한 경우에 성능이 저하되는 문제가 있었다. 본 논문에서는 ASM 파일과 BYTES 파일에서 추출한 특징을 결합한 하이브리드 데이터셋을 제안하고, FNN을 사용하여 분류 성능을 평가한다. 실험 결과에 따르면 제안하는 방법은 단일 데이터셋에 비해 약 4% 향상된 성능을 보였으며, 특히 희소한 패밀리에 대해서는 약 30%의 성능 향상을 보였다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
최서우, 이일구, 한명진, 이연지, "Classification of Malware Families Using Hybrid Datasets," Journal of The Korea Institute of Information Security and Cryptology, vol. 33, no. 6, pp. 1067-1076, 2023. DOI: JKIISC.2023.33.6.1067.

[ACM Style]
최서우, 이일구, 한명진, and 이연지. 2023. Classification of Malware Families Using Hybrid Datasets. Journal of The Korea Institute of Information Security and Cryptology, 33, 6, (2023), 1067-1076. DOI: JKIISC.2023.33.6.1067.