Stacked Autoencoder 기반 악성코드 Feature 정제 기술 연구

Vol. 30, No. 4, pp. 593-603, 8월. 2020
10.13089/JKIISC.2020.30.4.593, Full Text:
Keywords:
Abstract

네트워크의 발전에 따라 악성코드 생성도구가 유포되는 등으로 인해 악성코드의 출현이 기하급수적으로 증가하였 으나 기존의 악성코드 탐지 방법을 통한 대응에는 한계가 존재한다. 이러한 상황에 따라 머신러닝 기반의 악성 코드 탐지 방법이 발전하는 추세이며, 본 논문에서는 머신러닝 기반의 악성 코드 탐지를 위해 PE 헤더에서 데이터의 feature를 추출한 후 이를 이용하여 autoencoder를 통해 악성코드를 더 잘 나타내는 feature 및 feature importance를 추출하는 방법에 대한 연구를 진행한다. 본 논문은 악성코드 분석에서 범용적으로 사용되는 PE 파 일에서 확인 가능한 DLL/API 등의 정보로 구성된 549개의 feature를 추출하였고 머신러닝의 악성코드 탐지 성능 향상을 위해 추출된 feature를 이용하여 autoencoder를 통해 데이터를 압축적으로 저장함으로써 데이터의 feature를 효과적으로 추출해 우수한 정확도 제공 및 처리 시간을 2배 단축에 성공적임을 증명하였다. 시험 결과는 악성코드 그룹 분류에도 유용함을 보였으며, 향후 SVM과 같은 분류기를 도입하여 더욱 정확한 악성코드 탐지를 위 한 연구를 이어갈 예정이다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
H. Kim and T. Lee, "Stacked Autoencoder Based Malware Feature Refinement Technology Research," Journal of The Korea Institute of Information Security and Cryptology, vol. 30, no. 4, pp. 593-603, 2020. DOI: 10.13089/JKIISC.2020.30.4.593.

[ACM Style]
Hong-bi Kim and Tae-jin Lee. 2020. Stacked Autoencoder Based Malware Feature Refinement Technology Research. Journal of The Korea Institute of Information Security and Cryptology, 30, 4, (2020), 593-603. DOI: 10.13089/JKIISC.2020.30.4.593.