CNN 기반 MS Office 악성 문서 탐지

Vol. 32, No. 2, pp. 439-446, 4월. 2022
10.13089/JKIISC.2022.32.2.439, Full Text:
Keywords: MS office, Malicious, Detection, CNN, Deep Learning
Abstract

웹사이트나 메일의 첨부 파일을 이용해 문서형 악성코드의 유포가 활발하게 이루어지고 있다. 문서형 악성코드는 실행 파일이 직접 실행되는 것이 아니므로 보안 프로그램의 우회가 비교적 쉽다. 따라서 문서형 악성코드는 사전에 탐지하고 예방해야 한다. 이를 탐지하기 위해 문서의 구조를 파악하고 악성으로 의심되는 키워드를 선정하였다. 문서 내의 스트림 데이터를 아스키코드값으로 변환하여 데이터셋을 만들었다. CNN 알고리즘을 이용하여 문서의 스트림 데이터 내에 존재하는 악성 키워드의 위치를 확인하고 인접 정보를 활용하여 이를 악성으로 분류했다. 파일 내의 스트림 단위로 악성코드를 탐지한 결과 0.97의 정확도를 보였고, 파일 단위로 악성코드를 탐지한 결과 0.92의 정확도를 보였다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
박현수 and 강아름, "CNN 기반 MS Office 악성 문서 탐지," Journal of The Korea Institute of Information Security and Cryptology, vol. 32, no. 2, pp. 439-446, 2022. DOI: 10.13089/JKIISC.2022.32.2.439.

[ACM Style]
박현수 and 강아름. 2022. CNN 기반 MS Office 악성 문서 탐지. Journal of The Korea Institute of Information Security and Cryptology, 32, 2, (2022), 439-446. DOI: 10.13089/JKIISC.2022.32.2.439.