XAI기반 악성코드 그룹분류 결과 해석 연구

김도연; 이태진; 정아연

XAI기반 악성코드 그룹분류 결과 해석 연구

김도연

이태진

정아연

Vol. 31, No. 4, pp. 559-571, 8월. 2021

10.13089/JKIISC.2021.31.4.559, Full Text:

Keywords: Malware, XGBoost, Random Forest, XAI, SHAP
Abstract

컴퓨터의 보급 증가와 더불어 일반 사용자들에 대한 공격자들의 악성코드 배포 횟수 또한 증가하였다. 악성코드를 탐지하기 위한 연구는 현재까지도 진행되고 있으며 최근에는 AI를 이용한 악성코드 탐지 및 분석 연구가 중점적으로 이뤄지고 있다. 하지만 AI 알고리즘은 어떠한 이유로 악성코드를 탐지하고 분류하는지 설명할 수 없다는 단점이 존재한다. 이런 AI의 한계를 극복하고 실용성을 갖도록 하기 위해 XAI 기법이 등장하였다. XAI를 사용하면 AI의 최종 결과에 대해 판단 근거를 제시할 수 있다. 본 논문에서는 XGBoost와 Random Forest를 이용하여 악성코드 그룹분류를 진행하였으며, SHAP을 통해 결과를 해석하였다. 두 분류모델 모두 약 99%의 높은 분류 정확도를 보였으며, XAI를 통해 도출된 상위 API feature와 악성코드 주요 API를 비교해보았을 때 일정 수준 이상의 해석 및 이해가 가능하였다. 향후, 이를 바탕으로 직접적인 AI 신뢰성 향상 연구를 진행할 예정이다.

Statistics

Show / Hide Statistics

Cite this article

[IEEE Style]

김도연, 이태진, 정아연, "XAI기반 악성코드 그룹분류 결과 해석 연구," Journal of The Korea Institute of Information Security and Cryptology, vol. 31, no. 4, pp. 559-571, 2021. DOI: 10.13089/JKIISC.2021.31.4.559.

[ACM Style]

김도연, 이태진, and 정아연. 2021. XAI기반 악성코드 그룹분류 결과 해석 연구. Journal of The Korea Institute of Information Security and Cryptology, 31, 4, (2021), 559-571. DOI: 10.13089/JKIISC.2021.31.4.559.