페이로드 임베딩 사전학습 기반의 웹 공격 분류 모델

Vol. 30, No. 4, pp. 669-677, 8월. 2020
10.13089/JKIISC.2020.30.4.669, Full Text:
Keywords:
Abstract

인터넷 사용자가 폭발적으로 늘어나면서 웹을 이용한 공격이 증가했다. 뿐만 아니라 기존의 방어 기법들을 우회하 기 위해 공격 패턴이 다양해졌다. 전통적인 웹 방화벽은 알져지지 않은 패턴의 공격을 탐지하기 어렵다. 따라서 인 공지능으로 비정상을 탐지하는 방식이 대안으로 연구되고 있다. 특히 공격에 악용되는 스크립트나 쿼리가 텍스트로 이루어져 있다는 이유로 자연어 처리 기법을 적용하는 시도가 일어나고 있다. 하지만 스크립트나 쿼리는 미등록 단 어(Unknown word)가 다량 발생하기 때문에 자연어 처리와는 다른 방식의 접근이 필요하다. 본 논문에서는 BPE(Byte Pair Encoding)기법으로 웹 공격 페이로드에 자주 사용되는 토큰 집합을 추출하여 임베딩 벡터를 학 습시키고, 주의 메커니즘 기반의 Bi-GRU 신경망으로 토큰의 순서와 중요도를 학습하여 웹 공격을 분류하는 모델을 제안한다. 주요 웹 공격인 SQL 삽입 공격, 크로스 사이트 스크립팅, 명령 삽입 공격에 대하여 분류 평가 결과 약 0.9990의 정확도를 얻었으며, 기존 연구에서 제안한 모델의 성능을 상회하는 결과를 도출하였다

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
Y. Kim, Y. Ko, I. Euom, K. Kim, "Web Attack Classification Model Based on Payload Embedding Pre-Training," Journal of The Korea Institute of Information Security and Cryptology, vol. 30, no. 4, pp. 669-677, 2020. DOI: 10.13089/JKIISC.2020.30.4.669.

[ACM Style]
Yeonsu Kim, Younghun Ko, Ieckchae Euom, and Kyungbaek Kim. 2020. Web Attack Classification Model Based on Payload Embedding Pre-Training. Journal of The Korea Institute of Information Security and Cryptology, 30, 4, (2020), 669-677. DOI: 10.13089/JKIISC.2020.30.4.669.