자연어 처리 기반 멀티 소스 이벤트 로그의 보안 심각도 다중 클래스 분류

Vol. 32, No. 5, pp. 1009-1017, 10월. 2022
10.13089/JKIISC.2022.32.5.1009, Full Text:
Keywords: Security Event Log, Natural Language Processing, Multi-source, Multiclass Classification, cybersecurity
Abstract

로그 데이터는 정보 시스템의 주요 동작과 상태를 이해하고 판단하는 근거로 사용되어 왔으며, 여러 보안 분야 응용에서도 중요한 입력 데이터로 사용된다. 로그 데이터로부터 필요한 정보를 얻어 이를 근거로 의사 결정을 하고, 적절한 대응 방안을 취하는 것은 시스템을 보호하고 안정적으로 운영하는 데 있어 필수적인 요소이지만, 로그의 종류와 양이 폭발적으로 증가함에 따라 기존 도구들로는 효과적이고 효율적인 대응이 쉽지 않은 상황이다. 이에 본 연구에서는 자연어 처리 기반의 머신 러닝을 이용해 멀티 소스 이벤트 로그의 보안 심각도를 여러 단계로 분류하는 방법을 제안하였으며, 472,972건의 훈련 및 테스트 샘플을 이용하여 실험을 수행한 결과 99.59%의 정확도를 달성하였다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
서양진, "자연어 처리 기반 멀티 소스 이벤트 로그의 보안 심각도 다중 클래스 분류," Journal of The Korea Institute of Information Security and Cryptology, vol. 32, no. 5, pp. 1009-1017, 2022. DOI: 10.13089/JKIISC.2022.32.5.1009.

[ACM Style]
서양진. 2022. 자연어 처리 기반 멀티 소스 이벤트 로그의 보안 심각도 다중 클래스 분류. Journal of The Korea Institute of Information Security and Cryptology, 32, 5, (2022), 1009-1017. DOI: 10.13089/JKIISC.2022.32.5.1009.