보안 데이터 분류를 위한 대규모 언어모델의 활용: CVSS 벡터 사례

Vol. 35, No. 6, pp. 1555-1563, 12월. 2025
10.13089/JKIISC.2025.35.6.1555, Full Text:
Keywords: LLM, Security Data Classification, RAG, Few-Shot Learning, CVSS Vector
Abstract

대규모 언어모델(LLM)은 높은 문맥 이해 능력과 추론, 데이터 생성 능력을 바탕으로 보안 데이터 분석에 유용한 도구가 될 수 있으나, 블랙박스 특성과 환각 문제, 높은 연산 비용 등으로 인해 정확성과 신뢰성이 중요한 보안 과제에 이를 적용하는 것이 쉽지 않다. 본 연구는 중형 로컬 LLM에 검색 증강 생성(RAG) 기반 퓨샷 학습을 적용하여 CVE 설명으로부터 CVSS 3.1 벡터를 자동 분류하는 사례를 소개하여 보안 데이터 분류에 대규모 언어 모델을 활용하는 실제적 가이드를 제공한다. 실험을 통해 RAG 기반 퓨샷 학습만으로도 미세조정된 대형 LLM이나 BERT 모델과 유사한 성능을 비용 효율적으로 달성할 수 있음을 보였으며. 상세 분석을 바탕으로 보안 데이터 분류에 대규모 언어 모델을 활용하는 방향을 제시하였다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
서양진, "Leveraging Large Language Models for Security Data Classification: The Case of CVSS Vector," Journal of The Korea Institute of Information Security and Cryptology, vol. 35, no. 6, pp. 1555-1563, 2025. DOI: 10.13089/JKIISC.2025.35.6.1555.

[ACM Style]
서양진. 2025. Leveraging Large Language Models for Security Data Classification: The Case of CVSS Vector. Journal of The Korea Institute of Information Security and Cryptology, 35, 6, (2025), 1555-1563. DOI: 10.13089/JKIISC.2025.35.6.1555.