RAG 기반 라이브러리 하네스 자동 생성 프레임워크

최지혁; 권태경; 원신영; 한상수

RAG 기반 라이브러리 하네스 자동 생성 프레임워크

Vol. 36, No. 1, pp. 139-145, 2월. 2026

10.13089/JKIISC.2026.36.1.139, Full Text:

Keywords: library fuzzing, Harness, LLM, retrieval-augmented generation (RAG), Vulnerability discovery
Abstract

라이브러리 퍼징은 단일 진입점이 없는 API 중심 구조로 인해, 퍼저 입력을 유효한 API 호출 시퀀스로 변환하는 하네스(harness) 생성이 핵심 병목으로 작용한다. 기존 LLM 기반 하네스 생성 기법은 라이브러리별 문서나 코드 맥락 없이 API를 조합하는 방식에 의존하여, 환각, API 오용, 잘못된 초기화로 인한 실행 불가능한 하네스를 다수 생성하는 한계를 가진다. 본 연구는 이러한 문제를 해결하기 위해 RAG을 활용한 하네스 자동 생성 프레임워크를 제안한다. 제안한 프레임워크는 API 문서, 헤더 파일, 예제 코드 등 라이브러리 자원을 검색하여 LLM 입력 컨텍스트로 제공함으로써, 라이브러리 고유의 초기화 규칙과 API 사용 제약을 반영한 근거 기반 하네스 생성을 가능하게 한다. 또한 컴파일 기반 검증과 반복 수정 루프를 통해, 실제 퍼저에 적용 가능한 실행 가능한 하네스만을 최종 산출물로 선별한다. 실험 결과, RAG 기반 컨텍스트 주입은 하네스의 컴파일 성공률과 실행 가능성을 유의미하게 향상시키며, 퍼징 과정에서 도달 가능한 함수 범위를 확대하는 데 기여함을 확인하였다. 본 연구는 RAG와 LLM을 결합한 새로운 하네스 생성 패러다임을 제시하며, 향후 LLM 기반 라이브러리 퍼징 자동화의 신뢰성과 효율성을 동시에 향상시키는 기반 기술로 활용될 수 있다.

Statistics

Show / Hide Statistics

Cite this article

[IEEE Style]

최지혁, 권태경, 원신영, 한상수, "RAG-Based Framework for Automatic Library Harness Generation," Journal of The Korea Institute of Information Security and Cryptology, vol. 36, no. 1, pp. 139-145, 2026. DOI: 10.13089/JKIISC.2026.36.1.139.

[ACM Style]

최지혁, 권태경, 원신영, and 한상수. 2026. RAG-Based Framework for Automatic Library Harness Generation. Journal of The Korea Institute of Information Security and Cryptology, 36, 1, (2026), 139-145. DOI: 10.13089/JKIISC.2026.36.1.139.