기계학습을 이용한 소스코드 정적 분석 개선에 관한 연구

박양환; 최진영

기계학습을 이용한 소스코드 정적 분석 개선에 관한 연구

박양환

최진영

Vol. 30, No. 6, pp. 1131-1139, 12월. 2020

10.13089/JKIISC.2020.30.6.1131, Full Text:

Keywords: Static Analysis, Secure Coding, Deep Learning, Convolutional Neural Networks(CNN)
Abstract

소스코드에 대한 정적 분석은 광범위한 소스코드에 대해서 잔존하는 보안약점을 찾는 것으로 정적 분석 도구를활용하여 점검을 하고, 그 결과에 대해서 정적 분석 전문가가 정탐 및 오탐 분석을 한다. 이 과정에서 분석양이 많고 오탐의 비율이 높아 많은 시간과 노력이 들어가게 되어 효율적으로 분석하는 방안이 요구되고 있다. 또한 전문가들은 정·오탐 분석을 할 때 결함이 발생한 라인의 소스코드만 보고 분석을 하는 경우는 드물다. 결함의 유형에 따라서 주변의 소스코드를 같이 분석하고 최종 분석 결과를 내리게 된다. 이러한 정적 분석 도구를 사용하여 전문가가정·오탐을 판별하는 어려움을 해결하기 위해서 본 논문에서는 정적 분석 도구가 찾은 보안약점이 정탐인지 아닌지를전문가가 아닌 인공지능을 통해 판별하는 방법을 제안한다. 또한 이러한 기계학습에 사용되는 학습 데이터(결함주변소스코드)의 크기가 성능에 어떤 영향을 미치는지 실험을 통해 최적의 크기를 확인하였다. 이 결과를 통해 정적 분석 후 정·오탐을 분류하는 정적 분석 전문가의 업무에 도움을 줄 것으로 기대한다.

Statistics

Show / Hide Statistics

Cite this article

[IEEE Style]

박양환 and 최진영, "A Study on the Improvement of Source Code Static Analysis Using Machine Learning," Journal of The Korea Institute of Information Security and Cryptology, vol. 30, no. 6, pp. 1131-1139, 2020. DOI: 10.13089/JKIISC.2020.30.6.1131.

[ACM Style]

박양환 and 최진영. 2020. A Study on the Improvement of Source Code Static Analysis Using Machine Learning. Journal of The Korea Institute of Information Security and Cryptology, 30, 6, (2020), 1131-1139. DOI: 10.13089/JKIISC.2020.30.6.1131.