선형 판별 분석 및 k-means 알고리즘을 이용한 적대적 공격 유형 분류 방안

최석환; 김형건; 최윤호

선형 판별 분석 및 k-means 알고리즘을 이용한 적대적 공격 유형 분류 방안

최석환

김형건

최윤호

Vol. 31, No. 6, pp. 1215-1225, 12월. 2021

10.13089/JKIISC.2021.31.6.1215, Full Text:

Keywords: Deep Learning, Adversarial example, Adversarial attack, clustering
Abstract

인공지능 기술은 우수한 성능을 기반으로 다양한 분야에 적용되고 있지만 입력 데이터에 인간이 감지할 수 없는 적대적 섭동을 추가하여 인공지능 모델의 오작동을 유도하는 적대적 예제에 취약하다. 현재까지 적대적 예제에 대응하기 위한 방법은 세 가지 범주로 분류할 수 있다. (1) 모델 재학습 방법; (2) 입력 변환 방법; (3) 적대적 예제 탐지 방법. 이러한 적대적 예제에 대응하기 위한 방법은 끊임없이 등장하고 있지만 각 적대적 공격 유형을 분류하는 연구는 미비한 실정이다. 따라서, 본 논문에서는 차원 축소와 군집화 알고리즘을 활용한 적대적 공격 유형 분류 방법을 제안한다. 구체적으로, 제안하는 방법은 적대적 예시로부터 적대적 섭동을 추출하고 선형 판별 분석(LDA)를 통해 적대적 섭동의 차원을 축소한 후에 k-means 알고리즘으로 적대적 공격 유형 분류를 수행한다. MNIST 데이터셋과 CIFAR-10 데이터셋을 대상으로 한 실험을 통해, 제안하는 기법은 5개의 적대적 공격(FGSM, BIM, PGD, DeepFool, C&W)을 효율적으로 분류할 수 있으며, 적대적 예제에 대한 정상 입력을 알 수 없는 제한적인 상황에서도 우수한 분류 성능을 나타내는 것을 확인하였다

Statistics

Show / Hide Statistics

Cite this article

[IEEE Style]

최석환, 김형건, 최윤호, "선형 판별 분석 및 k-means 알고리즘을 이용한 적대적 공격 유형 분류 방안," Journal of The Korea Institute of Information Security and Cryptology, vol. 31, no. 6, pp. 1215-1225, 2021. DOI: 10.13089/JKIISC.2021.31.6.1215.

[ACM Style]

최석환, 김형건, and 최윤호. 2021. 선형 판별 분석 및 k-means 알고리즘을 이용한 적대적 공격 유형 분류 방안. Journal of The Korea Institute of Information Security and Cryptology, 31, 6, (2021), 1215-1225. DOI: 10.13089/JKIISC.2021.31.6.1215.