다크웹 CAPTCHA에 대한 CNN 기반 문자 인식 연구

Vol. 35, No. 6, pp. 1469-1480, 12월. 2025
10.13089/JKIISC.2025.35.6.1469, Full Text:
Keywords: Dark web, CAPTCHA, Convolutional Neural Network, Character recognition, Cyber Threat Intelligence(CTI)
Abstract

다크웹은 불법 거래와 사이버 범죄 활동이 빈번하게 이루어지는 공간으로 사이버 위협 인텔리전스 확보를 위한 데이터 수집 자동화 연구가 활발히 이루어지고 있다. 다크웹은 특수한 접속 구조와 다양한 보안 조치는 데이터 크롤링의 동작을 방해하고 있으며, 특히, CAPTCHA는 자동화가 목적인 시스템에 주요 제약 요소로 작용한다. 본 논문은 CAPTCHA 해결 절차의 자동화 가능성 검증을 위해 CNN 기반 CAPTCHA 문자 인식 연구를 수행한다. 실제 다크웹에서 수집한 CAPTCHA 이미지를 바탕으로 최소한의 전처리 과정을 거쳐 학습 및 테스트 데이터셋을 구축하였다. ResNet과 VGGNet 기반의 총 5가지 모델을 구현하였으며 모델 문자 인식 성능 평가를 통해 다크웹에서의 CAPTCHA 자동 해결 가능성을 실험적으로 입증하였다. 향후, CAPTCHA Solver 구현을 통해 수사관의 수동 개입 없이 효율적인 다크웹 실시간 모니터링을 가능하게 하며, 수준 높은 CTI 확보와 범죄 수사 역량 강화에 기여할 것이다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
장예진, 박영진, 한미란, 김다슬, 한지훈, 조금환, 전주혁, 류성욱, "CNN-Based Character Recognition for Dark Web CAPTCHA," Journal of The Korea Institute of Information Security and Cryptology, vol. 35, no. 6, pp. 1469-1480, 2025. DOI: 10.13089/JKIISC.2025.35.6.1469.

[ACM Style]
장예진, 박영진, 한미란, 김다슬, 한지훈, 조금환, 전주혁, and 류성욱. 2025. CNN-Based Character Recognition for Dark Web CAPTCHA. Journal of The Korea Institute of Information Security and Cryptology, 35, 6, (2025), 1469-1480. DOI: 10.13089/JKIISC.2025.35.6.1469.