의미적 유사성의 효과적 탐지를 위한 데이터 전처리 연구

강하리; 정두원; 이상진

의미적 유사성의 효과적 탐지를 위한 데이터 전처리 연구

강하리

정두원

이상진

Vol. 25, No. 3, pp. 595-602, 6월. 2015

10.13089/JKIISC.2015.25.3.595, Full Text:

Keywords: Approximate Matching, Semantic similarity, Digital Forensics
Abstract

디지털 포렌식 분야가 직면한 과제 중 하나는 대량의 데이터를 어떻게 효율적으로 처리할 것인가이다. 디지털 객체 간의 유사성을 빠르게 식별하기 위해 신뢰성 있는 다양한 근사 매칭 알고리즘이 계속하여 제시되어왔다. 하지만 알고리즘만으로 문자열의 의미적 유사성을 식별하면 많은 오탐을 보여 오히려 그 실효성을 끌어내리고 있다. 이와 같은 문제점을 해결하고자 근사 매칭 대상의 전처리 과정을 추가하여, 알고리즘 자체의 신뢰성은 유지하면서 유사도 탐지 정확성을 더 높일 수 있는 방법을 제시한다. 본 논문에서는 의미적 유사성을 식별하고자 eml과 hwp 세트를 가지고 sdhash로 실험하였으며, 실험 결과를 이용하여 그 효과성을 검증한다.

Statistics

Show / Hide Statistics

Cite this article

[IEEE Style]

H. Kang, D. Jeong, S. Lee, "A Study on Preprocessing Method for Effective Semantic-based Similarity Measures using Approximate Matching Algorithm," Journal of The Korea Institute of Information Security and Cryptology, vol. 25, no. 3, pp. 595-602, 2015. DOI: 10.13089/JKIISC.2015.25.3.595.

[ACM Style]

Hari Kang, Doowon Jeong, and Sangjin Lee. 2015. A Study on Preprocessing Method for Effective Semantic-based Similarity Measures using Approximate Matching Algorithm. Journal of The Korea Institute of Information Security and Cryptology, 25, 3, (2015), 595-602. DOI: 10.13089/JKIISC.2015.25.3.595.