오디오 데이터 내 개인 신상 정보 검출과 마스킹을 위한 인공지능 API의 활용 및 음성 분할 방법의 연구

김태영; 홍지원; 김도희; 김형종

오디오 데이터 내 개인 신상 정보 검출과 마스킹을 위한 인공지능 API의 활용 및 음성 분할 방법의 연구

Vol. 30, No. 5, pp. 895-907, 10월. 2020

10.13089/JKIISC.2020.30.5.895, Full Text:

Keywords: Audio Data Partition, Privacy Protection, speech recognition
Abstract

최근 기존 텍스트 기반 콘텐츠 외 멀티미디어 콘텐츠의 영향력이 급증함에 따라 콘텐츠 내 정보들을 처리할 수있도록 도와주는 서비스가 콘텐츠 이용에 큰 편리함을 주고 있다. 이러한 서비스의 대표적인 기능으로는 중요 정보에 대한 검색과 마스킹이 있다. 텍스트 데이터와 이미지 데이터의 검색 및 마스킹 기술을 제공해주는 솔루션들은 활발히 보급되고 있어 쉽게 접할 수 있다. 그러나 오디오 콘텐츠의 경우, 검색 및 마스킹의 필요성은 인식되지만 기술의 난이도로 인해 범용적으로 적용되는 솔루션을 찾는 것이 쉽지 않다. 본 논문은 음성 분할을 이용하여 오디오 데이터 내 정보 검색과 마스킹 기능을 제공하는 웹 애플리케이션을 제안한다. 추가적으로, 국내외 인공지능 기반 음성인식 API에 대한 분석을 통해 적절한 API의 선택을 진행하였으며, 정규식을 이용한 개인 신상 정보의 검출 방법을제시하였다. 마지막으로 구현결과의 정확도를 측정하여 성능을 검증하였다. 본 논문의 기여점은 오디오 데이터 내특정 패턴의 검출 및 마스킹 기능을 설계하고 실험을 통해 검증한 것에 있다.

Statistics

Show / Hide Statistics

Cite this article

[IEEE Style]

김태영, 홍지원, 김도희, 김형종, "A System of Audio Data Analysis and Masking Personal Information Using Audio Partitioning and Artificial Intelligence API," Journal of The Korea Institute of Information Security and Cryptology, vol. 30, no. 5, pp. 895-907, 2020. DOI: 10.13089/JKIISC.2020.30.5.895.

[ACM Style]

김태영, 홍지원, 김도희, and 김형종. 2020. A System of Audio Data Analysis and Masking Personal Information Using Audio Partitioning and Artificial Intelligence API. Journal of The Korea Institute of Information Security and Cryptology, 30, 5, (2020), 895-907. DOI: 10.13089/JKIISC.2020.30.5.895.