오디오 딥페이크 생성 억제 기술의 강건성 및 실용성 분석

Vol. 35, No. 6, pp. 1627-1640, 12월. 2025
10.13089/JKIISC.2025.35.6.1627, Full Text:
Keywords: Deepfake Suppresion, speech enhancement, Neural Codec, Removal Robustness
Abstract

딥페이크 음성이 ASV(Automatic Speaker Verification) 시스템을 통과하는 사례가 증가함에 따라 오디오 딥페이크 생성 억제 기술이 최근 주목받고 있다. 이러한 방식은 원본 음성에 노이즈를 주입해 모델이 화자의 음색을 학습하지 못하도록 하는 사전적 대응에 해당하지만, 노이즈로 인한 품질 저하와 정화 과정에서의 보호 효과 감소라는 한계를 지닌다. 따라서 본 연구에서는 생성 억제 기술의 품질과 보호 효과 간의 관계를 분석하고, 음성 향상(Speech Enhancement), 뉴럴 코덱(Neural Codec), 신호 변환 절차를 각각 적용하여 방어 효과를 재평가한다. 이러한 분석을 통해 지각 품질과 제거 내성을 함께 고려한 실용적 평가 지표의 필요성을 제기하며, 오디오 딥페이크 생성 억제 연구가 품질 보존성과 강건성을 동시에 달성하는 방향으로 나아가야 함을 제안한다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
박서영, 정수환, 이요원, "Robustness and Practicality Analysis of Audio Deepfake Suppression Techniques," Journal of The Korea Institute of Information Security and Cryptology, vol. 35, no. 6, pp. 1627-1640, 2025. DOI: 10.13089/JKIISC.2025.35.6.1627.

[ACM Style]
박서영, 정수환, and 이요원. 2025. Robustness and Practicality Analysis of Audio Deepfake Suppression Techniques. Journal of The Korea Institute of Information Security and Cryptology, 35, 6, (2025), 1627-1640. DOI: 10.13089/JKIISC.2025.35.6.1627.