트랜스포머 기반 GAN을 이용한 개인정보 보호 합성 텍스트 생성 연구

Vol. 35, No. 6, pp. 1541-1554, 12월. 2025
10.13089/JKIISC.2025.35.6.1541, Full Text:
Keywords: synthetic text generation, privacy-preserving
Abstract

본 논문은 현대 데이터 주도 환경에서 인간 중심의 개인정보 보호 요구를 해결하기 위해 고품질 합성 데이터의 통제된 생성을 목표로 하며, 트랜스포머 기반 생성적 적대 신경망을 활용한 새로운 개인정보 보호 합성 텍스트 생성 프레임워크를 제안한다. 제안된 프레임워크에서 생성자는 사용자가 정의한 프라이버시 선호도를 반영하는 구조화된 프롬프트의 안내에 따라 유창하고 도메인 정렬된 텍스트를 생성한다. 다중 작업 판별자는 생성된 각 샘플을 사실성, 도메인 적합성, 민감 정보 포함 여부라는 세 가지 핵심 기준으로 평가한다. 또한 생성 성능을 한층 강화하기 위해, 본 연구는 판별자의 피드백에 기반하여 입력 프롬프트를 반복적으로 개선하는 비모수적 피드백 루프를 도입하였다. 광범위한 실험 결과, 제안된 방법론은 우수한 텍스트 품질과 강력한 개인정보 보호를 동시에 달성함을 입증하며, 이는 개인정보에 민감한 도메인에서 대규모 언어 모델의 미세 조정을 위해 즉시 활용 가능한 온디맨드 합성 데이터셋 생성을 가능하게 한다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
우타리예바 아쎔, 최윤호, 박혜경, "A Study on Privacy-Preserving Synthetic Text Generation via Transformer-Based GANs," Journal of The Korea Institute of Information Security and Cryptology, vol. 35, no. 6, pp. 1541-1554, 2025. DOI: 10.13089/JKIISC.2025.35.6.1541.

[ACM Style]
우타리예바 아쎔, 최윤호, and 박혜경. 2025. A Study on Privacy-Preserving Synthetic Text Generation via Transformer-Based GANs. Journal of The Korea Institute of Information Security and Cryptology, 35, 6, (2025), 1541-1554. DOI: 10.13089/JKIISC.2025.35.6.1541.