차분 프라이버시를 만족하는 안전한 GAN 기반 재현 데이터 생성 기술 연구

Vol. 30, No. 5, pp. 945-956, 10월. 2020
10.13089/JKIISC.2020.30.5.945, Full Text:
Keywords: Synthetic Data, CGAN, Differential privacy, Rényi Differential Privacy, data privacy
Abstract

많은 응용프로그램들로부터 양질의 서비스를 제공받기 위해서 데이터 공개는 필수적이다. 하지만 원본 데이터를그대로 공개할 경우 개인의 민감한 정보(정치적 성향, 질병 등)가 드러날 위험이 있기 때문에 원본 데이터가 아닌재현 데이터를 생성하여 공개함으로써 프라이버시를 보존하는 많은 연구들이 제안되어왔다. 그러나 단순히 재현 데이터를 생성하여 공개하는 것은 여러 공격들(연결공격, 추론공격 등)에 의해 여전히 프라이버시 유출 위험이 존재한다. 본 논문에서는 이러한 민감한 정보의 유출을 방지하기 위해, 재현 데이터 생성 모델로 주목받고 있는 GAN에최신 프라이버시 보호 기술인 차분 프라이버시를 적용하여 프라이버시가 보존되는 재현 데이터 생성 알고리즘을 제안한다. 생성 모델은 레이블이 있는 데이터의 효율적인 학습을 위해 CGAN을 사용하였고, 데이터의 유용성 측면을고려하여 기존 차분 프라이버시보다 프라이버시가 완화된 Rényi 차분 프라이버시를 적용하였다. 그리고 생성된 데이터의 유용성에 대한 검증을 다양한 분류기를 통해 실시하고 비교분석하였다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
강준영, 정수용, 홍도원, 서창호, "A Study on Synthetic Data Generation Based Safe Differentially Private GAN," Journal of The Korea Institute of Information Security and Cryptology, vol. 30, no. 5, pp. 945-956, 2020. DOI: 10.13089/JKIISC.2020.30.5.945.

[ACM Style]
강준영, 정수용, 홍도원, and 서창호. 2020. A Study on Synthetic Data Generation Based Safe Differentially Private GAN. Journal of The Korea Institute of Information Security and Cryptology, 30, 5, (2020), 945-956. DOI: 10.13089/JKIISC.2020.30.5.945.