다언어 LLM의 개인정보 보호 응답 불균형과 지역 기반 제어 정책 모델 제안

Vol. 35, No. 4, pp. 827-837, 8월. 2025
10.13089/JKIISC.2025.35.4.827, Full Text:
Keywords: AI policy, AI safety, Privacy, Multilingual AI, Personal Data
Abstract

본 연구는 다언어 LLM(Large Language Model)이 동일한 정보를 담은 질문이라 하더라도 입력된 언어에 따라 이를 개인정보로 인식하거나 그렇지 않게 처리하는 문제를 중심으로 다룬다. 예를 들어, 특정인과 연계된 정보(예: 회사, 동아리 등)에 대해 한국어로 질문할 경우 개인정보 보호를 이유로 응답이 차단되지만, 다른언어(예: 영어, 아랍어 등)로 유사한 질문을 하면 정보가 그대로 노출되는 현상이 존재한다. 이는 LLM이 언어별로 데이터를 학습하고 응답 정책을 다르게 적용하기 때문에 발생하며, 결과적으로 개인정보 보호 수준의 불균형, 규제 회피 가능성, 사용자 신뢰 저하 등의 문제를 야기한다. 본 논문은 이러한 문제의 실태를 다양한 언어로 구성된 질문 실험을 통해 검증하고, 그 결과를 기술적·정책적 관점에서 분석하였다. 이를 바탕으로, LLM의 응답 제어기준이 ‘언어’가 아닌 ‘지역(법적 관할권)’을 기반으로 정렬되어야 함을 주장하며, 넷플릭스나 유튜브 등 글로벌 콘텐츠 서비스에서 사용되는 지역 기반 필터링 구조를 참고하여 LLM에도 적용 가능한 응답 제어 모델을 제안한다. 본 연구는 다언어 LLM의 개인정보 보호 체계에 대한 기술적·정책적 개선 방향을 제시하고, 글로벌 AI 서비스의 규제 정합성과 책임성을 확보하는 데 기여하고자 한다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
한종문 and 권헌영, "다언어 LLM의 개인정보 보호 응답 불균형과 지역 기반 제어 정책 모델 제안," Journal of The Korea Institute of Information Security and Cryptology, vol. 35, no. 4, pp. 827-837, 2025. DOI: 10.13089/JKIISC.2025.35.4.827.

[ACM Style]
한종문 and 권헌영. 2025. 다언어 LLM의 개인정보 보호 응답 불균형과 지역 기반 제어 정책 모델 제안. Journal of The Korea Institute of Information Security and Cryptology, 35, 4, (2025), 827-837. DOI: 10.13089/JKIISC.2025.35.4.827.