Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

유전 데이터의 안전한 공유를 위한 로컬 차분 프라이버시 기반 사용자 비식별화 기법

Full metadata record
DC Field Value Language
dc.description.abstract최근 들어, 유전자 분석 기술과 정보 기술의 발달로 유전 데이터의 생산량이 폭발적으로 증가하고 있으며, 의료 분야 등에서 유전 데이터의 사용이 늘어남에 따라 공유 수요 또한 꾸준히 증가하고 있다. 유전 데이터는 개인의 고유한 특성을 나타내고 있기 때문에 안전하게 관리되어야 하며, 공유할 때에도 인증된 사용자에게 안전한 방법으로 전송되어야 한다. 하지만, 유전 데이터를 공유하고 난 후에는 공유된 데이터를 관리하는 것이 거의 불가능하기 때문에 유전 데이터의 노출 위험이 커지게 된다. 또한, 유전 데이터의 크기는 200~300G정도로 매우 큰데, 현재 존재하는 암호화 기술을 유전 데이터에 적용하게 되면 많은 시간이 소요될 것이다. 이와 같은 문제점들을 해결하기 위하여, 본 논문에서는 염기 서열 중 참조 염기서열과 다른, 개인을 식별할 수 있는 부분에 로컬 차분 프라이버시를 이용하여 노이즈를 추가하는 기법을 제안한다. 기존의 암호화 방식이 아닌, 비가역적인 노이즈 추가 방식을 사용했기 때문에, 공유 받은 사용자는 원본 데이터를 알아내기 거의 힘들어질 것이다. 또한, 전체 유전 데이터가 아닌, 개인을 식별할 수 있는 극히 일부분에만 노이즈를 추가하였기 때문에 보안 기술을 적용하는데 수행시간이 획기적으로 줄어들 것이다. 즉, 유전 데이터를 관리하고 공유하면서 발생하는 효율성 문제와 공유 이후의 프라이버시 문제를 동시에 해결할 수 있을 것이다. 본 논문의 후반부에서는 수학적 증명과 실험을 통하여 보안성과 효율성을 검증한다.-
dc.description.abstractRecently, the production of genetic data has been explosively increased due to the development of genetic analysis technology and information technology, and as th use of genetic data increases in the medical field, the demand for sharing is also steadily increasing. because genetic data represents an individual’s unique characteristics, it must be managed safely and, even when shared, must be transmitted in a secure way to authorized users. however, once the genetic data is shared, the risk of exposure to genetic data increases because it is almost impossible to manage the shared data. in addition, the size of genetic data is very large, ahout 200~300G. it will take a lot of time if the existing encryption technology is applied to the genetic data. In order to solve these problems, in this paper, we propose a technique of adding noise using Local Differential Privacy(LDP) to identifiable part of a base sequence that is different from a reference genome sequence. since an irreversible noise addition method is used instead of the existing encryption method, it will be difficult for users shared genetic data with added noise to find out the original data. In addition, since noise is added to only a small portion that can identify an individual, not the entire genetic data, the execution time for applying the security technology will be drastically reduced. In other words, it will be possible to solve the problem of efficiency in managing and sharing genetic data and the problem of privacy after sharing. In the latter part of this paper, security and efficiency are verified through mathematical proofs and experiments.-
dc.title유전 데이터의 안전한 공유를 위한 로컬 차분 프라이버시 기반 사용자 비식별화 기법-
dc.title.alternativeUser De-identification Scheme for Secure Genome Data Sharing based on Local Differential Privacy-
dc.identifier.bibliographicCitation전자공학회논문지, v.59, no.11, pp 59 - 66-
dc.subject.keywordAuthorGenetic data-
dc.subject.keywordAuthorData privacy-
dc.subject.keywordAuthorPartial encryption-
Files in This Item
Appears in
ETC > 1. Journal Articles


Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Park, Younghoon photo

Park, Younghoon
공과대학 (소프트웨어학부(첨단))
Read more


Total Views & Downloads