Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

메타 의사 라벨을 이용한 오토인코더 기반 이상 탐지 성능 향상 기법A Performance Improvement Method for Autoencoder-based Anomaly Detection Using Meta Pseudo Label

Other Titles
A Performance Improvement Method for Autoencoder-based Anomaly Detection Using Meta Pseudo Label
Authors
원다영김수희이기용
Issue Date
May-2023
Publisher
한국전자거래학회
Keywords
Anomaly Detection; Autoencoder; Meta Pseudo Label; Semi-Supervised Learning; 이상 탐지; 오토인코더; 메타 의사 라벨; 준지도 학습
Citation
한국전자거래학회지, v.28, no.2, pp 37 - 51
Pages
15
Journal Title
한국전자거래학회지
Volume
28
Number
2
Start Page
37
End Page
51
URI
https://scholarworks.sookmyung.ac.kr/handle/2020.sw.sookmyung/151861
DOI
10.7838/jsebs.2023.28.2.037
ISSN
2288-3908
2765-3846
Abstract
이상 탐지(anomaly detection)는 대다수 데이터의 패턴에서 크게 벗어나는 데이터를 탐지하는 것이다. 오토인코더는 이상 탐지에 사용되는 대표적인 모델로서, 정상 데이터의 특징을 먼저 학습한 후 이 특징에 크게 벗어나는 데이터를 이상 데이터로 판별한다. 오토인코더가 정상 데이터의 특징을 학습하기 위해서는 정상이라고 라벨링(labeling)된 다량의 데이터가 필요하다. 하지만 라벨링된 다량의 데이터를 확보하는 것은 일반적으로 쉽지 않은 일이다. 이를 위해 본 논문은 메타 의사 라벨(meta pseudo label) 기법을 이용하여, 라벨링되지 않은 데이터까지 오토인코더의 학습에 활용하는 기법을 제안한다. 제안 기법은 라벨링되지 않은 데이터에서 정상으로 예측되는 데이터를 선별하여 이를 추가로 오토인코더의 학습에 사용한다. 그로 인해 제안 기법은 라벨링된 데이터가 많지 않은 환경에서도 라벨링되지 않은 데이터를 활용하여 이상 탐지의 성능을 향상시킬 수 있다. 두 개의 실제 데이터셋을 사용한 실험 결과, 제안 기법은 기존 이상 탐지 기법에 비해 이상 데이터를 더욱 정확히 탐지함을 확인하였다.
Anomaly detection is to detect data that deviate significantly from the pattern of the majority of data. The autoencoder is a representative model used for anomaly detection. An autoencoder first learns the features of normal data, and then determines data that greatly deviate from the the learned features as anomalous data. In order to learn the features of normal data, an autoencoder needs a large amount of data labeled as normal. However, it is usually not easy to obtain a large amount of labeled data. To address this problem, this paper proposes a method that utilizes even unlabeled data to train an autoencoder, which is based on the meta pseudo labeling. The proposed method selects data that is predicted as normal from unlabeled data and additionally uses them to train an autoencoder. Consequently, the proposed method can improve the performance of anomaly detection by using unlabeled data even in an environment where there are not much labeled data. Through experiments using two real datasets, we confirmed that the proposed method detects anomalies more accurately than the existing anomaly detection techniques.
Files in This Item
Go to Link
Appears in
Collections
ETC > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Lee, Ki Yong photo

Lee, Ki Yong
공과대학 (소프트웨어학부(첨단))
Read more

Altmetrics

Total Views & Downloads

BROWSE