시계열 분류 모델의 성능 향상을 위한 시계열 데이터 증강 및 대조 학습 기반 사전 훈련 기법Time Series Data Augmentation and Contrastive Learning-based Pre-training Techniques to Improve the Performance of Time Series Classification Models
- Other Titles
- Time Series Data Augmentation and Contrastive Learning-based Pre-training Techniques to Improve the Performance of Time Series Classification Models
- Authors
- 김수희; 이기용
- Issue Date
- Nov-2022
- Publisher
- 한국정보과학회
- Keywords
- time series; classification; data augmentation; contrastive learning; 시계열 데이터; 분류; 데이터 증강; 대조 학습
- Citation
- 정보과학회 컴퓨팅의 실제 논문지, v.28, no.11, pp 550 - 556
- Pages
- 7
- Journal Title
- 정보과학회 컴퓨팅의 실제 논문지
- Volume
- 28
- Number
- 11
- Start Page
- 550
- End Page
- 556
- URI
- https://scholarworks.sookmyung.ac.kr/handle/2020.sw.sookmyung/152304
- DOI
- 10.5626/KTCP.2022.28.11.550
- ISSN
- 2383-6318
2383-6326
- Abstract
- 최근 딥러닝을 이용한 시계열 데이터 분류가 활발히 연구되면서 대량의 데이터 확보가 더욱 중요해지고 있다. 하지만 레이블(label)이 존재하는 시계열 데이터를 대량으로 확보하는 것은 많은 경우 쉽지 않은 일이다. 따라서 본 논문은 시계열 분류 모델의 성능을 향상시키기 위한 시계열 데이터의 효과적인 데이터 증강 기법과 그를 이용한 대조 학습 기반 사전 훈련 기법을 제안한다. 제안하는 시계열 데이터 증강 기법은 원 시계열 데이터의 측정 간격 및 특성을 유지하면서 길이가 다른 새로운 데이터를 생성한다. 또한 제안하는 시계열 분류 모델 사전 훈련 기법은 제안 증강 기법으로 생성된 시계열 데이터를 활용하여 시계열 분류 모델이 유사한 시계열 데이터와 유사하지 않은 시계열 데이터를 구분할 수 있도록 학습시킴으로써 시계열 분류 모델의 성능을 향상시킨다. 제안하는 시계열 데이터 증강 기법 및 사전 훈련 기법을 사용자 행동 분류 모델에 적용한 결과 모델의 정확도를 최대 18%p 향상시킴을 확인하였다.
Recently, as time series classification using deep learning has been actively studied, securing large amounts of data is becoming more important. However, securing a large amount of time series data in which labels exist is often difficult. Therefore, in this paper, we proposed an effective data augmentation and contrastive learning-based pre-training technique to improve the performance of time series classification models. The proposed time series data augmentation technique can create new data of different lengths while maintaining the measurement interval and characteristics of the original time series data. In addition, the proposed pre-training technique for time series classification models can improve the performance of the time series classification model. Using the time series data generated by the proposed augmentation technique, it can pre-train the time series classification model to distinguish similar and dissimilar time series data. As a result of applying the proposed time series data augmentation and the pre-training technique to user activity recognition model, the accuracy of the model was improved by up to 18%p.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - ETC > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.