토픽 모델을 이용한 비지도 요약 기법의 연구open accessA Study of Unsupervised Summarization Using Topic Model
- Other Titles
- A Study of Unsupervised Summarization Using Topic Model
- Authors
- 배현진; 김철연
- Issue Date
- Mar-2023
- Publisher
- 한국소프트웨어감정평가학회
- Keywords
- document summarization; extractive summarization; topic modeling; NLP; Deep Learning; 자동 문서 요약; 추출 요약; 토픽 모델링; 자연어 처리; 딥러닝
- Citation
- 한국소프트웨어감정평가학회 논문지, v.19, no.1, pp 77 - 88
- Pages
- 12
- Journal Title
- 한국소프트웨어감정평가학회 논문지
- Volume
- 19
- Number
- 1
- Start Page
- 77
- End Page
- 88
- URI
- https://scholarworks.sookmyung.ac.kr/handle/2020.sw.sookmyung/152004
- DOI
- 10.29056/jsav.2023.3.10
- ISSN
- 2092-8114
2733-4384
- Abstract
- 자동 문서 요약(Automatic Document Summarization)은 문서의 중요한 내용은 유지하면서 길이가 짧은 요약문을 만들어 내는 것을 목표로 하는 연구 분야이다. 그동안 자동 문서 요약은 대용량의 데이터셋을 이용한지도 학습 기반의 심층 신경망 모델을 사용해왔다. 하지만 늘어나는 산업의 수요와는 달리 자동 요약을 위한요약 데이터셋이 여전히 부족한 실정이다. 이런 데이터 부족 문제는 요약 분야뿐만 아니라 자연어 처리 전반에 걸쳐 새로운 문제점으로 대두되고 있다.
이를 해결하기 위해 Zero-Shot Learning이나 자가 지도 학습 등의 기법이 등장했다. 이들의 공통점은 기존의 데이터에 대한 좋은 표현을 만들어 모델이 기존에 보지 못한 데이터에 대해서도 잘 다룰 수 있도록 하는것을 목표로 한다. 이에 본 논문에서는 토픽 모델을 이용한 비지도 추출 요약 모델 TES(Topic model based Extractive Summarization)에 대해 제안하고, 이에 대한 실험을 통해 기존의 비지도 추출 요약 모델들과 비슷한 성능을 기록하는 것을 확인하고, TES가 기존의 모델 대비 가지는 장점을 제시했다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - ETC > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.