토픽 모델을 이용한 비지도 요약 기법의 연구
A Study of Unsupervised Summarization Using Topic Model
Citations

WEB OF SCIENCE

0
Citations

SCOPUS

0

초록

자동 문서 요약(Automatic Document Summarization)은 문서의 중요한 내용은 유지하면서 길이가 짧은 요약문을 만들어 내는 것을 목표로 하는 연구 분야이다. 그동안 자동 문서 요약은 대용량의 데이터셋을 이용한지도 학습 기반의 심층 신경망 모델을 사용해왔다. 하지만 늘어나는 산업의 수요와는 달리 자동 요약을 위한요약 데이터셋이 여전히 부족한 실정이다. 이런 데이터 부족 문제는 요약 분야뿐만 아니라 자연어 처리 전반에 걸쳐 새로운 문제점으로 대두되고 있다. 이를 해결하기 위해 Zero-Shot Learning이나 자가 지도 학습 등의 기법이 등장했다. 이들의 공통점은 기존의 데이터에 대한 좋은 표현을 만들어 모델이 기존에 보지 못한 데이터에 대해서도 잘 다룰 수 있도록 하는것을 목표로 한다. 이에 본 논문에서는 토픽 모델을 이용한 비지도 추출 요약 모델 TES(Topic model based Extractive Summarization)에 대해 제안하고, 이에 대한 실험을 통해 기존의 비지도 추출 요약 모델들과 비슷한 성능을 기록하는 것을 확인하고, TES가 기존의 모델 대비 가지는 장점을 제시했다.

키워드

document summarizationextractive summarizationtopic modelingNLPDeep Learning자동 문서 요약추출 요약토픽 모델링자연어 처리딥러닝
제목
토픽 모델을 이용한 비지도 요약 기법의 연구
제목 (타언어)
A Study of Unsupervised Summarization Using Topic Model
저자
배현진김철연
DOI
10.29056/jsav.2023.3.10
발행일
2023-03
저널명
한국소프트웨어감정평가학회 논문지
19
1
페이지
77 ~ 88