WV-BTM: SNS 단문의 주제 분석을 위한 토픽 모델 정확도 개선 기법
WV-BTM: A Technique on Improving Accuracy of Topic Model for Short Texts in SNS
Citations

WEB OF SCIENCE

0
Citations

SCOPUS

0

초록

SNS의 사용자와 데이터량이 폭발적으로 증가함에 따라, SNS 빅 데이터를 기반으로 한 연구들이 활발히 진행되고 있다. 특히 소셜 마이닝 분야에서는 비 분류된 대용량 SNS 텍스트 데이터로부터 각 텍스트 별 유사성을 파악하고, 그로부터 트렌드를 추출하기 위해 대표적인 토픽 모델 기법인 LDA를 사용한다. 그러나 LDA는 단문 데이터에 대하여 비 빈발 단어 출현으로 인한 의미 희박성(semantic sparsity)으로 인해 양질의 주제 추론이 어렵다는 한계를 가진다. BTM 연구는 이와 같은 LDA의 한계점을 두 단어의 조합을 통해 개선하였으나, BTM 또한 조합된 단어 중 높은 빈도수의 단어에 더 큰 영향을 받아 각 주제와의 연관성을 고려한 가중치 계산이 불가능하다는 한계점을 지닌다. 본 논문은 단어 간의 의미적 연관성을 반영함으로써 기존 연구 BTM의 정확도를 개선하는 방안을 모색한다.

키워드

Social Network ServiceNatural Language ProcessingText MiningTopic ModelClustering소셜 네트워크 서비스자연어 처리텍스트 마이닝토픽 모델클러스터링
제목
WV-BTM: SNS 단문의 주제 분석을 위한 토픽 모델 정확도 개선 기법
제목 (타언어)
WV-BTM: A Technique on Improving Accuracy of Topic Model for Short Texts in SNS
저자
송애린박영호
DOI
10.9728/dcs.2018.19.1.51
발행일
2018-01
저널명
디지털컨텐츠학회논문지
19
1
페이지
51 ~ 58