WV-BTM: SNS 단문의 주제 분석을 위한 토픽 모델 정확도 개선 기법WV-BTM: A Technique on Improving Accuracy of Topic Model for Short Texts in SNS
- Other Titles
- WV-BTM: A Technique on Improving Accuracy of Topic Model for Short Texts in SNS
- Authors
- 송애린; 박영호
- Issue Date
- Jan-2018
- Publisher
- 한국디지털콘텐츠학회
- Keywords
- Social Network Service; Natural Language Processing; Text Mining; Topic Model; Clustering; 소셜 네트워크 서비스; 자연어 처리; 텍스트 마이닝; 토픽 모델; 클러스터링
- Citation
- 디지털콘텐츠학회논문지, v.19, no.1, pp 51 - 58
- Pages
- 8
- Journal Title
- 디지털콘텐츠학회논문지
- Volume
- 19
- Number
- 1
- Start Page
- 51
- End Page
- 58
- URI
- https://scholarworks.sookmyung.ac.kr/handle/2020.sw.sookmyung/4734
- DOI
- 10.9728/dcs.2018.19.1.51
- ISSN
- 1598-2009
2287-738X
- Abstract
- SNS의 사용자와 데이터량이 폭발적으로 증가함에 따라, SNS 빅 데이터를 기반으로 한 연구들이 활발히 진행되고 있다. 특히 소셜 마이닝 분야에서는 비 분류된 대용량 SNS 텍스트 데이터로부터 각 텍스트 별 유사성을 파악하고, 그로부터 트렌드를 추출하기 위해 대표적인 토픽 모델 기법인 LDA를 사용한다. 그러나 LDA는 단문 데이터에 대하여 비 빈발 단어 출현으로 인한 의미 희박성(semantic sparsity)으로 인해 양질의 주제 추론이 어렵다는 한계를 가진다. BTM 연구는 이와 같은 LDA의 한계점을 두 단어의 조합을 통해 개선하였으나, BTM 또한 조합된 단어 중 높은 빈도수의 단어에 더 큰 영향을 받아 각 주제와의 연관성을 고려한 가중치 계산이 불가능하다는 한계점을 지닌다. 본 논문은 단어 간의 의미적 연관성을 반영함으로써 기존 연구 BTM의 정확도를 개선하는 방안을 모색한다.
- Files in This Item
-
Go to Link
- Appears in
Collections - Engineering > Division of Artificial Intelligence Engi > 1. Journal Articles

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.