한국어 텍스트 마이닝의 특성과 2011 한국 경제총조사 자료에의 응용

구주나; 김경아

상세 보기

Text Mining for Korean: Characteristics and Application to 2011 Korean Economic Census Data

구주나;
김경아

Citations

WEB OF SCIENCE

0

Citations

SCOPUS

0

초록

한국 전체 사업체 대한 최초의 전수조사인 2011 경제총조사 중 한식 음식점업 사업체 자료는 취급 메뉴에 대한 텍스트 자료와 영업 지역, 창립연월, 매출액 등 사업체의 특성을 나타내는 구조화 자료로 구성되어 있는 빅데이터이다. 본 연구에서는 취급 메뉴 자료에 텍스트 마이닝을 실시하는 과정에서 발생하는 통계 및 기술적 문제점들을 살펴보고, 이를 통해 한국어 텍스트 마이닝의 특징을 고찰하였다. 또한 텍스트 마이닝의 결과를 사업체 특성 자료와 결합하여 한식 메뉴와 이를 취급하는 사업체 특성 간의 연관성을 탐색하였다. 2010년 기준 가장 많은 사업체가 최급하는 인기메뉴는 삼겹살구이로 특히 강원도와 대전광역시에 인구 대비 취급 사업체가 많았다. 신생 사업체들의 인기 메뉴는 육회와 돈가스였고, 닭백숙과 매운탕 등이 장수 사업체가 많이 취급하는 메뉴였다. 이러한 결과들은 한식 음식점 창업 시 메뉴 선정 가이드라인으로 활용될 수 있으며 관련 정부 부처가 영세 사업체들의 메뉴 변경 유도를 통한 폐업 방지 동의 정책을 마련하는데 도움이 될 것이다.

키워드

Text mining; dictionary construction; big data; Korean economic census.; 텍스트 마이닝; 사전 구축; 빅데이터; 한국 경제총조사

제목: 한국어 텍스트 마이닝의 특성과 2011 한국 경제총조사 자료에의 응용

제목 (타언어): Text Mining for Korean: Characteristics and Application to 2011 Korean Economic Census Data

저자: 구주나; 김경아

발행일: 2014-12

저널명: 응용통계연구

권: 27

호: 7

페이지: 1207 ~ 1217

ScholarWorks@숙명여자대학교

상세 보기

초록

키워드