CART를 활용한 결측값 대체방법 : 인구주택총조사 혼인상태 항목을 중심으로
Missing Value Imputation Method Using CART : For Marital Status in the Population and Housing Census
  • 김영원
  • 이주원
Citations

WEB OF SCIENCE

0
Citations

SCOPUS

0

초록

본 연구에서는 일반적인 사회조사에서 사용될 수 있는 효과적인 결측값 대체방법을 검토하기 위해 인구주택총조사 조사항목 중 혼인상태의 결측값을 대체할 수 있는 두 가지 방법을 제안하고 있다. 첫 번째 방법은 CART(Classification and Regression Tree)모형에서 얻어진 최대 예측확률을 기준으로 결측값을 대체하는 일종의 모형기반 접근법이고, 두 번째 방법은 CART 모형에서 얻어진 결과를 근거로 대체층을 구성하여 핫덱(hot-deck) 방법을 적용하는 대체방법이다. 효율성 비교를 위해 2000년 인구주택총조사를 위한 시험조사에서 얻어진 재조사 결과를 이용하여 오분류율을 검토해 본 결과 두 방법 중 CART 모형을 기반으로 핫덱 방법을 적용하는 것이 효율적이라는 결론을 얻을 수 있었다. 아울러 전국에 대해 동일한 모형을 설정한 경우와 거주지 특성에 따라 광역시․도의 동지역, 도의 읍․면지역으로 구분하여 대체방법을 적용하는 경우를 비교해 본 결과 지역 구분을 통한 효율성 향상 효과는 미흡한 것으로 파악되었다.

키워드

인구주택총조사결측값 대체핫덱CART 모형Classification and Regression TreeHot-deckMissing Value ImputationCensusClassification and Regression TreeHot-deckMissing Value ImputationCensus
제목
CART를 활용한 결측값 대체방법 : 인구주택총조사 혼인상태 항목을 중심으로
제목 (타언어)
Missing Value Imputation Method Using CART : For Marital Status in the Population and Housing Census
저자
김영원이주원
발행일
2003-09
저널명
조사연구
4
2
페이지
1 ~ 21