상세 보기
초록
본 연구에서는 일반적인 사회조사에서 사용될 수 있는 효과적인 결측값 대체방법을 검토하기 위해 인구주택총조사 조사항목 중 혼인상태의 결측값을 대체할 수 있는 두 가지 방법을 제안하고 있다. 첫 번째 방법은 CART(Classification and Regression Tree)모형에서 얻어진 최대 예측확률을 기준으로 결측값을 대체하는 일종의 모형기반 접근법이고, 두 번째 방법은 CART 모형에서 얻어진 결과를 근거로 대체층을 구성하여 핫덱(hot-deck) 방법을 적용하는 대체방법이다. 효율성 비교를 위해 2000년 인구주택총조사를 위한 시험조사에서 얻어진 재조사 결과를 이용하여 오분류율을 검토해 본 결과 두 방법 중 CART 모형을 기반으로 핫덱 방법을 적용하는 것이 효율적이라는 결론을 얻을 수 있었다. 아울러 전국에 대해 동일한 모형을 설정한 경우와 거주지 특성에 따라 광역시․도의 동지역, 도의 읍․면지역으로 구분하여 대체방법을 적용하는 경우를 비교해 본 결과 지역 구분을 통한 효율성 향상 효과는 미흡한 것으로 파악되었다.
키워드
인구주택총조사; 결측값 대체; 핫덱; CART 모형; Classification and Regression Tree; Hot-deck; Missing Value Imputation; Census; Classification and Regression Tree; Hot-deck; Missing Value Imputation; Census
- 제목
- CART를 활용한 결측값 대체방법 : 인구주택총조사 혼인상태 항목을 중심으로
- 제목 (타언어)
- Missing Value Imputation Method Using CART : For Marital Status in the Population and Housing Census
- 저자
- 김영원; 이주원
- 발행일
- 2003-09
- 저널명
- 조사연구
- 권
- 4
- 호
- 2
- 페이지
- 1 ~ 21