상세 보기
초록
맵리듀스(MapReduce)는 대용량의 데이터를 다수의 컴퓨터로 병렬 처리하기 위해 사용되는 프레임워크이다. Group-by 질의는 데이터를 지정된 애트리뷰트들의 값에 따라 그룹화하고, 각 그룹에 대해 지정된 집계 함수 값을 구하는 질의이다. 본 논문에서는 둘 이상의 group-by 질의가 동시에 요청되었을 때, 이들을 맵리듀스를 사용하여 효율적으로 처리하는 기법을 제안한다. 제안 기법은 각 group-by 질의를 독립적으로 계산하는 대신, 총 수행비용을 줄이기 위해 하나 이상의 맵리듀스 잡을 통해 단계적으로 계산한다. 성능 평가 실험을 통해, 제안 기법이 각 group-by 질의를 독립적으로 계산하는 단순 방법에 비해 좋은 성능을 가짐을 보인다.
키워드
MapReduce; group-by query; multiple query optimization; big data; 맵리듀스; Group-by 질의; 다중 질의 최적화; 빅데이터
- 제목
- 맵리듀스에서 빅데이터 분석을 위한 다중 Group-by 질의의 효율적인 처리 기법
- 제목 (타언어)
- Efficient Processing of Multiple Group-by Queries in MapReduce for Big Data Analysis
- 저자
- 박은주; 박소정; 오소현; 최혜진; 이기용; 심준호
- 발행일
- 2015-05
- 권
- 21
- 호
- 5
- 페이지
- 387 ~ 392