맵리듀스에서 빅데이터 분석을 위한 다중 Group-by 질의의 효율적인 처리 기법
Efficient Processing of Multiple Group-by Queries in MapReduce for Big Data Analysis
Citations

WEB OF SCIENCE

0
Citations

SCOPUS

0

초록

맵리듀스(MapReduce)는 대용량의 데이터를 다수의 컴퓨터로 병렬 처리하기 위해 사용되는 프레임워크이다. Group-by 질의는 데이터를 지정된 애트리뷰트들의 값에 따라 그룹화하고, 각 그룹에 대해 지정된 집계 함수 값을 구하는 질의이다. 본 논문에서는 둘 이상의 group-by 질의가 동시에 요청되었을 때, 이들을 맵리듀스를 사용하여 효율적으로 처리하는 기법을 제안한다. 제안 기법은 각 group-by 질의를 독립적으로 계산하는 대신, 총 수행비용을 줄이기 위해 하나 이상의 맵리듀스 잡을 통해 단계적으로 계산한다. 성능 평가 실험을 통해, 제안 기법이 각 group-by 질의를 독립적으로 계산하는 단순 방법에 비해 좋은 성능을 가짐을 보인다.

키워드

MapReducegroup-by querymultiple query optimizationbig data맵리듀스Group-by 질의다중 질의 최적화빅데이터
제목
맵리듀스에서 빅데이터 분석을 위한 다중 Group-by 질의의 효율적인 처리 기법
제목 (타언어)
Efficient Processing of Multiple Group-by Queries in MapReduce for Big Data Analysis
저자
박은주박소정오소현최혜진이기용심준호
발행일
2015-05
저널명
정보과학회 컴퓨팅의 실제 논문지
21
5
페이지
387 ~ 392