2단계 신경망과 계층적 프레임 탐색 방법을 이용한 MPEG 비디오 분할

김주민; 최영우; 정규식

상세 보기

MPEG Video Segmentation using Two-stage Neural Networks and Hierarchical Frame Search

김주민;
최영우;
정규식

Citations

WEB OF SCIENCE

0

Citations

SCOPUS

0

초록

본 논문에서는 MPEG 비디오 데이타의 컷(cut)과 디졸브(dissolve)를 검출하여 샷(shot) 단위로 분할하고 각 샷의 카메라 동작 또는 객체 움직임의 형태를 분류하는 방법을 제안하고자 한다. 정확한 샷의 위치와 카메라, 객체의 세분화된 동작을 구별하기 위한 전단계의 연구에서 1 우선 MPEG 데이타의 I(Intra) 프레임의 DC(Direct Current) 계수를 분석하여 픽처 그룹을 Shot(장면이 바뀐 경우), Move(카메라 동작 또는 객체가 움직인 경우), Static(영상의 변화가 거의 없는 경우)으로 세분화하여 분류하였다. 이 과정에서 2단계 구조의 신경망을 구성하고 여러 종류의 특징을 서로 다른 해상도에서 추출하여 결합시키는 방법을 제안하였다. 다음 단계로 Shot 또는 Move로 분류된 픽처 그룹의 P(Predicted), B(Bi- directional) 프레임을 선별적, 계층적으로 탐색하여 컷의 정확한 발생 위치와 카메라 동작 또는 객체 움직임의 종류를 결정하는 방법을 제안한다. P, B 프레임의 매크로 블록의 종류별 분포를 통계적으로 이용하여 컷의 발생 위치를 검출하며, P, B 프레임의 매크로 블록 종류와 움직임 벡터를 동시에 사용하는 신경망을 구성하여 디졸브, 카메라 동작, 객체 움직임의 종류를 검출한다. 본 논문에서 제안하는 방법은 MPEG 데이타의 압축을 풀지 않은 상태에서 I 프레임의 DC 계수만을 사용하여 픽처 그룹을 분류하며, 분류된 픽처 그룹 내에서 일부의 P, B 프레임만을 계층적으로 선택하여 탐색함으로서 처리 시간을 감소시키고자 하였다. 세 종류의 서로 다른 비디오 데이타를 사용한 실험에서 93.9-100.0%로 픽처 그룹을, 96.1 -100.0%로 컷을 검출하였다. 또한 두 종류의 비디오 데이타를 사용한 실험에서 90.13% 및 89.28%의 정확성으로 카메라 동작 또는 객체 움직임을 분류하였다.

키워드

MPEG; Video Segmentation; Shot Detection; Camera Motion Detection; MPEG; Video Segmentation; Shot Detection; Camera Motion Detection; MPEG; 비디오 분할; 샷 검출; 카메라 동작 검출

제목: 2단계 신경망과 계층적 프레임 탐색 방법을 이용한 MPEG 비디오 분할

제목 (타언어): MPEG Video Segmentation using Two-stage Neural Networks and Hierarchical Frame Search

저자: 김주민; 최영우; 정규식

발행일: 2002-02

저널명: 정보과학회논문지 : 소프트웨어 및 응용

권: 29

호: 2

페이지: 114 ~ 125

ScholarWorks@숙명여자대학교

상세 보기

초록

키워드