상세 보기
초록
최근 다양한 디지털 플랫폼과 애플리케이션에서 발화자 인식 기술의 중요성이 부각되고 있다. 특히 OTT(Over The Top) 서비스, 오디오 북, 음성 인식 서비스 등에서 이 기술에 관한 관심이 높아지고 있다. 그러나 기존의 발화자 인식 기술은 음성 인식 영역에만 치중되어 있어서, 소설과 같이 음성 정보가 없는 분야에서 문맥을 기반으로 발화자를 특정하기 어렵다는 문제가 있다. 본 연구에서는 이러한 문제를 해결하기 위해 소설 속 인용문과 텍스트 맥락 정보를 활용하여 CSN(Candidate Scoring Network)기반의 발화자 인식 기법을 제안하였다. 시뮬레이션 결과, 테스트 데이터의 예측 정확도는 83.2%로 우수한 결과를 보였다. 본 연구에서 개발한 시스템은 소설 텍스트에서 발화자를 자동으로 식별하는 기능을 제공함으로써, 데이터 라벨링 작업이 필요했던 문제점을 해결하고 음성 기반 발화자 인식 서비스를 향상할 수 있을 것으로 기대한다.
키워드
multi-party conversation; speaker recognition; named entity recognition; candidate scoring network; .
- 제목
- 텍스트 맥락 정보를 활용한 CSN기반 발화자 인식 시스템 개발
- 제목 (타언어)
- Development of a Candidate Scoring Network based Speaker Recognition System Utilizing Textual Context Information
- 저자
- 전승호; 윤은; 이하원; 강민혁; 김정원; 유길상
- 발행일
- 2024-05
- 저널명
- 한국정보기술학회논문지
- 권
- 22
- 호
- 5
- 페이지
- 151 ~ 163