텍스트 맥락 정보를 활용한 CSN기반 발화자 인식 시스템 개발
Development of a Candidate Scoring Network based Speaker Recognition System Utilizing Textual Context Information
  • 전승호
  • 윤은
  • 이하원
  • 강민혁
  • 김정원
  • 외 1명
Citations

WEB OF SCIENCE

0
Citations

SCOPUS

0

초록

최근 다양한 디지털 플랫폼과 애플리케이션에서 발화자 인식 기술의 중요성이 부각되고 있다. 특히 OTT(Over The Top) 서비스, 오디오 북, 음성 인식 서비스 등에서 이 기술에 관한 관심이 높아지고 있다. 그러나 기존의 발화자 인식 기술은 음성 인식 영역에만 치중되어 있어서, 소설과 같이 음성 정보가 없는 분야에서 문맥을 기반으로 발화자를 특정하기 어렵다는 문제가 있다. 본 연구에서는 이러한 문제를 해결하기 위해 소설 속 인용문과 텍스트 맥락 정보를 활용하여 CSN(Candidate Scoring Network)기반의 발화자 인식 기법을 제안하였다. 시뮬레이션 결과, 테스트 데이터의 예측 정확도는 83.2%로 우수한 결과를 보였다. 본 연구에서 개발한 시스템은 소설 텍스트에서 발화자를 자동으로 식별하는 기능을 제공함으로써, 데이터 라벨링 작업이 필요했던 문제점을 해결하고 음성 기반 발화자 인식 서비스를 향상할 수 있을 것으로 기대한다.

키워드

multi-party conversationspeaker recognitionnamed entity recognitioncandidate scoring network.
제목
텍스트 맥락 정보를 활용한 CSN기반 발화자 인식 시스템 개발
제목 (타언어)
Development of a Candidate Scoring Network based Speaker Recognition System Utilizing Textual Context Information
저자
전승호윤은이하원강민혁김정원유길상
DOI
10.14801/jkiit.2024.22.5.151
발행일
2024-05
저널명
한국정보기술학회논문지
22
5
페이지
151 ~ 163