집합 기반 POI 검색을 이용한 문장 유사도 측정 기법
Sentence Similarity Measurement Method Using a Set-based POI Data Search
Citations

WEB OF SCIENCE

0
Citations

SCOPUS

0

초록

최근 논문 표절 논란과 지능형 텍스트 검색서비스에 대한 관심이 증가하면서 문장 유사도 측정의 필요성이 증가하고 있다. n-gram, 편집거리, LSA 등 기존의 다양한 방향으로 선행 연구가 있었지만 각 기법마다 장단점이 존재한다. 본 논문에서는 집합 기반 POI 검색 기법을 이용한 새로운 방향의 문장 유사도 측정 기법을 제안한다. 집합 기반 POI 검색 기법은 하드매칭에 비해 단어의 도치, 누락, 삽입, 변경에 현저한 성능 향상을 보인다. 이 기법을 이용하면 보다 정확하고 빠른 문장 유사도 측정이 가능하다. 제안하는 기법은 기존 집합 기반 POI 검색 기법의 데이터 로딩 알고리즘과 텍스트 검색 알고리즘을 변형하고 어절 연산 알고리즘을 추가하여 두 문장의 유사도를 백분율로 표현한다. 실험을 통해 본 논문에서 제시하는 기법이 정확도와 속도에서 n-gram과 기존 집합 기반 POI 검색 기법에 비해 우수함을 확인하였다.

키워드

POI searchSet-based algorithmsentence similaritypiracy testtext searchPOI 검색집합-기반 검색 알고리즘문장 유사도표절 검사텍스트 검색
제목
집합 기반 POI 검색을 이용한 문장 유사도 측정 기법
제목 (타언어)
Sentence Similarity Measurement Method Using a Set-based POI Data Search
저자
고은별이종우
DOI
10.5626/KTCP.2014.20.12.711
발행일
2014-12
저널명
정보과학회 컴퓨팅의 실제 논문지
20
12
페이지
711 ~ 716