상세 보기
집합 기반 POI 검색을 이용한 문장 유사도 측정 기법
Sentence Similarity Measurement Method Using a Set-based POI Data Search
- 고은별;
- 이종우
Citations
WEB OF SCIENCE
0Citations
SCOPUS
0초록
최근 논문 표절 논란과 지능형 텍스트 검색서비스에 대한 관심이 증가하면서 문장 유사도 측정의 필요성이 증가하고 있다. n-gram, 편집거리, LSA 등 기존의 다양한 방향으로 선행 연구가 있었지만 각 기법마다 장단점이 존재한다. 본 논문에서는 집합 기반 POI 검색 기법을 이용한 새로운 방향의 문장 유사도 측정 기법을 제안한다. 집합 기반 POI 검색 기법은 하드매칭에 비해 단어의 도치, 누락, 삽입, 변경에 현저한 성능 향상을 보인다. 이 기법을 이용하면 보다 정확하고 빠른 문장 유사도 측정이 가능하다. 제안하는 기법은 기존 집합 기반 POI 검색 기법의 데이터 로딩 알고리즘과 텍스트 검색 알고리즘을 변형하고 어절 연산 알고리즘을 추가하여 두 문장의 유사도를 백분율로 표현한다. 실험을 통해 본 논문에서 제시하는 기법이 정확도와 속도에서 n-gram과 기존 집합 기반 POI 검색 기법에 비해 우수함을 확인하였다.
키워드
POI search; Set-based algorithm; sentence similarity; piracy test; text search; POI 검색; 집합-기반 검색 알고리즘; 문장 유사도; 표절 검사; 텍스트 검색
- 제목
- 집합 기반 POI 검색을 이용한 문장 유사도 측정 기법
- 제목 (타언어)
- Sentence Similarity Measurement Method Using a Set-based POI Data Search
- 저자
- 고은별; 이종우
- 발행일
- 2014-12
- 권
- 20
- 호
- 12
- 페이지
- 711 ~ 716