집합 기반 POI 검색을 이용한 문장 유사도 측정 기법Sentence Similarity Measurement Method Using a Set-based POI Data Search
- Other Titles
- Sentence Similarity Measurement Method Using a Set-based POI Data Search
- Authors
- 고은별; 이종우
- Issue Date
- Dec-2014
- Publisher
- 한국정보과학회
- Keywords
- POI search; Set-based algorithm; sentence similarity; piracy test; text search; POI 검색; 집합-기반 검색 알고리즘; 문장 유사도; 표절 검사; 텍스트 검색
- Citation
- 정보과학회 컴퓨팅의 실제 논문지, v.20, no.12, pp 711 - 716
- Pages
- 6
- Journal Title
- 정보과학회 컴퓨팅의 실제 논문지
- Volume
- 20
- Number
- 12
- Start Page
- 711
- End Page
- 716
- URI
- https://scholarworks.sookmyung.ac.kr/handle/2020.sw.sookmyung/5684
- DOI
- 10.5626/KTCP.2014.20.12.711
- ISSN
- 2383-6318
2383-6326
- Abstract
- 최근 논문 표절 논란과 지능형 텍스트 검색서비스에 대한 관심이 증가하면서 문장 유사도 측정의 필요성이 증가하고 있다. n-gram, 편집거리, LSA 등 기존의 다양한 방향으로 선행 연구가 있었지만 각 기법마다 장단점이 존재한다. 본 논문에서는 집합 기반 POI 검색 기법을 이용한 새로운 방향의 문장 유사도 측정 기법을 제안한다. 집합 기반 POI 검색 기법은 하드매칭에 비해 단어의 도치, 누락, 삽입, 변경에 현저한 성능 향상을 보인다. 이 기법을 이용하면 보다 정확하고 빠른 문장 유사도 측정이 가능하다. 제안하는 기법은 기존 집합 기반 POI 검색 기법의 데이터 로딩 알고리즘과 텍스트 검색 알고리즘을 변형하고 어절 연산 알고리즘을 추가하여 두 문장의 유사도를 백분율로 표현한다. 실험을 통해 본 논문에서 제시하는 기법이 정확도와 속도에서 n-gram과 기존 집합 기반 POI 검색 기법에 비해 우수함을 확인하였다.
- Files in This Item
-
Go to Link
- Appears in
Collections - ICT융합공학부 > IT공학전공 > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.