Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

이미지 내의 텍스트 데이터 인식 정확도 향상을 위한 멀티 모달 이미지 처리 프로세스

Full metadata record
DC FieldValueLanguage
dc.contributor.author박정은-
dc.contributor.author주경돈-
dc.contributor.author김철연-
dc.date.available2021-02-22T07:46:05Z-
dc.date.issued2018-12-
dc.identifier.issn1598-9798-
dc.identifier.urihttps://scholarworks.sookmyung.ac.kr/handle/2020.sw.sookmyung/4082-
dc.description.abstract광학 문자 인식(OCR)은 텍스트를 포함한 이미지에서 텍스트 영역을 인식하고 이로부터 텍스트를 추출하는 기술이다. 전체 텍스트 데이터 중 상당히 많은 텍스트 정보가 이미지에 포함되어 있기 때문에 OCR은 데이터 분석 분야에 있어 중요한 전처리 단계를 담당한다. 대부분의 OCR 엔진이, 흰 바탕의 검정 글씨의 단순한 형태를 가진 이미지와 같은, 텍스트와 배경의 구분이 뚜렷한 저 복잡도 이미지에 대해서는 높은 인식률을 보이는 반면, 텍스트와 배경의 구분이 뚜렷하지 않은 고 복잡도 이미지에 대해서는 저조한 인식률을 보이기 때문에, 인식률 개선을 위해 입력 이미지를 OCR 엔진이 처리하기 용이한 이미지로 변형하는 전처리 작업이 필요하게 된다. 따라서 본 논문에서는 OCR 엔진의 정확성 증대를 위해 텍스트 라인별로 이미지를 분리하고, 영상 처리 기법 기반의 CLAHE 모듈과 Two-step 모듈을 병렬적으로 수행하여 텍스트와 배경 영역을 효율적으로 분리한 후 텍스트를 인식한다. 이어서 두 모듈의 결과 텍스트에 대하여 N-gram방법과 Hunspell 사전을 결합한 알고리즘으로 인식률을 비교하여 가장 높은 인식률의 결과 텍스트를 최종 결과물로 선정하는 방법론을 제안한다. 대표적인 OCR 엔진인 Tesseract와 Abbyy와의 다양한 비교 실험을 통해 본 연구에서 제안하는 모듈이 복잡한 배경을 가진 이미지에서 가장 정확한 텍스트 인식률을 보임을 보였다.-
dc.format.extent11-
dc.language한국어-
dc.language.isoKOR-
dc.publisher한국정보과학회-
dc.title이미지 내의 텍스트 데이터 인식 정확도 향상을 위한 멀티 모달 이미지 처리 프로세스-
dc.title.alternativeMulti-modal Image Processing for Improving Recognition Accuracy of Text Data in Images-
dc.typeArticle-
dc.publisher.location대한민국-
dc.identifier.bibliographicCitation데이타베이스연구, v.34, no.3, pp 148 - 158-
dc.citation.title데이타베이스연구-
dc.citation.volume34-
dc.citation.number3-
dc.citation.startPage148-
dc.citation.endPage158-
dc.identifier.kciidART002420078-
dc.description.isOpenAccessN-
dc.description.journalRegisteredClasskci-
dc.subject.keywordAuthor데이터 추출-
dc.subject.keywordAuthor광학문자인식-
dc.subject.keywordAuthor이미지 처리-
dc.subject.keywordAuthorData Extraction-
dc.subject.keywordAuthorOCR-
dc.subject.keywordAuthorImage Processing-
dc.identifier.urlhttps://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002420078-
Files in This Item
Go to Link
Appears in
Collections
ICT융합공학부 > IT공학전공 > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Kim, Chul Yun photo

Kim, Chul Yun
공과대학 (인공지능공학부)
Read more

Altmetrics

Total Views & Downloads

BROWSE