OCR은 어떻게 작동합니까? 간단하고 이해하기 쉬운 방식으로 설명
이 기사에서는 OCR 작동 방식에 대해 설명합니다. OCR은 "광학 문자 인식"의 약자로 독일어에서는 간단히 텍스트 인식이라고합니다. 이것은 컴퓨터가 OCR을 사용하여 스캔 이미지의 텍스트를 인식 한 다음 간단한 텍스트 문서로 변환 할 수 있음을 의미합니다.
이것이 OCR의 작동 방식입니다
동료로부터 종이 프레젠테이션을 받았다고 상상해보십시오. 개별 구절이 마음에 들지 않기 때문에 PC에서 이들을 편집하려고합니다. 스캔하고 OCR 프로그램으로 이동하십시오. 이제 다음이 발생합니다.
- 소프트웨어는 먼저 소위 레이아웃 분석을 수행합니다. 이를 위해 페이지 레이아웃을보고 이미지를 텍스트와 분리합니다. 그녀는 또한 페이지에서 자신의 위치를 기록합니다. 그런 다음 단락 수를 세고 페이지 번호와 같은 개별 요소를 저장합니다.
- 이제 어려운 부분이 온다. 소프트웨어는 개별 텍스트 블록을보고 문장으로 나눕니다. 그런 다음 문장은 개별 단어로 분리되고 단어는 문자로 분리됩니다.
- OCR 소프트웨어에는 문자 및 문자 패턴이 포함되어 있습니다. 이제 프로그램은 스캔 한 문자를 이러한 패턴과 비교합니다. 그것들이 99 % 유사하다면, 알고리즘은 아마도 그 문자가되어야한다고 결정합니다. 단시간에 많은 패턴을 비교할 수 있기 때문에 매우 정확합니다. 이런 식으로 그는 "8"과 "B"를 성공적으로 구별합니다.
- 따라서 글자와 문자가 점차 인식됩니다. 그런 다음 그들은 다시 단어로 결합되어 문장에서 제자리로 돌아갑니다. 소프트웨어가 완료 되 자마자 모든 것이 일반 문서에 저장되어 편집 할 수 있습니다. 완료!
소프트웨어 지식을 테스트 하시겠습니까? 우리의 큰 소프트웨어 퀴즈에 참여하십시오!