OCR은 어떻게 작동합니까? 간단하고 이해하기 쉬운 방식으로 설명

이 기사에서는 OCR 작동 방식에 대해 설명합니다. OCR은 "광학 문자 인식"의 약자로 독일어에서는 간단히 텍스트 인식이라고합니다. 이것은 컴퓨터가 OCR을 사용하여 스캔 이미지의 텍스트를 인식 한 다음 간단한 텍스트 문서로 변환 할 수 있음을 의미합니다.

이것이 OCR의 작동 방식입니다

동료로부터 종이 프레젠테이션을 받았다고 상상해보십시오. 개별 구절이 마음에 들지 않기 때문에 PC에서 이들을 편집하려고합니다. 스캔하고 OCR 프로그램으로 이동하십시오. 이제 다음이 발생합니다.

소프트웨어는 먼저 소위 레이아웃 분석을 수행합니다. 이를 위해 페이지 레이아웃을보고 이미지를 텍스트와 분리합니다. 그녀는 또한 페이지에서 자신의 위치를 기록합니다. 그런 다음 단락 수를 세고 페이지 번호와 같은 개별 요소를 저장합니다.
이제 어려운 부분이 온다. 소프트웨어는 개별 텍스트 블록을보고 문장으로 나눕니다. 그런 다음 문장은 개별 단어로 분리되고 단어는 문자로 분리됩니다.
OCR 소프트웨어에는 문자 및 문자 패턴이 포함되어 있습니다. 이제 프로그램은 스캔 한 문자를 이러한 패턴과 비교합니다. 그것들이 99 % 유사하다면, 알고리즘은 아마도 그 문자가되어야한다고 결정합니다. 단시간에 많은 패턴을 비교할 수 있기 때문에 매우 정확합니다. 이런 식으로 그는 "8"과 "B"를 성공적으로 구별합니다.
따라서 글자와 문자가 점차 인식됩니다. 그런 다음 그들은 다시 단어로 결합되어 문장에서 제자리로 돌아갑니다. 소프트웨어가 완료 되 자마자 모든 것이 일반 문서에 저장되어 편집 할 수 있습니다. 완료!

소프트웨어 지식을 테스트 하시겠습니까? 우리의 큰 소프트웨어 퀴즈에 참여하십시오!