본문 바로가기

머신러닝/OCR

GOCR

오늘은 최근에 사용해본 GOCR 사용 방법에 대해 정리해보려고 한다.

 

( GOCR 공식 사이트 : www-e.ovgu.de/jschulen/ocr/ )


Introduction

  • gocr은 2000년 12월 2일에 처음 배포되어 업데이트 되고 있다. (마지막 업데이트는 2018년 12월 31일이다.)
  • 현재(21.04.02) 가장 최신 버전은 GOCR 0.52이다.
  • 지원하는 이미지 포맷은 pnm, pbm, pgm, ppm, pca, tga 등이다.
  •  -> png, jpg등 일반적인 이미지는 컨버터를 사용해서 지원되는 이미지 포맷으로 바꿔주면 된다.
  • tcl/tk로 작성된 GUI도 제공한다고 한다.  이 포스팅에서는 command로 실행하는 방법을 소개하려고 한다.

 


Requirements

 

  • gcc
    • 컴파일러가 필요하므로 아래 링크에서 다운 받는다.
    • gcc.gnu.org/

Usage

1.

위 링크에 들어가서 가장 처음 보이는 페이지에서 Download로 들어간다.


2.

 원하는 버전을 다운받는다.


3.

아래 두 command 중 하나로 압축해제 하거나 직접 압축해제를 해준다.

tar -xzf gocr[version].tar.gz

 

gzip -cd gocr[version].tgz | tar -xf -

4.

../gocr-0.52/gocr-0.52 에서 다음 명령어를 실행해준다.

./configure

5. 

동일한 경로에서 아래 명령어를 차례대로 실행한다.(GNU make)

make

 

make examples

 

make install

6.

이제 gocr -h를 실행해보면 help 문서를 확인할 수 있다.


7.

OCR을 수행할 이미지를 준비한다. (pbm,pnm 등)

(저는 jpg 파일을 convertio.co/kr/ 사이트를 이용해서 pnm 으로 변환해서 사용했습니다)

../gocr-0.52/gocr-0.52 에 pnm 파일을 저장한다.

사용한 test 이미지


8.

이제 OCR을 테스트 해 볼 수 있다.

여러가지 옵션이 있는데 먼저 가장 기본적인 명령어를 실행해보자.

gocr 이미지파일명.pnm

 

[결과]

gocr테스트 결과

다음과 같은 결과가 터미널에 그대로 뜬다.

 

결과를 txt파일이나 xml로 저장하려면 아래 명령어를 실행하면 된다.

gocr -v 1 이미지파일명.pnm > 저장할txt파일명.txt 2>out.log  //로그와 함께 txt 파일로 저장

 

gocr -f XML -i 이미지파일명.pnm -o 저장할xml파일명.xml  // xml파일로 저장

실행시키고 나면 루트폴더에 결과가 저장되어있는 것을 확인할 수 있다.

 

+ 다른 옵션들은 gocr -h 와 gocr폴더에 들어있는 readme파일로 확인해보면 된다.


9.

추가적으로 결과를 가시화 할 수 있도록 파이썬으로 코드를 작성해보았다. 

위의 xml파일로 저장하는 명령어를 실행한 후 결과 파일을 이용해 코드를 실행하면 된다.

 

( 결과 가시화 코드 다운로드 : github.com/mijoo308/GOCR_visualize_result )

result1

 

 result2

 

반응형

'머신러닝 > OCR' 카테고리의 다른 글

EasyOCR 사용 방법  (7) 2022.01.16
pytesseract 사용방법  (0) 2021.11.04
EasyOCR 소개  (0) 2021.10.10
Tesseract OCR 5.0 Windows용 학습 방법  (23) 2021.08.26
Tesseract OCR  (0) 2021.05.08