오늘은 유명한 OCR 프레임워크인 EasyOCR에 대해 소개해보려고 합니다.
EasyOCR 소개
EasyOCR은 문자 영역 인식(Detection) + 문자 인식(Recognition)기능을 모두 하는 프레임워크입니다.
EasyOCR은 2020년에 나타난 비교적 최신 OCR입니다. 현재까지 많은 사람들이 이용하고 있고 80가지가 넘는 언어를 지원합니다.
초기엔 Detection+Recognition을 한번에 하는 기능만 있었는데 작년 8월에 Detection과 Recogntion을 나눠 사용할 수도 있게 업데이트 되었습니다. 전체 기능이 아닌 Detection, Recognition 각각을 따로 사용하고 싶을 때도 사용하기 편리합니다.
현재까지도 활발히 업데이트가 이루어지고 있는 것을 보아 이후에도 기능 추가, 성능 개선 등의 발전이 예상됩니다 :)
EasyOCR 구조
Detection은 clova ai의 CRAFT를 사용하고 있습니다. (이후 CRAFT에 대해서도 포스팅할 계획입니다!)
Recognition은 원래는 CRNN 모델의 VGG-LSTM-CTC의 구조였고 현재는 VGG도, ResNet도 사용한다고 합니다.
Recognition의 training pipeline 또한 clova ai의 deep-text-recognition-benchmark를 사용하고 있습니다.
위와 같이 회색 테두리로 표시된 영역은 사용자들이 커스텀해서 사용할 수 있는 부분입니다.
사용자들이 원하는 detection모델, recognition모델이 따로 있다면 해당 부분에 적용해 사용할 수 있습니다.
현재 저도 Recognition 부분에 제가 원하는 모델로 학습시킨 것을 적용해보고 inference까지 잘 되는지 확인하는 실험을 하고 있습니다.
다음엔 EasyOCR 사용 방법에 대해 포스팅하겠습니다.
https://wandukong.tistory.com/10
'머신러닝 > OCR' 카테고리의 다른 글
EasyOCR 사용 방법 (7) | 2022.01.16 |
---|---|
pytesseract 사용방법 (0) | 2021.11.04 |
Tesseract OCR 5.0 Windows용 학습 방법 (23) | 2021.08.26 |
Tesseract OCR (0) | 2021.05.08 |
GOCR (0) | 2021.04.02 |