본문 바로가기

머신러닝

(13)
[논문 리뷰] A Review on Human Pose Estimation (2021) human pose estimation에 대한 리뷰 논문의 리뷰(?)입니다. 저는 human pose estimation 중에서도 딥러닝을 이용한 body pose estimation에 관심이 있습니다. 따라서 body 위주의 내용을 다루려고 합니다. 논문 링크 : https://arxiv.org/abs/2110.06877 A Review on Human Pose Estimation The phenomenon of Human Pose Estimation (HPE) is a problem that has been explored over the years, particularly in computer vision. But what exactly is it? To answer this, the concept..
[논문 리뷰] EfficientNet 논문 리뷰 (Rethinking Model Scaling for Convolutional Neural Networks) Transformer에 이어 ViT를 리뷰하려고 했으나,, 인턴 때 사용해보았던 Efficient Net이 급 궁금해져서 읽어보았습니다. EfficientNet : Rethinking Model Scaling for Convolutional Neural Networks (2020) 논문 링크 : https://arxiv.org/abs/1905.11946 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks Convolutional Neural Networks (ConvNets) are commonly developed at a fixed resource budget, and then scaled up for better accu..
[논문 리뷰] Transformer 논문 리뷰 (Attention Is All You Need) NLP에서 아주 유명한 논문인 Transformer를 리뷰해보겠습니다. ViT를 리뷰하기 전에 먼저 리뷰해보도록 하겠습니다. 논문 링크 : https://arxiv.org/abs/1706.03762 Attention Is All You Need The dominant sequence transduction models are based on complex recurrent or convolutional neural networks in an encoder-decoder configuration. The best performing models also connect the encoder and decoder through an attention mechanism. We propose a new arxiv..
[논문 리뷰] ResNet 논문 리뷰 오늘은 최근에 읽은 유명한 논문, ResNet을 리뷰해보려고 합니다. 논문 링크 : https://arxiv.org/abs/1512.03385 Deep Residual Learning for Image Recognition Deeper neural networks are more difficult to train. We present a residual learning framework to ease the training of networks that are substantially deeper than those used previously. We explicitly reformulate the layers as learning residual functions with arxiv.org Abstra..
[논문 리뷰] SynthTIGER 리뷰 SynthTIGER는 Synthetic Text Image GEneratoR Towrads Better Text Recognition Models 로, Clova ai 에서 발표한 Scene Text Recognition (STR) Dataset 생성 방법에 대한 논문입니다. OCR을 오래 하다보니 OCR 모델뿐만 아니라 데이터셋 생성도 매우 중요하다고 생각하게 되었습니다. 언어별로 다른 문자 수, 폰트, 문자 크기, 문자의 길이 등 너무나 다양한 특성을 가진 text를 학습시키기 위해 어떤 augmentation이 필요하고 어떤 합성 데이터 생성 방법이 필요할지 자연스레 고민해보게 되었는데, 제가 느꼈던 어려움들이 논문에서 하나하나 언급되는 것을 보고 반가운 기분이 들었습니다. + 참고 OCR은 크게 ..
EasyOCR 사용 방법 https://wandukong.tistory.com/8 EasyOCR 소개 오늘은 유명한 OCR 프레임워크인 EasyOCR에 대해 소개해보려고 합니다. 깃허브 : https://github.com/JaidedAI/EasyOCR GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popu.. wandukong.tistory.com 이전 포스팅에서 EasyOCR를 소개했었는데요, 오늘은 이어서 EasyOCR을 사용하는 방법을 설명하려 합니다. (1) anaconda 가상 환경 만들기 anaconda 가상 환경을 만들어줍시다. conda create -n "easyocr" python=3.7 -y conda acti..
pytesseract 사용방법 요새 tesseract5 학습 방법을 보고 찾아오시는 분이 많길래 학습한 모델을 사용하는 방법도 알려드리면 좋을 것 같아 포스팅해봅니다! windows용 tesseract 5.0 학습방법 : https://wandukong.tistory.com/7 Tesseract OCR 5.0 Windows용 학습 방법 Tesseract OCR을 처음 학습시킬 때 정보가 충분하지 않아 오랜시간 헤맸던 기억이 있다. 방법을 찾아 학습시켜본 지는 꽤 오래됐지만 누군가에게 도움이 되지 않을까 해서 방법을 글로 정리해보려 wandukong.tistory.com 오늘은 tesseract를 파이썬으로 사용할 수 있는 pytesseract 사용방법에 대해 소개해보겠습니다. (1) Tesseract OCR 설치 https://git..
EasyOCR 소개 오늘은 유명한 OCR 프레임워크인 EasyOCR에 대해 소개해보려고 합니다. 깃허브 : https://github.com/JaidedAI/EasyOCR GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chines Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc. - GitHub - JaidedAI/EasyOCR: Ready-to-use ..