처음 패키지가 본체(?)고 그 위에는 한글언어 인식 데이터 패키지

$ sudo apt install tesseract-ocr tesseract-ocr-kor tesseract-ocr-script-hang tesseract-ocr-script-hang-vert

 

도움말을 보는데 도움은 안된다(응?)

리눅스에서 실행시 outputbase를 stdout으로 하면 콘솔에 텍스트로 출력된다.

$ tesseract --help
Usage:
  tesseract --help | --help-extra | --version
  tesseract --list-langs
  tesseract imagename outputbase [options...] [configfile...]

OCR options:
  -l LANG[+LANG]        Specify language(s) used for OCR.
NOTE: These options must occur before any configfile.

Single options:
  --help                Show this help message.
  --help-extra          Show extra help for advanced users.
  --version             Show version information.
  --list-langs          List available languages for tesseract engine.

$ tesseract --list-langs
List of available languages (5):
Hangul
Hangul_vert
eng
kor
osd

 

LSTM 학습

[링크 : https://hongjong.tistory.com/19]

[링크 : https://diyworld.tistory.com/114]

[링크 : https://davelogs.tistory.com/70]

[링크 : https://davelogs.tistory.com/72]

[링크 : https://tesseract-ocr.github.io/tessdoc/]

'프로그램 사용 > tesseract ocr' 카테고리의 다른 글

tesseract 버전별 차이?  (0) 2023.12.27
tesseract 학습 데이터  (0) 2023.12.27
tesseract on arm  (0) 2023.12.26
tesseract ocr  (0) 2023.12.21
Posted by 구차니