Skip to content

shuheik/ocr_table_images

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 

Repository files navigation

ocr_table_images

Setup

  • Python 3.7+
  • install PaddlePaddle
python -m pip install paddlepaddle-gpu -i https://pypi.tuna.tsinghua.edu.cn/simple
  • install PaddleOCR
pip install paddleocr

OCRの適用

  • /data/path/tables以下に表領域を切り出したpngファイルを置き、以下を実行する。
python table_ocr.py /data/path
  • /data/path/tables以下にOCR結果のjsonファイルが出力される。

表構造認識の適用

  • 表領域を切り出した画像を置いたフォルダ(img_dir)、画像の拡張子(extension)、htmlファイルを出力するフォルダ(out_dir)を指定し、以下を実行する。
python ocr_tsr.py --img-dir img_dir --extension png --out-dir out_dir
  • out_dirに表構造認識結果のhtmlファイルが出力される。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages