Bug:表格识别结果行列错乱 #23
Unanswered
jiataiping
asked this question in
Q&A
Replies: 2 comments
-
图中蓝色框是表格识别模型检测到的cell框(注意是cell框,表格识别模型不检测文本框),可以看到最底部的蓝色不是很准。 两者匹配,是以cell框为准的,因此存在错位问题。不是代码bug。 |
Beta Was this translation helpful? Give feedback.
0 replies
-
怀疑是Paddle 表格模型转换为onnx时有误差导致的。于是,我这里验证了一下直接用PaddleOCR(main分支最新代码)来推理所给原图: 推理代码(参考link): cd PaddleOCR/ppstructure
# 下载模型
mkdir inference && cd inference
# 下载PP-OCRv3文本检测模型并解压
wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar && tar xf ch_PP-OCRv3_det_infer.tar
# 下载PP-OCRv3文本识别模型并解压
wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar && tar xf ch_PP-OCRv3_rec_infer.tar
# 下载PP-StructureV2中文表格识别模型并解压
wget https://paddleocr.bj.bcebos.com/ppstructure/models/slanet/ch_ppstructure_mobile_v2.0_SLANet_infer.tar && tar xf ch_ppstructure_mobile_v2.0_SLANet_infer.tar
cd ..
# 执行表格识别
python table/predict_table.py \
--det_model_dir=inference/ch_PP-OCRv3_det_infer \
--rec_model_dir=inference/ch_PP-OCRv3_rec_infer \
--table_model_dir=inference/ch_ppstructure_mobile_v2.0_SLANet_infer \
--rec_char_dict_path=../ppocr/utils/ppocr_keys_v1.txt \
--table_char_dict_path=../ppocr/utils/dict/table_structure_dict_ch.txt \
--image_dir=1.png \
--output=../output/table 可视化结果:Excel结果:相关附件:结论
|
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
系统环境:Win10 22H2
语言:Python 3.10.1
模型文件:en_ppstructure_mobile_v2_SLANet
初步原因分析:表格识别模型TableStructurer类检测到的文本框位置与RapidOCR检测到的文本框位置差别较大,导致TableMatch类执行结果行列错乱。
原始图片:
表格引擎检测到的文本框及位置:
Beta Was this translation helpful? Give feedback.
All reactions