diff --git a/docs/about_model/convert_model/index.html b/docs/about_model/convert_model/index.html
index 9fd43f87..3be080e7 100644
--- a/docs/about_model/convert_model/index.html
+++ b/docs/about_model/convert_model/index.html
@@ -1632,8 +1632,8 @@ <h3 id="离线转换httpsgithubcomrapidaipaddleocrmodelconverter"><a href="https
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/about_model/custom_different_model/index.html b/docs/about_model/custom_different_model/index.html
index 8583fe91..8888a3e9 100644
--- a/docs/about_model/custom_different_model/index.html
+++ b/docs/about_model/custom_different_model/index.html
@@ -1699,8 +1699,8 @@ <h4 id="3-使用该模型">3. 使用该模型 <a href="#3-%e4%bd%bf%e7%94%a8%e8%
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/about_model/download_onnx/index.html b/docs/about_model/download_onnx/index.html
index 0ed33261..53134797 100644
--- a/docs/about_model/download_onnx/index.html
+++ b/docs/about_model/download_onnx/index.html
@@ -1614,8 +1614,8 @@ <h3 id="hugging-face-modelshttpshuggingfacecoswhlrapidocrtreemain"><a href="http
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/about_model/index.html b/docs/about_model/index.html
index c7cc54db..dff8c03a 100644
--- a/docs/about_model/index.html
+++ b/docs/about_model/index.html
@@ -1569,8 +1569,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/about_model/model_summary/index.html b/docs/about_model/model_summary/index.html
index 13b6e9d1..e85af918 100644
--- a/docs/about_model/model_summary/index.html
+++ b/docs/about_model/model_summary/index.html
@@ -2019,8 +2019,8 @@ <h4 id="文本识别模型">文本识别模型 <a href="#%e6%96%87%e6%9c%ac%e8%a
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/about_model/support_language/index.html b/docs/about_model/support_language/index.html
index 1dc3fc6c..fdbf50c0 100644
--- a/docs/about_model/support_language/index.html
+++ b/docs/about_model/support_language/index.html
@@ -1622,8 +1622,8 @@ <h3 id="转换教程convert_modelmd"><a data-bs-delay="{&#34;hide&#34;:300,&#34;
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/blog/01_optim_tutorial/index.html b/docs/blog/01_optim_tutorial/index.html
index 9d6355f0..4343fbac 100644
--- a/docs/blog/01_optim_tutorial/index.html
+++ b/docs/blog/01_optim_tutorial/index.html
@@ -1777,8 +1777,8 @@ <h4 id="情况二轻量中英文模型对个别英文或数字识别错误">情
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/blog/02_config_parameter/index.html b/docs/blog/02_config_parameter/index.html
index 890bb4eb..90d33afb 100644
--- a/docs/blog/02_config_parameter/index.html
+++ b/docs/blog/02_config_parameter/index.html
@@ -1913,8 +1913,8 @@ <h4 id="rec部分"><code>Rec</code>部分 <a href="#rec%e9%83%a8%e5%88%86" class
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/blog/03_which_inference/index.html b/docs/blog/03_which_inference/index.html
index 9a9fdb84..1092025f 100644
--- a/docs/blog/03_which_inference/index.html
+++ b/docs/blog/03_which_inference/index.html
@@ -1615,8 +1615,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/blog/04_inference_summary/index.html b/docs/blog/04_inference_summary/index.html
index df8ac433..ebedd7ba 100644
--- a/docs/blog/04_inference_summary/index.html
+++ b/docs/blog/04_inference_summary/index.html
@@ -1683,8 +1683,8 @@ <h3 id="paddlexhttpsaibaiducomai-docaistudiozlisojzjs"><a href="https://ai.baidu
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/blog/05_rec_dict_onnx/index.html b/docs/blog/05_rec_dict_onnx/index.html
index 4cdf9cd2..881d5e08 100644
--- a/docs/blog/05_rec_dict_onnx/index.html
+++ b/docs/blog/05_rec_dict_onnx/index.html
@@ -1712,8 +1712,8 @@ <h3 id="获取字典内容">获取字典内容 <a href="#%e8%8e%b7%e5%8f%96%e5%a
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/blog/index.html b/docs/blog/index.html
index e4a971db..52ae9ae6 100644
--- a/docs/blog/index.html
+++ b/docs/blog/index.html
@@ -1569,8 +1569,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/business_support/index.html b/docs/business_support/index.html
index badd2ad7..27996a58 100644
--- a/docs/business_support/index.html
+++ b/docs/business_support/index.html
@@ -1622,8 +1622,8 @@ <h4 id="服务三国产操作系统ocr-docker部署">服务三：国产操作系
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/changelog/index.html b/docs/changelog/index.html
index 5a69dd40..3ba1c886 100644
--- a/docs/changelog/index.html
+++ b/docs/changelog/index.html
@@ -1552,8 +1552,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/changelog/rapidocr/index.html b/docs/changelog/rapidocr/index.html
index e3098b3c..a31a8665 100644
--- a/docs/changelog/rapidocr/index.html
+++ b/docs/changelog/rapidocr/index.html
@@ -1938,8 +1938,8 @@ <h4 id="2021-03-24-udpate">2021-03-24 udpate: <a href="#2021-03-24-udpate" class
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/changelog/rapidocr_api/index.html b/docs/changelog/rapidocr_api/index.html
index 16b4fa7e..cd49e905 100644
--- a/docs/changelog/rapidocr_api/index.html
+++ b/docs/changelog/rapidocr_api/index.html
@@ -1618,8 +1618,8 @@ <h4 id="2023-05-22-api-update">🍜2023-05-22 api update: <a href="#2023-05-22-a
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/changelog/rapidocr_paddle/index.html b/docs/changelog/rapidocr_paddle/index.html
index 4979481b..33c673eb 100644
--- a/docs/changelog/rapidocr_paddle/index.html
+++ b/docs/changelog/rapidocr_paddle/index.html
@@ -1664,8 +1664,8 @@ <h4 id="2023-10-23-v139-update">2023-10-23 v1.3.9 update: <a href="#2023-10-23-v
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/changelog/rapidocr_web/index.html b/docs/changelog/rapidocr_web/index.html
index a05fc9ca..008651db 100644
--- a/docs/changelog/rapidocr_web/index.html
+++ b/docs/changelog/rapidocr_web/index.html
@@ -1637,8 +1637,8 @@ <h4 id="2023-04-16-ocrweb-v011-update">🏸2023-04-16 ocrweb v0.1.1 update: <a h
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/communicate/index.html b/docs/communicate/index.html
index 269fd38a..2452d68f 100644
--- a/docs/communicate/index.html
+++ b/docs/communicate/index.html
@@ -1627,8 +1627,8 @@ <h3 id="推荐-加入qq频道">(推荐) 加入QQ频道 <a href="#%e6%8e%a8%e8%8d
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/faq/index.html b/docs/faq/index.html
index 27e53511..6c496ead 100644
--- a/docs/faq/index.html
+++ b/docs/faq/index.html
@@ -1675,8 +1675,8 @@ <h4 id="q-边缘总有一行文字无法识别怎么办">Q: 边缘总有一行
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/index.html b/docs/index.html
index 39ad0e82..bcc11e4e 100644
--- a/docs/index.html
+++ b/docs/index.html
@@ -1714,8 +1714,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/inference_engine/index.html b/docs/inference_engine/index.html
index e49ed21a..b3b0153b 100644
--- a/docs/inference_engine/index.html
+++ b/docs/inference_engine/index.html
@@ -1518,8 +1518,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/inference_engine/onnxruntime/index.html b/docs/inference_engine/onnxruntime/index.html
index ef099b69..bfa205ff 100644
--- a/docs/inference_engine/onnxruntime/index.html
+++ b/docs/inference_engine/onnxruntime/index.html
@@ -1526,8 +1526,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/inference_engine/onnxruntime/infer_optim/index.html b/docs/inference_engine/onnxruntime/infer_optim/index.html
index ae1ce00b..3a60895b 100644
--- a/docs/inference_engine/onnxruntime/infer_optim/index.html
+++ b/docs/inference_engine/onnxruntime/infer_optim/index.html
@@ -1958,8 +1958,8 @@ <h4 id="参考资料">参考资料 <a href="#%e5%8f%82%e8%80%83%e8%b5%84%e6%96%9
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/inference_engine/onnxruntime/onnxruntime-gpu/index.html b/docs/inference_engine/onnxruntime/onnxruntime-gpu/index.html
index 55f91744..d3185740 100644
--- a/docs/inference_engine/onnxruntime/onnxruntime-gpu/index.html
+++ b/docs/inference_engine/onnxruntime/onnxruntime-gpu/index.html
@@ -1673,8 +1673,8 @@ <h3 id="相关对比表格">相关对比表格 <a href="#%e7%9b%b8%e5%85%b3%e5%a
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/inference_engine/openvino/index.html b/docs/inference_engine/openvino/index.html
index 2ebe716e..1dd60193 100644
--- a/docs/inference_engine/openvino/index.html
+++ b/docs/inference_engine/openvino/index.html
@@ -1526,8 +1526,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/inference_engine/openvino/infer-gpu/index.html b/docs/inference_engine/openvino/infer-gpu/index.html
index b564502c..87d7f6ad 100644
--- a/docs/inference_engine/openvino/infer-gpu/index.html
+++ b/docs/inference_engine/openvino/infer-gpu/index.html
@@ -1593,8 +1593,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/inference_engine/openvino/infer/index.html b/docs/inference_engine/openvino/infer/index.html
index 3831ac79..95dec2e2 100644
--- a/docs/inference_engine/openvino/infer/index.html
+++ b/docs/inference_engine/openvino/infer/index.html
@@ -1845,8 +1845,8 @@ <h3 id="openvino与onnxruntime推理代码写法对比">OpenVINO与ONNXRuntime
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/install_usage/index.html b/docs/install_usage/index.html
index a5ffe6a8..7db88485 100644
--- a/docs/install_usage/index.html
+++ b/docs/install_usage/index.html
@@ -1552,8 +1552,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/install_usage/rapidocr/cli/index.html b/docs/install_usage/rapidocr/cli/index.html
index 9a9fb0f9..2232da6f 100644
--- a/docs/install_usage/rapidocr/cli/index.html
+++ b/docs/install_usage/rapidocr/cli/index.html
@@ -818,26 +818,26 @@ <h3 id="使用示例">使用示例 <a href="#%e4%bd%bf%e7%94%a8%e7%a4%ba%e4%be%8
 		
 
 		<a class="nav-link  active"
-		   id="dfcbeaTab" data-bs-toggle="tab" data-bs-target="#dfcbea"
-		   type="button" role="tab" aria-controls="dfcbea" aria-selected="true">图像预测</a>
+		   id="acbdfeTab" data-bs-toggle="tab" data-bs-target="#acbdfe"
+		   type="button" role="tab" aria-controls="acbdfe" aria-selected="true">图像预测</a>
 
 		
 
 		<a class="nav-link "
-		   id="cdafbeTab" data-bs-toggle="tab" data-bs-target="#cdafbe"
-		   type="button" role="tab" aria-controls="cdafbe" aria-selected="true">只使用检测</a>
+		   id="efcbdaTab" data-bs-toggle="tab" data-bs-target="#efcbda"
+		   type="button" role="tab" aria-controls="efcbda" aria-selected="true">只使用检测</a>
 
 		
 
 		<a class="nav-link "
-		   id="edcfbaTab" data-bs-toggle="tab" data-bs-target="#edcfba"
-		   type="button" role="tab" aria-controls="edcfba" aria-selected="true">只使用识别</a>
+		   id="ceafdbTab" data-bs-toggle="tab" data-bs-target="#ceafdb"
+		   type="button" role="tab" aria-controls="ceafdb" aria-selected="true">只使用识别</a>
 
 		
 
 		<a class="nav-link "
-		   id="dabcefTab" data-bs-toggle="tab" data-bs-target="#dabcef"
-		   type="button" role="tab" aria-controls="dabcef" aria-selected="true">可视化查看</a>
+		   id="adefbcTab" data-bs-toggle="tab" data-bs-target="#adefbc"
+		   type="button" role="tab" aria-controls="adefbc" aria-selected="true">可视化查看</a>
 
 		
 
@@ -853,7 +853,7 @@ <h3 id="使用示例">使用示例 <a href="#%e4%bd%bf%e7%94%a8%e7%a4%ba%e4%be%8
 
 
 
-<div class="tab-pane fade show active" id="dfcbea" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade show active" id="acbdfe" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -886,7 +886,7 @@ <h3 id="使用示例">使用示例 <a href="#%e4%bd%bf%e7%94%a8%e7%a4%ba%e4%be%8
 
 
 
-<div class="tab-pane fade" id="cdafbe" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="efcbda" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -919,7 +919,7 @@ <h3 id="使用示例">使用示例 <a href="#%e4%bd%bf%e7%94%a8%e7%a4%ba%e4%be%8
 
 
 
-<div class="tab-pane fade" id="edcfba" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="ceafdb" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -952,7 +952,7 @@ <h3 id="使用示例">使用示例 <a href="#%e4%bd%bf%e7%94%a8%e7%a4%ba%e4%be%8
 
 
 
-<div class="tab-pane fade" id="dabcef" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="adefbc" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -1894,8 +1894,8 @@ <h3 id="使用示例">使用示例 <a href="#%e4%bd%bf%e7%94%a8%e7%a4%ba%e4%be%8
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/install_usage/rapidocr/index.html b/docs/install_usage/rapidocr/index.html
index 9dbf250c..bfd2a239 100644
--- a/docs/install_usage/rapidocr/index.html
+++ b/docs/install_usage/rapidocr/index.html
@@ -1544,8 +1544,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/install_usage/rapidocr/install/index.html b/docs/install_usage/rapidocr/install/index.html
index 027776e6..0978ea65 100644
--- a/docs/install_usage/rapidocr/install/index.html
+++ b/docs/install_usage/rapidocr/install/index.html
@@ -1794,8 +1794,8 @@ <h4 id="安装">安装 <a href="#%e5%ae%89%e8%a3%85" class="anchor" aria-hidden=
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/install_usage/rapidocr/usage/index.html b/docs/install_usage/rapidocr/usage/index.html
index 204cf148..26708df4 100644
--- a/docs/install_usage/rapidocr/usage/index.html
+++ b/docs/install_usage/rapidocr/usage/index.html
@@ -865,32 +865,32 @@ <h3 id="输入">输入 <a href="#%e8%be%93%e5%85%a5" class="anchor" aria-hidden=
 		
 
 		<a class="nav-link  active"
-		   id="abcdfeTab" data-bs-toggle="tab" data-bs-target="#abcdfe"
-		   type="button" role="tab" aria-controls="abcdfe" aria-selected="true">str</a>
+		   id="dbfeacTab" data-bs-toggle="tab" data-bs-target="#dbfeac"
+		   type="button" role="tab" aria-controls="dbfeac" aria-selected="true">str</a>
 
 		
 
 		<a class="nav-link "
-		   id="fadbceTab" data-bs-toggle="tab" data-bs-target="#fadbce"
-		   type="button" role="tab" aria-controls="fadbce" aria-selected="true">np.ndarray</a>
+		   id="dbefcaTab" data-bs-toggle="tab" data-bs-target="#dbefca"
+		   type="button" role="tab" aria-controls="dbefca" aria-selected="true">np.ndarray</a>
 
 		
 
 		<a class="nav-link "
-		   id="cadebfTab" data-bs-toggle="tab" data-bs-target="#cadebf"
-		   type="button" role="tab" aria-controls="cadebf" aria-selected="true">PIL.Image.Image</a>
+		   id="aebcdfTab" data-bs-toggle="tab" data-bs-target="#aebcdf"
+		   type="button" role="tab" aria-controls="aebcdf" aria-selected="true">PIL.Image.Image</a>
 
 		
 
 		<a class="nav-link "
-		   id="fcedabTab" data-bs-toggle="tab" data-bs-target="#fcedab"
-		   type="button" role="tab" aria-controls="fcedab" aria-selected="true">Bytes</a>
+		   id="badefcTab" data-bs-toggle="tab" data-bs-target="#badefc"
+		   type="button" role="tab" aria-controls="badefc" aria-selected="true">Bytes</a>
 
 		
 
 		<a class="nav-link "
-		   id="ecfabdTab" data-bs-toggle="tab" data-bs-target="#ecfabd"
-		   type="button" role="tab" aria-controls="ecfabd" aria-selected="true">Path</a>
+		   id="cfebdaTab" data-bs-toggle="tab" data-bs-target="#cfebda"
+		   type="button" role="tab" aria-controls="cfebda" aria-selected="true">Path</a>
 
 		
 
@@ -906,7 +906,7 @@ <h3 id="输入">输入 <a href="#%e8%be%93%e5%85%a5" class="anchor" aria-hidden=
 
 
 
-<div class="tab-pane fade show active" id="abcdfe" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade show active" id="dbfeac" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -946,7 +946,7 @@ <h3 id="输入">输入 <a href="#%e8%be%93%e5%85%a5" class="anchor" aria-hidden=
 
 
 
-<div class="tab-pane fade" id="fadbce" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="dbefca" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -986,7 +986,7 @@ <h3 id="输入">输入 <a href="#%e8%be%93%e5%85%a5" class="anchor" aria-hidden=
 
 
 
-<div class="tab-pane fade" id="cadebf" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="aebcdf" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -1026,7 +1026,7 @@ <h3 id="输入">输入 <a href="#%e8%be%93%e5%85%a5" class="anchor" aria-hidden=
 
 
 
-<div class="tab-pane fade" id="fcedab" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="badefc" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -1068,7 +1068,7 @@ <h3 id="输入">输入 <a href="#%e8%be%93%e5%85%a5" class="anchor" aria-hidden=
 
 
 
-<div class="tab-pane fade" id="ecfabd" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="cfebda" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -1120,38 +1120,38 @@ <h3 id="输出">输出 <a href="#%e8%be%93%e5%87%ba" class="anchor" aria-hidden=
 		
 
 		<a class="nav-link  active"
-		   id="abdcefTab" data-bs-toggle="tab" data-bs-target="#abdcef"
-		   type="button" role="tab" aria-controls="abdcef" aria-selected="true">只有检测</a>
+		   id="fcbadeTab" data-bs-toggle="tab" data-bs-target="#fcbade"
+		   type="button" role="tab" aria-controls="fcbade" aria-selected="true">只有检测</a>
 
 		
 
 		<a class="nav-link "
-		   id="bafdceTab" data-bs-toggle="tab" data-bs-target="#bafdce"
-		   type="button" role="tab" aria-controls="bafdce" aria-selected="true">只有分类</a>
+		   id="dbcafeTab" data-bs-toggle="tab" data-bs-target="#dbcafe"
+		   type="button" role="tab" aria-controls="dbcafe" aria-selected="true">只有分类</a>
 
 		
 
 		<a class="nav-link "
-		   id="adfbecTab" data-bs-toggle="tab" data-bs-target="#adfbec"
-		   type="button" role="tab" aria-controls="adfbec" aria-selected="true">只有识别</a>
+		   id="dfbecaTab" data-bs-toggle="tab" data-bs-target="#dfbeca"
+		   type="button" role="tab" aria-controls="dfbeca" aria-selected="true">只有识别</a>
 
 		
 
 		<a class="nav-link "
-		   id="acebfdTab" data-bs-toggle="tab" data-bs-target="#acebfd"
-		   type="button" role="tab" aria-controls="acebfd" aria-selected="true">检测 &#43; 识别</a>
+		   id="ecbadfTab" data-bs-toggle="tab" data-bs-target="#ecbadf"
+		   type="button" role="tab" aria-controls="ecbadf" aria-selected="true">检测 &#43; 识别</a>
 
 		
 
 		<a class="nav-link "
-		   id="becdfaTab" data-bs-toggle="tab" data-bs-target="#becdfa"
-		   type="button" role="tab" aria-controls="becdfa" aria-selected="true">分类 &#43; 识别</a>
+		   id="dacfebTab" data-bs-toggle="tab" data-bs-target="#dacfeb"
+		   type="button" role="tab" aria-controls="dacfeb" aria-selected="true">分类 &#43; 识别</a>
 
 		
 
 		<a class="nav-link "
-		   id="adebcfTab" data-bs-toggle="tab" data-bs-target="#adebcf"
-		   type="button" role="tab" aria-controls="adebcf" aria-selected="true">检测 &#43; 分类 &#43; 识别</a>
+		   id="ebcfdaTab" data-bs-toggle="tab" data-bs-target="#ebcfda"
+		   type="button" role="tab" aria-controls="ebcfda" aria-selected="true">检测 &#43; 分类 &#43; 识别</a>
 
 		
 
@@ -1167,7 +1167,7 @@ <h3 id="输出">输出 <a href="#%e8%be%93%e5%87%ba" class="anchor" aria-hidden=
 
 
 
-<div class="tab-pane fade show active" id="abdcef" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade show active" id="fcbade" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -1231,7 +1231,7 @@ <h3 id="输出">输出 <a href="#%e8%be%93%e5%87%ba" class="anchor" aria-hidden=
 
 
 
-<div class="tab-pane fade" id="bafdce" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="dbcafe" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -1294,7 +1294,7 @@ <h3 id="输出">输出 <a href="#%e8%be%93%e5%87%ba" class="anchor" aria-hidden=
 
 
 
-<div class="tab-pane fade" id="adfbec" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="dfbeca" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -1360,7 +1360,7 @@ <h3 id="输出">输出 <a href="#%e8%be%93%e5%87%ba" class="anchor" aria-hidden=
 
 
 
-<div class="tab-pane fade" id="acebfd" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="ecbadf" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -1427,7 +1427,7 @@ <h3 id="输出">输出 <a href="#%e8%be%93%e5%87%ba" class="anchor" aria-hidden=
 
 
 
-<div class="tab-pane fade" id="becdfa" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="dacfeb" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -1493,7 +1493,7 @@ <h3 id="输出">输出 <a href="#%e8%be%93%e5%87%ba" class="anchor" aria-hidden=
 
 
 
-<div class="tab-pane fade" id="adebcf" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="ebcfda" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -1583,14 +1583,14 @@ <h3 id="可视化查看结果">可视化查看结果 <a href="#%e5%8f%af%e8%a7%8
 		
 
 		<a class="nav-link  active"
-		   id="aefcbdTab" data-bs-toggle="tab" data-bs-target="#aefcbd"
-		   type="button" role="tab" aria-controls="aefcbd" aria-selected="true">只可视化检测</a>
+		   id="edbafcTab" data-bs-toggle="tab" data-bs-target="#edbafc"
+		   type="button" role="tab" aria-controls="edbafc" aria-selected="true">只可视化检测</a>
 
 		
 
 		<a class="nav-link "
-		   id="edfabcTab" data-bs-toggle="tab" data-bs-target="#edfabc"
-		   type="button" role="tab" aria-controls="edfabc" aria-selected="true">可视化检测和识别</a>
+		   id="dcaefbTab" data-bs-toggle="tab" data-bs-target="#dcaefb"
+		   type="button" role="tab" aria-controls="dcaefb" aria-selected="true">可视化检测和识别</a>
 
 		
 
@@ -1606,7 +1606,7 @@ <h3 id="可视化查看结果">可视化查看结果 <a href="#%e5%8f%af%e8%a7%8
 
 
 
-<div class="tab-pane fade show active" id="aefcbd" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade show active" id="edbafc" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -1652,7 +1652,7 @@ <h3 id="可视化查看结果">可视化查看结果 <a href="#%e5%8f%af%e8%a7%8
 
 
 
-<div class="tab-pane fade" id="edfabc" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="dcaefb" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -2609,8 +2609,8 @@ <h3 id="可视化查看结果">可视化查看结果 <a href="#%e5%8f%af%e8%a7%8
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/install_usage/rapidocr_api/index.html b/docs/install_usage/rapidocr_api/index.html
index 20de10da..2afba5f9 100644
--- a/docs/install_usage/rapidocr_api/index.html
+++ b/docs/install_usage/rapidocr_api/index.html
@@ -843,14 +843,14 @@ <h4 id="python调用">Python调用 <a href="#python%e8%b0%83%e7%94%a8" class="an
 		
 
 		<a class="nav-link  active"
-		   id="cebdfaTab" data-bs-toggle="tab" data-bs-target="#cebdfa"
-		   type="button" role="tab" aria-controls="cebdfa" aria-selected="true">以文件方式发送POST请求</a>
+		   id="ecbfadTab" data-bs-toggle="tab" data-bs-target="#ecbfad"
+		   type="button" role="tab" aria-controls="ecbfad" aria-selected="true">以文件方式发送POST请求</a>
 
 		
 
 		<a class="nav-link "
-		   id="dcfabeTab" data-bs-toggle="tab" data-bs-target="#dcfabe"
-		   type="button" role="tab" aria-controls="dcfabe" aria-selected="true">以base64方式发送POST请求</a>
+		   id="cedfbaTab" data-bs-toggle="tab" data-bs-target="#cedfba"
+		   type="button" role="tab" aria-controls="cedfba" aria-selected="true">以base64方式发送POST请求</a>
 
 		
 
@@ -866,7 +866,7 @@ <h4 id="python调用">Python调用 <a href="#python%e8%b0%83%e7%94%a8" class="an
 
 
 
-<div class="tab-pane fade show active" id="cebdfa" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade show active" id="ecbfad" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -908,7 +908,7 @@ <h4 id="python调用">Python调用 <a href="#python%e8%b0%83%e7%94%a8" class="an
 
 
 
-<div class="tab-pane fade" id="dcfabe" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="cedfba" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -1979,8 +1979,8 @@ <h3 id="api输出">API输出 <a href="#api%e8%be%93%e5%87%ba" class="anchor" ari
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/install_usage/rapidocr_paddle/index.html b/docs/install_usage/rapidocr_paddle/index.html
index 925dbc2d..c3e56b4a 100644
--- a/docs/install_usage/rapidocr_paddle/index.html
+++ b/docs/install_usage/rapidocr_paddle/index.html
@@ -793,14 +793,14 @@ <h4 id="使用">使用 <a href="#%e4%bd%bf%e7%94%a8" class="anchor" aria-hidden=
 		
 
 		<a class="nav-link  active"
-		   id="facbdeTab" data-bs-toggle="tab" data-bs-target="#facbde"
-		   type="button" role="tab" aria-controls="facbde" aria-selected="true">CPU端推理</a>
+		   id="fedbacTab" data-bs-toggle="tab" data-bs-target="#fedbac"
+		   type="button" role="tab" aria-controls="fedbac" aria-selected="true">CPU端推理</a>
 
 		
 
 		<a class="nav-link "
-		   id="bacfedTab" data-bs-toggle="tab" data-bs-target="#bacfed"
-		   type="button" role="tab" aria-controls="bacfed" aria-selected="true">GPU端推理</a>
+		   id="fbcdaeTab" data-bs-toggle="tab" data-bs-target="#fbcdae"
+		   type="button" role="tab" aria-controls="fbcdae" aria-selected="true">GPU端推理</a>
 
 		
 
@@ -816,7 +816,7 @@ <h4 id="使用">使用 <a href="#%e4%bd%bf%e7%94%a8" class="anchor" aria-hidden=
 
 
 
-<div class="tab-pane fade show active" id="facbde" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade show active" id="fedbac" role="tabpanel" aria-labelledby="nav-1">
 
 	<p>前提是安装了CPU版的PaddlePaddle</p>
 
@@ -859,7 +859,7 @@ <h4 id="使用">使用 <a href="#%e4%bd%bf%e7%94%a8" class="anchor" aria-hidden=
 
 
 
-<div class="tab-pane fade" id="bacfed" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="fbcdae" role="tabpanel" aria-labelledby="nav-1">
 
 	<p>前提是安装了GPU版的PaddlePaddle，注意在实例化<code>RapidOCR</code>类时，需要通过参数显式指定使用GPU。</p>
 
@@ -1844,8 +1844,8 @@ <h4 id="推理速度比较">推理速度比较 <a href="#%e6%8e%a8%e7%90%86%e9%8
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/install_usage/rapidocr_web/desktop_usage/index.html b/docs/install_usage/rapidocr_web/desktop_usage/index.html
index 980ece90..d8b52fe2 100644
--- a/docs/install_usage/rapidocr_web/desktop_usage/index.html
+++ b/docs/install_usage/rapidocr_web/desktop_usage/index.html
@@ -1816,8 +1816,8 @@ <h4 id="使用步骤">使用步骤 <a href="#%e4%bd%bf%e7%94%a8%e6%ad%a5%e9%aa%a
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/install_usage/rapidocr_web/index.html b/docs/install_usage/rapidocr_web/index.html
index 80cd7afb..b6f6df63 100644
--- a/docs/install_usage/rapidocr_web/index.html
+++ b/docs/install_usage/rapidocr_web/index.html
@@ -1577,8 +1577,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/install_usage/rapidocr_web/nuitka_package/index.html b/docs/install_usage/rapidocr_web/nuitka_package/index.html
index 432b53fd..17e8cea0 100644
--- a/docs/install_usage/rapidocr_web/nuitka_package/index.html
+++ b/docs/install_usage/rapidocr_web/nuitka_package/index.html
@@ -1832,8 +1832,8 @@ <h4 id="补充">补充 <a href="#%e8%a1%a5%e5%85%85" class="anchor" aria-hidden=
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/install_usage/rapidocr_web/ocrweb_multi/index.html b/docs/install_usage/rapidocr_web/ocrweb_multi/index.html
index bd72b172..b96e151f 100644
--- a/docs/install_usage/rapidocr_web/ocrweb_multi/index.html
+++ b/docs/install_usage/rapidocr_web/ocrweb_multi/index.html
@@ -1787,8 +1787,8 @@ <h3 id="运行步骤">运行步骤 <a href="#%e8%bf%90%e8%a1%8c%e6%ad%a5%e9%aa%a
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/install_usage/rapidocr_web/pyinstaller/index.html b/docs/install_usage/rapidocr_web/pyinstaller/index.html
index 605a3b88..4bfdce8a 100644
--- a/docs/install_usage/rapidocr_web/pyinstaller/index.html
+++ b/docs/install_usage/rapidocr_web/pyinstaller/index.html
@@ -1590,8 +1590,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/install_usage/rapidocr_web/rapidocr_web/index.html b/docs/install_usage/rapidocr_web/rapidocr_web/index.html
index 6df5d65c..902b1f7d 100644
--- a/docs/install_usage/rapidocr_web/rapidocr_web/index.html
+++ b/docs/install_usage/rapidocr_web/rapidocr_web/index.html
@@ -1733,8 +1733,8 @@ <h3 id="使用">使用 <a href="#%e4%bd%bf%e7%94%a8" class="anchor" aria-hidden=
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/online_demo/index.html b/docs/online_demo/index.html
index c1890790..c5ec83d6 100644
--- a/docs/online_demo/index.html
+++ b/docs/online_demo/index.html
@@ -1636,8 +1636,8 @@ <h4 id="在线demo">在线Demo <a href="#%e5%9c%a8%e7%ba%bfdemo" class="anchor"
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/other_programing_lan/index.html b/docs/other_programing_lan/index.html
index 9dde0bd0..d40f1c21 100644
--- a/docs/other_programing_lan/index.html
+++ b/docs/other_programing_lan/index.html
@@ -1632,8 +1632,8 @@ <h4 id="net范例chttpsgithubcomrapidairapidocrcsharp"><a href="https://github.c
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/overview/index.html b/docs/overview/index.html
index c58a9f91..b7b14d1c 100644
--- a/docs/overview/index.html
+++ b/docs/overview/index.html
@@ -1671,8 +1671,8 @@ <h3 id="相关产品概览图">相关产品概览图 <a href="#%e7%9b%b8%e5%85%b
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/quickstart/index.html b/docs/quickstart/index.html
index 20b95fd5..5c328fa0 100644
--- a/docs/quickstart/index.html
+++ b/docs/quickstart/index.html
@@ -724,14 +724,14 @@ <h3 id="2-使用">2. 使用 <a href="#2-%e4%bd%bf%e7%94%a8" class="anchor" aria-
 		
 
 		<a class="nav-link  active"
-		   id="fedbcaTab" data-bs-toggle="tab" data-bs-target="#fedbca"
-		   type="button" role="tab" aria-controls="fedbca" aria-selected="true">终端使用</a>
+		   id="daefbcTab" data-bs-toggle="tab" data-bs-target="#daefbc"
+		   type="button" role="tab" aria-controls="daefbc" aria-selected="true">终端使用</a>
 
 		
 
 		<a class="nav-link "
-		   id="cedfbaTab" data-bs-toggle="tab" data-bs-target="#cedfba"
-		   type="button" role="tab" aria-controls="cedfba" aria-selected="true">Python使用</a>
+		   id="cfabedTab" data-bs-toggle="tab" data-bs-target="#cfabed"
+		   type="button" role="tab" aria-controls="cfabed" aria-selected="true">Python使用</a>
 
 		
 
@@ -747,7 +747,7 @@ <h3 id="2-使用">2. 使用 <a href="#2-%e4%bd%bf%e7%94%a8" class="anchor" aria-
 
 
 
-<div class="tab-pane fade show active" id="fedbca" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade show active" id="daefbc" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -780,7 +780,7 @@ <h3 id="2-使用">2. 使用 <a href="#2-%e4%bd%bf%e7%94%a8" class="anchor" aria-
 
 
 
-<div class="tab-pane fade" id="cedfba" role="tabpanel" aria-labelledby="nav-1">
+<div class="tab-pane fade" id="cfabed" role="tabpanel" aria-labelledby="nav-1">
 
 	
 
@@ -1768,8 +1768,8 @@ <h3 id="3-查看效果">3. 查看效果 <a href="#3-%e6%9f%a5%e7%9c%8b%e6%95%88%
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/related_projects/derivatives_projects/index.html b/docs/related_projects/derivatives_projects/index.html
index e8641ba4..bcc9f405 100644
--- a/docs/related_projects/derivatives_projects/index.html
+++ b/docs/related_projects/derivatives_projects/index.html
@@ -1628,8 +1628,8 @@ <h4 id="rapidocrserverhttpsgithubcomphystonrapidocrserverrapidocr-http服务win3
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/related_projects/index.html b/docs/related_projects/index.html
index 5815366e..d8f7b2fd 100644
--- a/docs/related_projects/index.html
+++ b/docs/related_projects/index.html
@@ -1518,8 +1518,8 @@ <h1 class="content-title mb-0">
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/related_projects/index.xml b/docs/related_projects/index.xml
index 1a8e513d..eddcc59d 100644
--- a/docs/related_projects/index.xml
+++ b/docs/related_projects/index.xml
@@ -30,7 +30,7 @@ ReadingBank 手写体识别 linkTODO
 单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。
 这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。
 有关数据集：IBEM 和中文 CnMFD_Dataset
-发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：
+发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：
 PubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：</description>
     </item>
     
diff --git a/docs/related_projects/related_projects/index.html b/docs/related_projects/related_projects/index.html
index 9d243191..3772388c 100644
--- a/docs/related_projects/related_projects/index.html
+++ b/docs/related_projects/related_projects/index.html
@@ -41,12 +41,12 @@
 单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。
 这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。
 有关数据集：IBEM 和中文 CnMFD_Dataset
-发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr&#43;&#43; | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：
+发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr&#43;&#43; | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：
 PubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：" />
 <meta property="og:type" content="article" />
 <meta property="og:url" content="https://rapidai.github.io/RapidOCRDocs/docs/related_projects/related_projects/" /><meta property="og:image" content="https://rapidai.github.io/RapidOCRDocs/opengraph/card-base-2_hu06b1a92291a380a0d2e0ec03dab66b2f_17642_filter_15172179912961098941.png"/><meta property="article:section" content="docs" />
 
-<meta property="article:modified_time" content="2024-04-28T11:13:30+08:00" /><meta name="twitter:card" content="summary_large_image"/>
+<meta property="article:modified_time" content="2024-05-14T18:34:39+08:00" /><meta name="twitter:card" content="summary_large_image"/>
 <meta name="twitter:image" content="https://rapidai.github.io/RapidOCRDocs/opengraph/card-base-2_hu06b1a92291a380a0d2e0ec03dab66b2f_17642_filter_15172179912961098941.png"/>
 <meta name="twitter:title" content="垂直项目(偏学术)"/>
 <meta name="twitter:description" content="以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：
@@ -57,7 +57,7 @@
 单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。
 这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。
 有关数据集：IBEM 和中文 CnMFD_Dataset
-发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr&#43;&#43; | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：
+发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr&#43;&#43; | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：
 PubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集："/>
 
     
@@ -765,6 +765,7 @@ <h3 id="文档增强">文档增强 <a href="#%e6%96%87%e6%a1%a3%e5%a2%9e%e5%bc%b
 <h3 id="文档图像矫正">文档图像矫正 <a href="#%e6%96%87%e6%a1%a3%e5%9b%be%e5%83%8f%e7%9f%ab%e6%ad%a3" class="anchor" aria-hidden="true"><i class="material-icons align-middle">link</i></a></h3><ul>
 <li><a href="https://github.com/cvlab-stonybrook/PaperEdge" rel="external" target="_blank">PaperEdge<svg width="16" height="16" viewBox="0 0 24 24" xmlns="http://www.w3.org/2000/svg"><path fill="currentColor" d="M14 5c-.552 0-1-.448-1-1s.448-1 1-1h6c.552 0 1 .448 1 1v6c0 .552-.448 1-1 1s-1-.448-1-1v-3.586l-7.293 7.293c-.391.39-1.024.39-1.414 0-.391-.391-.391-1.024 0-1.414l7.293-7.293h-3.586zm-9 2c-.552 0-1 .448-1 1v11c0 .552.448 1 1 1h11c.552 0 1-.448 1-1v-4.563c0-.552.448-1 1-1s1 .448 1 1v4.563c0 1.657-1.343 3-3 3h-11c-1.657 0-3-1.343-3-3v-11c0-1.657 1.343-3 3-3h4.563c.552 0 1 .448 1 1s-.448 1-1 1h-4.563z"/></svg></a>：文档图像矫正 | <a href="https://huggingface.co/spaces/SWHL/PaperEdgeDemo" rel="external" target="_blank">Demo<svg width="16" height="16" viewBox="0 0 24 24" xmlns="http://www.w3.org/2000/svg"><path fill="currentColor" d="M14 5c-.552 0-1-.448-1-1s.448-1 1-1h6c.552 0 1 .448 1 1v6c0 .552-.448 1-1 1s-1-.448-1-1v-3.586l-7.293 7.293c-.391.39-1.024.39-1.414 0-.391-.391-.391-1.024 0-1.414l7.293-7.293h-3.586zm-9 2c-.552 0-1 .448-1 1v11c0 .552.448 1 1 1h11c.552 0 1-.448 1-1v-4.563c0-.552.448-1 1-1s1 .448 1 1v4.563c0 1.657-1.343 3-3 3h-11c-1.657 0-3-1.343-3-3v-11c0-1.657 1.343-3 3-3h4.563c.552 0 1 .448 1 1s-.448 1-1 1h-4.563z"/></svg></a></li>
 <li><a href="https://arxiv.org/pdf/2304.08796.pdf" rel="external" target="_blank">DocTr++<svg width="16" height="16" viewBox="0 0 24 24" xmlns="http://www.w3.org/2000/svg"><path fill="currentColor" d="M14 5c-.552 0-1-.448-1-1s.448-1 1-1h6c.552 0 1 .448 1 1v6c0 .552-.448 1-1 1s-1-.448-1-1v-3.586l-7.293 7.293c-.391.39-1.024.39-1.414 0-.391-.391-.391-1.024 0-1.414l7.293-7.293h-3.586zm-9 2c-.552 0-1 .448-1 1v11c0 .552.448 1 1 1h11c.552 0 1-.448 1-1v-4.563c0-.552.448-1 1-1s1 .448 1 1v4.563c0 1.657-1.343 3-3 3h-11c-1.657 0-3-1.343-3-3v-11c0-1.657 1.343-3 3-3h4.563c.552 0 1 .448 1 1s-.448 1-1 1h-4.563z"/></svg></a> | <a href="https://demo.doctrp.top/" rel="external" target="_blank">Demo<svg width="16" height="16" viewBox="0 0 24 24" xmlns="http://www.w3.org/2000/svg"><path fill="currentColor" d="M14 5c-.552 0-1-.448-1-1s.448-1 1-1h6c.552 0 1 .448 1 1v6c0 .552-.448 1-1 1s-1-.448-1-1v-3.586l-7.293 7.293c-.391.39-1.024.39-1.414 0-.391-.391-.391-1.024 0-1.414l7.293-7.293h-3.586zm-9 2c-.552 0-1 .448-1 1v11c0 .552.448 1 1 1h11c.552 0 1-.448 1-1v-4.563c0-.552.448-1 1-1s1 .448 1 1v4.563c0 1.657-1.343 3-3 3h-11c-1.657 0-3-1.343-3-3v-11c0-1.657 1.343-3 3-3h4.563c.552 0 1 .448 1 1s-.448 1-1 1h-4.563z"/></svg></a> | <a href="https://github.com/fh2019ustc/DocTr-Plus" rel="external" target="_blank">Code<svg width="16" height="16" viewBox="0 0 24 24" xmlns="http://www.w3.org/2000/svg"><path fill="currentColor" d="M14 5c-.552 0-1-.448-1-1s.448-1 1-1h6c.552 0 1 .448 1 1v6c0 .552-.448 1-1 1s-1-.448-1-1v-3.586l-7.293 7.293c-.391.39-1.024.39-1.414 0-.391-.391-.391-1.024 0-1.414l7.293-7.293h-3.586zm-9 2c-.552 0-1 .448-1 1v11c0 .552.448 1 1 1h11c.552 0 1-.448 1-1v-4.563c0-.552.448-1 1-1s1 .448 1 1v4.563c0 1.657-1.343 3-3 3h-11c-1.657 0-3-1.343-3-3v-11c0-1.657 1.343-3 3-3h4.563c.552 0 1 .448 1 1s-.448 1-1 1h-4.563z"/></svg></a></li>
+<li><a href="https://github.com/ZZZHANG-jx/DocRes" rel="external" target="_blank">DocRes<svg width="16" height="16" viewBox="0 0 24 24" xmlns="http://www.w3.org/2000/svg"><path fill="currentColor" d="M14 5c-.552 0-1-.448-1-1s.448-1 1-1h6c.552 0 1 .448 1 1v6c0 .552-.448 1-1 1s-1-.448-1-1v-3.586l-7.293 7.293c-.391.39-1.024.39-1.414 0-.391-.391-.391-1.024 0-1.414l7.293-7.293h-3.586zm-9 2c-.552 0-1 .448-1 1v11c0 .552.448 1 1 1h11c.552 0 1-.448 1-1v-4.563c0-.552.448-1 1-1s1 .448 1 1v4.563c0 1.657-1.343 3-3 3h-11c-1.657 0-3-1.343-3-3v-11c0-1.657 1.343-3 3-3h4.563c.552 0 1 .448 1 1s-.448 1-1 1h-4.563z"/></svg></a>： 统一文档图像恢复任务的广义模型</li>
 </ul>
 <h3 id="版面分析">版面分析 <a href="#%e7%89%88%e9%9d%a2%e5%88%86%e6%9e%90" class="anchor" aria-hidden="true"><i class="material-icons align-middle">link</i></a></h3><ul>
 <li>相关论文和帖子：
@@ -928,9 +929,9 @@ <h3 id="印章ocr">印章OCR <a href="#%e5%8d%b0%e7%ab%a0ocr" class="anchor" ari
     <div id="last-modified" class="mt-1">
         <p class="mb-0 fw-semibold">Last updated <span
             id="relativetime"
-            data-authdate="2024-04-28T11:13:30&#43;0800"
-            title="28 Apr 2024, 11:13 &#43;0800">
-            28 Apr 2024, 11:13 &#43;0800
+            data-authdate="2024-05-14T18:34:39&#43;0800"
+            title="14 May 2024, 18:34 &#43;0800">
+            14 May 2024, 18:34 &#43;0800
         </span>. <span class="material-icons size-20 align-text-bottom opacity-75">history</span>
         </p>
     </div>
@@ -1788,8 +1789,8 @@ <h3 id="印章ocr">印章OCR <a href="#%e5%8d%b0%e7%ab%a0ocr" class="anchor" ari
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/docs/sponsor/index.html b/docs/sponsor/index.html
index a1c777ba..41eb34e8 100644
--- a/docs/sponsor/index.html
+++ b/docs/sponsor/index.html
@@ -1631,8 +1631,8 @@ <h4 id="buy-me-a-coffee">Buy me a Coffee <a href="#buy-me-a-coffee" class="ancho
                 id:  34 ,
                 href: "\/RapidOCRDocs\/docs\/related_projects\/related_projects\/",
                 title: "垂直项目(偏学术)",
-                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
-                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
+                description: "以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：",
+                content: " 以下几个方向，每个都是比较独立的方向，但是却和OCR有着千丝万缕的关系，关于它们的资料就像散落在天空中的星星一般，散发着微弱的光芒，这里要做的就是将这些点点光芒聚集起来。 这里将会汇总出以下几个OCR周边项目的一些文档和资源，包括学术动态和一些工程化代码。 欢迎各位小伙伴提供PR。 阅读序列抽取 link数据集：\nReadingBank 手写体识别 linkTODO\n手写体公式识别 linkTODO\n公式识别 linkTODO\n公式检测 link图像中公式检测需求一般出现于文档分析和还原需求中。\n单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。\n这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。\n有关数据集：IBEM 和中文 CnMFD_Dataset\n发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：\nPubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：\nCDLA：中文文档版面分析数据集，面向中文文献类（论文）场景，总共6000张（5000训练，1000测试），分为10类：正文、标题、图片、图片标题、表格、表格标题、页眉、页脚、注释和公式。 表格结构识别 link 相关论文和帖子： OCR之表格结构识别综述 合合信息：表格识别与内容提炼技术理解及研发趋势 论文阅读: （ICDAR2021 海康威视）LGPMA（表格识别算法）及官方源码对应解读 相关工程： 海康官方LGPMA源码 LGPMA Inference PaddleOCR Table 数据集汇总： 英文表格识别数据集： PubTabNet: IBM构建，568k+文档图像数据，包括表格图像和对应的HTML标注。 视频OCR link 相关论文和帖子： 【NeurIPS2021】A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer | 博客解读 【ACM MM 2019】You only recognize once: Towards fast video text spotting 相关工程： video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件 RapidVideOCR: 提取视频中硬字幕 数据集汇总： BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出，大规模双语开放场景下的视频文本基准数据集，该数据集主要提供了2000+视频，1,750,000帧开放视频场景的视频。同时，还提供了丰富的标注类型（标题、字幕、场景文本等）。该数据集支持四个任务：视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。 卡证OCR link 相关论文和帖子： 相关工程： fake_certificate_generator: 假的证件合成器，包括身份证、驾驶证、营业执照。 数据集汇总： 暂无，一般这类数据较为敏感，通常都合成假数据来使用。 印章OCR link 相关论文和帖子： 来也智能文档处理系统中的印章识别实践 【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势 基于文字分割的印章识别技术 相关工程： JS生成印章 Python绘制透明背景印章 在线印章合成大全网站 TrOCR-Seal-Recognition 数据集汇总： DocDiff "
             }
         );
     index.add(
diff --git a/index.xml b/index.xml
index d59bf7a7..dfd4b657 100644
--- a/index.xml
+++ b/index.xml
@@ -312,7 +312,7 @@ ReadingBank 手写体识别 linkTODO
 单纯公式检测任务包括对行内公式和行间公式的检测。而版面分析任务中，仅有对行间公式的标注，缺乏行内公式标注。如果想要精细化做版面还原，行内公式的检测识别就变得尤为重要。
 这一块的工作，breezedeus做得比较好，详情可以参见其博客：Pix2Text (P2T) 新版公式检测模型。
 有关数据集：IBEM 和中文 CnMFD_Dataset
-发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：
+发票识别 link CSIG 2022 Competition on Invoice Recognition and Analysis 图像文字擦除 link CTRNet：图像文字擦除 | Demo 文档增强 link DocDiff（Github）: 文档增强模型，可以用于文档去模糊、文档去噪、文档二值化、文档去水印和印章等任务。 文档图像矫正 link PaperEdge：文档图像矫正 | Demo DocTr++ | Demo | Code DocRes： 统一文档图像恢复任务的广义模型 版面分析 link 相关论文和帖子： 版面分析方法汇总 相关工程： PaddleOCR Layout 海康DAVAR VSR 数据集汇总： 英文版面分析数据集：
 PubLayNet: IBM构建，34万张图像，分为5类：text, title list table figure。 DocBank：微软亚洲研究院构建，50万英文文档图像，分为12类：摘要、作者、标题、公式、图形、页脚、列表、段落、参考、节标题、表格和文章标题。 D4LA: 阿里通义实验室构建，11092张图像，12个文档种类，27个类别，手工标注。详情可参见论文Vision Grid Transformer for Document Layout Analysis 中文版面分析数据集：</description>
     </item>
     
diff --git a/sitemap.xml b/sitemap.xml
index 959a601d..d91020cc 100644
--- a/sitemap.xml
+++ b/sitemap.xml
@@ -105,7 +105,7 @@
     <lastmod>2024-04-24T09:27:46+08:00</lastmod>
   </url><url>
     <loc>https://rapidai.github.io/RapidOCRDocs/docs/related_projects/related_projects/</loc>
-    <lastmod>2024-04-28T11:13:30+08:00</lastmod>
+    <lastmod>2024-05-14T18:34:39+08:00</lastmod>
   </url><url>
     <loc>https://rapidai.github.io/RapidOCRDocs/docs/faq/</loc>
     <lastmod>2024-04-24T09:27:46+08:00</lastmod>
@@ -150,7 +150,7 @@
     <lastmod>2024-05-12T15:24:22+08:00</lastmod>
   </url><url>
     <loc>https://rapidai.github.io/RapidOCRDocs/</loc>
-    <lastmod>2024-05-12T15:24:22+08:00</lastmod>
+    <lastmod>2024-05-14T18:34:39+08:00</lastmod>
   </url><url>
     <loc>https://rapidai.github.io/RapidOCRDocs/categories/</loc>
   </url><url>