点击后续列表的版本号链接,可前往对应备份分支页面。
部分备份分支含有体积较大的二进制库,会让你花费长时间下载。因此,建议只下载你需要用的分支。
方法1:将所需的分支,fork到你自己的账号下,然后clone你自己仓库。
方法2:使用以下命令手动clone指定分支:
git clone --single-branch --branch [分支名] https://github.com/hiroi-sora/Umi-OCR.git
方法3:在本仓库手动下载指定分支的zip源码包。
[分支名]
可以是 main
、release/2.0.0
等,详见下方列表。
main
、dev
等分支,可能含有开发中的不稳定的新功能。如果用于研究学习或二次开发,建议选择 release
开头的分支。
分支名:main
- 修复:引擎原始输出项的"text"为空时,导致文本分析越界的错误。 (#625)
- 新增UI语言:葡萄牙语
Português
。译者:@杨鹏 - PaddleOCR 插件相关:
- 修复:布尔类型选项不生效的问题。
- 修复:
繁体中文
配置文件错误的问题。 - 优化:调整默认线程/内存限制,默认内存占用不超过系统总内存的一半。
- 优化:调整识别语言库结构,精简不必要的文件。
- Linux 版本相关:
- 修复:Docker 部署 在部分旧系统中报错
'code': 803
的问题。(#621) - 优化:
glibc
依赖降级至2.31
,兼容 Debian-11 、 Ubuntu-20 等发行版。
- 修复:Docker 部署 在部分旧系统中报错
v2.1.3 2024.7.23
分支名:release/2.1.3
- 新兼容 Linux 平台。
- 支持:Docker 部署 。
- 新增:HTTP 文档识别接口。👉 文档
- 修复:文档中宽高为0的异常图片会导致任务卡住。
- 优化:排版解析的 单栏-单行 方案,对于间隔较大的两个相邻文本块,会添加空格作为间隔符。
v2.1.2 2024.6.5
分支名:release/2.1.2
- 新增:批量任务(图片、文档)支持 暂停任务 。只要不退出软件,在待机/休眠后可以恢复任务。 (#469)
- 新增:批量文档任务,支持保存为 单层纯文本PDF 。
- 新增:HTTP OCR接口 允许设置 忽略区域 参数。 (#525)
- 新增:HTTP 二维码接口 允许设置 图像预处理 参数。 (#512)
- 新增:命令行
--screenshot
允许指定屏幕范围,自动进行截图。 (#452) - 修复:文档内容提取和写入时的坐标旋转、比例适配问题。
- 修复:截图预览 & 记录面板中,跨区块复制文本时,尾块的复制字数不正确。
- 优化:批量文档标签页,拖入大量文件、提交大批任务时的性能和流畅度。 (#476)
- UI:优化一些布局,美化一些视觉效果。
v2.1.1 2024.3.29
分支名:release/2.1.1
- 新增:批量文档识别允许指定忽略区域的页数范围。
- 新增:命令行
--path
允许传入多个图片或文件夹。 - 新增:新的命令行、HTTP接口:识别/生成二维码图像。
- 新增:命令行新指令
--output
,--output_append
,--clip
。 - 新增:清空全部识别记录的快捷键。 (#420)
- 新增:截图预览 删除图片显示的选项和快捷键。 (#427)
- 修复:Esc取消截图的消息传递错误。 (#402)
- 修复:文档
整页强制OCR
模式下,提高小尺寸页面的渲染精度。 - 修复:Windows7及低端CPU无法进行文档识别的Bug。
- 优化:开始菜单/开机自启快捷方式,默认放置于用户目录下,避免请求管理员权限。
- 优化:保存双层PDF,在没有新文本写入时的处理逻辑。 (#416)
- 优化:PDF解析时,提取原有文本行的逻辑。
- 优化:双栏面板会记忆左右折叠状态。
- UI:优化一些提示,修复一些渲染问题,美化一些视觉效果。
v2.1.0 2024.2.29
分支名:release/2.1.0
- 新增:批量文档识别功能。支持
pdf, epub, mobi
等格式。 - 新增:允许隐藏托盘图标。 (#338)
- 新增:重复上一次截图区域的快捷键。 (#357)
- 新增:用本地图片浏览器打开图片的快捷按钮。 (#335)
- 更新:更强大的排版解析器。
- 修复:避免系统环境变量
QMLSCENE_DEVICE
的影响。 (#270)
v2.0.2 2024.1.15
分支名:release/2.0.2
- 更新:全局设置可调节 图片文字叠加层
开启/关闭
默认显示状态。 (#264) - 优化:输出为
txt 单独文件
时,将应用指定路径
参数。 (#269) - 优化:
段落合并-多行-代码段
去除结尾多余换行符。 (#292) - 优化:渲染器不兼容时,减少渲染层级错误的影响。 (#259)
- 修复:清理图片缓存前进行检查,避免空图错误。 (#279)
- 修复:记录面板中,光标无法移到第1个字符前面。 (#264)
- 修复:系统语言非简体中文时,软件启动异常。 (#274) (#306)
- 修复:csv输出的字符编码兼容性问题。 (#284)
- 修复:
段落合并参数不存在
的误报。 - 修复:组件
DefaultTips
不生效。
v2.0.1 2023.12.8
分支名:release/2.0.1
- 更新:重新设计了OCR HTTP接口,允许省略参数,允许指定段落合并。
- 更新:命令行增加指令
-->
和-->>
,将结果输出到文件。 - 优化:调整图像数据的内部编码,减少英文空格丢失的几率。
- 优化:调整部分UI文本和布局。
- 优化:csv默认保存为ansi编码,以兼容Office Excel。 (#237)
- 修复:开启“禁用美化效果”后,外部通知弹窗无法关闭。 (#234)
- 修复:别的程序通过命令行调用Umi-OCR时,无法获取stdout输出。
v2.0.0 2023.11.19
分支名:release/2.0.0
- 优化:插件UI翻译机制。
- 优化:下拉框UI。
- 修复:段落合并-自然段合并的bug。
- 新增:生成二维码功能。
- 新增:所有图片预览窗口(如截图、二维码页),允许保存图片到指定路径。
- 优化:二维码解析库改用性能更好、功能更丰富的zxingcpp。 (v2 #47) (感谢:@Byxs20)
- 优化:截图预览面板中,文本框的位置更准确。
- 修复:图片预览窗口,无法复制本地图片的Bug。
- 修复:tbpu合并自然段时,垂直距离不准确的Bug。
- 修复:HTTP API 的跨域问题。 v2 #52
- 修复:HTTP API 传base64的大小限制问题。 v2 #49
- 修复:其它少量报错。
- 翻译:人工校对
繁体中文
和英语
。 (贡献:@QZGao)
- 新增:记忆窗口位置。 v2 #44
- 新增:批量识图页增加图片预览窗口,单击图片条目打开。 v2 #2
- 新增:检查软件是否有权限读写配置文件。 v2 #30
- 新增:报错弹窗提供一键复制及打开issues的功能。
- 新增:全局设置页添加左侧目录栏。
- 新增:插件的多国语言UI机制。
- 优化:截图预览面板中,文本框的位置更准确。
- 优化:调整部分UI布置。
- 修复:扫码模块添加导入异常检查。 v2 #33
- 修复:补充扫码页的拖入图片功能。 v2 #43
- 修复:输出到单独文件txt时,文件名去除原后缀。 v2 #36
- 修复:一些小Bug。
- 新增:命令行支持传入图片路径。 v2 #28
- 新增:HTTP接口支持Base64传输图片。 v2 #28
- 新增:忽略区域功能。
- 新增:二维码识别页。支持识别多种格式的二维码、条形码。 (Umi-OCR #95)
- 新增:提供备选启动器
UmiOCR-data/RUN_GUI.bat
,供Umi-OCR.exe
不兼容时使用。 v2 #21 - 优化:图片预览窗口,支持用
Tab
切换显示/隐藏文本。 - 优化:记录面板,每条记录顶部添加复制按钮。 v2 #32
- 优化:记录面板,拖拽过程中允许指针移出文本框区域。 v2 #32
- 优化:重新设计截图缓存机制,避免Image组件销毁时的内存泄露。
- 优化:标签页应用动态解析机制,小幅提高加载速度。
- 优化:运行环境转为64位包。(计划不再提供对32位的兼容)
- 修正:配置项中布尔值解析不正确的问题。 v2 #30
- 修正:拖入非图片文件可能导致卡顿几秒的问题。
- 修正:PaddleOCR插件的兼容性问题。 (Umi-OCR #209)
- 新增:截图前自动隐藏窗口。 v2 #26
- 新增:更改字体功能。 v2 #25
- 新增:可爱的加载动画。
- 新增:截图预览面板 支持显示结果文本、划选文本。
- 新增:截图预览面板 支持将图片复制到剪贴板。
- 新增:结果记录面板 支持跨文本框划选文本。 v2 #18
- 新增:结果记录面板 支持删除一条或多条记录。 v2 #10
- 新增:支持用Esc或右键中断截图。
- 优化:更改插件目录结构和导入机制。
- 修正:文件重复导致无法添加开机自启。 v2 #27
- 新功能:第一次启动软件时,根据系统情况,选择最恰当的渲染器。解决截图闪烁问题。 v2 #7
- 新功能:初步实现插件机制,切换引擎等组件更加便捷。
- 新功能:支持调整界面比例(文字大小)。
- 优化:调整截图页UI,提高屏占比。优化标签栏阴影。 v2 #8
- 优化:双击通知弹窗可打开主窗口。 v2 #10
- 优化:截图完成后,如果主窗口在前台,则不弹出成功提示。 v2 #10
- 优化:禁用美化效果时,外部弹窗将不会渲染阴影区域。 v2 #14
- 优化:Paddle引擎也支持win7系统了。
- 支持多种界面语言(实验性)
- 截图OCR
- 兼容高分辨率屏幕和多屏幕系统
- 更准确、智能的段落合并
- 批量OCR
- 现代化UI风格
- 自定义标签页系统
- 主题切换:明亮/深色
v1.3.7 2023.10.10
- Paddle引擎兼容Win7 x64 。
- 新功能:更强大的段落合并方案-
单行/多行自然段/多行代码段
。支持自动判断中/英文段落,采取对应的合并规则。 - 移除一些过时的段落合并方案。
- 功能调整:
截图联动
划分为独立的功能,不受常规截图OCR影响。
v1.3.5 2023.6.20
- 新功能:复制识别结果后,可发送指定按键,以便联动唤起翻译器等工具。
- 新功能:命令行增加切换识别语言的指令。
- 修Bug:低配置机器上有概率误报
OCR init timeout: 5s
。#154 , #156。 - 调整:默认停止任务30秒后释放一次内存。
v1.3.4 2023.4.26
- 新功能:截图预览窗口。
- 新功能:可用方向键微调截图框位置。
- 修Bug:拖入图片时有几率卡退主窗口 issue #126 。
- 优化了一些处理流程。
v1.3.3 2023.3.19
- 新功能:命令行模式。
- 新功能:识图完成的通知悬浮窗。
- 新功能:自动清理引擎内存。
- 修复了一些BUG,优化了一些UI表现。
v1.3.2 2022.12.1
- 新功能:创建开机启动项时,可选
不显示主窗口
。 - 新功能:OCR结果输出到每个图片同名的单独txt文件。
- 新功能:增加独立的设置语言窗口,可在多处点开,便于切换语言。
- 新功能:合并段落添加
合并自然段-西文模式
,可在英文段落换行时补充空格。 - 新功能:快捷识图可选
自动清空面板
,只显示本次识别结果,且隐藏时间信息。 - 修复了一些BUG。
v1.3.1 2022.11.4
- 修Bug:快捷键模块重写,引入pynput库,舍弃keyboard库,解决几率失效、录制不正确等Bug。
- 新功能:添加开机自启,桌面快捷方式,开始菜单快捷方式。
- 新功能:多开软件时提示。
- 新功能:截图时隐藏窗口。
- 调整UI:使用频率极低的设置项设为隐藏的高级选项。
- 优化:检查引擎组件是否存在。
- 优化:
横排-合并多行-自然段
优化逻辑,支持0~2全角空格首行缩进。
v1.3.0 2022.9.29
- 新功能:框选截屏。
- 新功能:系统托盘图标。
- 新功能:引擎进程常驻。
- 新功能:文本块后处理模块。
- 新功能:自定义主输出栏字体。
- 新功能:设置窗口弹出模式(保持置顶)。
- 调整UI:自适应Win风格组件。
- 修正了Bug:系统语言兼容性问题 issue #16 。
- 修正了Bug:微信图片粘贴问题 issue #22 。
- 更新PaddleOCR-json模块至
v1.2.1
,提供剪贴板支持。快捷识图通过剪贴板中转,无需再保存临时文件到硬盘。
v1.2.6 2022.9.1
- 更新PaddleOCR-json模块至
v1.2.0
,提高识别速度、准确度。 - 调整UI:更方便地用下拉框切换识别语言。
- 调整UI:可以从主窗口任意位置/任意选项卡拖入图片。
- 修正了Bug:提高程序健壮性,增加启动子进程时的更多异常处理情况。
- 修正了Bug:彻底解决了对边缘过窄的图片,识别结果不准确的问题 issue #7 。
- 优化适配PP-OCRv3模型,彻底解决了v3版模型比v2慢、不准的问题 issue #4 。
- 新功能:计划任务。识图完成后执行自动关机等任务。
- 新功能:可选拖入文件夹时递归导入子文件夹中所有图片。
- 调整UI:添加一些配置文件的快捷入口。
- 新功能:可选识别剪贴板图片后自动复制识别的文本。
- 补充功能:快捷键调用剪贴板识图时,若程序窗口被最小化,则恢复前台状态并挪到最前位置。
- 新功能:读取剪贴板图片。配置全局快捷键调用该功能。
- 新功能:可选任务完成后自动打开输出文件或目录。
- 更新PaddleOCR-json模块至
v1.1.1
,修正了可能得到错误包围盒的漏洞。
- 可选生成图文链接.md文件,作为索引使用有更佳的观感。
- 修改设置面板的样式,改为滚动面板以容纳更多设置选项。
- 用户修改配置项后可自动保存。
- 修正了Bug:退出忽略区域窗口时,OCR子进程未关闭。
- 新功能:忽略区域窗口以虚线框 展示识别出的文字块。
- “梦开始的地方”