本项目的所有明显改变将被记录在这个文件里。
本文件的格式将会基于Keep a Changelog,同时本项目的版本号将遵守Semantic Versioning。
- 未发布
- 0.5.7-alpha - 2020-05-06
- 0.5.6-alpha - 2020-03-20
- 0.5.5-alpha - 2020-03-04
- 0.5.4-alpha - 2020-01-31
- 0.5.3-alpha - 2019-12-30
- 0.5.2-alpha - 2019-11-05
- 0.5.1-alpha - 2019-08-02
- 0.5.0-alpha - 2019-07-27
- 0.4.1-alpha - 2019-07-11
- 0.4.0-alpha - 2019-02-17
点击上箭头以返回目录。
- 添加convert_wav方法在cmdline_utils.py中。
- 添加手动翻译的方法。
- 添加sub_to_file方法在cmdline_utils.py中。
- 添加复杂的行合并功能。
- 添加Auditok选项优化功能。
- 添加了send2trash,在某些情况下替代了os.remove。
- 添加字词检查在man_get_vtt_words_index。
- 添加速度限制在trim在join-events中。
- 添加方法split_dst_lf_src_assfile来分离同行双语字幕。
- 添加当前工作路径文件名重命名支持。
- 添加youtube自动字幕json格式行合并功能。
- 添加googletrans v4.0.0rc1支持在类ManualTranslator中。
- 添加更多的字幕格式支持在方法sub_processing中,以方便分割及合并字幕行。
- 添加去除首尾空格的功能在类YTBWebVTT的类方法from_json_file中。
- 添加keep_events到--join-control中以在分割及合并字幕行中,保留字幕文件中字幕行的时间戳。
- 修改
-et
默认参数为50。 - 修改方法audio_or_video_prcs的控制流程,使用args.output_files来控制。
- 修改ci为github actions,由@jitingcn完成。
- 重构sub_conversion方法。
- 修复不输入
-D
选项时的问题。 - 修复args.audio_split_cmd替换问题当使用
-ap
参数时。issue #122 - 修复选项
--user-agent
的默认值问题。issue #127 - 修复vtt读取不到每行最后一个词的问题,在方法YTBWebVTT.from_file中。
- 修复list_to_googletrans中错误的返回值。issue #136
- 修复youtube vtt多个单词共用一个时间戳问题。
- 修复输出文件路径问题,在方法str_to_file中,由@jitingcn完成。
- 修复使用-der选项时输出双语字幕的越界问题,由@jitingcn完成。
- 修复Auditok v0.1.8+兼容性问题。
- 修复style_name问题在方法split_dst_lf_src_assfile中。
- 修复运行完程序后,终端无法输入的问题,由@9mido完成。
- 修复args.ext_regions为None时对其操作的错误,在方法sub_processing中。
- 修复vtt_sub为None时对其成员访问的错误,在方法sub_processing中。
- 修复src_sub为None时对其成员访问的错误,在方法sub_processing中。
0.5.7-alpha - 2020-05-06
- 添加讯飞开放平台语音听写(流式版)WebSocket API支持。
- 添加百度智能云语音识别/极速语音识别API支持。issue #68
- 添加字符过滤器用于讯飞开放平台语音听写。
- 添加delete_chars功能到方法list_to_googletrans里。
- 添加方法merge_src_assfile,merge_bilingual_assfile。
- 添加停用词用于方法merge_src_assfile里的断句。
- 添加标点符号分割功能在方法merge_src_assfile里。
- 添加音频长度至少为4字节的检测,在SplitIntoAudioPiece里。
- 添加源语言自动识别功能,当不输入
-SRC
选项时。
- 修改音频分割指令的更换条件为仅当用户不修改它时。
- 修改最长语音区域限制为60秒。
- 修改所有文本文件输入编码为"utf-8"。
- 修改字幕翻译中字幕样式选择的默认方式。
- 修改ffmpeg指令中的loglevel为
-loglevel error
。 - 修改DEFAULT_MIN_REGION_SIZE为0.5。
- 修改langcodes为可选依赖。
- 修改证书为GPLv2。
- 修复list_to_googletrans中当最后一行是需要被分割时的长度计算问题。
- 修复delete_chars问题当使用
-of full-src
时。 - 修复api_xfyun.py中的os.remove()文件占用问题。
- 修复DEFAULT_AUDIO_PRCS_CMDS和DEFAULT_CHECK_CMD。
- 修复依赖查找中,路径检查的问题。
- 修复百度奇怪的错误代码处理。issue #114
- 删除Python 2.7支持。
0.5.6-alpha - 2020-03-20
- 修改选项
-sml
为-nsml
。 - 修改Auditok默认参数。
- 即将删除Python 2.7支持。
- 修复Google Speech-to-Text API空结果返回bug。issue #89
0.5.5-alpha - 2020-03-04
- 添加Google Cloud语音转文字API识别配置文件输入支持。
- 添加语音转文字识别结果json文件输出支持。issue #76
- 添加Google-Speech-v2识别错误的异常。
- 添加Nuitka兼容性代码,使得Nuitka编译版在使用Google Cloud服务账号凭据时终止运行。Nuitka pkg_resources.DistributionNotFound错误
- 修复部分高内存占用,通过终结子进程,减少默认多进程数量,使用
gc.collect(0)
。issue #67,issue #74 - 修复依赖查找问题。issue #82
- 修复ass标签翻译问题。issue #79
0.5.4-alpha - 2020-01-31
- 删除gtransv2支持。
- 修复输入是字幕文件时的输出格式限制。
0.5.3-alpha - 2019-12-30
- 修复ffmpeg参数导致的过长转码时间问题。pull request #66
- 修复Auditok选项问题。issue #70
- 修复输出选项问题。issue #73
0.5.2-alpha - 2019-11-05
- 添加问题模板。
- 修复最后一排空翻译丢行问题。issue #62
- 修复当前运行路径的可执行文件检测问题。
0.5.1-alpha - 2019-08-02
- 添加翻译源语言代码自动匹配功能。
- 修复方法list_to_googletrans的列表越界bug。issue #48
- 修复unix subprocess.check_output的兼容性问题。issue #47
- 修复googletrans全角字符长度过长翻译错误的问题。issue #49
0.5.0-alpha - 2019-07-27
- 为根据音量自动分句时的分句大小提供外部输入参数控制。issue #3
- 添加项目元数据文件。issue #5
- 添加输出文件名检测,以避免覆盖写入。
- 添加新的dev分支用于推送最新的代码。
- 添加多个输出格式(ass, ssa, sub, mpl2, tmp)。issue #20
- 添加参数用于控制auditok.StreamTokenizer和energy_threshold。issue #30
- 添加覆写参数
-y
用于输出文件覆写并且取消任何运行时暂停。issue #29 - 添加ass样式文件输入并在输出格式是ass时起作用。issue #21
- 添加自动分句/自动生成时间轴功能,而不需要调用speech-to-text api。issue #14
- 添加参数用于控制识别结果可信度。issue #6
- 添加参数用于删除在语音转文字后产生的空行。
- 添加来自googletrans的免费API用于翻译。issue #25
- 添加双语字幕输出。issue #16
- 添加多种类型字幕同时输出(指可选时间轴字幕/原语言字幕/目标语言字幕/双语字幕的输出)在使用
--output-files
参数时。 - 添加停止主程序工作的异常。issue #35
- 添加双语字幕样式输入。issue #32
- 添加字幕翻译。issue #38
- 添加自动替换翻译结果中
’
为'
的功能。 - 添加py-googletrans控制参数。issue #36
- 添加语言代码支持。(依赖于langcodes包)issue #34
- 添加ass格式的复杂json文件输出。issue #39
- 添加音频预处理。issue #7
- 添加用于控制所有ffmpeg参数的选项。issue #43
- 添加临时文件保存功能。issue #22
- 添加仅音频片段输出功能。issue #44
- 添加检测首行字幕语言的功能(googletrans)。issue #40
- 添加http, https代理支持。(设置环境变量)issue #17
- 添加i18n支持。issue #9
- 添加i18n语言选择功能。issue #45
- issue #5。
- 重写帮助信息。
- 重构argparse命令行参数解析。
- 重构常量。
- 将原先的dev分支改名为origin分支。
- 将alpha分支当作alpha版本发布的分支。
- 修改文档。
- 改进音频转码步骤来获得更好的音频质量用于处理。现在会从原始文件分别地创建出两个文件。一个是48kHz/16bit/单声道的.wav用于本地分句,一个是44.1kHz/24bit/单声道的.flac用于上传给api进行语音识别。需要指出的是Google-Speech-v2上面关于api可以接受的.flac声道数说的有问题,经过我的测试实际上api还是不支持两声道的.flac文件的。agermanidis/autosub issue #155
- 修改内部音频处理的时间单位为毫秒。issue #23
- 修改内部时间轴/分句处理为auditok。issue #27
- 重构内部函数generate_subtitles为3个独立的部分。issue #24
- 重构内部函数api_gen_text为两部分。一个是speech_to_text。另一个是text_translation。issue #33
- 重构txt输出,现在可以用txt输出时间码。
- 重构方法list_to_sub_str。issue #37
- issue #8
- 修复python3兼容性问题。
- 修复Nuitka构建问题(Nuitka更新至0.6.4后解决,环境Anaconda2 python3.5)。
- 修复vtt输出模块替换所有逗号到句号的问题。
0.4.1-alpha - 2019-07-11
- 添加https语音转文字api的url,并提供选择参数。agermanidis/autosub pull request #135
- 添加外部字幕文件输入以控制语音识别分句。agermanidis/autosub pull request #159
- 添加用于打包,发布等事务的脚本。
- 修改文档。
- 修复因不确切的语言代码导致的错误识别结果。agermanidis/autosub pull request #136
0.4.0-alpha - 2019-02-17
- 修复多个问题。agermanidis/autosub pull request #128 by @iWangJiaxiang
- 修复Windows上ffmpeg依赖不存在问题。
- 修复无法解析JSON对象导致的异常ValueError未被处理的问题。
- 修复Windows 10临时文件夹权限被拒绝的问题。agermanidis/autosub issue #15
- 修复无法解析JSONDecodeError对象导致的异常ValueError未被处理的问题。agermanidis/autosub pull request #131 by @raryelcostasouza