Releases: CanCLID/canto-filter
Releases · CanCLID/canto-filter
v1.1.3 優化粵語特徵檢測邏輯,增加粵語特徵字詞
Full Changelog: v1.1.1...v1.1.3
v1.1.2 增加粵語詞彙,提高召回率
Full Changelog: v1.1.1...v1.1.2
v1.1.1 優化性能;增加判別詞;重構測試數據
新版本改動:
judge()
邏輯入面改用set
、any()
同all()
嚟優化判別速度- 增加判別詞
- 將測試例句提取重構成一個 txt 文檔,方便以後增加測試例句
v1.1.0 改用`StrEnum`輸出類型
Python 最低版本要求升為 3.11
命令行 --type 改為 --mode,增加判別詞彙
改動
- 原有嘅命令行參數
--type
改成--mode
,增加可讀性 - 增加「看」「也」判別詞彙
- 改善註釋同變量命名
- 增加測試用例句子
更新判別詞表,README 加入引用同設計思路説明
- 判別詞表加入更多粵語特徵詞
- README 加入引用文獻
- README 加入分類器設計思路説明
v1.0.2 「不」「在」唔再係官話特徵
因為「不」同「在」兩隻字喺粵文中應用廣泛,如果作為官話判別特徵會導致好高嘅 false negative,所以今次更新將佢哋移出 mando_feature
。