ABCI Training Script 2022 Version
使い方
python3 finetune.py music/music_train.jsonl music/music_valid.jsonl
コーパスのTokenizer による字句数をチェックする。
max_length
を設定するときの参考にする。
python3 tokenizer_check.py music/music_train.jsonl
--tokenizer_path='google/mt5-small'
Tokenizer を指定する--source_max_length=128
: 最大長を超える入力をダンプする--target_max_length=128
: 最大長を超える出力をダンプする
- lightning_logsディレクトリがある階層で、ターミナルに以下のコードを打ちます
tensorboard --logdir ./lightning_logs
http://localhostXXXX
が返ってくるので、Chromeで開きます- 見える。終わり