Skip to content

KuramitsuLab/abci2022

Repository files navigation

abci2022

ABCI Training Script 2022 Version

ファインチューニング

使い方

python3 finetune.py music/music_train.jsonl music/music_valid.jsonl

字句解析器のチェック

コーパスのTokenizer による字句数をチェックする。 max_lengthを設定するときの参考にする。

python3 tokenizer_check.py music/music_train.jsonl 
  • --tokenizer_path='google/mt5-small' Tokenizer を指定する
  • --source_max_length=128: 最大長を超える入力をダンプする
  • --target_max_length=128: 最大長を超える出力をダンプする

Tensolboardによる学習ログの可視化

  1. lightning_logsディレクトリがある階層で、ターミナルに以下のコードを打ちます
tensorboard --logdir ./lightning_logs
  1. http://localhostXXXXが返ってくるので、Chromeで開きます
  2. 見える。終わり

About

ABCI Training Script 2022 Version

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published