ئەمە لەلایان تیمی ئاسۆسۆفتەوە ئامادە کراوە, بۆ یەکەمین جار کۆستەمایزکردنی زمانی نوێ لە Whisper کە پێشتر نەکرابوو. ئێمە توانیمان کۆستەمایزی بکەین بۆ زمانی کوردی بەم چەند گۆڕانکارییەی خوارەوە:
١-لە شوێن بەکارهێنانی تۆکەنایزەری Pretrain, زیاد کردنی تۆکەنایزەری نوێ.
tokenizer = WhisperTokenizer(vocab_file='/content/ckb/vocab.json', merges_file='/content/merges.txt', unk_token='', bos_token= '<|endoftext|>', pad_token= '<|endoftext|>', model_max_length = 1024, task='transcribe')
٢-لابردنی لایەری کۆتای Decoder لە مۆدێڵێ Pretrain و دووبارە دروست کردنەوەی لە scratch بۆ زمانی نوێ.
model.config.decoder_layerdrop=1