GitHub - snipaid-nlg/gptj-model-tuning: Improving GPT-J for snippet generation.

GPT-J Model Tuning

We finetuned GPT-J for title and teaser snippet generation.

We evaluated the following approaches for model tuning:

Prompt tuning did not prove to be successfull.
Fine tuning and multitask fine tuning delivered promising results.

We finetuned GPT-J-6B-8bit for title and teaser generation with multitask finetuning.
We finetuned on two datasets with different sizes.

Model	Capabilities	Dataset
gptj-title-teaser-1k	title and teaser generation	1.000 german online news from varying publishers
gptj-title-teaser-10k	title and teaser generation	10.000 german online news from varying publishers

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.gitignore		.gitignore
GPT-J-6B-8-bit-Prompt-Tuning-Headline-Generation.ipynb		GPT-J-6B-8-bit-Prompt-Tuning-Headline-Generation.ipynb
GPT-J-6B-8bit-HeadlineGeneration.ipynb		GPT-J-6B-8bit-HeadlineGeneration.ipynb
LICENSE		LICENSE
README.md		README.md
gpt-j-6b-8bit-multitask-finetuning-title-teaser.py		gpt-j-6b-8bit-multitask-finetuning-title-teaser.py