alpaca-data-german

English

This is a German instruct data set with about 50.000 samples. It was generated based on the Stanford Alpaca approach with GPT-3.5. It can be used to finetune open source text completion LLMs (e.g. Llama) for instruct purposes in German.

Citation

Please cite this data set as following:

Zauleck, Julius P. P.; Thieme, Nils; Witt, Oliver; Perfood. (2023). alpaca-data-german - 50k German instruct samples. GitHub Repository

Deutsch

Dies ist ein deutscher Instruct Datensatz mit ungefähr 50.000 Beispielen. Er wurde basierend auf dem Stanford-Alpaka-Ansatz mit GPT-3.5 generiert. Er kann verwendet werden, um open source Textvervollständigungsmodelle (z.B. Llama) für Anweisungsanwendungen auf Deutsch zu finetunen.

Zitierung

Bitte diesen Datensatz wie folgt zitieren:

Zauleck, Julius P. P.; Thieme, Nils; Witt, Oliver; Perfood. (2023). alpaca-data-german - 50k German instruct samples. GitHub Repository

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.gitattributes		.gitattributes
LICENSE		LICENSE
README.md		README.md
german_alpaca_data.json		german_alpaca_data.json
german_alpaca_data_short.json		german_alpaca_data_short.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

alpaca-data-german

English

Citation

Deutsch

Zitierung

About

Releases

Packages

License

perfood/alpaca-data-german

Folders and files

Latest commit

History

Repository files navigation

alpaca-data-german

English

Citation

Deutsch

Zitierung

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Packages