Releases · ksjae/KoGPT

08 Mar 00:53

ksjae

v0.2.2-384

7a4d35b

HF Transformers compatible KoGPT2 Latest

Latest

Someone asked me to make a Transformers-compatible version of KoGPT2.
Well, here you go.

Sorry this is not a full version, couldn't get Transformers to train properly (ugh)

https://nas.ksjit.com:5001/sharing/AcmROoopD

If link is down, don't hesitate to email me. It is likely that I may not know.

Assets 2

27 Oct 03:07

ksjae

v0.2.1

7a4d35b

Version 0.2 final release

Will not be updated until I get my hands on more data.
Couldn't make the 2.7B model on TPUs because OOM.

Available from my server

Assets 2

02 Oct 04:31

ksjae

v0.2-SNS

1299346

v0.2 for SNS article generation

Do note that this model was originally for book content generation, but experiments show this model is more suited for SNS content generation.

Available from my server and Google Drive

Assets 2

25 Sep 12:10

ksjae

v0.2-news

33b6f7c

v0.2 optimized for plain written text

All releases will be available from my server. If Google drive gives too much hassle(e.g. headless linux), just wget from there.

v0.2-news is not trained on the book dataset(any dataset incl. books) but everything else.
Trained on v3-8 TPUs for 5 days(about 205K steps)

My server : here
Google Drive : uploading

From this release, I'm switching to home-brew code. This makes the model unable to be loaded in HF Transformers. I'll make a pull request later this year(lots of paperwork involved).
For demo/generation, check out the train code(ksjae/KoGPT2-train).

Assets 2

22 Sep 06:39

ksjae

v0.2-beta

f010360

1.5B is finally here! Pre-release

Pre-release

All releases will be available from my server. If Google drive gives too much hassle(e.g. headless linux), just wget from there.

v0.2-beta is only trained on ~700MB web corpus, on v3-8 TPUs for 36 hours(about 80K steps)

My server : here
Google Drive : here

Assets 2

15 Sep 06:33

ksjae

v0.1-beta

b4e23c2

v0.1-beta

Now Includes KNLI-WEB & KNLI-WRITTEN corpus!

Known Issues
Using very short prompts (e.g. "안녕하세요.") may output parts of original corpus.

Available from Google Storage:
gs://kogpt2/code/transformers/kogptN1
or This link

Assets 2

04 Sep 02:23

ksjae

alpha

8005428

KoGPT2-large

KoGPT2-large trained on

Kookmin Uni. Dataset
Sejong corpus
Namuwiki dump

Trained for 3 weeks on 2*V100

Sorry for that. Get it from Google drive

Assets 2

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Releases: ksjae/KoGPT

HF Transformers compatible KoGPT2

Version 0.2 final release

v0.2 for SNS article generation

v0.2 optimized for plain written text

1.5B is finally here!

v0.1-beta

KoGPT2-large