LanguageModels

Use cases:

Text generation.
Text classification/Sentiment Analysis.
Text Summarisation.
Text rewriting/Paraphrasing.
Text clustering.
Embeddings generation.
Translation.

Multi-Purpose NLP Models

Text generation steps:

python pytorch-transformers/examples/run_generation.py 
    --model_type=transfo-xl 
    --length=100 
    --model_name_or_path=transfo-xl-wt103

XLNet

Text generation steps:

python pytorch-transformers/examples/run_generation.py
    --model_type=xlnet
    --length=50
    --model_name_or_path=xlnet-base-cased

OpenAI’s GPT-2

Text completion steps:

Tokenize and index the text as a sequence of numbers
Pass it to the gp2 pretrained model e.g Pytorch's GPT2LMHeadModel.
Get predictions.

Text generation steps:

python pytorch-transformers/examples/run_generation.py
    --model_type=gpt2
    --length=100
    --model_name_or_path=gpt2

Universal Language Model Fine Tuning - ULMFiT
Steps:

Data prep.
Creating LM Model & fine-tuning it with the pre-trained model.
Get predictions with the fine tuned model.

Implementations in Spacy and Fastai.

Transformer

Google’s BERT

Masked language modeling steps:

Text tokenisation.
Convert tokesn into a sequence of integers.
Use bert's masked language model e.g Pytorch's BertForMaskedLM.
Get predictions.

Word Embeddings

Embeddings from Language Model - ELMo

NLP framework by AllenNLP. Word vectors are calculated using a 2-layer bidirectional language model (biLM). Each layer comprises back &forward pass.
Represents word embeddings using complete sentence, thus, capture the context of the word used in the sentence unlike Glove and Word2Vec.

Flair

Captures latent syntattic-semantic info from text.
Gives word embeddings based on its sorrounding text.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.gitignore		.gitignore
README.md		README.md
bert.py		bert.py
bert_embeddings.py		bert_embeddings.py
elmo.py		elmo.py
flair.py		flair.py
gpt2.py		gpt2.py
hugging_face.py		hugging_face.py
text_classification_evolvement.py		text_classification_evolvement.py
transformer.py		transformer.py
transformer_xl.py		transformer_xl.py
umfit.py		umfit.py
xlnet.py		xlnet.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LanguageModels

Multi-Purpose NLP Models

Word Embeddings

About

Releases

Packages

Languages

ada-k/LanguageModels

Folders and files

Latest commit

History

Repository files navigation

LanguageModels

Multi-Purpose NLP Models

Word Embeddings

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages