Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
__init__.py		__init__.py
__main__.py		__main__.py
args.py		args.py

README.md

DocBERT

Finetuning the pre-trained BERT models for Document Classification tasks.

Quick start

For fine-tuning the pre-trained BERT-base model on Reuters dataset, just run the following from the project working directory.

python -m models.bert --dataset Reuters --model bert-base-uncased --max-seq-length 256 --batch-size 16 --lr 2e-5 --epochs 30

The best model weights will be saved in

models/bert/saves/Reuters/best_model.pt

To test the model, you can use the following command.

python -m models.bert --dataset Reuters --model bert-base-uncased --max-seq-length 256 --batch-size 16 --lr 2e-5 --epochs 30 --trained-model models/bert/saves/Reuters/best_model.pt

Model Types

We follow the same types of models as in huggingface's implementation

bert-base-uncased
bert-large-uncased
bert-base-cased
bert-large-cased

Dataset

We experiment the model on the following datasets:

Reuters (ModApte)
AAPD
IMDB
Yelp 2014

Settings

Finetuning procedure can be found in :

Acknowledgement

Our implementation is inspired from huggingface's implementation

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

bert

bert

README.md

DocBERT

Quick start

Model Types

Dataset

Settings

Acknowledgement

Files

bert

Directory actions

More options

Directory actions

More options

Latest commit

History

bert

Folders and files

parent directory

README.md

DocBERT

Quick start

Model Types

Dataset

Settings

Acknowledgement