Added Support for Bge-Reranker-v2 into RankLLM #132

Yuv-sue1005 · 2024-08-24T00:10:16Z

Pull Request Checklist

Reference Issue

ref: N/A

Checklist Items

Before submitting your pull request, please review these items:

[] Have you followed the contributing guidelines?
[Y] Have you verified that there are no existing Pull Requests for the same update/change?
[] Have you updated any relevant documentation or added new tests where needed?

PR Type

Type: Feature
Description: Adds support for the bge-reranker-v2 models on Hugging Face for pointwise reranking via rank_llm. All bge supported models are: BAAI/bge-reranker-base, BAAI/bge-reranker-large, BAAI/bge-reranker-v2-m3, BAAI/bge-reranker-v2-gemma, and BAAI/bge-reranker-v2-minicpm-layerwise. Now the above bge models can be run like any other pointwise reranker on rank_llm.

Documentation

Dependencies

Aside from rank_llm's general setup, install the following:

pip install -U FlagEmbedding

Running bge

We can run bge with a simple command in the rank_llm directory as follows:

# if you want to remove progress bars, pass env var TQDM_DISABLE=1
python src/rank_llm/scripts/run_rank_llm.py --model_path=insert_model_name_on_hf --dataset=insert_dataset_path_or_name --retrieval_method=_insert_retrieval_method --prompt_mode=bge-reranker-v2 --batch_size=insert_batch_size --context_size=Insert_context_size

Tests

Here are some tests on the Deep Learning 2019 dataset, just to make sure things work.

# base
python src/rank_llm/scripts/run_rank_llm.py --model_path=BAAI/bge-reranker-base --dataset=dl19 --retrieval_method=bm25 --prompt_mode=bge-reranker-v2

# large
python src/rank_llm/scripts/run_rank_llm.py --model_path=BAAI/bge-reranker-large --dataset=dl19 --retrieval_method=bm25 --prompt_mode=bge-reranker-v2

# m3
python src/rank_llm/scripts/run_rank_llm.py --model_path=BAAI/bge-reranker-v2-m3 --dataset=dl19 --retrieval_method=bm25 --prompt_mode=bge-reranker-v2

# gemma
python src/rank_llm/scripts/run_rank_llm.py --model_path=BAAI/bge-reranker-v2-gemma --dataset=dl19 --retrieval_method=bm25 --prompt_mode=bge-reranker-v2

# minicpm-layerwise
python src/rank_llm/scripts/run_rank_llm.py --model_path=BAAI/bge-reranker-v2-minicpm-layerwise --dataset=dl19 --retrieval_method=bm25 --prompt_mode=bge-reranker-v2

Implemented unicamp-dl/mt5-13b-mmarco-100k into rank_llm.

Yuv-sue1005 added 11 commits August 23, 2024 12:06

Added support for bge-reranker-v2 base, large, and m3 models

491c55e

Working on addition of minicpm-layerwise

89e3ba8

recent updates to minicpm

2ff7643

Added RankLLM support for minicpm-layerwise and gemma

3c206d8

Modified maximum context size

2dbb8e9

Implement varied outputs bug fix

19e93f7

Update create_prompt method

154e503

update run_llm, get_num_tokens, and remove tokenizer

14523e7

Reduced FlagEmbedding's Logging

dbe5ff9

Implement mt5-13b-mmarco-100k

e753401

Implemented unicamp-dl/mt5-13b-mmarco-100k into rank_llm.

Implemented float16

280a520

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Added Support for Bge-Reranker-v2 into RankLLM #132

Added Support for Bge-Reranker-v2 into RankLLM #132

Yuv-sue1005 commented Aug 24, 2024 •

edited

Loading

Added Support for Bge-Reranker-v2 into RankLLM #132

Are you sure you want to change the base?

Added Support for Bge-Reranker-v2 into RankLLM #132

Conversation

Yuv-sue1005 commented Aug 24, 2024 • edited Loading

Pull Request Checklist

Reference Issue

Checklist Items

PR Type

Documentation

Dependencies

Running bge

Tests

Yuv-sue1005 commented Aug 24, 2024 •

edited

Loading