Reranker Inference Service

Reranker inference service intended for use with the Digital Assistant. Simply hosts a reranker model using HuggingFace transformers and exposes a prediction endpoint.

Build

make build

Running

To run in the project use

make run

When running in production, use

docker volume create hf_cache  # If not exists
docker run -it -p 5000:5000 -v hf_cache:/app/hf_cache --gpus all -e API_KEY=<token> ghcr.io/aidotse/reranker-inference:latest

Push

make push

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.github/workflows		.github/workflows
src		src
.gitignore		.gitignore
Dockerfile		Dockerfile
Makefile		Makefile
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reranker Inference Service

Build

Running

Push

About

Releases

Packages

Languages

aidotse/reranker-inference

Folders and files

Latest commit

History

Repository files navigation

Reranker Inference Service

Build

Running

Push

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages