Kaiju

AI model executor for async servers and programms

Installation

Install using pip
From source:

pip3 install git+https://github.com/ninja-96/kaiju

Getting Started

Server usage

Write your own class for pass data throught Pipeline

from kaiju.item import BaseItem

class ImageItem(BaseItem):
    image: torch.Tensor = Field(default_factory=torch.Tensor)
    predict: torch.Tensor = Field(default_factory=torch.Tensor)

Write your own class for handler

from kaiju.handler import BaseHandler

class ModelHandler(BaseHandler):
    def __init__(self, device: str) -> None:
        super().__init__()
        self._model = torchvision.models.resnet18(weights='DEFAULT').eval().to(device)
        self._device = device

    def forward(self, data: ImageItem) -> ImageItem:
        with torch.inference_mode():
            data.predict = self._model(data.image.to(self._device)).cpu()
            return data

Create Pipeline instance

from kaiju.runner import Runner

pipeline = Pipeline(
    Runner(ModelHandler('cpu'))
)

Call Pipeline from async function

from typing import Any
from fastapi import FastAPI

app = FastAPI()

...

@app.post('/predict')
async def post_predict(data: Any) -> Any:
    # getting and prepare data from request

    item = ImageItem()
    result = await pipeline(item)

    # postprocess pipeline result and return response

Programm usage

Write your own class for pass data throught Pipeline

from kaiju.item import BaseItem

class ImageItem(BaseItem):
    image: torch.Tensor = Field(default_factory=torch.Tensor)
    predict: torch.Tensor = Field(default_factory=torch.Tensor)

Write your own class for handlers

class DummyReader(BaseHandler):
    def forward(self, data: ImageItem) -> ImageItem:
        data.image = torch.rand(16, 3, 224, 224)
        return data


class R18Model(BaseHandler):
    def __init__(self, device) -> None:
        super().__init__()
        self._model = torchvision.models.resnet18(weights='DEFAULT').eval().to(device)
        self._device = device

    def forward(self, data: ImageItem) -> ImageItem:
        with torch.inference_mode():
            data.predict = self._model(data.image.to(self._device)).cpu()
            return data

Create Pipeline instance

from kaiju.runner import Runner

if __name__ == '__main__':
    pipeline = Pipeline(
        Runner(DummyReader()).n_workers(2),
        Runner(R18Model('cuda')).n_workers(4).critical_section()
    )

Start Pipeline

pipeline.start(ImageItem(), batch_size=32)

# batch size - number of coroutines that will be created for execution

Note

You can set number of worker for every Runner

Runner(ModelHandler('cpu')).n_workers(4)

If your model uses Nvidia GPU, you can device your Runner as critical section of Pipeline. It will be useful for preventing GPU memory overload. See

Runner(ModelHandler('cuda')).n_workers(2).critical_section()

Built with

pydantic - Data validation using Python type hints

Versioning

All versions available, see the tags on this repository.

Authors

Oleg Kachalov - Initial work - ninja-96

See also the list of contributors who participated in this project.

License

This project is licensed under the GPL-3.0 license - see the LICENSE.md file for details.

Name		Name	Last commit message	Last commit date
Latest commit History 45 Commits
.github/workflows		.github/workflows
kaiju		kaiju
samples		samples
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Kaiju

Installation

Getting Started

Server usage

Programm usage

Note

Built with

Versioning

Authors

License

About

Releases 5

Packages

Languages

License

ninja-96/kaiju

Folders and files

Latest commit

History

Repository files navigation

Kaiju

Installation

Getting Started

Server usage

Programm usage

Note

Built with

Versioning

Authors

License

About

Topics

Resources

License

Stars

Watchers

Forks

Releases 5

Packages 0

Languages

Packages