-
-
Notifications
You must be signed in to change notification settings - Fork 5
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Python版のcuda対応に関すること #95
Comments
すみません失礼します |
実際に計測しないことにはわかりませんが、動的にslotを読み込んだりアンロードする負荷は間違いなく低いため、slotの読み込み上限を付けることで結果的に複数モデル扱うときのVRAM節約をすることはできるはずです。 |
そこらへんの実装をすることにしました(python版ではなくdocker版に) |
python版にも実装できそうです |
ありがとうございます。>< |
機能追加の説明
GPUとかで動かしたいって方がいるので、その対応としてdynamicを提案する
メリット
dynamicにすることでcuda以外でも使える
デメリット
ユーザーの負担が増える
The text was updated successfully, but these errors were encountered: