Releases: derekwin/OneInfer
Releases · derekwin/OneInfer
OneInfer v0.1
First Release Version of OneInfer.
Key Features:
- Backend Support: Supports the llama.cpp backend for deploying LLM models in GGUF format.
- Model Loading: Capable of loading models from Hugging Face, ModelScope, and local sources.
- WebUI Management: Offers a web-based user interface for managing models.
- Docker-like CLI: Provides a command-line interface similar to Docker for model management.
- Multi-GPU and Multi-Platform: Supports multi-GPU deployment and is compatible with multiple platforms.
OneInfer预编译安装包:
关键特性:
- 后端支持:支持使用 llama.cpp 后端部署 GGUF 格式的 LLM 模型。
- 模型加载:支持从 Hugging Face、ModelScope 和本地加载模型。
- WebUI 模型管理:提供基于网页的用户界面用于管理模型。
- 类似 Docker 的模型管理 CLI:提供类似 Docker 的命令行界面用于模型管理。
- 多 GPU 和多平台支持:支持多 GPU 部署,兼容多种平台。