Skip to content

Releases: derekwin/OneInfer

OneInfer v0.1

10 Feb 15:44

Choose a tag to compare

OneInfer v0.1 Pre-release
Pre-release

First Release Version of OneInfer.
Key Features:

  • Backend Support: Supports the llama.cpp backend for deploying LLM models in GGUF format.
  • Model Loading: Capable of loading models from Hugging Face, ModelScope, and local sources.
  • WebUI Management: Offers a web-based user interface for managing models.
  • Docker-like CLI: Provides a command-line interface similar to Docker for model management.
  • Multi-GPU and Multi-Platform: Supports multi-GPU deployment and is compatible with multiple platforms.

OneInfer预编译安装包:
关键特性:

  • 后端支持:支持使用 llama.cpp 后端部署 GGUF 格式的 LLM 模型。
  • 模型加载:支持从 Hugging Face、ModelScope 和本地加载模型。
  • WebUI 模型管理:提供基于网页的用户界面用于管理模型。
  • 类似 Docker 的模型管理 CLI:提供类似 Docker 的命令行界面用于模型管理。
  • 多 GPU 和多平台支持:支持多 GPU 部署,兼容多种平台。