Skip to content

IntelliStream Research Group

Total Stars

Website GitHub Organization

专注于流处理、AI系统与智能数据库的研究与开发

Focused on Stream Processing, AI Systems, and Intelligent Databases


🌟 SAGE 项目生态系统 | SAGE Project Ecosystem

SAGE (Streaming-Augmented Generative Execution) 是一个高性能、模块化的 AI 推理框架生态系统,通过数据流抽象实现透明、可扩展的 LLM 驱动系统。

SAGE is a high-performance, modular AI inference framework ecosystem that enables transparent, scalable LLM-powered systems through dataflow abstractions.

📦 核心仓库 | Core Repositories

🎯 SAGE

GitHub Stars Python

主框架 | Main Framework

声明式、可组合的流式增强生成执行框架,用于通过数据流抽象构建透明的 LLM 驱动系统。

A declarative, composable framework for building transparent LLM-powered systems through dataflow abstractions.

特性 | Features:

  • ⚡ 生产就绪的企业级应用
  • 🔧 直观的声明式 API
  • 🚀 高吞吐量流式工作负载优化
  • 👁️ 内置可观测性和调试工具

Documentation GitHub Stars

文档中心 | Documentation Hub

SAGE 系统的官方对外文档仓库,包含快速开始、架构图、API 文档等。

Official public documentation repository for the SAGE system, including quick start guides, architecture diagrams, and API documentation.

内容 | Contents:

  • 📘 快速开始指南
  • 🏗️ 架构与核心模块说明
  • 📊 Dashboard 使用指南
  • 🔗 API 文档

🔧 数据库组件 | Database Components

💾 sageDB

C++ GitHub Stars

向量数据库核心 | Vector Database Core

高性能向量数据库 C++ 核心库,支持可插拔 ANNS 架构和多模态特性。

High-performance C++20 vector database library with pluggable ANNS architecture and multimodal support.

核心能力 | Core Capabilities:

  • 🔍 精确与近似搜索
  • 📏 多种距离度量 (L2, Inner Product, Cosine)
  • 🏷️ 元数据管理与过滤
  • 🔌 可插拔 ANNS 算法
  • 🎨 多模态融合支持

C++ GitHub Stars

向量流处理引擎 | Vector Stream Processing Engine

向量原生流处理引擎,专为实时 LLM 生成任务维护和物化语义状态快照而设计。

Vector-native stream processing engine designed to maintain and materialize semantic state snapshots for real-time LLM generation tasks.

特性 | Features:

  • 🎯 向量原生处理
  • 📝 声明式 API
  • ⚡ 增量低延迟更新
  • 🪟 有状态窗口操作

⏱️ sageTSDB

C++

时序数据库 | Time Series Database

SAGE 生态系统的时序数据库组件,用于处理时间序列数据。

Time series database component of the SAGE ecosystem for handling temporal data streams.

C++ GitHub Stars

数据库基准测试 | Database Benchmark

SAGE 数据库组件的性能基准测试套件。

Performance benchmark suite for SAGE database components.

🤖 AI 组件 | AI Components

🧠 sageLLM

Python

LLM 集成模块 | LLM Integration Module

SAGE 生态系统的大语言模型集成组件,提供统一的 LLM 接口。

Large Language Model integration component for the SAGE ecosystem, providing unified LLM interfaces.

示例代码库 | Examples Repository

SAGE 框架的示例代码和使用案例集合。

Collection of example code and use cases for the SAGE framework.

记忆管理引擎 | Memory Management Engine

SAGE 项目的记忆体组件,RAG 应用的独立内存管理引擎。

Memory component of the SAGE project, a standalone memory management engine for RAG applications.

Python

基准数据集 | Benchmark Datasets

SAGE 基准测试的共享数据集和资源库。

Shared test datasets and resources for SAGE benchmarks.

🧮 算法库 | Algorithm Libraries

🔢 LibAMM

Python C++ GitHub Stars

近似矩阵乘法库 | Approximate Matrix Multiplication Library

聚合了主流 AMM 算法的高性能库,支持标准化评估和高效实验管理,兼容 LibTorch (C++)。

Aggregates prevalent AMM algorithms for standardized evaluations and efficient experiment management, compatible with LibTorch (C++).

特性 | Features:

  • 🚀 高性能 C++ 实现
  • 🐍 Python 绑定 (PyAMM)
  • 🔥 可选 CUDA 加速支持
  • 📊 PAPI 性能分析工具

🔍 hnswlib

C++ Python

HNSW 近似最近邻搜索库 | HNSW Approximate Nearest Neighbor Search

头文件库,实现 HNSW 算法的快速近似最近邻搜索,支持 C++ 和 Python 绑定。

Header-only C++ HNSW implementation with Python bindings for fast approximate nearest neighbor search.

特性 | Features:

  • 📦 头文件库,无依赖
  • ⚡ 增量索引构建
  • 🔄 支持元素更新和删除
  • 🐍 可 pickle 的 Python 索引

C++

并发 HNSW 库 | Concurrent HNSW Library

支持并发操作的 HNSW 实现,提供快速并发的近似最近邻搜索。

Header-only C++/Python library for fast and concurrent approximate nearest neighbor search.

状态 | Status: 🚧 开发中 | In Development

C++

Parlay-HNSW 基线 | Parlay-HNSW Baseline

基于 Parlay 框架的 HNSW 实现,作为 ConcurrentHNSW 的基线。

Parlay-based HNSW implementation serving as baseline for ConcurrentHNSW.

状态 | Status: 🚧 开发中 | In Development

C++

内积 DiskANN 实现 | Inner Product DiskANN

基于图结构的可扩展、快速、新鲜和过滤的近似最近邻搜索索引实现。

UNOFFICIAL implementation of IP-DiskANN: Graph-structured indices for scalable, fast, fresh and filtered approximate nearest neighbor search.

状态 | Status: 🚧 待集成 | To Be Integrated

🗄️ 历史仓库 | Historical Repositories

  • sage-db_outdated - SAGE 数据库的早期版本(已过时)| Early version of SAGE database (outdated)

🚀 其他研究项目 | Other Research Projects

流处理系统 | Stream Processing Systems

  • MorphStream ⭐ 141 - 可扩展的事务性流处理引擎 | Scalable transactional stream processing engine
  • Sesame ⭐ 26 - [SIGMOD'23] 数据流聚类实证研究 | Data stream clustering empirical study
  • AllianceDB ⭐ 16 - 分布式数据库系统 | Distributed database system

基准测试与工具 | Benchmarks & Tools

  • CANDOR-Benchmark ⭐ 25 - 性能基准测试套件 | Performance benchmark suite
  • PDSC - 并行数据流聚类基准 | Parallel data stream clustering benchmark

机器学习与AI | Machine Learning & AI

  • SentiStream ⭐ 7 - 情感分析流处理 | Sentiment analysis stream processing
  • StreamLearning - 流式学习框架 | Stream learning framework

资源与文档 | Resources & Documentation


📖 快速开始 | Quick Start

安装 SAGE | Install SAGE

# 标准安装 | Standard installation (recommended)
pip install isage[standard]

# 核心安装 | Core installation only
pip install isage[core]

简单示例 | Simple Example

from sage.kernel.api.local_environment import LocalEnvironment
from sage.libs.io.source import FileSource
from sage.middleware.operators.rag import DenseRetriever, QAPromptor, OpenAIGenerator
from sage.libs.io.sink import TerminalSink

# 创建执行环境 | Create execution environment
env = LocalEnvironment("rag_pipeline")

# 构建声明式管道 | Build declarative pipeline
(
    env.from_source(FileSource, {"file_path": "questions.txt"})
    .map(DenseRetriever, {"model": "sentence-transformers/all-MiniLM-L6-v2"})
    .map(QAPromptor, {"template": "Answer based on: {context}\nQ: {query}\nA:"})
    .map(OpenAIGenerator, {"model": "gpt-3.5-turbo"})
    .sink(TerminalSink)
)

# 执行管道 | Execute pipeline
env.submit()

详细文档请访问:SAGE Documentation

For detailed documentation, visit: SAGE Documentation


🤝 参与贡献 | Contributing

我们欢迎各种形式的贡献!请查看各个仓库的 CONTRIBUTING.md 文件了解详情。

We welcome contributions of all kinds! Please check the CONTRIBUTING.md file in each repository for details.


📞 联系我们 | Contact Us


📄 许可证 | License

各项目许可证详见各仓库的 LICENSE 文件。大多数项目采用 MIT 或 Apache 2.0 许可证。

License details can be found in each repository's LICENSE file. Most projects use MIT or Apache 2.0 licenses.


⭐ 如果我们的项目对您有帮助,请给我们一个 Star!

If our projects help you, please give us a Star!

Pinned Loading

  1. SAGE SAGE Public

    Python 15 8

  2. sageFlow sageFlow Public

    C++ 3 1

  3. sageDB sageDB Public

    C++ 1

  4. sageLLM sageLLM Public

    Python 1

  5. neuromem neuromem Public

    Standalone memory management engine for RAG applications

    Python

  6. sageTSDB sageTSDB Public

    C++

Repositories

Showing 10 of 40 repositories

Top languages

Loading…

Most used topics

Loading…