-
Notifications
You must be signed in to change notification settings - Fork 2
Description
Xu hướng AI Mã nguồn mở 2026-03-23
Nguồn: GitHub Trending + GitHub Search API | Thời gian tạo: 2026-03-23 02:06 UTC
Báo cáo Xu hướng Mã nguồn mở AI — 2026-03-23
Bước 1 — Lọc
Từ dữ liệu cung cấp, tôi giữ các repo rõ ràng liên quan AI/ML (bao gồm agent, RAG/vector DB, inference/infra, mô hình/huấn luyện, ứng dụng AI). Bỏ qua các repo chung/không AI như systemd, trivy, v.v.
Bước 2 — Phân loại (nhóm chính)
🔧 Cơ sở hạ tầng AI
- https://github.com/huggingface/transformers — ⭐158,261
Framework chuẩn định nghĩa mô hình NLP/multimodal; tiếp tục là nền tảng cho fine‑tuning và triển khai. - https://github.com/vllm-project/vllm — ⭐73,972
Engine inference hiệu suất cao cho LLM, tập trung vào throughput và tiết kiệm bộ nhớ. - https://github.com/ollama/ollama — ⭐165,893
Runtime/manager cho nhiều model mở (Kimi‑K2.5, GLM‑5, Qwen…), giúp đơn giản hoá chạy models tại chỗ. - https://github.com/pytorch/pytorch — ⭐98,495
Thư viện lõi cho huấn luyện và nghiên cứu, ảnh hưởng trực tiếp đến hệ sinh thái ML. - https://github.com/tensorflow/tensorflow — ⭐194,321
Framework ML phổ biến cho training/production ở quy mô lớn. - https://github.com/open-webui/open-webui — ⭐128,298
Giao diện người dùng cho mô hình/lokally-hosted models, tiện cho thử nghiệm và triển khai nhanh.
🤖 AI Agent / Workflow
- https://github.com/langchain-ai/langchain — ⭐130,625
Nền tảng kỹ thuật agent hàng đầu, chuẩn hoá cách tích hợp LLM + tools. - https://github.com/langgenius/dify — ⭐133,981
Production-ready platform cho phát triển workflow agent; tăng chú ý vì dễ triển khai. - https://github.com/bytedance/deer-flow — (trending +1690 hôm nay)
SuperAgent harness của Bytedance — bùng nổ interest hôm nay như một agent toàn diện. - https://github.com/affaan-m/everything-claude-code — ⭐98,284 (trending +3,724 hôm nay)
Hệ sinh thái tối ưu hoá “Claude Code” / agent harness; surge lớn thể hiện quan tâm cao tới Claude ecosystem. - https://github.com/FlowiseAI/Flowise — ⭐50,988
Công cụ visual để xây agent/flow; hữu dụng cho maker không code. - https://github.com/browser-use/browser-use — ⭐82,633 (trending +428 hôm nay)
Kết nối web để cho phép agent truy cập/tuần tự hoá trang web — nền tảng cho nhiều agent thực tế. - https://github.com/jamwithai/production-agentic-rag-course — (trending +237 hôm nay)
Khóa học/guide hướng dẫn xây production agent + RAG — hữu ích cho chuyển demo→production.
📦 Ứng dụng AI
- https://github.com/OpenBB-finance/OpenBB — ⭐63,433
Nền tảng dữ liệu/AI cho phân tích tài chính; ví dụ ứng dụng ngành rõ rệt. - https://github.com/zhayujie/chatgpt-on-wechat — ⭐42,386
Agent/assistant tích hợp đa kênh (WeChat, Feishu…); đại diện cho adoption doanh nghiệp/tiện ích cá nhân. - https://github.com/FujiwaraChoki/MoneyPrinterV2 — (trending +1,787 hôm nay)
Các dự án “monetization via LLM” thu hút nhiều sao; phản ánh trend ứng dụng sinh lợi nhanh. - https://github.com/harry0703/MoneyPrinterTurbo — (trending +189 hôm nay)
Tương tự, dùng LLM để tạo nội dung video/shorts — ứng dụng content automation. - https://github.com/Crosstalk-Solutions/project-nomad — (trending +2,300 hôm nay)
“Offline survival computer” có AI + knowledge tools — minh hoạ xu hướng self‑hosted, offline AI. - https://github.com/louis-e/arnis — ⭐582 (trending +582 hôm nay)
Tạo địa hình/thế giới Minecraft bằng AI — ứng dụng sáng tạo nội dung thế hệ mới.
🧠 LLM / Huấn luyện
- https://github.com/rasbt/LLMs-from-scratch — ⭐89,015
Hướng dẫn/implement LLM từ đầu — hữu ích cho học tập và nghiên cứu. - https://github.com/hiyouga/LlamaFactory — ⭐68,895
Công cụ fine‑tuning hiệu quả cho nhiều LLM/VLM; liên quan đến efficient tuning. - https://github.com/galilai-group/stable-pretraining — ⭐135
Thư viện cho pretraining ổn định, tối giản hoá pipeline huấn luyện lớn. - https://github.com/Picovoice/picollm — ⭐305
Inference LLM on‑device với quantization X‑bit — phản ánh nhu cầu privacy/on‑device. - https://github.com/open-compass/opencompass — ⭐6,783
Nền tảng đánh giá LLM, cần thiết khi nhiều model mới liên tục xuất hiện.
🔍 RAG / Tri thức (vector DB, retrieval, memory)
- https://github.com/run-llama/llama_index — ⭐47,875
Leading document agent/RAG layer — trung tâm kết nối dữ liệu→LLM. - https://github.com/milvus-io/milvus — ⭐43,455
Vector DB hiệu suất cao, dùng rộng trong RAG production. - https://github.com/qdrant/qdrant — ⭐29,778
Vector search engine, chú trọng scale & cloud. - https://github.com/weaviate/weaviate — ⭐15,857
Vector DB + semantic search, kết hợp filters/metadata. - https://github.com/lancedb/lancedb — ⭐9,596
Embedded retrieval library, hướng dev thân thiện. - https://github.com/mem0ai/mem0 — ⭐50,716
Lớp memory universal cho AI agents — giải pháp lưu/truy xuất trạng thái dài hạn. - https://github.com/VectifyAI/PageIndex — ⭐22,597
Khái niệm “vectorless” document index, sáng tạo trong trade‑off giữa lưu trữ và reasoning. - https://github.com/PaddlePaddle/PaddleOCR — ⭐72,824
OCR mạnh cho chuỗi dữ liệu hình ảnh→text, then vào pipeline RAG.
Phần 3 — Phân tích tín hiệu xu hướng (200–300 từ)
Cộng đồng đang tập trung mạnh mẽ vào hệ sinh thái agent: hôm nay nhiều repo agent/agent‑harness (stack như langchain, dify, deer‑flow, everything‑claude‑code, Flowise, browser‑use) có mức tương tác lớn, cho thấy chuyển tiếp từ “LLM như chat” sang “LLM như hệ điều hành tác vụ” — tức là tích hợp tool‑calling, memories, subagents và sandboxes để xử lý workflow thực tế. Kèm theo đó, RAG và vector DB vẫn là hạ tầng cốt lõi: LlamaIndex, Milvus, Qdrant, Mem0… cho thấy nhu cầu kết hợp dữ liệu lớn với reasoning vẫn tăng. Một nhánh rõ rệt là privacy/on‑device inference và tối ưu hoá: Picovoice/picollm, tin tức về on‑device quantization và các dự án “anything‑llm”/LEANN cho thấy nhiều nhóm muốn chạy inference local để tránh phí API và rủi ro dữ liệu. Ngoài ra, xuất hiện surge các ứng dụng “monetize with AI” và multi‑agent trong tài chính/content (MoneyPrinter, TradingAgents, OpenBB) cùng repo pentagi (autonomous pentest) báo hiệu cả cơ hội và rủi ro bảo mật; cộng đồng cần chú ý governance và sandboxing. Cuối cùng, availability của nhiều model mở (Kimi‑K2.5, Qwen, Gemma…) qua runtime như Ollama làm giảm rào cản entry cho production LLM — thúc đẩy cả layer infra và app. Tóm lại: tập trung vào agent orchestration + RAG + inference/quantization.
Phần 4 — Điểm nóng cộng đồng (3–5 mục)
- Agent harness & safety sandboxes — ví dụ: https://github.com/affaan-m/everything-claude-code và https://github.com/bytedance/deer-flow
Lý do: surge sao/trending cho thấy nhiều nhóm đang đầu tư vào quản lý hành vi, kỹ năng, memory và bảo mật agent. - RAG + vector DB convergence — ví dụ: https://github.com/run-llama/llama_index + https://github.com/milvus-io/milvus + https://github.com/mem0ai/mem0
Lý do: production agents cần truy xuất dữ liệu hiệu quả và lưu memory dài hạn. - On‑device inference & quantization — ví dụ: https://github.com/Picovoice/picollm và https://github.com/Mintplex-Labs/anything-llm
Lý do: privacy‑first và chi phí inference thúc đẩy giải pháp chạy cục bộ. - Ứng dụng ngành hóa & tự động hóa nội dung (tài chính, video, chatops) — ví dụ: https://github.com/TauricResearch/TradingAgents và https://github.com/FujiwaraChoki/MoneyPrinterV2
Lý do: nhiều repo trending cho thấy demand thương mại hoá nhanh, cần quan tâm đến ethical/legal/regulatory. - Web‑access tooling cho agents — ví dụ: https://github.com/browser-use/browser-use và https://github.com/jackwener/opencli
Lý do: cho phép agent thực thi tác vụ trực tiếp trên web/CLI là bước cần thiết để đưa agent vào workflow thực tế.
Kết
Ngày hôm nay rõ ràng là “thời của agent”: influx dự án agent‑harnesss, RAG và vector DB ổn định, cùng sự tăng tốc của on‑device inference. Nếu bạn phát triển trong lĩnh vực AI, ưu tiên theo dõi stack agent→RAG→inference (vllm/ollama/quant) và chú trọng sandboxing/bảo mật khi đưa agent vào production.
Nếu cần, tôi có thể xuất báo cáo ngắn hơn cho từng nhóm công nghệ, hoặc checklist kỹ thuật để đánh giá integrate một agent stack production-ready.
Bản tin này được tạo tự động bởi agents-radar.