Skip to content

YSGStudyHards/Awesome-AI

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 

Repository files navigation

Awesome-AI

🤖 Awesome AI — 一份精心整理的人工智能资源清单

涵盖从基础数学、经典算法到最前沿的大语言模型(LLM)与智能体(Agents)

助你从零开始掌握 AI 的全景学习指南

Awesome GitHub stars GitHub forks


📖 目录


🧮 AI 基础数学

扎实的数学基础是学好 AI 的关键,涵盖线性代数、概率统计、微积分和最优化理论。

线性代数

资源名称 类型 描述 链接
线性代数(Gilbert Strang,MIT OpenCourseWare) 视频课程 MIT 最经典的线性代数公开课,Strang 教授讲解清晰 🔗
《线性代数及其应用》 书籍 David C. Lay 著,适合初学者,理论与应用并重 🔗
3Blue1Brown:线性代数的本质 视频 用可视化动画直觉理解线性代数核心概念 🔗
Interactive Linear Algebra 在线教材 佐治亚理工交互式线性代数教材,含可视化工具 🔗

概率论与数理统计

资源名称 类型 描述 链接
概率论与数理统计(陈希孺) 书籍 中文经典教材,中科大版本,严谨系统 🔗
《概率论沉思录》(Jaynes) 书籍 从贝叶斯视角深入理解概率论,适合进阶读者 🔗
Statistics and Probability(Khan Academy) 在线课程 免费、系统的统计与概率入门课,适合零基础 🔗
《统计学习方法》(李航) 书籍 中文 AI 领域必读书籍之一,涵盖统计机器学习核心方法 🔗

微积分与优化

资源名称 类型 描述 链接
Calculus(MIT OpenCourseWare) 视频课程 MIT 单变量与多变量微积分公开课 🔗
《凸优化》(Boyd & Vandenberghe) 书籍/课程 斯坦福凸优化经典教材,免费在线阅读 🔗
3Blue1Brown:微积分的本质 视频 直觉化理解微积分核心概念的动画系列 🔗

🤖 经典机器学习算法

掌握机器学习的经典算法,是迈向深度学习与 AI 的必经之路。

入门教材与课程

资源名称 类型 描述 链接
机器学习(Andrew Ng,Coursera) 视频课程 AI 领域最经典的入门 MOOC,适合零基础学习者 🔗
《机器学习》(周志华,西瓜书) 书籍 中文机器学习最权威教材,系统覆盖各类算法 🔗
《统计学习方法》(李航) 书籍 中文 AI 必读,侧重统计机器学习理论基础 🔗
CS229:Machine Learning(Stanford) 课程讲义 斯坦福经典机器学习课程,讲义与视频均免费 🔗
《Hands-On ML with Scikit-Learn, Keras & TF》 书籍 Aurélien Géron 著,实战导向,代码丰富 🔗

经典算法概览

算法 适用场景 推荐学习资源
线性回归 / 逻辑回归 回归、分类 Scikit-Learn 官方文档
决策树 / 随机森林 分类、回归 Scikit-Learn 决策树
支持向量机(SVM) 分类、回归 CS229 讲义第 6 章
K-近邻算法(KNN) 分类、回归 Scikit-Learn 官方文档
K-Means 聚类 无监督聚类 Scikit-Learn 聚类
主成分分析(PCA) 降维 Scikit-Learn 官方文档
朴素贝叶斯 文本分类 Scikit-Learn 官方文档
梯度提升(XGBoost/LightGBM) 竞赛利器 XGBoost 文档

工具库

工具 描述 链接
Scikit-Learn Python 机器学习最流行的库,算法丰富、文档完善 🔗
XGBoost 高效梯度提升库,竞赛和工业界广泛使用 🔗
LightGBM 微软出品的高效梯度提升框架 🔗

🧠 深度学习

深度学习是现代 AI 的核心驱动力,涵盖神经网络、CNN、RNN、Transformer 等关键技术。

入门教材与课程

资源名称 类型 描述 链接
深度学习专项课程(Andrew Ng,Coursera) 视频课程 五门课系列,系统学习深度学习,中英文均有字幕 🔗
动手学深度学习(李沐) 书籍/课程 中文深度学习教材,代码实战导向,GitHub 星标极高 🔗
CS231n:CNN for Visual Recognition 课程 斯坦福计算机视觉经典课程,深度讲解 CNN 🔗
CS224N:NLP with Deep Learning 课程 斯坦福 NLP 深度学习课程,涵盖 RNN、Transformer 🔗
《深度学习》(花书,Goodfellow 等) 书籍 深度学习领域奠基之作,理论深度极高 🔗
Fast.ai 实用深度学习 在线课程 以实战为先的深度学习课程,适合有编程基础的初学者 🔗

主流框架

框架 描述 链接
PyTorch Meta 开源,学术界最流行的深度学习框架 🔗
TensorFlow / Keras Google 开源,工业界广泛应用 🔗
JAX Google 开源,高性能数值计算与自动微分 🔗
PaddlePaddle 百度自研深度学习框架,中文生态完善 🔗
MindSpore 华为开源 AI 计算框架 🔗

关键技术方向

方向 代表模型/技术 推荐资源
计算机视觉(CV) ResNet, YOLO, ViT, SAM 2 Papers With Code - CV
自然语言处理(NLP) BERT, GPT, T5, LLaMA HuggingFace 模型库
语音识别与合成 Whisper, wav2vec 2.0, Fish Speech Whisper GitHub
图像生成 DALL-E 3, Flux, Stable Diffusion 3.5 Diffusers 库
视频生成 Sora, Kling, Runway Gen-3 Sora
强化学习 DQN, PPO, AlphaGo Spinning Up in Deep RL
图神经网络(GNN) GCN, GAT, GraphSAGE PyTorch Geometric

💬 大语言模型(LLM)

大语言模型(LLM)是当前 AI 最前沿的研究方向,以 GPT、LLaMA、Claude 等为代表。

里程碑模型

模型 机构 开源 特点 链接
GPT-4o / GPT-4.5 OpenAI 业界顶级闭源大模型,GPT-4.5 为最新一代 🔗
o1 / o3 OpenAI 推理增强模型,擅长数学、编程与复杂推理 🔗
ChatGPT OpenAI 最广泛使用的 AI 对话助手 🔗
Claude 3.7 Sonnet Anthropic 混合推理模型,支持扩展思考,长上下文能力强 🔗
Gemini 2.5 Pro Google DeepMind 原生多模态思考模型,推理能力顶级 🔗
LLaMA 4 Meta 最新一代开源大模型,支持多模态,MoE 架构 🔗
Mistral / Mixtral Mistral AI 高效开源模型,MoE 架构 🔗
Qwen 2.5(通义千问) 阿里巴巴 最新通义千问系列,编程与数学能力大幅提升 🔗
DeepSeek-V3 深度求索 国产高性能开源大模型,MoE 架构,性能强劲 🔗
DeepSeek-R1 深度求索 开源推理模型,推理能力媲美 OpenAI o1 🔗
Grok xAI 马斯克 xAI 大模型,开源 Grok-1 🔗
GLM-4(ChatGLM) 清华大学 清华开源,中文优化,支持工具调用和多模态 🔗
Baichuan(百川) 百川智能 中文优化开源大模型 🔗
Yi(零一万物) 零一万物 李开复创立,中英双语能力出色 🔗
InternLM(书生) 上海 AI 实验室 国产高性能开源模型,科研友好 🔗
Phi-4 Microsoft 小型高效模型,端侧部署友好 🔗
Gemma 3 Google 谷歌最新开源模型,支持多模态和多语言 🔗
Command R+ Cohere 企业级 RAG 优化模型,长上下文 🔗

多模态大模型

模型 机构 特点 链接
GPT-4o OpenAI 文本+图像+语音全模态 🔗
Gemini 2.5 Pro Google 原生多模态思考模型,支持流式输出 🔗
Claude 3.7 Sonnet Anthropic 强视觉理解,支持 PDF 分析与扩展思考 🔗
LLaVA-NeXT 学术界 新一代开源视觉语言模型,能力大幅提升 🔗
Qwen2.5-VL 阿里巴巴 最新中文多模态模型,视觉理解和视频理解强 🔗
InternVL 2.5 上海 AI 实验室 开源多模态,性能强劲,支持多种视觉任务 🔗
DALL-E 3 OpenAI 高质量文生图 🔗
Flux Black Forest Labs 新一代开源图像生成模型,质量超越 SD 🔗
Stable Diffusion 3.5 Stability AI 最流行的开源图像生成模型最新版 🔗
Midjourney Midjourney 商业图像生成,艺术风格出色 🔗
Sora OpenAI 文生视频里程碑模型 🔗
Kling(可灵) 快手 国产文生视频模型,生成效果出色 🔗
Runway Gen-3 Alpha Runway 商业级文生视频,创意工具 🔗

LLM 核心技术

技术 描述 推荐资源
Transformer 架构 LLM 的基础架构 Attention Is All You Need 论文
预训练(Pre-training) 大规模语料上的自监督学习 GPT 系列论文
指令微调(SFT) 让模型遵循人类指令 InstructGPT 论文
RLHF 基于人类反馈的强化学习 RLHF 介绍博客
GRPO 基于群组的策略优化,DeepSeek-R1 训练方法 DeepSeek-R1 论文
RAG(检索增强生成) 结合外部知识库增强模型能力 RAG 论文
提示工程(Prompt Engineering) 设计有效提示词的技术 Prompt Engineering Guide
量化(Quantization) 降低模型推理成本 GPTQ 论文
LoRA / QLoRA 低成本微调大模型 LoRA 论文
模型对齐(Alignment) 让 AI 更安全、符合人类价值观 Constitutional AI
长上下文(Long Context) 扩展模型处理长文本的能力 RoPE 论文
MoE(混合专家模型) 稀疏激活提升效率 Mixtral 论文
思维链推理(CoT) 提升模型复杂推理能力 CoT 论文
推理增强(Test-time Compute) 推理时增加计算量以提升推理能力 OpenAI o1 博客
蒸馏(Distillation) 将大模型能力迁移到小模型 DistilBERT 论文
MCP(模型上下文协议) Anthropic 开源的模型与工具交互协议 MCP 官方文档

LLM 学习资源

资源名称 类型 描述 链接
LLM 课程(Maxime Labonne) 在线课程 系统学习 LLM 的开源课程,从理论到微调 🔗
大规模语言模型:从理论到实践 书籍 复旦大学团队出品,中文 LLM 学习资料 🔗
Andrej Karpathy:Let's build GPT 视频 从零手写 GPT,深入理解 Transformer 🔗
Andrej Karpathy:Neural Networks: Zero to Hero 视频系列 从零构建神经网络直到 LLM,强烈推荐 🔗
Hugging Face NLP 课程 在线课程 HF 官方 NLP 与 LLM 入门教程 🔗
Hugging Face Agents 课程 在线课程 HF 官方 AI Agent 开发教程 🔗
A Survey of Large Language Models 论文 LLM 综述论文,覆盖全面 🔗
3Blue1Brown:深度学习可视化 视频 用动画直觉理解神经网络与 Transformer 🔗
DeepSeek-R1 技术解读 论文/博客 理解推理模型训练范式的重要参考 🔗

🕵️ 智能体(Agents)

AI Agent 是能够自主规划、调用工具、完成复杂任务的智能系统,是当前 AI 最热门的应用方向之一。

核心概念

概念 描述
规划(Planning) Agent 分解目标、制定步骤的能力
工具调用(Tool Use) Agent 调用外部 API、代码执行等能力
记忆(Memory) 短期记忆(上下文)与长期记忆(向量数据库)
多 Agent 协作 多个 Agent 分工合作完成复杂任务
ReAct 框架 推理(Reasoning)+ 行动(Acting)交替进行
反思(Reflection) Agent 自我评估和迭代改进的能力

主流 Agent 框架

框架 描述 链接
LangChain 最流行的 LLM 应用开发框架,生态丰富 🔗
LangGraph LangChain 出品的图工作流 Agent 框架,支持复杂编排 🔗
LlamaIndex 专注于数据索引和 RAG 的框架 🔗
AutoGen 微软开源的多 Agent 对话框架 🔗
CrewAI 多 Agent 角色协作框架,易用性好 🔗
MetaGPT 模拟软件公司的多 Agent 框架 🔗
Dify 开源 LLM 应用开发平台,支持可视化编排 🔗
OpenAI Agents SDK OpenAI 官方 Agent 开发框架,支持工具调用与交接 🔗
Google ADK Google Agent Development Kit,构建多 Agent 系统 🔗
AutoGPT 早期自主 Agent 的代表项目 🔗
BabyAGI 基于任务驱动的自主 Agent 🔗
Camel 多 Agent 角色扮演框架 🔗
Phidata(Agno) 构建具备记忆和工具的 AI 助手 🔗
TaskWeaver 微软开源的代码优先 Agent 框架 🔗
Qwen-Agent 阿里通义千问 Agent 框架 🔗
Mastra TypeScript AI Agent 框架,集成 MCP 协议 🔗
Smolagents HuggingFace 轻量级 Agent 框架 🔗

Agent 协议与标准

协议 描述 链接
MCP(Model Context Protocol) Anthropic 开源的模型上下文协议,标准化工具调用 🔗
A2A(Agent-to-Agent Protocol) Google 提出的 Agent 间通信协议 🔗

Agent 应用案例

应用 描述 链接
Devin AI 软件工程师,自主完成编程任务 🔗
OpenHands(OpenDevin) 开源 AI 软件开发 Agent 🔗
SWE-agent 自动修复 GitHub Issues 的 Agent 🔗
Perplexity AI 基于 Agent 的 AI 搜索引擎 🔗
Cursor AI 编程助手,深度集成 LLM 的 IDE 🔗
GitHub Copilot 微软/GitHub AI 编程助手 🔗
Claude Code Anthropic 推出的终端 AI 编程 Agent 🔗
Windsurf Codeium 推出的 AI IDE,支持多步骤编程 🔗
Cline VS Code AI 编程插件,支持自主代码编写 🔗
Manus 通用 AI Agent,支持复杂任务自动化 🔗
Lovable AI 全栈应用生成器,对话式构建 Web 应用 🔗
Bolt.new StackBlitz 推出的 AI 全栈开发工具 🔗

Agent 学习资源

资源名称 类型 描述 链接
LangChain Academy 课程 LangChain 官方学习路径,从 RAG 到 Agent 🔗
AI Agents in LangGraph 课程 LangGraph 构建 Agent 的官方课程 🔗
Building Agentic RAG with LlamaIndex 课程 LlamaIndex 官方 Agentic RAG 课程 🔗
Multi AI Agent Systems with CrewAI 课程 多 Agent 协作系统入门 🔗
Lilian Weng:LLM Powered Autonomous Agents 博客 OpenAI 研究员写的 Agent 综述博客,必读 🔗
The Rise and Potential of LLM-based Agents 论文 LLM Agent 综述论文 🔗
MCP 官方文档与教程 文档 学习模型上下文协议,构建工具集成 🔗
Anthropic:Building effective agents 博客 Anthropic 官方 Agent 构建最佳实践指南 🔗

🛠️ AI 工具与框架

LLM 推理与部署

工具 描述 链接
Ollama 本地运行开源 LLM 的最简单方式 🔗
vLLM 高吞吐量 LLM 推理和服务框架 🔗
llama.cpp CPU 推理开源 LLM 的利器 🔗
LM Studio 桌面端本地 LLM 运行工具 🔗
TensorRT-LLM NVIDIA 高性能 LLM 推理优化 🔗
SGLang 高性能 LLM 服务框架,支持结构化生成 🔗
Text Generation Inference HuggingFace 生产级 LLM 推理服务 🔗
MLX Apple 芯片优化的机器学习框架 🔗
Jan 开源本地 AI 助手,支持离线运行 🔗

模型微调

工具 描述 链接
LLaMA-Factory 一站式高效 LLM 微调工具,支持多种模型 🔗
Axolotl 灵活的 LLM 微调框架 🔗
Unsloth 极速低内存占用 LLM 微调工具 🔗
PEFT HuggingFace 参数高效微调库 🔗
TRL HuggingFace 强化学习微调库(RLHF/DPO) 🔗
Swift 阿里 ModelScope 高效微调框架 🔗

向量数据库(RAG 必备)

工具 描述 链接
Chroma 轻量级开源向量数据库,开发友好 🔗
Milvus 高性能开源向量数据库,支持大规模部署 🔗
Weaviate 开源向量数据库,支持多模态 🔗
Qdrant 高性能向量搜索引擎,Rust 编写 🔗
FAISS Meta 开源的高效向量相似度搜索库 🔗
pgvector PostgreSQL 的向量扩展 🔗

模型评估

工具 描述 链接
OpenCompass 上海 AI 实验室 LLM 评测平台 🔗
lm-evaluation-harness EleutherAI 开源 LLM 评测框架 🔗
MMLU 多学科多任务语言理解评测基准 🔗
HumanEval 代码生成能力评测基准 🔗

LLM API 与平台

平台 描述 链接
OpenAI API ChatGPT/GPT-4 系列官方 API 🔗
Anthropic API Claude 系列官方 API 🔗
Google AI Studio Gemini 系列免费调用入口 🔗
HuggingFace Inference API 数千模型一键调用 🔗
OpenRouter 多模型聚合 API 网关,一个 Key 调用多模型 🔗
Together AI 高性能开源模型推理平台 🔗
Groq 超低延迟 LLM 推理平台(LPU 芯片) 🔗
阿里云百炼 阿里云大模型服务平台(含通义系列) 🔗
百度千帆 百度大模型服务平台(含文心系列) 🔗
腾讯混元 腾讯大模型服务 🔗
硅基流动(SiliconFlow) 国内高性价比推理平台,聚合多模型 🔗
月之暗面(Moonshot / Kimi) 长文本理解能力强,国内流行 🔗
智谱 AI(GLM) 清华系大模型 API 服务 🔗
DeepSeek 开放平台 深度求索 API 服务,高性价比 🔗

📚 学习路线与课程

系统性学习路径

资源名称 描述 链接
AI/ML 学习路线图(roadmap.sh) 可视化 AI/ML 学习路线图 🔗
Deep Learning Specialization Andrew Ng 深度学习专项,共 5 门课 🔗
Machine Learning Specialization Andrew Ng 机器学习专项,共 3 门课 🔗
Full Stack LLM Bootcamp LLM 应用全栈开发训练营 🔗
DeepLearning.AI Short Courses 与业界领袖合作的系列短课程 🔗
fast.ai Practical Deep Learning 自上而下的实用深度学习课程 🔗
Microsoft AI-For-Beginners 微软开源 AI 入门课程(12 周) 🔗
Google Machine Learning Crash Course Google 免费机器学习速成课程 🔗

中文优质课程

资源名称 平台 描述 链接
动手学深度学习(李沐) B站/官网 最受欢迎的中文深度学习课程,代码实战 🔗
跟李沐学 AI B站 李沐论文精读、代码实现系列视频 🔗
吴恩达机器学习(中文字幕) B站 Coursera 课程中文字幕版 🔗
LLM 大模型学习路线 GitHub 面向中文学习者的 LLM 系统学习路线 🔗
大模型实战教程(DataWhale) GitHub DataWhale 社区出品的 LLM 实战课程 🔗
Prompt Engineering for LLM GitHub DataWhale 提示工程实践指南 🔗

📄 论文与研究资源

必读经典论文

论文 贡献 链接
Attention Is All You Need(2017) 提出 Transformer 架构 🔗
BERT(2018) 预训练语言模型范式 🔗
GPT-3(2020) 大规模语言模型 few-shot 学习 🔗
InstructGPT(2022) RLHF 对齐方法 🔗
Chain-of-Thought Prompting(2022) 思维链推理提示 🔗
LLaMA(2023) 开源大语言模型 🔗
GPT-4 Technical Report(2023) GPT-4 技术报告 🔗
Toolformer(2023) LLM 自主学习使用工具 🔗
ReAct(2022) 推理与行动结合的 Agent 框架 🔗
Mixtral of Experts(2024) 高效混合专家架构 🔗
DeepSeek-V3(2024) 高效开源大模型架构 🔗
DeepSeek-R1(2025) 开源推理模型,RL 训练范式创新 🔗
Qwen2.5 Technical Report(2024) 通义千问系列技术报告 🔗
LLaMA 3(2024) Meta 开源大模型技术报告 🔗

论文资源平台

平台 描述 链接
arXiv(cs.AI/cs.LG/cs.CL) 最新 AI 预印本论文 🔗
Papers With Code 论文+开源代码,附性能排行榜 🔗
Semantic Scholar AI 辅助学术搜索引擎 🔗
Google Scholar 谷歌学术搜索 🔗
Hugging Face Papers 最受关注的 AI 论文每日推送 🔗
The Batch(DeepLearning.AI) Andrew Ng 主编的 AI 周报 🔗

📦 实战项目与数据集

推荐实战项目

项目 描述 链接
手写数字识别(MNIST) 深度学习 Hello World,CNN 入门 🔗
情感分析 NLP 经典任务,文本分类入门 🔗
图像分类(ImageNet/CIFAR) 计算机视觉入门任务 🔗
构建自己的 GPT 从零实现 GPT,理解 Transformer 🔗
构建 RAG 问答系统 LLM + 向量数据库实战 🔗
Fine-tune LLaMA 使用 LoRA 微调开源大模型 🔗
构建 AI Agent 用 LangChain 构建工具调用 Agent 🔗
Kaggle 机器学习竞赛 真实数据集竞赛,学以致用 🔗

常用数据集

数据集 领域 描述 链接
ImageNet CV 大规模图像分类数据集 🔗
COCO CV 目标检测、分割数据集 🔗
GLUE / SuperGLUE NLP NLU 综合评测基准数据集 🔗
Common Crawl LLM 超大规模网页语料,LLM 预训练用 🔗
The Pile LLM EleutherAI 大规模预训练语料 🔗
BELLE LLM 中文指令微调数据集 🔗
Alpaca LLM 斯坦福指令微调数据集 🔗
HuggingFace Datasets 综合 数万个公开数据集的中心平台 🔗
Kaggle Datasets 综合 机器学习竞赛与开放数据集 🔗

🌐 AI 社区与资讯

社区与论坛

社区 描述 链接
Hugging Face AI 模型、数据集、应用的开源社区 🔗
Reddit r/MachineLearning 机器学习英文社区,最新研究讨论 🔗
Reddit r/LocalLLaMA 本地 LLM 运行爱好者社区 🔗
ModelScope(魔搭社区) 阿里巴巴 AI 模型开源社区 🔗
AI研习社 国内 AI 学习交流社区 🔗

必关注博客与新闻

资源 描述 链接
OpenAI Blog OpenAI 官方研究博客 🔗
Google DeepMind Blog DeepMind 最新研究成果 🔗
Anthropic Research Claude 背后的 AI 安全研究 🔗
Lilian Weng's Blog OpenAI 研究员的高质量技术博客 🔗
Sebastian Raschka's Blog ML 研究员的高质量技术博客 🔗
The Gradient AI 研究深度分析媒体 🔗
AI Weekly AI 行业周报 🔗
机器之心 国内领先 AI 科技媒体 🔗
量子位 国内 AI 资讯媒体 🔗
新智元 国内 AI 前沿资讯 🔗

GitHub 精选仓库

仓库 描述 链接
awesome-machine-learning 机器学习资源汇总,GitHub Stars 极高 🔗
awesome-deep-learning 深度学习资源汇总 🔗
awesome-llm 大语言模型资源汇总 🔗
awesome-langchain LangChain 资源汇总 🔗
LLMSurvey LLM 综述论文及相关资源 🔗
Awesome-Chinese-LLM 中文大模型资源汇总 🔗
open-llms 可商用的开源大模型列表 🔗
awesome-mcp-servers MCP 服务器资源汇总 🔗
awesome-deepseek-integration DeepSeek 集成与应用汇总 🔗

🤝 贡献指南

欢迎提交 Issue 或 Pull Request 贡献更多优质 AI 资源!

贡献时请遵循以下原则:

  • 确保资源真实有效,链接可访问
  • 对资源进行简短准确的中文描述
  • 按照现有表格格式添加内容
  • 优先收录高质量、经过验证的学习资源

如果这个项目对你有帮助,请给一个 ⭐ Star 支持!

Made with ❤️ by YSGStudyHards

About

🤖Awesome AI,一份精心整理的人工智能资源清单,涵盖从基础数学、经典算法到最前沿的大语言模型(LLM)与智能体(Agents)。助你从零开始掌握 AI 的全景学习指南。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors