
大家好,我是 Ai 学习的老章
大模型还是要学啊,太深了,学无止境
老章长期大量网上冲浪,推荐几个图文教程/视频课程
1 是优质,2 是免费
别看到英文就露怯,沉浸式翻译插件一键就 OK 了

《大语言模型推理手册》是一本集技术术语表、指南和参考资料于一身的手册,全面涵盖大语言模型推理相关知识。其内容从核心概念与性能指标,如首令牌生成时间、每秒生成令牌数,到优化技术,如连续批处理、前缀缓存,以及生产环境中的部署、扩展和操作最佳实践。手册面向在生产环境中部署、扩展或操作大语言模型的工程师,无论微调小模型还是大规模部署,只要目标是提升推理速度、降低成本或增强可靠性,都适用。
这是一门关于生成式人工智能(Generative AI)的课程介绍及开发环境搭建指南。
课程从 AI 基础原理讲起,包括其定义、起源和大语言模型的兴起,后续进入实践教程,如构建聊天机器人、实现检索增强生成等,旨在帮助学员构建可扩展的实际 AI 应用。
课程特色在于无晦涩术语,讲解深入浅出。同时,阐述了 AI 工程与传统机器学习的关键区别,如 AI 工程更侧重模型适配而非训练等。文档还详细给出了搭建开发环境及运行实验练习的步骤,涵盖安装 Visual Studio Code、Git、Python 扩展,克隆仓库,创建环境文件获取 OpenAI API 密钥,设置 Python 虚拟环境等,最后提供了常见问题的解决办法及安全注意事项。

**"上下文工程是一门精妙的艺术与科学,其核心在于为后续步骤精准填充语境窗口中的信息。" — Andrej Karpathy
该文档围绕“上下文工程(Context Engineering)”展开,强调其超越提示工程,是一门关于为模型下一步操作精准填充上下文窗口信息的艺术与科学。文档以生物学隐喻构建了从基础到高级的四层上下文工程学习路径,包括原子、分子、细胞、器官等基础部分,神经网络和神经场等场论部分,协议外壳和统一系统等协议系统部分,以及元递归框架等元递归部分。

在大语言模型能够遵循指令或回答问题前,需经历预训练与后期训练两个关键阶段。这门由华盛顿大学助理教授、NexusFlow 联合创始人朱邦华讲授的“大语言模型(LLM)的后期训练”短期课程,旨在教授学员如何对大语言模型进行后期训练与定制。
课程中,可以学到监督微调(SFT)、直接偏好优化(DPO)和在线强化学习(RL)这三种常见的后期训练方法,了解其基本概念、常见用例以及为有效训练策划高质量数据的原则,并通过实践操作,从 HuggingFace 下载预训练模型,运用这三种方法进行后期训练,观察不同技术对模型行为的塑造。

该项目聚焦检索增强生成(RAG)技术,拥有全面且动态的 RAG 教程集合,涵盖多种先进技术,旨在提升 RAG 系统的准确性、效率和上下文丰富度。通过丰富的关键特性,如包含最前沿的 RAG 增强技术、详尽的文档说明、实用的实施指南以及定期更新等,展示了其在 RAG 领域的专业性与前沿性。项目详细阐述了众多 RAG 技术,包括基础技术、查询增强、上下文丰富、高级检索、迭代技术、评估、可解释性以及先进架构等方面,每种技术都有概述及实施方法。

该仓库是《从零构建大语言模型》一书的官方代码库,包含开发、预训练和微调类似 GPT 的大语言模型的代码。书中通过逐步编写代码,由内而外深入讲解大语言模型的工作原理,指导读者创建自己的大语言模型,并以清晰的文字、图表和示例阐释每个阶段。其训练和开发自用小型功能模型的方法与创建大规模基础模型(如 ChatGPT 背后的模型)的方法相似,还提供了加载更大预训练模型权重进行微调的代码。
来源见截图
这本主要讲神经网络

这本是深度学习

参考资料
[1]
LLM Inference Handbook: https://bentoml.com/llm/
[2]
GenerativeAICourse: https://github.com/AbdullahAbuHassann/GenerativeAICourse
[3]
Context-Engineering: https://github.com/davidkimai/Context-Engineering
[4]
Post-training of LLMs: https://learn.deeplearning.ai/courses/post-training-of-llms/lesson/n25bz/introduction
[5]
Advanced RAG Techniques: https://github.com/NirDiamant/RAG_Techniques
[6]
Build a Large Language Model (From Scratch): https://github.com/rasbt/LLMs-from-scratch#build-a-large-language-model-from-scratch