课程亮点
1.涵盖大模型prompt、RAG、LangChain、Fine-Turning、多模态、视觉生成等主流开源大模型技术
2.OpenAl开源大模型、昇腾大模型产品丝滑融合
3.从大模型产品开发到商业闭环到产品运营一站式打造大模型高级解决方案架构师
4.金牌讲师团队+昇腾计算一线专家倾力交付
5.岗位年薪30W+,打造超一流就业薪资
6.送价值2000元昇腾系列高性能训练服务器实验环境
HCIP-AI Solution Architect课程简介
该阶段详细介绍昇腾大模型解决方案、AscendSpeed 加速框架、华为智算中心解决方案、大模型应用开发基础、提示工程、RAG,共计 63 课时。
第一节:计算机视觉技术概述与图像处理基础 - (6 课时)
- 什么是计算机视觉;计算机视觉技术发展简史;计算机视觉技术的应用领域;计算机视觉技术在人工智能产业中的重要性及作用;
- 什么是图像处理;图像处理常见需求点;图像处理技术分类;图像处理工具介绍;图像的表示与数字化;图像的表示方法;图像数字化过程:采样、量化、编码;基本图处理操作:缩放、旋转、镜像;
- 图像增强:亮度调整、对比度增强;图像滤波:均值滤波、高斯滤波、中值滤波;图像的边缘检测:Sobel、Prewitt、Canny 算子;图像分割:阈值分割、区域分割、边缘分割;
- 图像二值化:全局二值化、自适应二值化;形态学图像处理:腐蚀、膨胀、开操作、闭操作;形态学应用:图像去除噪声、图像分割;
第二节:图像的特征提取与描述 - (3 课时)
- 关键点检测:关键点的概念与特征、角点、边缘点;常见的关键点检测算法:Harris 角点检测、Shi-Tomasi 角点检测;图像的局部特征与全局特征;
- 特征向量的表示与匹配:特征向量的表示方法(向量、直方图、直方图梯度);特征向量的相似度度量方法(欧氏距离、汉明距离、余弦相似度);特征匹配算法(最近邻匹配、RANSAC 算法);
第三节:图像分类与目标(对象)检测 - (3 课时)
- 什么是图像分类;分类任务的定义与实施流程;基本图像分类器介绍:SVM、决策树、神经网络;使用深度学习框架进行图像分类任务;
- 对象检测基础概念;对象检测任务的定义及实施流程;基于滑动窗口的方法;
- 基于深度学习的对象检测方法:RCNN、Fast RCNN 网络论文精读;基于深度学习的对象检测方法:YOLOv8 及其历史版本论文精读;
第四节:图像分割与语义分割 - (3 课时)
- 图像分割基础概念;图像分割任务的定义与流程;基于阈值、区域和边缘的图像分割方法介绍;基于深度学习的图像分割方法:FCN、U-Net、SegNet 论文精读;
- 语义分割基础概念;语义分割任务的定义与实施流程;基于全卷积神经网络的语义分割方法;语义分割应用案例介绍:自动驾驶、医学影像分析;
第五节:注意力机制与 Transformer - (6 课时)
- 什么是注意力机制;什么是 Transformer;
- 注意力机制与 Transformer 的背景及含义;注意力机制和 Transformer 在自然语言处理和其他领域中的重要应用;注意力机制的定义和基本概念;
- 注意力机制的作用和优势;注意力机制的发展简史;注意力机制相关经典论文精读;自注意力机制核心原理;自注意力机制与 Transformer 的关系;
- Encoder 与 Decoder 结构及其组件;编码器结构及组件:多头自注意力层、前馈全连接层;解码器结构和组件:编码器-解码器注意力层、多头自注意力层、前馈全连接层;
- Transformer 模型的训练流程;Transformer 模型的训练数据准备及预处理;
- Transformer 训练的优化器选择;
- Transformer 应用领域;
第六节:自然语言处理概述与文本处理基础 - (6 课时)
- 什么是自然语言处理;自然语言处理的应用领域;自然语言处理技术在人工智能领域的重要性;自然语言处理技术的发展趋势;
- 文本处理技术简介;文本处理的应用领域;文本处理任务的实施流程;什么是文本预处理;文本预处理实施步骤:分词、定义、作用;
- 分词方法:基于空格、标点、词典的分词方法;中英文分词工具介绍;什么是标记化;文本预处理实施步骤:标记化、定义、作用;
- 标记化方法:单词、标点符号、数字标记化方法;中英文标记化工具介绍;什么是停用词;文本预处理实施步骤:停用词、定义、作用;
- 常见的停用词列表和移除方法;什么是词形还原;词形还原定义及作用;词干提取和词形还原的区别;常见词形还原方法和工具介绍;
- 什么是词袋模型;词袋模型的定义及作用;文档-词矩阵表示及基于词频的向量化方法;词袋模型的局限性和改进方法;词频-逆文档频率 TF-IDF;TF-IDF 的定义和作用;TF-IDF 在文本分类和信息检索中的应用;TF-IDF 方法的实现和优化技巧;什么是词嵌入;词嵌入的意义及作用;Word2Vec、GloVe、FastText 等常见词嵌入模型介绍;
第七节:语言理解技术 - (3 课时)
- 什么是词性标注;什么是命名体识别;词性标注及命名体识别的任务及方法;
- 常用词性标注及命名体识别模型和工具介绍;
- 什么是句法分析;什么是语法树;句法分析的概念及目标;常见的句法分析方法:依存句法分析、短语结构句法分析;
- 解析树与语法树的概念和表示方法;
第八节:语言生成技术 - (3 课时)
- 什么是语言模型;语言模型的定义和作用;基于统计方法和神经网络的语言模型实战;什么是文本生成;文本生成模型的定义和作用;
- 文本生成任务的常见模型:循环神经网络 RNN、长短期记忆网络 LSTM、门控循环单元 GRU、基于注意力机制的 Transformer 应用实战;
- 什么是机器翻译;机器翻译的定义和作用;什么是文本摘要;文本摘要的定义和作用;
- 机器翻译和文本摘要常见模型:神经机器翻译、抽取式与生成式文本摘要;
第九节:语义理解技术 - (3 课时)
- 什么是文本分类;文本分类任务的定义和常见应用;什么是情感分析;情感分析任务的定义和常见应用;
- 基于机器学习和深度学习的文本分类模型与情感分析模型;
- 什么是文本相似度;文本相似度计算的定义和应用场景;基于词向量和深度学习的文本相似度计算方法;
- 语义匹配任务常见模型:Siamese 网络、BERT;
第十节:常用自然语言处理工具库及综合实战 - (3 课时)
- 常用的自然语言处理工具和库:NLTK、spaCy、Stanford NLP、Gensim;
- 自然语言处理技术综合实战:Kaggle 赛题精讲;
第十一节:昇腾大模型解决方案简介 - (2 课时)
- 昇腾 AI 基础软件介绍;
- 集群监控与运维软件介绍;
第十二节:华为智算中心解决方案简介 - (2 课时)
- 算力方案和昇腾计算产品介绍;
- 网络方案和产品介绍;
- 存储方案和产品介绍;
- 华为天成解决方案介绍;
- 绿色数据中心概念;
第十三节:大模型应用开发基础 - (3 课时)
- AI 产品开发者核心能力概念模型解读;
- AI 大模型能力综述;AI 大模型行业产品介绍;
- AI 大模型基本工作原理解读;
- 大模型应用产品架构;大模型应用技术架构;
- OpenAI API 服务付费教程、API 使用教程;
第十四节:提示工程(Prompt Engine) - (5 课时)
- 什么是提示工程;提示工程调优;
- 提示工程的典型构成;提示工程中如何定义角色;
- 对话系统的基本模块和思路;
- 提示工程思维链、自洽性、思维树;
- Prompt 防止攻击;
第十五节:Function Calling 业务连接 - (6 课时)
- 大模型人机交互接口;大模型自然语言连接;
- Action 连接开发;
- Function Calling 机制原理;
第十六节:检索增强生成模型 RAG - (6 课时)
- 什么是 RAG;LLMs 的固有局限性;
- RAG 系统的基本搭建流程;
- 什么是向量检索;文本向量;向量数据库服务;
- RAG 系统进阶:文本分割的粒度、混合检索;
- 向量模型的本地加载与运行;
领取专属 10元无门槛券
私享最新 技术干货