暂无搜索历史
UDF 的核心逻辑是一行进、一个值出,本质上是对表中每一行的某个字段做一次独立的转换或计算,结果作为新的一列返回。你可以把它理解为对每一行数据套用同一个"加工模...
🚀 本文收录于 AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!
想象你在使用 ChatGPT 处理工作文档。你上传了一份 200 页的公司手册,然后问"我们的年假政策是什么?"AI 瞬间就能找到相关段落并回答你。这背后不是把...
想象一家医院,如果只有一位"全科医生"处理所有病人,效率会很低;但如果有内科、外科、眼科等多位专科医生,每个病人根据症状被分配给最合适的专家,效率和质量都会大幅...
AI Agent(智能体)是一种能够自主感知环境、制定计划、并采取行动来完成目标的人工智能系统。与传统的 AI 工具不同,它不只是"你问一句,它答一句",而是能...
LoRA 全称是 Low-Rank Adaptation(低秩适配),是一种用于微调大型预训练模型的技术。简单来说,它是一种让你用很少的资源和数据,就能"教会"...
RAG 是一种将"信息检索"与"大语言模型生成"相结合的技术架构。简单来说,它让 AI 在回答问题之前,先去查阅相关资料,然后基于查到的内容来生成答案。你可以把...
微调(Fine-tuning)是指在一个已经预训练好的大语言模型基础上,用特定领域或任务的数据继续训练,让模型更好地适应具体需求。
有关人工智能的学习内容
在 Transformer 出现之前,处理文本的主流方法是 RNN 及其改进版 LSTM。它们有几个比较头疼的问题。
LLM 蒸馏 (Distillation) 是一种技术,用于将大型语言模型 (LLM) 的知识转移到较小的模型中。其主要目的是在保持模型性能的同时,减少模型的大...
宏观来看:Spark SQL 语句,经过一个优化器(Catalyst),转化为 RDD,交给集群执行。
GROUPING SETS 是 SQL 中 GROUP BY 子句的扩展功能,它的核心作用是:在一次查询中同时执行多个不同维度的分组统计,最后将所有分组的结果合...
物化视图是数据库中的一种特殊对象,它存储了查询结果的物理副本,与普通视图(只保存查询定义)不同。
暂未填写学校和专业
暂未填写个人网址