首页
学习
活动
专区
圈层
工具
发布
首页标签第四期热点征文-大模型技术

#第四期热点征文-大模型技术

构建AI智能体:SVD模型压缩的艺术:如何科学选择K值实现最佳性能

未闻花名

近年来,深度学习模型呈现出越大越好的发展趋势。如今大模型也如雨后春笋般蓬勃发展,随意一个模型动辄需要数百GB的存储空间。这种模型规模的爆炸式增长带来了严峻的挑战...

600

构建AI智能体:SVD知识整理与降维:从数据混沌到语义秩序的智能转换

未闻花名

信息时代,每天都面临着爆炸式的数据增长,以文本数据为例,一个中等规模的文档集合可能涉及数千个不同的词语,每个文档都可以表示为一个高维向量。这种"词袋"表示方法虽...

2400

构建AI智能体:参数的艺术:如何在有限算力下实现高质量的AI诗歌创作

未闻花名

回顾昨日的训练历程,我们经历了一场从混乱到有序的技术探索。初始阶段,模型表现令人堪忧:生成内容严重重复、格律混乱,损失值高达1.7467,输出的诗歌如同破碎的镜...

19610

构建AI智能体:深入浅出LoRA:低成本高效微调大模型的原理与实践

未闻花名

在我们的印象中,我们曾比喻大模型为一位学识渊博、通晓古今的大学者,他读过亿万本书,知识储备深不可测。但是,如果我们先想让他成为我们公司的法律顾问,或者帮我们写中...

96220

构建AI智能体:模型的成绩单:一文读懂损失函数,看懂AI如何学习

未闻花名

在我们与大语言模型的每一次对话背后,都隐藏着一个至关重要的学习机制就是损失函数。这个看似抽象的概念,实则是所有大模型实现智能进化的核心引擎。它如同一位严格的导师...

16310

构建AI智能体:交叉验证:从模型评估的基石到大模型时代的演进

未闻花名

在机器学习的核心工作流中,模型评估与选择是确保最终模型泛化能力的关键。当数据有限时,如何准确评估模型性能、避免过拟合成为核心挑战。交叉验证作为一种强大而经典的统...

18210

第 5 期:AI × 云原生安全:如何用大模型打造企业级“风险决策引擎”

春根实战AI云原生安全

前四期我们讲了资产画像、讲了决策模型、讲了流程。你可能会说:“道理我都懂,但数据量太大了,关联分析太难了。”

10210

构建AI智能体:模型评估指南:准确率、精确率、F1分数与ROC/AUC的深度解析

未闻花名

在我们面对项目需求时,构建模型只是第一步,评估其性能并判断它是否真正解决了问题,才是决定项目成败的关键。一个在训练集上表现完美的模型,可能在现实数据面前一败涂地...

80010

构建AI智能体:小树成林,聚沙成塔:随机森林与大模型的协同进化

未闻花名

随机森林是一种非常强大的机器学习算法,它属于集成学习中的Bagging方法。随机森林的基本单元是决策树,而森林就是由很多棵决策树组成的。简单的说随机森林就是由多...

11310

构建AI智能体:Bootstrap采样在大模型评估中的应用:从置信区间到模型稳定性

未闻花名

在我们选择使用一个模型时,我们经常需要评估模型的性能。通常,我们会将数据集分为训练集和测试集,用测试集来评估模型的泛化能力。然而,单次划分的测试集可能不能完全代...

11010

构建AI智能体:集成学习:从三个臭皮匠到AI集体智慧的深度解析

未闻花名

我们通常说“三个臭皮匠,顶个诸葛亮”,集成学习就是利用这个思想。在机器学习中,我们训练多个模型,这些模型可以是同一种类的,也可以是不同种类的,然后通过某种方式将...

18010

构建AI智能体:超参数如何影响大模型?通俗讲解原理、作用与实战示例

未闻花名

超参数是机器学习模型在训练开始前需要设定的配置参数,它们不是从数据中学习得到的,而是用来控制学习过程的指导参数,通俗的理解,想象一下,我们在骑自行车时,需要先进...

26610

构建AI智能体:智能的边界:通过偏差-方差理论理解大模型的能力与局限

未闻花名

最近我们分享模型拟合和早停机制时,都涉及到了“偏差-方差权衡”的概念,那么什么是偏差,什么又是方差,隐含了哪些新奇巧妙的知识点,今天我们来一探究竟。首先,我们找...

14710

构建AI智能体:模型拟合的平衡艺术:深入理解欠拟合与过拟合

未闻花名

不知道大家有没有过类似的经历,在很多针对数据类处理的项目中,我们常常遇到这样的困境,模型在训练数据上表现不佳,或者相反,在训练数据上表现完美却在真实场景中一败涂...

14310

构建AI智能体:金融风控系统:基于信息熵和KL散度的异常交易检测

未闻花名

在数字化金融时代,欺诈交易已成为金融机构面临的重要挑战,欺诈交易已成为金融机构面临的重要挑战。传统基于规则的检测方法难以应对日益复杂的欺诈模式,今天我们实现一种...

25710

10分钟拥有AI搭子,开启人机协作新方式

用户1369678

好消息来了!CNB虽然是为程序员打造的专业云原生平台,但它的云开发环境其实非常适合作为所有人的云端办公环境,让每个人都能轻松享受到企业级的工作空间:

11600

构建AI智能体:信息论完全指南:从基础概念到在大模型中的实际应用

未闻花名

想象一下这样的场景,我们每天出门都会查看天气预报,如果预报总是说"今天晴,气温25度",久而久之你会觉得这信息索然无味,因为太确定了。但如果预报说"今天有80%...

26211

🔥 为什么现在所有 AI 企业都在抢着做大模型备案?内行人说透核心原因!​

算法-大模型备案 多米

打开手机刷到 AI 生成的文案、用智能工具做设计、靠聊天机器人写方案…… 这些渗透生活的智能服务,背后都藏着一个关键门槛 —— 大模型备案。很多人觉得这是 "多...

24610

数智洞察:架构师视角下商业研究多智能体atypica.AI的创新与落地

math chen

说明:本文所有架构设计相关观点都是由陈凯里原创提出,与特赞企业无关,和2025年12月的最近的实际迭代版本技术架构有一定差异,仅供参考和学术讨论。

38320

基于 MemOS 大模型长记忆系统的架构实践与场景落地

math chen

大模型技术落地过程中,“短期记忆有限、上下文断裂、多轮交互记忆丢失” 成为制约其在复杂业务场景应用的核心瓶颈。传统大模型仅能处理有限窗口内的上下文信息,在智能客...

65921
领券