暂无搜索历史
最近,在 NVIDIA 的一次内部对话中,英伟达的三位员工 Nader、Stephen 和 Carter 三位员工分享了他们对 CUDA 技术的发展历程及其在计...
编者按:本文是台大教授李宏毅讲授AI Agent的爆火油管视频的文字稿。内容层层递进,是学习和理解AI Agent难得的好教材。由于原视频较长,为方便订阅读者们...
在大语言模型(LLM)迅速发展的今天,开发者们面临着海量的资源和工具选择。如何高效地筛选和利用这些资源,成为了每一个 LLM 开发者的关键任务。 今天,我们要介...
上一次我们学习了如何部署ragflow,本次我们学习如何使用ragflow+dify搭建本地问答系统。
如果有一个虚拟试衣镜,直接在线生成一个符合自己身材的数字人,我们把衣服商品图和尺码给到AI,它直接生成衣服的上身效果。再以同样的方式搭全套。
检索增强生成(Retrieval Augmented Generation),简称 RAG。在构建RAG(Retrieval-Augmented Generat...
自从 OpenAI 发布 GPT-4o 图像生成功能以来,短短几天时间,我们眼睛里看的,耳朵里听的,几乎都是关于它的消息。
ModelScope: https://modelscope.cn/datasets
LS-Imagine 通过纯视觉观测来玩 Minecraft,仿照人类玩家的做法来学习 RL 控制策略,不开外挂,不使用特权信息。
前几天,“杭州六小龙”之一「群核科技」在GTC 2025大会开源了空间理解模型:SpatialLM。
本研究类似建了一个"王者荣耀实战题库" + "考试评分系统" + "新解题方法"。
突然就想写点应用、开发相关的东西,一方面是不断有企业和朋友问我他们可以用DeepSeek做什么,怎么用;另一方面是这个方向的职业、行业也在不知不觉中慢慢改变。干...
本文通过10篇R1相关的研究,介绍R1后LLM的新范式。其核心就是如何进一步增强LLM的能力。
现在大家经常使用 DeepSeek 等通用大模型。但是用着用着就会发现他们就像一个啥都懂但不太精的学霸,啥都能聊几句,但可能包含错误信息。
通过将LLM作为翻译引擎的核心,该系统具备高度可调控性。例如相较于传统机器翻译(MT)系统,通过修改提示词可以更便捷地实现以下功能:调整输出文本风格(正式/非正...
整理:Datawhale 有时候我们写论文或者看 blog,看到别人画的很好看的结构图,觉得自己肯定画不了这么好。
DeepSeek-R1 的热度还是居高不下,各个云计算厂商都在争着发布「免费的 DeepSeek-R1」,大家不断地在各个平台间转换。但就在这纷乱中,GpuGe...
三天前,看到了我们 Datawhale 公众号上发了文章《零基础入门:DeepSeek 微调教程来了!》反响很好,其中的内容写的非常接地气,适合学习者进行学习体...
上次的《最全梳理:一文搞懂 RAG 技术的5种范式!》梳理了对 RAG 进行了一个完整的综述。这次带来 RAG 的小白应用教程:介绍如何通过 ragflow 框...
在此处可以看到很明显大模型进行微调后口吻已经发生了更改。据笔者使用下来的记录表示,微调后的大模型思考时间更加短暂。
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市