暂无搜索历史
三天前,看到了我们 Datawhale 公众号上发了文章《零基础入门:DeepSeek 微调教程来了!》反响很好,其中的内容写的非常接地气,适合学习者进行学习体...
上次的《最全梳理:一文搞懂 RAG 技术的5种范式!》梳理了对 RAG 进行了一个完整的综述。这次带来 RAG 的小白应用教程:介绍如何通过 ragflow 框...
在此处可以看到很明显大模型进行微调后口吻已经发生了更改。据笔者使用下来的记录表示,微调后的大模型思考时间更加短暂。
本文主要回顾 RAG 技术的发展,第一部分梳理了综述和关键论文,第二部分梳理了工程实践工具。
最近 DeepSeek-R1 非常热门,我们知道在 o1-Like 模型出现之前,传统的大模型的多语言能力已经十分出色。
你是否读过大语言模型综述文章《A Survey of Large Language Models》?这是学术界首篇系统介绍大语言模型技术的综述性文章,成为了很多...
https://github.com/datawhalechina/hugging-llm/tree/main/resources
在 200 多万人的见证下,马斯克的 AI 公司 xAI 正式推出 Grok 3!
项目代码可见:unlock-deepseek/Datawhale-R1(https://github.com/datawhalechina/unlock-dee...
这两天找遍各个渠道,深度体验了市面上接近 10 多个第三方网站后,发现了一个十分惊艳的平台,叫 AskManyAI,一口气把上面的 6 大问题全解决了。
DeepSeek + Word ,让你的工作更高效!在 Word 界面里,选中文字点击按钮,就能让 DeepSeek 为你快速检索信息、精准翻译文本、智能生成内...
昨天文章《DeepSeek R1本地部署,小白教程来了!》的预告来兑现了。同时,有学习者问「可以上传文件啥的吗」?有的兄弟,有的。今天完整教程,它来了!
Take Home Message: Janus 是一个简单、统一且可扩展的多模态理解与生成模型,其将多模态理解与生成的视觉编码进行解耦,缓解了两个任务潜在存在...
知乎链接:https://zhuanlan.zhihu.com/p/13905150871
文本是一类非常重要的非结构化数据,如何表示文本数据一直是机器学习领域的一个重点研究方向。文本向量就是深度学习时代产生的一种文本表示的方法。
就在不久前,科技界目光聚焦于一篇别具深意的文章。其作者正是Salesforce首席科学家、斯坦福大学计算机科学兼职教授——Silvio Savarese。
近日,支付宝百宝箱团队的技术负责人王月凡在 Datawhale 社区带来了 AI Agent 综述分享。从大语言模型的发展历程出发,全面分享了AI Agent现...
比如如果没有好好构建数据集,最后发现微调模型效果不佳是数据集的问题,就事倍功半了。
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市