暂无搜索历史
众所周知,检索是大模型RAG应用中的重要步骤。用户输入的问题,需要rag服务先使用检索模块检索到与问题最相关的知识,再进行筛选、排序、甄别、整理、总结,...
相信大家都有过使用知识库或在线文档编辑的经历。飞书、钉钉文档、百度知识库等产品都提供了word、excel等office文档的创建和编辑能力。onlyoffic...
独立完成大数据部署。。是不是想的太多了。看看实际各种项目现场的情况吧,申请服务器,网络打通、跨多部门申请审批,别说AI,人去做都费死劲,你觉得这些限制是技术的问题吗?
在上一篇文章中提到,在postgresql中,使用pgvector可以实现向量存储和检索,使用pg_trgm基于三元组文本模糊匹配和相似度计算,结合GI...
大模型的RAG架构,不论是入门还是某个环节的深入,已经有不少文章都做了介绍。我在大模型 RAG:文档分块方案与 RAG 全流程中也做了阐述。本篇在 大模...
前段时间,有位朋友询问DeepSeek本地化部署是否有必要。这个问题看似简单,实际上并不好回答。个人认为,如果对数据安全有很强的要求,那么是需要的;再有...
大模型尤其是DeepSeek的火爆,带来了无数话题。最近很火的一个话题就是DeepSeek+AI工具的组合,很多营销号冠以N大神器之名,仿佛是开天辟地的...
与通义千问、文心一言等大模型的网页版相比,DeepSeek的页面更简洁,除了简单的介绍+对话框,深度思考和联网搜索两个选项,以及文档上传。不过DeepS...
在上一篇文章《大模型RAG:基于PgSql的向量检索》中,简单介绍了RAG概念和简要实现。在实际的应用中,技术方案远不会这样简单。
检索增强生成(Retrieval-augmented Generation),简称RAG。
半吊子全栈工匠
大模型无疑是这两年最火的概念,国内外各厂商都不甘示弱纷纷推出自己的大模型能力和应用。废话不多说,在实际的大模型应用中,向量检索服务无疑是目前不可缺少的一...
对象存储——Minio 初探中我们介绍了单机部署MinIO的过程,以及在控制台上的一些操作。因为在实际应用中,主要还是通过sdk进行操作,所以这里我们也开始介绍...
上一篇的初体验之后,本篇我们继续探索,将transformers模型导出到onnx。这里主要参考huggingface的官方文档:https://hugging...
huggingface相关环境的安装和问题处理本篇暂不涉及,后续补充。这里以一个模型为例,完成从模型介绍到加载、运行的完整过程,作为我们熟悉huggingfac...
上一篇我们讲到了处理器在执行时,会对指令进行重排序,而这会导致数据一致性问题。对指令重排的理解非常重要,这也是并发问题出现的最大原因。
在上一篇文章,概述了JVM体系结构和内存模型的基础概念,我们了解到synchronized 和 volatile都属于内存模型中,处理可见性、顺序性、一致性等问...
类加载器的功能,是处理类的动态加载(Loading),链接(Linking),并且在第一次引用类时进行初始化(Initialization)。
huggingface 相关环境的安装和问题处理本篇暂不涉及,后续补充。这里以一个模型为例,完成从模型介绍到加载、运行的完整过程,作为我们熟悉 huggingf...
暂未填写个人网址