背景
►前世:始于上世纪80年代的浅层神经网络探索,受限于算力与数据,早期进展缓慢。
►今生:2017年Transformer架构被提出;2022年底,ChatGPT横空出世
关键事件
搭建个人知识库
工具 | 型号 | 功能 |
---|---|---|
文本 | Coremail相关资料文档 | 预训练材料 |
LLM | deepseek-r1:7b | 分析推理问题 |
嵌入Model | nomic-embed-text:latest等 | 文本进行向量化 |
模型平台 | Ollama | 管理LLM、Embedding 模型 |
知识库工具 | AnythingLLM | 提供UI界面接入大模型文本切割会话历史缓存 |
向量数据库 | LanceDB,一款基于磁盘存储的Vector DB | 存储Embedding模型编码后的向量 |
选择知识库工具,可以选AnythingLLM,也可以用open-web.ui,UI体验上两者差别不大,但后者还可以细化权限管理。