Loading [MathJax]/jax/output/CommonHTML/jax.js
部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >DeepSeek 本地化新篇章:Ollama 兼容 OpenAI API 的深度解析与部署实践

DeepSeek 本地化新篇章:Ollama 兼容 OpenAI API 的深度解析与部署实践

作者头像
蒙娜丽宁
发布于 2025-04-15 06:38:07
发布于 2025-04-15 06:38:07
1K00
代码可运行
举报
文章被收录于专栏:极客起源极客起源
运行总次数:0
代码可运行

随着大语言模型(LLM)的快速发展,开发者对本地化部署和 API 兼容性的需求日益增加。Ollama 作为一个轻量级开源框架,通过兼容 OpenAI API 的接口设计,为本地运行 DeepSeek 等大模型提供了便捷途径。本文深入探讨 Ollama 如何实现与 OpenAI API 的无缝对接,结合 DeepSeek 模型的本地部署,展示其在文本生成、聊天对话及流式响应中的应用。从安装配置到高级功能实现,本文提供了大量带中文注释的 Python 代码示例,涵盖 Curl 请求、SDK 调用及错误处理等内容。此外,文章还分析了这种兼容性的优势与局限,适合希望在无 GPU 环境下运行 DeepSeek 或迁移 OpenAI 项目的开发者。通过本文,读者将掌握如何利用 Ollama 将 DeepSeek 等模型融入本地化开发,充分发挥其潜力。

正文

1. 引言

大语言模型(LLM)如 DeepSeek、LLaMA 等在自然语言处理领域表现出色,但云端部署的隐私风险和高成本促使开发者转向本地化解决方案。Ollama 是一个专为本地化 LLM 设计的开源工具,不仅支持多种预训练模型,还通过兼容 OpenAI API 的接口设计,让开发者能够以熟悉的方式调用本地模型,例如 DeepSeek。本文将深入探讨 Ollama 的 OpenAI API 兼容性,结合 DeepSeek 的本地部署,提供丰富的代码示例和实践指南。

2. Ollama 与 OpenAI API 的兼容性概述

Ollama 默认运行在 http://localhost:11434,并提供了一套与 OpenAI API 高度兼容的 RESTful 接口。这意味着,开发者可以使用 OpenAI 的官方 Python SDK 或简单的 HTTP 请求调用本地模型,无需大幅调整现有代码。主要兼容端点包括:

  • 文本生成/v1/completions
  • 聊天对话/v1/chat/completions
  • 流式响应:支持 stream=True 参数

这种设计让 Ollama 成为连接本地模型(如 DeepSeek)与 OpenAI 生态的桥梁,尤其适合需要隐私保护或离线运行的场景。

2.1 安装 Ollama

Linux 或 macOS 上,安装 Ollama 的命令如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
curl -fsSL https://ollama.com/install.sh | sh 

安装完成后,启动服务:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ollama serve 
2.2 DeepSeek 模型的本地部署

DeepSeek 是一款由中国团队开发的高性能开源模型,支持多种任务。Ollama 目前支持导入外部模型,但需要先将其转换为 Ollama 可识别的格式。以下是部署步骤:

下载 DeepSeek 模型 从 Hugging Face 或官方仓库下载 DeepSeek 模型(例如 deepseek-7b)。假设已下载 GGUF 格式文件(如 deepseek-7b.gguf)。

创建 Modelfile Ollama 使用 Modelfile 定义模型配置。新建一个文件 Modelfile

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
FROM ./deepseek-7b.gguf PARAMETER temperature 0.7 PARAMETER top_p 0.9 
  • FROM:指定模型文件路径。
  • PARAMETER:设置生成参数。

导入模型 在终端运行:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ollama create deepseek-7b -f Modelfile 

完成后,通过以下命令验证:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ollama list 
3. API 调用详解与代码实践
3.1 使用 OpenAI SDK 调用 DeepSeek

由于 Ollama 兼容 OpenAI API,可以直接使用 openai Python 库调用本地 DeepSeek 模型。安装依赖:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install openai 
3.1.1 基本文本生成

以下代码展示如何生成文本:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from openai import OpenAI  # 初始化客户端,指定本地 Ollama 地址 client = OpenAI(base_url="http://localhost:11434/v1", api_key="ollama")  # api_key 可随意填写  # 调用 completions 接口 response = client.completions.create(     model="deepseek-7b",     prompt="请用中文介绍一下深度学习的基本概念",     max_tokens=200,     temperature=0.7 )  # 输出结果 print("生成结果:", response.choices[0].text) 
中文注释版
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from openai import OpenAI  # 初始化 OpenAI 客户端,连接本地 Ollama 服务 # base_url 指定 Ollama 的 API 地址,api_key 在本地模式下无实际作用 client = OpenAI(base_url="http://localhost:11434/v1", api_key="ollama")  # 调用文本生成接口 # model: 指定使用的模型名称 # prompt: 输入的提示文本 # max_tokens: 限制生成的最大 token 数 # temperature: 控制生成文本的随机性,值越高越随机 response = client.completions.create(     model="deepseek-7b",  # 使用本地部署的 DeepSeek 模型     prompt="请用中文介绍一下深度学习的基本概念",     max_tokens=200,       # 最多生成 200 个 token     temperature=0.7       # 设置随机性为 0.7 )  # 从响应中提取生成的文本并打印 print("生成结果:", response.choices[0].text) 
输出解释

响应对象与 OpenAI API 一致,choices[0].text 包含生成的文本,例如:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
生成结果:深度学习是机器学习的一个分支,利用神经网络模拟人脑处理信息... 
3.2 聊天对话(/v1/chat/completions)

DeepSeek 在对话任务中表现出色,以下是多轮对话示例:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from openai import OpenAI  # 初始化客户端 client = OpenAI(base_url="http://localhost:11434/v1", api_key="ollama")  # 定义对话历史 messages = [     {"role": "system", "content": "你是一个知识渊博的助手"},     {"role": "user", "content": "请解释量子计算的基本原理"} ]  # 调用聊天接口 response = client.chat.completions.create(     model="deepseek-7b",     messages=messages,     max_tokens=300 )  # 输出助手回复 reply = response.choices[0].message.content print("助手回复:", reply)  # 将回复加入对话历史,继续下一轮 messages.append({"role": "assistant", "content": reply}) messages.append({"role": "user", "content": "那量子比特是怎么工作的?"}) response = client.chat.completions.create(     model="deepseek-7b",     messages=messages,     max_tokens=300 ) print("助手回复:", response.choices[0].message.content) 
输出示例
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
助手回复:量子计算基于量子力学,利用量子比特(qubit)进行计算... 助手回复:量子比特不同于经典比特,它可以处于 01 的叠加态... 
3.3 流式响应处理

Ollama 支持流式响应,与 OpenAI 的 stream=True 参数一致。以下是实时显示 DeepSeek 生成内容的代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from openai import OpenAI  # 初始化客户端 client = OpenAI(base_url="http://localhost:11434/v1", api_key="ollama")  # 调用聊天接口并启用流式响应 stream = client.chat.completions.create(     model="deepseek-7b",     messages=[{"role": "user", "content": "写一首关于秋天的诗"}],     stream=True )  # 逐块读取并打印响应 for chunk in stream:     if chunk.choices[0].delta.content is not None:         print(chunk.choices[0].delta.content, end="", flush=True) 
中文注释版
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from openai import OpenAI  # 初始化客户端,连接本地 Ollama client = OpenAI(base_url="http://localhost:11434/v1", api_key="ollama")  # 调用聊天接口,启用流式响应 # stream=True 表示逐块返回结果,而不是一次性返回完整响应 stream = client.chat.completions.create(     model="deepseek-7b",  # 使用 DeepSeek 模型     messages=[{"role": "user", "content": "写一首关于秋天的诗"}],  # 输入提示     stream=True           # 启用流式输出 )  # 遍历流式响应,实时打印生成内容 for chunk in stream:     # 检查当前块是否包含内容     if chunk.choices[0].delta.content is not None:         # end="" 避免换行,flush=True 确保立即输出         print(chunk.choices[0].delta.content, end="", flush=True) 
输出解释

终端将实时显示诗句,例如:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
秋风吹过叶飘零,寒露凝霜映月明... 
3.4 使用 Curl 调用 API

除了 Python SDK,也可以通过 Curl 直接调用:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
curl http://localhost:11434/v1/chat/completions \   -H "Content-Type: application/json" \   -d '{     "model": "deepseek-7b",     "messages": [{"role": "user", "content": "你好,DeepSeek!"}],     "max_tokens": 100   }' 
输出示例
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
{   "choices": [     {       "message": {         "role": "assistant",         "content": "你好!我是 DeepSeek,很高兴为你服务!"       }     }   ],   "model": "deepseek-7b" } 
4. DeepSeek 与 Ollama 的数学原理

DeepSeek 的生成过程基于 Transformer 架构,其核心是注意力机制。注意力分数计算公式如下:

其中:

  • (Q):查询向量。
  • (K):键向量。
  • (V):值向量。
  • (d_k):键向量的维度。

Ollama 通过参数(如 temperature)调整生成概率:

  • (T):温度参数,值越高生成的随机性越强。

示例代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
response = client.completions.create(     model="deepseek-7b",     prompt="随机生成一个故事",     temperature=1.2  # 高随机性 ) 
5. 高级应用:DeepSeek 翻译助手

以下是基于 DeepSeek 的翻译工具:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from openai import OpenAI  client = OpenAI(base_url="http://localhost:11434/v1", api_key="ollama")  def translate_with_deepseek(text, target_lang="中文"):     # 构造提示     prompt = f"将以下文本翻译成{target_lang}:{text}"     response = client.completions.create(         model="deepseek-7b",         prompt=prompt,         max_tokens=200     )     return response.choices[0].text  # 测试翻译 text = "The beauty of nature inspires us all." translation = translate_with_deepseek(text) print("翻译结果:", translation) 
输出示例
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
翻译结果:大自然的美感激励着我们所有人。 
6. 性能优化与注意事项
  • 模型选择:DeepSeek 的 7B 参数模型适合普通 PC,66B 版本需更多内存。
  • 流式响应:适合实时应用,但需处理分块数据。
  • 错误处理:建议添加重试机制:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import time from openai import OpenAI  client = OpenAI(base_url="http://localhost:11434/v1", api_key="ollama")  def retry_request(messages, retries=3):     for attempt in range(retries):         try:             response = client.chat.completions.create(                 model="deepseek-7b",                 messages=messages             )             return response.choices[0].message.content         except Exception as e:             print(f"尝试 {attempt + 1} 失败:{e}")             time.sleep(2)     return "请求失败"  messages = [{"role": "user", "content": "你好"}] print(retry_request(messages)) 
7. 结论

Ollama 兼容 OpenAI API 的设计为本地化部署 DeepSeek 等模型提供了强大支持。通过本文的代码示例和解析,读者可以快速上手,将 DeepSeek 融入本地开发流程。未来,随着 Ollama 的功能扩展,它将成为本地 AI 开发的首选工具。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-04-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 极客起源 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Oracle 审计失败的用户登陆(Oracle audit)
       对于在线交易系统,且Oracle用户在使用缺省的profile的情形下,多用户共享相同的数据库用户及密码,任意用户输入错误密码累计达到10次以上,其帐户会被自动锁定使得交易被迫临时终止将产生不小的损失。故有必要对那些失败的帐户登陆进行分析以预估是否存在恶意攻击等。Oracle提供了审计功能用于审计那些失败的Oracle用户登陆来进行风险评估。本文即是描述如何开启审计失败的用户登陆。本文不涉及审计的具体的描述信息,仅仅描述如何审计失败的用户登陆。详细完整的审计大家可以参考Oracle Database Security Guide。
Leshami
2018/08/13
1.8K0
等保测评2.0:Oracle安全审计
本篇文章主要说一说Oracle数据库安全审计控制点中b、c、d测评项的相关内容和理解,以及一些其它零碎的与等保相关的内容。
FB客服
2020/07/28
7.6K0
Oracle 10g安全加固(审计、监听密码)
Oracle 10g审计功能默认是关闭的。 需要注意开启审计功能必然会额外消耗一部分数据库性能,开启审计需要重启数据库生效。 具体的审计策略则需要根据项目实际要求自行配置。
Alfred Zhao
2019/05/24
9270
【DB笔试面试828】在Oracle中,什么是审计(Audit)?
审计(Audit)用于监视用户所执行的数据库操作,审计信息可存储于数据字典表,称为审计记录。审计记录存储在SYSTEM表空间中的SYS.AUD表中,可通过视图DBA_AUDIT_TRAIL查看。审计记录也可以存储在操作系统文件中(默认位置为ORACLE_BASE/admin/ORACLE_SID/adump/)。若审计表不存在,则可以通过脚本ORACLE_HOME/rdbms/admin/cataudit.sql来创建。
AiDBA宝典
2020/06/24
2.2K0
案例分享:关闭 Oracle 审计时遇到的 Bug 排查与解决
一重要的生产库长期以来就有各种问题,前段时间刚进行完 PSU190716 的更新,这两天查到发现审计功能对其性能有较大的影响,故客户要求关闭审计功能。我们便申请了三个小时的停机窗口,进行关闭审计的操作。心想改参数重启实例四十分钟就可以搞定的事,三个小时多多有余,因为数据量达五六十 T ,小伙伴都比较怕,只有我做了。以下涉及到实际的主机名、实例名均已替换为测试相关的,如不对应忽略即可。
JiekeXu之路
2020/05/12
1.9K0
由dual导致的一个潜在的监控问题(r7笔记第3天)
Oracle对于sys用户的审计是默认的操作,所以不管你开启了什么审计策略,sys的登录等操作都会记录下来,这也是Oracle的默认配置,可能他 们也没有料到有些应用可能把这个影响放大,毕竟频繁登录sys听起来是不现实的。但是放到自动化监控的部分,这个影响就会放大,可能有些功能还不够严谨, 存在一定的问题。 比如下面的这个场景,发现在审计目录下存在着一些细小的文件,生成时间也很紧凑,可见还是有一些操作很频繁的使用了sys,而且生成了意料之外的大批量审计日志文件。 $ ls -lrt|head -5 -rw
jeanron100
2018/03/16
6260
【常用命令】监视数据库的用户登录和注销会话信息
通过使用audit session whenever successful 命令,成功的连接会被审计。
SQLplusDB
2020/03/26
1.6K0
Oracle 主库rac + 备库rac 11.2.0.4的DG环境部署
各位技术爱好者,看完本文后,你可以掌握如下的技能,也可以学到一些其它你所不知道的知识,~O(∩_∩)O~:
AiDBA宝典
2023/04/27
4.1K0
Oracle 主库rac + 备库rac 11.2.0.4的DG环境部署
Oracle告警日志里记录了“KILL SOFT -/-/-”会话被杀掉的信息
当由于空闲超时而手动或由PMON终止会话后手动执行alter system kill session时,将在警报日志中记录相关信息
AiDBA宝典
2023/09/08
5060
Oracle告警日志里记录了“KILL SOFT -/-/-”会话被杀掉的信息
手动清理Oracle审计记录
a、对于Oracle 11g,审计功能默认被开启,因此如果在必须启用的情况下应考虑性能影响; b、开启审计的情况下,建议将审计从system或sysaux表空间剥离,使用单独的表空间; c、对于历史审计日志的清除,应考虑清除期间所带来的性能影响; d、调用DBMS_AUDIT_MGMT.SET_AUDIT_TRAIL_LOCATION这个过程已经开始了搬迁过程,如果审计日志很庞大,应考虑IO影响; e、审计日志的清除需要先设定归档,已归档的审计日志会被清理; f、也可以通过trunate table aud$ reuse storage以及deallocate非常规方式来处理。
Leshami
2018/08/13
1.7K0
EXP导出aud$报错EXP-00008,ORA-00904 解决
主题:EXP导出aud$报错EXP-00008,ORA-00904 解决 环境:Oracle 11.2.0.4 问题:在自己的测试环境,导出sys用户下的aud$表报错。
Alfred Zhao
2019/05/24
1.5K0
Oracle 常用命令大汇总
第一章:日志管理     1.forcing log switches     sql> alter system switch logfile;     2.forcing checkpoints     sql> alter system checkpoint;     3.adding online redo log groups     sql> alter database add logfile [group 4]     sql> ('/disk3/log4a.rdo','/di
阿新
2018/04/09
9430
2021年4月Oracle数据库补丁分析报告
编写此文档为了更好地指导Oracle补丁安装工作,细化工作任务,规范安装升级操作。
数据和云
2021/05/31
2.4K0
又一例SPFILE设置错误导致数据库无法启动
--========================================
Leshami
2018/08/07
7420
Oracle知识集锦:对Oracle数据库进行监控检查
execute dbbms_workload_repository.create_snapshot();
星哥玩云
2022/08/16
1.2K0
等保测评之Oracle关系型数据库安全加固实践指南
select ‘bgdrac’ database,t11.username,t11.default_tablespace tablespace_name,segment_size_in_GB,datafile_size_in_gb,tablespace_free_size_in_gb from (select username,default_tablespace from dba_users) t11 left join ( select nvl(t1.tablespace_name,t2.tablespace_name) tablespace_name,t1.size_in_GB datafile_size_in_GB,t2.size_in_GB segment_size_in_GB,t1.size_in_GB-t2.size_in_GB tablespace_free_size_in_GB from (select tablespace_name,sum(bytes)/1024/1024/1024 size_in_GB from dba_data_files group by tablespace_name) t1 full join (select tablespace_name,sum(bytes)/1024/1024/1024 size_in_GB from dba_segments group by tablespace_name) t2 on t2.tablespace_name=t1.tablespace_name) t22 on t22.tablespace_name=t11.default_tablespace where t11.default_tablespace<>’zlbfxt’;
全栈工程师修炼指南
2022/09/29
1.9K0
Oracle 10gR2 Dataguard搭建(非duplicate方式)
我的实验环境: 源生产库(主库): IP地址:192.168.1.30 Oracle 10.2.0.5 单实例
Alfred Zhao
2019/05/24
7460
单实例Primary快速搭建Standby RAC参考手册(19.16 ADG)
上述为这里我做为演示环境的基本规划。 本文作为step by step的快速指导手册,方便快速部署此类ADG环境。
Alfred Zhao
2023/03/06
4020
一线运维 DBA 五年经验常用 SQL 大全(二)
本文 SQL 及相关命令均是在运维工作中总结整理而成的,对于运维 DBA 来说可提高很大的工作效率,值得收藏。当然如果你全部能够背下来那就很牛逼了,如果不能,还是建议收藏下来慢慢看,每条 SQL 的使用频率都很高,肯定能够帮助到你。
JiekeXu之路
2021/03/15
9050
一线运维 DBA 五年经验常用 SQL 大全(二)
oracle11g dataguard安装实施
Oracle DataGuard 实施 1.环境准备 1.1 修改主备机hosts文件 vi /etc/hosts 128.160.11.84    wang 128.160.11.218  dg2 1.2 修改(添加)主备机listener.ora和tnsnames.ora文件 vi $ORACLE_HOME/network/admin/listener.ora SID_LIST_LISTENER =         (SID_LIST =           (SID_DESC =                 (SID_NAME = softdb)                 (ORACLE_HOME = /u01/app/oracle/product/11.2.0/db_1/)           )         ) LISTENER =   (DESCRIPTION_LIST =     (DESCRIPTION =       (ADDRESS = (PROTOCOL = TCP)(HOST = wang)(PORT = 1521))       (ADDRESS = (PROTOCOL = IPC)(KEY = EXTPROC1521))     )   ) ADR_BASE_LISTENER = /u01/app/oracle vi $ORACLE_HOME/network/admin/tnsnames.ora SOFTPRI =   (DESCRIPTION =     (ADDRESS = (PROTOCOL = TCP)(HOST = wang)(PORT = 1521))     (CONNECT_DATA =       (SERVER = DEDICATED)       (SERVICE_NAME = softdb)     )   ) SOFTSTD =   (DESCRIPTION =     (ADDRESS = (PROTOCOL = TCP)(HOST = dg2)(PORT = 1521))     (CONNECT_DATA =       (SERVER = DEDICATED)       (SERVICE_NAME = softdb)     )   ) 1.3 确定主备机parameter/control/data/log/archivelog file 的路径 audit_file_dest='/u01/app/oracle/admin/softdb/adump' 1.4 设置主库强制写日志 SQL> select force_logging from v$database; FOR --- NO SQL> alter database force logging; Database altered. SQL> select force_logging from v$database; FOR --- YES 1.5 设置主库归档模式 SQL> archive log list; SQL> shutdown immediate; SQL> startup mount; SQL> alter database archivelog; SQL> alter database open; SQL> archive log list; Database log mode              Archive Mode Automatic archival             Enabled Archive destination            /u01/app/oracle/product/11.2.0/db_1//dbs/arch Oldest online log sequence     175 Next log sequence to archive   177 Current log sequence           177 2. 产生用于建立Standby库的全备份集及控制文件 2.1 创建并修改主库参数文件pfile SQL> shutdown immediate; SQL> create pfile from spfile; 修改initsoftdb.ora vi $ORACLE_HOME/db
吹水老王
2022/05/17
8120
推荐阅读
相关推荐
Oracle 审计失败的用户登陆(Oracle audit)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验