HAI 上部署 DeepSeek，再也不怕服务器崩了！

原创

不惑

修改于 2025-02-10 15:01:31

8222

文章被收录于专栏：GoboyGoboy

科技圈从来不缺新闻，DeepSeek的发布震撼了整个科技行业，它迅速超越了OpenAI的ChatGPT，成为苹果美国地区和中国地区应用商店免费APP下载排行榜第一位，并且导致芯片制造商英伟达单日市值蒸发近6000亿美元，创下了美国股市的新纪录。DeepSeek-R1 像一颗石子投进平静的湖面，激起了层层涟漪。这家本土的 AI 初创公司，凭借其开源的推理大模型 R1，正在迅速改变全球 AI 格局。DeepSeek-R1 不仅拥有与 OpenAI 的 GPT-3 相媲美甚至超越的性能，更以其低廉的成本和开放的姿态，赢得了全世界的关注。DeepSeek-R1 的出现，犹如 AI 界的“鲶鱼”，它的开源战略和卓越性能，迫使整个行业重新思考人工智能的未来。

本文将手把手教你如何在 腾讯云高性能应用服务 HAI 上部署 DeepSeek-R1 模型，助你轻松搭建属于自己的 AI 环境，快速踏上人工智能探索之旅！通过这一教程，你将掌握如何利用腾讯云的强大计算资源，顺利部署和运行 DeepSeek-R1 模型，体验其高效的推理性能和低延迟响应。无论你是 AI 开发者还是技术爱好者，这篇教程都将为你提供详细的步骤与实用的技巧，助你快速上手。

DeepSeek-R1

技术特点

强化学习训练：DeepSeek-R1通过大规模强化学习训练，无需依赖监督微调，展现了强大的推理能力。其训练过程包括冷启动阶段、推理导向的强化学习阶段、拒绝抽样与监督微调阶段，以及全任务强化学习阶段，逐步提升推理性能。

多阶段训练流程：模型训练分为冷启动阶段、推理导向的强化学习阶段、拒绝抽样与监督微调阶段，以及全任务强化学习阶段。每个阶段都有其特定的目标和优化方法。

创新的训练策略：DeepSeek-R1采用了组相对策略优化（GRPO）算法和高效的双重奖励系统，显著降低了训练成本并提高了模型的数学推理能力。GRPO算法通过简化价值模型的计算，减少了内存和计算开销，使得模型能够在相同的硬件条件下训练更大规模的模型。双重奖励系统则通过结合规则和结果奖励，提高了模型的输出质量和逻辑一致性。

性能表现

与OpenAI O1的比较：DeepSeek-R1在推理任务中的性能已达到与OpenAI O1-1217相当的水平，甚至在某些测试中表现更优。例如，在AIME 2024数学竞赛中，DeepSeek-R1的准确率从15.6%提升至71.0%，并在使用多数投票法后进一步提升至86.7%。

低成本优势：DeepSeek-R1的开发成本仅为600万美元，相比OpenAI的O1模型（约5亿美元）节省了超过98%的成本。这种显著的成本优势主要得益于创新的训练策略和高效的资源利用。通过减少监督微调步骤和优化计算资源，DeepSeek-R1在保持高性能的同时，大幅降低了训练和运营成本。

高性能应用服务 HAI

腾讯云的高性能应用服务（HAI）是一款面向AI和科学计算的GPU应用服务产品，旨在简化AI应用的开发和部署流程。

HAI的主要功能

AI绘画

HAI支持快速部署和优化AI绘画模型，如Stable Diffusion和ChatGLM-6B，用户可以通过预置的主流AI作画模型及常用插件，实现高质量的图像生成。AI绘画功能使得用户无需担心复杂的部署和计算资源需求，极大地降低了AI绘画的门槛，促进了AI技术在创意产业的应用。

LLM语言模型

HAI支持快速部署和运行大型语言模型，如LLAMA2和ChatGLM，提供开箱即用、启动迅速、高稳定性和可靠性的语言模型环境。这些功能使得研究者和企业能够快速将语言模型集成到自己的应用中，提升了自然语言处理和文本生成任务的效率。

AI模型开发

HAI的预配置环境支持大多数流行的AI框架和工具，如TensorFlow和PyTorch，开发者可以专注于算法设计和模型优化。这种预配置环境简化了开发流程，减少了环境配置的时间和精力投入，使得开发者能够更专注于算法创新和应用开发。

HAI的优势

简单易用

HAI大幅简化了计算、网络和存储等基础设施的配置流程，用户可以通过图形化界面或API快速创建、启动和管理应用。这种简单易用的设计降低了AI应用开发的复杂性，使得更多开发者和中小企业能够快速上手，提升了整体开发效率。

预置应用环境

HAI提供多种AI环境快速部署，使用户可以专注于业务及应用场景创新，无需担心底层基础设施的配置。预置应用环境不仅简化了开发流程，还加速了应用的开发周期，使得企业能够更快地将创新产品推向市场。

高灵活性

HAI支持用户登录实例，对AI模型和实例环境进行灵活配置，可进行内部开发、业务测试，或对外提供业务服务。这种灵活性使得HAI能够满足不同应用场景的需求，增强了其在企业和个人开发者中的吸引力。

多种登录方式

HAI支持通过JupyterLab、WebUI、SSH等多种方式一键启动，提供了便捷的开发和调试环境。多种登录方式满足了不同用户的需求，提升了用户体验，使得开发者可以更高效地进行开发和调试工作。

卡型种类丰富

HAI提供多种算力套餐选择，用户可以根据实际业务需求选择合适的算力套餐，未来还将加入更多种类供用户选择。丰富的算力套餐选择使得HAI能够满足不同规模和需求的用户，增强了其市场竞争力。

腾讯云的高性能应用服务（HAI）通过简化AI应用的开发和部署流程，降低了技术门槛，提高了开发效率。其丰富的功能和灵活的配置选项，使得中小企业和个人开发者能够快速部署和运行各种AI应用，如AI绘画、大型语言模型和数据科学等。HAI的简单易用、预置应用环境、高灵活性、多种登录方式和丰富的算力套餐选择，进一步提升了其市场竞争力，推动了AI技术的普及和应用。

前期准备

注册腾讯云账号并开通HAI服务

访问腾讯云官网，完成账号注册流程。
在腾讯云控制台中找到高性能应用服务HAI并开通该服务。

了解DeepSeek - R1模型要求

查看DeepSeek - R1模型的官方文档，明确其对硬件（如GPU类型、显存大小等）、软件环境（如操作系统版本、依赖库等）的要求。

创建HAI算力资源

登录HAI控制台

使用注册的腾讯云账号登录到高性能应用服务HAI的控制台。

选择合适的算力套餐

根据DeepSeek - R1模型的需求和预算，在HAI控制台选择合适的GPU算力套餐。例如，如果模型对显存要求较高，选择显存较大的GPU实例类型。

配置实例参数

设置实例名称、所在地域（根据数据传输成本和访问速度等因素选择）、网络安全组等参数。

ChatbotUI

Chatbot UI是一个开源的AI聊天用户界面，基于OpenAI聊天模型搭建，使用Next.js、TypeScript和Tailwind CSS构建，旨在模仿ChatGPT的界面和功能，帮助开发者创建个性化的Chatbot体验。

创建完成后，点击“算力连接”中的“ChatbotUI”

这个模型是 DeepSeek-R1 系列的一个版本，参数规模为 1.5B（即15亿个参数）。它的 文件大小为 1.12 GB，相对较小，适合在资源有限的环境中运行。尽管相较于更大规模的模型，它的性能可能略逊一筹，但依然能提供强大的自然语言理解与生成能力，特别适用于需要较快响应的轻量级应用。

该模型经过不断优化，并且是 5天前 最新更新的，这意味着它已经包含了最近的技术进展和调整，能够在推理过程中提供更好的性能和准确性。

系统提示与生成温度的说明

系统提示

在与 AI 模型交互时，你可以输入 prompt（提示）来指导模型生成相关的内容。通常情况下，系统会提示用户输入合适的文本或命令，帮助模型更好地理解你的需求。你还可以通过输入 / 来选择预设的提示内容，这样可以方便地引导模型生成特定的输出。

生成温度（Temperature）

生成温度是影响模型生成内容“随机性”与“确定性”的重要参数。温度值的高低，直接决定了模型输出的风格：

较高的温度值（例如 0.8）：生成的内容会更加多样化，具有较高的随机性。这个设置适合需要创新、开放性、富有创意的任务，如生成新颖的文本、创作类内容等。
较低的温度值（例如 0.2）：生成的内容会更加聚焦、稳定，重复性更高且确定性强。适合用于需要精确答案或较为规范的任务，如问答系统、技术文档生成等。

通过调整 温度值，你可以根据需求控制模型的输出风格。例如，若你希望模型生成更具创意的文本，可以将温度设置为较高的值；若你需要模型提供准确、规范的回应，可以选择较低的温度值。

模型介绍：deepseek-r1:1.5b

型号：deepseek-r1:1.5b
大小：1.12 GB
修改日期：5天前

模型介绍：deepseek-r1:7b

型号：deepseek-r1:7b
大小：4.68 GB
修改日期：5天前

DeepSeek-R1:1.5B 与 DeepSeek-R1:7B 模型的主要对比，展示它们在 参数规模、内存占用、推理性能 等方面的区别：

特性	DeepSeek-R1:1.5B	DeepSeek-R1:7B
模型参数规模	15 亿（1.5B）	70 亿（7B）
模型文件大小	1.12 GB	4.5 GB
内存占用	较低（适用于小型环境）	较高（适用于中型环境）
推理速度	较快（低资源设备支持）	较慢（需要更多计算资源）
计算资源需求	适合低至中端硬件	适合高端硬件（如 A100）
生成效果	更加集中，适用于短文本生成	生成效果更自然、丰富
适用场景	较简单任务、轻量级应用	中等规模任务、复杂应用
响应性与延迟	低延迟，快速响应	响应时间相对较长
处理能力（推理能力）	中等，适合快速反馈	较强，适合处理复杂语境
资源优化建议	可在低显存设备上运行	推荐使用大显存的GPU（如 A100 40GB）

DeepSeek-R1:1.5B 适合资源较为紧张的环境，能够快速处理轻量级任务，但在生成效果和复杂场景处理上可能逊色一些。
DeepSeek-R1:7B 提供更强大的生成能力，适用于复杂任务和长文本生成，虽然需要更多的计算资源，但在性能上要优于1.5B版本，尤其适合大规模推理与多轮对话任务。

释放HAI资源

支持关机不计费、制作自定义应用等功能。用户可根据自身使用需求动态开关机，节省成本，长期使用。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯技术创作特训营S11#重启人生

大模型部署

DeepSeek

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯技术创作特训营S11#重启人生

大模型部署

DeepSeek

登录后参与评论

0 条评论

热度