Loading [MathJax]/jax/output/CommonHTML/config.js
部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >DeepSeek模型技术动态引行业关注,企业生产系统API迁移需审慎评估

DeepSeek模型技术动态引行业关注,企业生产系统API迁移需审慎评估

作者头像
张善友
发布于 2025-02-13 02:04:14
发布于 2025-02-13 02:04:14
7160
举报
文章被收录于专栏:张善友的专栏张善友的专栏

在当今数字化浪潮中,人工智能技术迅猛发展,各类模型如雨后春笋般涌现,而 DeepSeek 模型凭借其独特的优势,在人工智能领域迅速崭露头角,成为备受瞩目的新星。

DeepSeek 模型由杭州深度求索人工智能基础技术研究有限公司精心打造,自问世以来,便以其卓越的性能和出色的表现吸引了全球的目光。在自然语言处理任务中,它能够精准理解人类语言的复杂语义,无论是日常对话、文章撰写还是问题解答,都能给出高质量的回应。比如在文本生成方面,它可以根据给定的主题和提示,生成逻辑清晰、内容丰富的文章,涵盖新闻报道、故事创作、技术文档等多种类型。在智能客服场景中,DeepSeek 模型能够快速准确地理解客户的问题,并提供专业、贴心的解答,极大地提高了客户服务的效率和质量。在智能写作领域,它为创作者们提供了丰富的灵感和素材,帮助他们更高效地完成创作任务。它还在智能翻译数据分析等众多领域得到了广泛应用,为各行业的发展注入了强大的动力。

在企业级应用的关键场景中,DeepSeek 模型在功能上的一些问题也逐渐显现出来,对其广泛应用和深入发展形成了一定的阻碍。当前面临的挑战是功能缺失与不稳定。

DeepSeek-R1:功能缺失之困

在实际应用中,Function Call 功能就像是一座桥梁,连接着人工智能模型与外部工具或服务。它能够让模型根据用户的需求,自动调用相应的函数或工具,从而实现更复杂、更智能的任务处理。比如在智能办公场景中,当用户需要查询特定日期的销售数据,并生成一份简单的销售报表时,如果模型支持 Function Call 功能,它就能自动调用数据库查询函数获取数据,再调用报表生成工具,快速生成一份格式规范、内容准确的销售报表。又比如在智能客服场景中,当客户询问某个产品的库存情况时,模型可以通过 Function Call 调用库存管理系统的接口,实时获取准确的库存信息并反馈给客户。而 Json Output 功能则能够将模型的输出结果以一种标准化、结构化的格式呈现出来,方便后续的处理和分析。在数据分析场景中,模型对大量文本数据进行情感分析后,通过 Json Output 将分析结果以 Json 格式输出,开发人员可以轻松地将这些数据导入到数据分析工具中,进行进一步的挖掘和可视化展示 。

然而,DeepSeek-R1 模型暂不支持这两项重要功能,这使得它在面对一些复杂任务时显得力不从心。在智能办公场景中,DeepSeek-R1 模型无法自动调用相关工具完成数据查询和报表生成的任务,用户可能需要手动进行这些操作,这大大增加了工作的复杂性和时间成本,降低了工作效率。在数据分析场景中,由于缺乏 Json Output 功能,模型输出的结果可能是无规则的文本形式,开发人员需要花费大量时间和精力对这些结果进行整理和格式化,才能进行后续的分析工作,这无疑增加了开发的难度和工作量。

V3 模型:不稳定的 Function Call

V3 模型虽然支持 Function Call 功能,但在实际使用中却存在严重的不稳定问题。循环调用是指模型在调用函数时,陷入了一种无限循环的状态,不断地重复调用同一个函数或多个函数,导致系统资源被大量消耗,最终可能导致程序崩溃。而空回复则是指模型在调用函数后,没有返回任何有效的结果,这让用户无法获取到所需的信息,影响了用户体验。这个官方已经在文档里做了说明:https://api-docs.deepseek.com/zh-cn/guides/function_calling

image
image
工具使用训练与推理速度

与 Claude-3.5-Sonnet/GPT-4o 相比,DeepSeek 在 tool use 专门训练上存在缺失。Claude-3.5-Sonnet/GPT-4o 做了 tool use 专门训练,这使得它在做 agent 时具有很大的优势。在智能办公场景中,Claude-3.5-Sonnet/GPT-4o 可以通过 tool use 训练,更好地调用各种办公工具,如文档编辑工具、表格处理工具等,实现更高效的办公任务处理。而 DeepSeek 目前暂未提供这样的专门训练,这限制了它在一些需要复杂工具调用的场景中的应用。

作为推理模型,DeepSeek 回答问题需要较长时间的推理,导致回答问题的速度相对缓慢。在在线客服场景中,客户通常希望能够快速得到回复,如果 DeepSeek 需要花费较长时间来思考和回答问题,客户可能会因为等待时间过长而失去耐心,从而降低客户满意度。在一些对实时性要求较高的场景中,如即时通讯、实时数据分析等,DeepSeek 的推理速度也可能成为其应用的瓶颈。为了在这些场景中更好地应用 DeepSeek 模型,需要进行特别优化,以提高其推理速度和响应效率 。

DeepSeek 模型作为人工智能领域的重要参与者,在展现出强大实力的同时,也暴露出一些亟待解决的问题。Function Call 和 Json Output 功能的缺失与不稳定,以及在工具使用训练和推理速度方面的不足,都在一定程度上限制了其在企业级应用和复杂业务场景中的广泛应用 。

然而,正视这些问题是 DeepSeek 模型进一步发展和完善的关键。我们有理由相信,随着技术的不断进步和研发的持续投入,DeepSeek 模型团队能够针对这些问题进行优化和改进。未来,DeepSeek 模型有望通过技术创新,如优化模型架构、改进训练算法等,来提升其在 Function Call、Json Output 等功能上的表现,使其更加稳定和高效。在输出结果的处理上,也能够通过更智能的算法和机制,实现思考过程和最终结果的合理展示,提高回复的稳定性和准确性。通过加强 tool use 专门训练,以及优化推理算法,DeepSeek 模型在处理复杂任务和提高推理速度方面也将取得显著进展,从而更好地满足不同场景下用户的需求 。

在人工智能技术飞速发展的今天,DeepSeek 模型面临着挑战,也迎来了前所未有的机遇。我们期待 DeepSeek 模型能够不断突破自我,解决现存问题,在人工智能领域绽放出更加耀眼的光芒,为推动各行业的智能化发展做出更大的贡献。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2025-02-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【愚公系列】《高效使用DeepSeek》003-DeepSeek文档处理和其他顶级 AI模型的区别
DeepSeek的核心竞争力在于垂直领域深度优化+高效架构设计,尤其适合技术文档解析、专业报告生成等场景;而GPT-4、Gemini在开放域创意生成、多模态交互上更具优势。未来,随着开源生态的完善,DeepSeek或将在企业级市场进一步扩大优势,而大厂模型需在成本与专业化之间寻求平衡。
愚公搬代码
2025/03/17
1650
DeepSeek R1&V3 原版论文摘要
论文还开源了DeepSeek-R1-Zero、DeepSeek-R1以及基于Qwen和Llama的多个蒸馏模型,为研究社区提供了宝贵的资源。
用户11468258
2025/02/05
5340
DeepSeek R1&V3 原版论文摘要
雷军千万年薪挖角的AI天才少女什么来头?Deepseek技术优势解析
近日,雷军以千万级别的年薪成功挖角了95后的AI天才少女罗福莉。罗福莉是一位在人工智能领域特别是自然语言处理(NLP)方面有着卓越成就的年轻科学家。
用户7353950
2025/01/01
1K0
雷军千万年薪挖角的AI天才少女什么来头?Deepseek技术优势解析
深度解析Claude 3.7 Sonnet:模型特性、性能基准与获取API Key实战开发指南
人工智能的浪潮正以惊人的速度席卷全球,大型语言模型(LLM)的能力边界也在不断被刷新。在这股浪潮中,Anthropic公司在2024年末至2025年初(根据文章原始信息,我们设定一个大致时间框架)正式推出了其Claude系列的最新力作——Claude 3.7 Sonnet。这款模型的问世,不仅是Anthropic在追求更智能、更实用AI道路上的一座新里程碑,也为整个行业带来了值得关注的性能表现和全新的应用想象空间。
网名重要么
2025/05/18
5600
深度解析Claude 3.7 Sonnet:模型特性、性能基准与获取API Key实战开发指南
【AGI-Eval行业动态 NO.4】Claude 3.7 Sonnet将模型行业卷向了新高度,但背后仍然还有新的问题
前日凌晨 2 点 Anthropic 放出大招,推出 Claude 3.7 Sonnet 及 Claude Code。Claude 产品的主管 Alex Albert 称 Claude 3.7 Sonnet 是“迄今为止最智能的模型”,业内也充满了好奇,但是不是最智能还需要实际测试,基于以下实测场景看看 Claude 3.7 Sonnet 的完成度如何。
AGI-Eval评测社区
2025/03/20
1290
【AGI-Eval行业动态 NO.4】Claude 3.7 Sonnet将模型行业卷向了新高度,但背后仍然还有新的问题
什么是DeepSeek-R1蒸馏模型?
DeepSeek在DeepSeek-V3之后发布了另一个革命性的模型,即DeepSeek-R1,这看起来是一个重大的发布,因为这个模型在几个基准测试中已经超越了OpenAI-o1,即SOTA推理模型。
码农编程进阶笔记
2025/04/26
2380
什么是DeepSeek-R1蒸馏模型?
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。‍
机器之心
2024/06/27
3930
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
Nature推荐:五大AI模型如何攻克不同科研场景?(内含Deepseek)
AI工具爆炸,模型遍地开花。今年的科研圈,要说最显眼的变化,绝对少不了“AI工具大跃进”。但问题来了!哪个模型,才是科研人该认真选择的外挂?
用户11203141
2025/03/12
2580
Nature推荐:五大AI模型如何攻克不同科研场景?(内含Deepseek)
DeepSeek V3被吹三天了,今天试了一下自称是“ChatGPT” model ?
根据官方技术论文,DeepSeek-V3的训练成本为 557.6万美元,远低于 GPT-4o 等闭源模型的 1亿美元,但依旧实现了与其性能相当的效果:
猫头虎
2024/12/31
22.8K1
DeepSeek V3被吹三天了,今天试了一下自称是“ChatGPT” model ?
使用DeepSeek必备的10个技巧
今天,我们直接讲干货。用10个问题带大家了解:DeepSeek是什么,怎么用,如何与DS高质量对话,以及一些隐藏技巧。
崔认知
2025/02/06
2K0
使用DeepSeek必备的10个技巧
当身边人都在用DeepSeek时,科研人如何悄悄拉开差距
随着人工智能技术的发展,Deepseek也好,ChatGPT也罢,单一AI工具在深度科研场景中的复杂需求逐渐显露出单一模型的局限性——比如:大模型能力差异、知识截止日期,计算能力制约、复杂数据的处理,而专业领域深度更是成为精准分析的瓶颈。
用户11203141
2025/03/06
2090
当身边人都在用DeepSeek时,科研人如何悄悄拉开差距
DeepSeek:大模型跃迁AGI,探索智能新航道(17/18)
文章摘要:文章详细介绍了DeepSeek在AI领域的发展历程、技术创新、开源策略以及其在迈向通用人工智能(AGI)过程中的成就与挑战。DeepSeek凭借其独特的技术路径,如混合专家(MoE)架构、多头潜在注意力(MLA)等,在大模型领域迅速崛起,展现出强大的性能和广泛的应用潜力。其开源策略推动了全球AI技术的普及和发展,同时也在智能开发、科学计算、企业决策等多个领域实现了深度应用。尽管面临诸多挑战,DeepSeek仍展现出巨大的发展潜力,为AGI的实现奠定了坚实基础。
正在走向自律
2025/03/23
2360
DeepSeek:大模型跃迁AGI,探索智能新航道(17/18)
DeepSeek霸榜一周:奥特曼终于承认在开源问题上处于“历史错误的一边”;迅雷斥资5亿收购“直男社区”虎扑 | Q资讯
DeepSeek-R1 霸榜一周:性能、价格与开源三重冲击;网传梁文锋回应冯骥国运论;阿里巴巴发布 AI 模型,声称超越 DeepSeek;马斯克掀起“硬核裁员”风暴:百万雇员面临“自愿离职”抉择;谷歌为 Pixel、Android 部门员工提供“自愿离职”机会;迅雷将以 5 亿元收购“直男社区”虎扑,曾最高估值达 77 亿元;Linux 基金会发布指南应对 OFAC 制裁挑战;谷歌开源 PebbleOS 操作系统......
深度学习与Python
2025/02/03
1860
DeepSeek霸榜一周:奥特曼终于承认在开源问题上处于“历史错误的一边”;迅雷斥资5亿收购“直男社区”虎扑 | Q资讯
轻松在本地部署 DeepSeek 蒸馏模型并无缝集成到你的 IDE
免费榜单双双登顶,超越了长期占据榜单的 GPT,这一突破性进展引发了投资者的广泛关注,甚至导致英伟达股价大幅下跌。从那时起,
陈明勇
2025/02/01
4.6K13
DeepSeek 新手使用指南:入门必备技巧与隐藏功能(建议收藏)
2025年春节过的好快,转眼间,大家又回到了各自工作岗位了,要说这个春节,什么最火,肯定绕不开DeepSeek。
测试开发技术
2025/02/10
1.9K0
DeepSeek 新手使用指南:入门必备技巧与隐藏功能(建议收藏)
AI模型Kubernetes问题诊断比拼
我们对 DeepSeek 的模型进行了正面测试,以对抗行业领导者,从而解决现实世界中的 Kubernetes 挑战。
云云众生s
2025/02/12
1230
AI模型Kubernetes问题诊断比拼
什么是DeepSeek?如何入门DeepSeek?
DeepSeek(深度求索)是一款由国内团队开发的开源人工智能工具库,专注于提供高效易用的AI模型训练与推理能力。它既包含预训练大语言模型(如DeepSeek-R1系列),也提供配套工具链,助力开发者快速实现AI应用落地。
猫头虎
2025/02/07
10.6K0
什么是DeepSeek?如何入门DeepSeek?
Nat. Med. | DeepSeek大模型赋能临床决策:基准测试与表现评估
大型语言模型(LLMs)正日益推动医疗应用的发展。然而,GPT-4o 等专有模型由于无法在医疗机构内部部署,难以满足严格的数据隐私法规,限制了其在临床中的实际应用。相比之下,DeepSeek 等开源模型因支持在具备 IT 基础设施的医院内部进行高效微调,成为更具前景的替代方案。为验证 DeepSeek-V3 与 DeepSeek-R1 的临床实用性,研究人员将其在临床决策支持任务中的表现与 GPT-4o、Gemini-2.0 Flash Thinking Experimental 等专有模型进行基准对比。结果基于125个涵盖常见与罕见疾病的真实病例,具备统计学效力,显示 DeepSeek 模型整体表现与专有模型相当,部分情境下更优。本研究表明,开源 LLM 有望在符合法规要求的前提下,为真实世界医疗应用提供可扩展且安全的技术路径。
DrugAI
2025/04/26
1470
Nat. Med. | DeepSeek大模型赋能临床决策:基准测试与表现评估
AGI 进阶之路探索:我和头部大模型对话学习3w+轮次后发现…
2024年7月,OpenAI 公司提出了通用人工智能(AGI)的五层框架理论,将 AGI 的发展分为5个阶段:聊天机器人(Chatbots)、推理者(Reasoners)、智能体(Agents)、创新者(Innovators)、组织者(Organizations)。
AGI-Eval评测社区
2025/05/22
1090
AGI 进阶之路探索:我和头部大模型对话学习3w+轮次后发现…
DeepSeek vs ChatGPT:AI对决中的赢家是……人类吗?
当今人工智能(AI)AIGC领域,DeepSeek 和 ChatGPT 吸引了众多目光。
猫头虎
2025/02/11
3480
DeepSeek vs ChatGPT:AI对决中的赢家是……人类吗?
推荐阅读
【愚公系列】《高效使用DeepSeek》003-DeepSeek文档处理和其他顶级 AI模型的区别
1650
DeepSeek R1&V3 原版论文摘要
5340
雷军千万年薪挖角的AI天才少女什么来头?Deepseek技术优势解析
1K0
深度解析Claude 3.7 Sonnet:模型特性、性能基准与获取API Key实战开发指南
5600
【AGI-Eval行业动态 NO.4】Claude 3.7 Sonnet将模型行业卷向了新高度,但背后仍然还有新的问题
1290
什么是DeepSeek-R1蒸馏模型?
2380
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
3930
Nature推荐:五大AI模型如何攻克不同科研场景?(内含Deepseek)
2580
DeepSeek V3被吹三天了,今天试了一下自称是“ChatGPT” model ?
22.8K1
使用DeepSeek必备的10个技巧
2K0
当身边人都在用DeepSeek时,科研人如何悄悄拉开差距
2090
DeepSeek:大模型跃迁AGI,探索智能新航道(17/18)
2360
DeepSeek霸榜一周:奥特曼终于承认在开源问题上处于“历史错误的一边”;迅雷斥资5亿收购“直男社区”虎扑 | Q资讯
1860
轻松在本地部署 DeepSeek 蒸馏模型并无缝集成到你的 IDE
4.6K13
DeepSeek 新手使用指南:入门必备技巧与隐藏功能(建议收藏)
1.9K0
AI模型Kubernetes问题诊断比拼
1230
什么是DeepSeek?如何入门DeepSeek?
10.6K0
Nat. Med. | DeepSeek大模型赋能临床决策:基准测试与表现评估
1470
AGI 进阶之路探索:我和头部大模型对话学习3w+轮次后发现…
1090
DeepSeek vs ChatGPT:AI对决中的赢家是……人类吗?
3480
相关推荐
【愚公系列】《高效使用DeepSeek》003-DeepSeek文档处理和其他顶级 AI模型的区别
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档