Loading [MathJax]/jax/output/CommonHTML/config.js
部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >重磅更新!DeepSeek V3低调发布,超越Claude,编程能力提升明显

重磅更新!DeepSeek V3低调发布,超越Claude,编程能力提升明显

作者头像
AgenticAI
发布于 2025-03-18 08:11:30
发布于 2025-03-18 08:11:30
1110
举报
文章被收录于专栏:AgenticAIAgenticAI

DeepSeek突然低调发布V3版本,并且已经上线官方网站,开源权重已经上传到HuggingFace,但还没有官方描述。多方测评显示,性能相较V2.5版本有巨大提升,编程领域甚至超越Claude。

地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base

唯一知道的是这是一个超大杯,参数高达685B,采用MoE架构,包含256个专家,每次选取TopK 8专家。

多方测评显示效果卓群。在LiveBench测评中显示DeepSeek V3是最棒的开源LLM,在非推理模型中仅次于gemini-exp-1206,排名第二。

在aider多语言编程测评中超过Claude 3.5 sonnet,仅次于OpenAI o1,相较于V2.5从17.8%完成率爆增到48.4%。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-12-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AgenticAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%
在 2024 年底,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了最新的混合专家(MoE)语言模型 DeepSeek-V3-Base。不过,目前没有放出详细的模型卡。
机器之心
2025/02/15
1100
超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%
DeepSeek-V3发布:编程能力超过 Claude Sonnet 3.5!
备受期待的Deepseek V3终于开源!这款全新的AI模型在多语言编程能力上取得了重大突破,其在aider多语言编程测评中的表现,甚至超越了Claude3.5Sonnet V2等竞争对手,引发了业界广泛关注。
致Great
2024/12/27
3020
DeepSeek-V3发布:编程能力超过 Claude Sonnet 3.5!
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑
新模型版本为DeepSeek-V3-0324,参数量为6850亿,相较上个版本参数增幅不大(6710亿)。
新智元
2025/03/27
1130
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑
DeepSeek-V3新版本发布,代码能力赶上Claude 3.7
DeepSeek-V3新版本突然发布,而且一发布就直接开源。DeepSeek真的无愧为开源界的“源神”。
算法一只狗
2025/03/25
4150
震惊!DeepSeek开源V3新版,代码能力直逼顶尖,国外开发者沸腾了!
3月24日晚,国内知名大模型平台DeepSeek悄然发布了V3模型的最新版本0324。与以往不同的是,此次发布异常低调,既未在国内公众号上宣传,也未在海外社交平台造势,而是直接将模型上传至HuggingFace平台,供用户下载使用。
福大大架构师每日一题
2025/03/27
1010
震惊!DeepSeek开源V3新版,代码能力直逼顶尖,国外开发者沸腾了!
Llama 4 开源了!千万上下文 + 单卡H100跑 400B + 反超DeepSeek,网友:RAG还好吗?
AI 圈周末炸锅,Meta 毫无预兆地扔出了 Llama 4 系列,直接抢回开源第一宝座。
AI进修生
2025/04/07
1270
Llama 4 开源了!千万上下文 + 单卡H100跑 400B + 反超DeepSeek,网友:RAG还好吗?
刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座
Meta官宣开源首个原生多模态Llama 4,首次采用MoE架构,支持12种语言,首批发布一共两款:
新智元
2025/04/07
1770
刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座
DeepSeekV2:这个新的开源的模型在多个基准测试中击败了 GPT-4、Claude-3 和 Llama-3!(附代码演示)
这两天有个新模型引起了不少关注,那就是DeepSeek-Coder-V2。这个模型是DeepSeek-Coder的最新升级版,相比之前的版本有了很大的提升,特别是在编码任务方面的表现令人惊艳。
AI进修生
2024/12/02
1.9K0
DeepSeekV2:这个新的开源的模型在多个基准测试中击败了 GPT-4、Claude-3 和 Llama-3!(附代码演示)
Deep Seek V2.5:新一代上线!结合编码与通用能力,超越前作
最近发布了很多模型,甚至 Deep Seek 也发布了一个新模型,Deep Seek V2.5。Deep Seek是一家提供非常出色的编码和通用开源模型的公司。
AI进修生
2024/12/02
9400
Deep Seek V2.5:新一代上线!结合编码与通用能力,超越前作
使用DeepSeek必备的10个技巧
今天,我们直接讲干货。用10个问题带大家了解:DeepSeek是什么,怎么用,如何与DS高质量对话,以及一些隐藏技巧。
崔认知
2025/02/06
1.9K0
使用DeepSeek必备的10个技巧
【AGI-Eval评测报告 NO.2】DeepSeek V3-0324抢先评测!最全报告输出
DeepSeek-V3 的版本更新 V3-0324 深夜在 AI 开源平台 HuggingFace 低调上线,尽管本次不是大家期待的 V4 或 R2 版本,但还是引起了大批网友的惊叹。
AGI-Eval评测社区
2025/03/26
2020
【AGI-Eval评测报告 NO.2】DeepSeek V3-0324抢先评测!最全报告输出
DeepSeek 大模型基本认知(V3、R1、Janus、VL2 简单介绍以及本地部署)
“以开源精神和长期主义追求普惠 AGI” 是 DeepSeek 一直以来的坚定信念
山河已无恙
2025/02/25
1.1K0
DeepSeek 大模型基本认知(V3、R1、Janus、VL2 简单介绍以及本地部署)
Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了
当地时间 4 月 8 日,英伟达宣布推出其最新大语言模型 Llama3.1 Nemotron Ultra 253B。该模型基于 Meta 的 Llama-3.1-405B-Instruct 构建,并利用创新的神经架构搜索(NAS)技术进行了深度优化。其性能超越了最近发布的 Llama4,如 Behemoth、Maverick,并在 Hugging Face 平台上开源,引起 AI 社区广泛关注的同时,也再次“暴击”了 Meta。
深度学习与Python
2025/04/13
690
Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了
DeepSeek大讨论:中国AI在成本、真实训练成本和封闭模型利润率影响方面的领导地位
在过去一周里,DeepSeek 成为全球唯一的话题。目前,DeepSeek 的日流量已经远远超过 Claude、Perplexity 甚至 Gemini。但对行业观察者来说,这并非“新”闻。我们已经讨论 DeepSeek 数月之久。这家公司并不新。SemiAnalysis 一直认为 DeepSeek 极具天赋,但公众此前并不关心。
用户11468091
2025/02/05
7600
DeepSeek大讨论:中国AI在成本、真实训练成本和封闭模型利润率影响方面的领导地位
万字长文解构DeepSeek V1/V2/V3/R1进化史:从算法革命到推理涌现!
在今年的春节期间,DeepSeek 火出了圈。凭借 DeepSeek-V3 与 DeepSeek-R1 的创新技术和卓越表现,DeepSeek 迅速成为了行业内外的焦点。不管是技术专家还是普通用户,都对 DeepSeek 赞不绝口。我们特别准备了这篇技术科普文章,期望无论你是不是技术同学,都能够读懂 DeepSeek。
腾讯云开发者
2025/02/27
7170
万字长文解构DeepSeek V1/V2/V3/R1进化史:从算法革命到推理涌现!
Gemma 3 27B版本超越DeepSeek V3:技术要点分析!
Gemma 3 是 Google 最新的开放权重大型语言模型。它有四种尺寸,分别是 10 亿、40 亿、120 亿 和 270 亿 参数,包含基础(预训练)和指令调优版本。Gemma 3 支持 多模态! 4B亿、12B和 27B参数的模型可以处理 图像 和 文本,而1B参数的模型仅限于文本。
致Great
2025/03/14
1.3K0
Gemma 3 27B版本超越DeepSeek V3:技术要点分析!
2024年开源大模型有哪些?这篇文章告诉你
最近,国内外开源大模型一直受到研究者的关注,但是种类比较繁多,就单单今年开源的大模型就有10+以上。
算法一只狗
2024/07/18
2.2K0
2024年开源大模型有哪些?这篇文章告诉你
Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek
万万没想到。Meta 选择在周六日,发布了最新 AI 模型系列 ——Llama 4,这是其 Llama 家族的最新成员。
机器之心
2025/04/07
1100
Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek
7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。在生成模型发展早期,这种刻板印象广泛存在于很多研究者的脑海中。
机器之心
2025/04/06
620
7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘
刚刚过去的 2024 年是生成式 AI 大发展的一年,我们见证了 OpenAI Sora 的崛起,大模型服务价格的飞速下降,以及国内开源大模型的奋起直追。这全方位的快速发展让我们对下一波 AI 的新技术大规模应用充满了信心。
机器之心
2025/02/03
1930
全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘
推荐阅读
超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%
1100
DeepSeek-V3发布:编程能力超过 Claude Sonnet 3.5!
3020
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑
1130
DeepSeek-V3新版本发布,代码能力赶上Claude 3.7
4150
震惊!DeepSeek开源V3新版,代码能力直逼顶尖,国外开发者沸腾了!
1010
Llama 4 开源了!千万上下文 + 单卡H100跑 400B + 反超DeepSeek,网友:RAG还好吗?
1270
刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座
1770
DeepSeekV2:这个新的开源的模型在多个基准测试中击败了 GPT-4、Claude-3 和 Llama-3!(附代码演示)
1.9K0
Deep Seek V2.5:新一代上线!结合编码与通用能力,超越前作
9400
使用DeepSeek必备的10个技巧
1.9K0
【AGI-Eval评测报告 NO.2】DeepSeek V3-0324抢先评测!最全报告输出
2020
DeepSeek 大模型基本认知(V3、R1、Janus、VL2 简单介绍以及本地部署)
1.1K0
Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了
690
DeepSeek大讨论:中国AI在成本、真实训练成本和封闭模型利润率影响方面的领导地位
7600
万字长文解构DeepSeek V1/V2/V3/R1进化史:从算法革命到推理涌现!
7170
Gemma 3 27B版本超越DeepSeek V3:技术要点分析!
1.3K0
2024年开源大模型有哪些?这篇文章告诉你
2.2K0
Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek
1100
7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
620
全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘
1930
相关推荐
超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档