Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >DeepSeek-Coder-V2.1:最佳编码LLM再度升级!(经过全面测试并击败 Claude,GPT-4o)

DeepSeek-Coder-V2.1:最佳编码LLM再度升级!(经过全面测试并击败 Claude,GPT-4o)

作者头像
AI进修生
发布于 2024-12-02 11:10:08
发布于 2024-12-02 11:10:08
1.7K0
举报
文章被收录于专栏:AI进修生AI进修生
Aitrainee | 公众号:AI进修生

Hi,这里是Aitrainee,欢迎阅读本期新文章。

前几天写了一篇DeepSeek-Chat更新的文章:

DeepSeek-V2又双叒升级了,最强开源模型!(DeepSeek-Chat-V2.1开源 & 全面测试)

今天他的代码模型 DeepSeek-Coder-V2 也升级到2.1了,全称:DeepSeek-Coder-V2.1 (0724)

它增加了填充中间功能以及函数调用和一些其他的便利功能。

虽然他们分享了更新模型的信息,但并没有分享任何新的基准测试结果。

但是多个独立的基准测试排行榜已经发布了他们对这个新版本的评估。

所以我们来看看它们。

如果我要给你一个预告,那就是这个新版本已经与Claude 3.5 Sonet相媲美,同时价格更便宜。无论如何,我们先来看一下大代码基准测试排行榜。

▲ https://bigcode-bench.github.io/

你可以看到新的Deep Seek Coder V2模型现在排在第二名,与Claude 3.5 Sonet并列。

这意味着在基准测试中,这个新模型至少与Claude 3.5 Sonet相当。之前这个模型排在第7位,如你所见。所以这是从之前的迭代中一个非常好的跳跃。

如果你考虑价格与性能的比率,现在更加出色了。

下一个基准测试也非常棒,因为它来自aider。aider发布了一篇关于新模型评估的博客文章,以及哪个模型最适合aider。

你可以看到Claude 3.5 Sonet得分77%,而Deep Seek Coder V2 0724得分73%。

▲ https://aider.chat/2024/07/25/new-models.html

所以你可以看到它与Claude 3.5 Sonet相当,并且远远优于Llama3 405B和Mistol Large 2。

他们还说Deep Seek Coder V2 0724是最大的惊喜,也是最强大的代码编辑模型,在排行榜上排名第二。它可以有效地编辑代码,进行搜索替换,这解锁了编辑大文件的能力。

这个新版本的代码编辑模型在基准测试中得分73%,非常接近Sonet的77%,而且价格几乎便宜50倍。所以这确实很酷。

我无法强调它非常便宜这一点。每百万个token只需约20美分,比GPT 40 mini的60美分还要便宜。

新的模型权重还没有在Hugging Face上发布,但它们应该会在接下来的几天内发布,就像Deep Seek V2的新版本一样。

但我们实际上可以在他们的平台上试用这个新模型,不花任何钱。

所以让我们用我的问题来测试一下。这些问题包括一般问题和编程问题,这样我们也可以看看它在一般推理方面的能力。无论如何,让我们开始吧。

第一个问题是,有一个与我们用来形容高大植物的词押韵的数字,这个数字是什么?答案应该是three。这是它的回答,

▲ Gpt4-o

但它没有正确回答这个问题,所以这题不及格。

下一个问题是,我有两个苹果,然后我又买了两个。我用两个苹果做了一个派,吃了一半后,我还剩下多少苹果?答案应该是两个。这是它的回答,

也是正确的,所以这题及格。

下一个问题是,莎莉是一个女孩,她有三个兄弟,每个兄弟都有两个相同的姐妹,莎莉有几个姐妹?答案应该是一个。这是Deep Seek的回答,

也是正确的,所以这题及格。

下一个问题是,如果一个正六边形的短对角线是64,那么它的长对角线是多少?答案应该是73.9。这是它的回答,

但它没有正确回答这个问题,所以这题不及格。

下一个问题是创建一个带有点击时爆炸彩纸的按钮的HTML页面,你也可以使用CSS和JS。

让我们看看它能不能做到。这是代码,它还增加了一个直接在聊天界面中预览HTML文件的选项,

这很酷,就像Artifacts一样。

这个工作正常,但我见过更好的生成,所以这题我会标记为不及格。

下一个问题是写一个打印未来20个闰年的Python函数,仅回复函数代码。让我们发送并检查一下。这是代码,

让我们运行一下。这个工作正常,所以这题及格。

下一个问题是生成一个蝴蝶的SVG代码。让我们看看它能不能做到。这是代码,让我们看看。

这个看起来不错,有蝴蝶需要的部分,可以识别出来,所以这题及格。

下一个问题是写一个HTML页面,这个HTML页面是一个AI公司的登录页面,他们喜欢现代和简约的界面带有动画。让我们发送并检查一下。这是代码,让我们看看。

这看起来不错,所以这题及格。

最后一个问题是写一个在终端运行的Python生命游戏。让我们发送并检查一下。这是代码,让我们复制并运行。

这个工作正常,所以这题及格。

现在这是最终的统计图,

你可以看到它没有通过三个问题,这是可以理解的,因为它没有通过的两个问题是语言或数学问题,这显然不是它的优化方向。

虽然在爆炸彩纸问题上它也很接近,但我希望它能通过这个问题,不过这也没关系。

我现在更加喜欢这个模型了,而且它的推理成本非常便宜。如果你想个人使用它,你也可以在他们的平台上免费使用,没有任何明显的限制,不像ChatGPT

🌟希望这篇文章对你有帮助,感谢阅读

视频教程

https://www.youtube.com/watch?v=LVSA-GtITb0

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-07-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI进修生 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
C#操作sql通用类 SQLHelper
using System; using System.Data; using System.Configuration; using System.Web; using System.Web.Security; using System.Collections; using System.Data.SqlClient; /// <summary> /// 数据库的通用访问代码 /// 此类为抽象类,不允许实例化,在应用时直接调用即可 /// </summary> public abstract class
艳艳代码杂货店
2021/10/27
2.5K0
C#的SQLiteHelper类似SqlHelper类实现存取Sqlite数据库
using System; using System.Data; using System.Text.RegularExpressions; using System.Xml; using System.IO; using System.Collections; using System.Data.SQLite; namespace DBUtility.SQLite { /// <summary> /// SQLiteHelper is a utility class similar to
艳艳代码杂货店
2021/10/27
2.1K0
C#操作Access通用类
using System; using System.Data; using System.Configuration; using System.Web; using System.Web.Security; using System.Web.UI; using System.Web.UI.WebControls; using System.Web.UI.WebControls.WebParts; using System.Web.UI.HtmlControls; using System.Data.Ol
艳艳代码杂货店
2021/10/29
9340
自己写的GeneralDatabaseLayer
菜鸟一个 在校大二学生 奉老师旨意写了个通用数据库层 各位大哥大姐的看过的给点意见 本人实在是没什么经验 指点指点我啊
MJ.Zhou
2022/05/07
4650
我的数据访问函数库的源代码(一)—— 共用部分
/* 2008 4 25 更新 */ 我的数据访问函数库的源码。整个类有1400多行,原先就是分开来写的,现在更新后还是分开来发一下吧。 第一部分:内部成员,初始化设置等。 using System; using System.Data; using System.Data.SqlClient; using HBS.DataStruct; using HBS.Form; //using System.Security.Principal; namespace HBS {     
用户1174620
2018/02/07
9040
ASP.NET Core 实战:基于 Dapper 扩展你的数据访问方法
  在非静态页面的项目开发中,必定会涉及到对于数据库的访问,最开始呢,我们使用 Ado.Net,通过编写 SQL 帮助类帮我们实现对于数据库的快速访问,后来,ORM(Object Relational Mapping,对象关系映射)出现了,我们开始使用 EF、Dapper、NHibernate,亦或是国人的 SqlSugar 代替我们原来的 SqlHelper.cs。通过这些 ORM 工具,我们可以很快速的将数据库中的表与代码中的类进行映射,同时,通过编写 SQL 或是 Lambda 表达式的方式,更加便捷的实现对于数据层的访问。
程序员宇说
2019/09/11
2.1K0
ASP.NET Core 实战:基于 Dapper 扩展你的数据访问方法
Net连接mysql的公共Helper类MySqlHelper.cs带MySql.Data.dll下载
MySqlHelper.cs代码如下: using System; using System.Collections.Generic; using System.Linq; using System.Web; using System.Text; using System.Data; using System.Collections; using MySql.Data.MySqlClient; using MySql.Data.Types; using System.Configuration; using
磊哥
2018/05/08
2.4K0
我的数据访问类(第二版)—— for .net2.0 (二)
下面写一下相对来说不变的地方 SQL语句部分,改成了静态函数的形式。 using System; using System.Collections.Generic; using System.Text; using System.Data; using System.Data.Common; using System.Data.SqlClient; using JYK; namespace JYK.DataAccessLibrary {     //DataAccessLibrary 数据访问库    
用户1174620
2018/02/07
1.1K0
机房收费系统(VB.NET)——存储过程实战
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/huyuyang6688/article/details/38170191
DannyHoo
2018/09/13
1K0
机房收费系统(VB.NET)——存储过程实战
抽出SqlHelper
什么叫SqlHelper,通过简单的翻译,能够获得这是对Sql的帮助,那么它究竟对我们的Sql做出了什么样的帮助呢?
全栈程序员站长
2022/07/14
3480
自定义 SqlHelp
1 using System; 2 using System.Collections.Generic; 3 using System.Data.SqlClient; 4 using System.Data; 5 using System.Configuration; 6 using System.Reflection; 7 using System.Collections; 8 namespace DataHelp 9 { 10 #region ADO.NET
跟着阿笨一起玩NET
2018/09/19
5390
开发自己的Data Access Application Block[下篇]
上接:[原创] 我的ORM: 开发自己的Data Access Application Block - Part I 4. Database 下面来介绍重中之重:Database,绝大部分的Data Access 操作都集中在这个Abstract Database中。这是一个相对庞大的Class,所以不得不采用Partial Class的方式来编写。 Part I:Field 和Property 这些Field 和Property基本上对应我们前面的Configuraiton。此为我们定义了三个Field
蒋金楠
2018/02/08
1.4K0
ASP.NET 存储过程操作
存储过程是存放在数据库服务器上的预先编译好的sql语句。使用存储过程,可以直接在数据库中存储并运行功能强大的任务。存储过程在第一应用程序执行时进行语法检查和编译,编译好的版本保存在高速缓存中。在执行重复任务时,存储过程可以提高性能和一致性。由于存储过程可以将一系列对数据库的操作放在数据库服务器上执行,因而可以降低Web服务器的负载,提高整个系统的性能。
跟着阿笨一起玩NET
2018/09/19
1.3K0
.Net中的5种事务总结
在一个MIS系统中,没有用事务那就绝对是有问题的,要么就只有一种情况:你的系统实在是太小了,业务业务逻辑有只要一步执行就可以完成了。因此掌握事务处理的方法是很重要,进我的归类在.net中大致有以下4种事务处理的方法。大家可以参考一下,根据实际选择适当的事务处理。 1、SQL事务     sql事务是使用SQL server自身的事务:在存储过程中直接使用Begin Tran,Rollback Tran,Commit Tran实现事务: 优点:执行效率最佳 限制:事务上下文仅在数据库中调用,难以实现复杂的业务
跟着阿笨一起玩NET
2018/09/18
5900
一个自定义的C#数据库操作基础类 SqlHelper
SqlHelper其实是我们自己编写的一个类,使用这个类目的就是让使用者更方便、更安全的对数据库的操作,既 是除了在SqlHelper类以外的所有类将不用引用对数据库操作的任何类与语句,无须担心数据库的连接与关闭的问题。
用户7108768
2021/11/02
8390
.NET简谈设计模式之(策略模式)
策略模式在我们日常开发中经常被用到,这篇文章不是策略模式的深入讨论和学术研究,只是让初学者能有个基本的了解。
王清培
2022/03/14
8140
.NET简谈设计模式之(策略模式)
c# mysql executenonquery_C#与数据库访问技术总结(八)之ExecuteNonQuery方法
Command对象通过ExecuteNonQuery方法更新数据库的过程非常简单,需要进行的步骤如下:
全栈程序员站长
2022/10/01
6640
ADO数据库C#中ExecuteReader、ExecuteNonQuery、ExecuteScalar、SqlDataReader、SqlDataAdapter
CommandType 命令类型,如果是sql语句,则为CommandType.Text,否则为 CommandType.StoredProcdure
全栈程序员站长
2022/08/28
1K0
sqlHelper的增删改查
当一件事情被反复做了多次后。会想找一种办法来取代自己去做这个反复的动作。
全栈程序员站长
2022/07/07
5430
2024年了还有人玩DbHelper?- 确实很6
时光荏苒,转眼已是2024年。在这个技术日新月异的时代,有些经典却永远不会过时。DbHelper,这个在开发者社区中一直备受瞩目的名字,如今依然熠熠生辉。最近,一位技术大佬再次展示了DbHelper的强大魅力,让我们一起来欣赏一下吧!
沙漠尽头的狼
2024/01/26
2110
2024年了还有人玩DbHelper?- 确实很6
相关推荐
C#操作sql通用类 SQLHelper
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档