DeepSeek突然低调发布V3版本,并且已经上线官方网站,开源权重已经上传到HuggingFace,但还没有官方描述。多方测评显示,性能相较V2.5版本有巨大提升,编程领域甚至超越Claude。
地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base
唯一知道的是这是一个超大杯,参数高达685B,采用MoE架构,包含256个专家,每次选取TopK 8专家。
多方测评显示效果卓群。在LiveBench测评中显示DeepSeek V3是最棒的开源LLM,在非推理模型中仅次于gemini-exp-1206,排名第二。
在aider多语言编程测评中超过Claude 3.5 sonnet,仅次于OpenAI o1,相较于V2.5从17.8%完成率爆增到48.4%。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有