首页
学习
活动
专区
圈层
工具
发布
首页标签DeepSeek

#DeepSeek

国产大模型杀疯了!DeepSeek V4 开源 1.6 万亿 MoE,推理成本仅 GPT-4 的 1/70

jack.yang

2026年4月24日,全球人工智能领域迎来一个历史性节点。就在OpenAI高调发布GPT-5.5的同一天,中国AI公司深度求索(DeepSeek)悄然开源了De...

8320

解密 DeepSeek V4:双轴稀疏 MoE + Engram 记忆 + Muon 优化器,如何打造高效万亿模型?

jack.yang

在人工智能技术迅猛发展的2026年,大语言模型(Large Language Models, LLMs)已成为推动全球科技变革的核心引擎。自2017年Trans...

3520

微调实战:DeepSeek V4领域适配完全指南

jack.yang

尽管DeepSeek V4在通用任务上表现出色,但其知识库截止于2025年12月,且训练数据主要来源于公开网络。这导致其在面对以下场景时存在局限:

7410

容器化部署:DeepSeek V4 Docker与K8s集成方案

jack.yang

DeepSeek V4,特别是其V4-Pro(1.6T参数)和V4-Flash(284B参数)版本,代表了当前开源大模型的顶尖水平。但其复杂的依赖(如特定版本的...

5110

边缘计算应用:DeepSeek V4轻量级部署实战——让万亿参数大模型在消费级设备上飞驰

jack.yang

长期以来,大语言模型(LLM)的部署被严格区分为两个世界:云端和本地。云端拥有无限的算力,可以轻松驾驭GPT-4、Claude 3等顶级闭源模型;而本地部署则受...

710

全栈国产化:DeepSeek V4与国产AI基础设施深度集成——中国AI产业的历史性突围

jack.yang

长久以来,中国AI产业深陷一种结构性困境:在算法和模型层面,我们已跻身世界第一梯队,诞生了如 DeepSeek、Kimi、GLM 等一系列世界级开源或闭源大模型...

9220

图文详细教程,不访问国外网站也能用 Claude Code + cc-switch 接入 DeepSeek V4

码哥字节

适合人群:国内没有访问国外网站条件,或者不想把访问国外网站和 AI 工具混在一起的职场用户。 预计阅读:22 分钟

51610

AI产业大分叉:从DeepSeek 500亿融资到Token价格崩塌,看懂这一周的五大趋势

老周聊架构

这个数字意味着什么?对比一下:OpenAI 上一轮融资后估值约 3000 亿美元,DeepSeek 已经追到六分之一。而 DeepSeek 的核心团队规模、算力...

11810

使用DeepSeek V4 重构项目,只用了3块钱

灬沙师弟

更重要的是,这种低价不是“赔本赚吆喝”的限时活动,而是DeepSeek基于自身技术栈和基础设施优化,给出的长期定价。当行业里还在为“降本增效”喊口号时,Deep...

16810

万亿参数震撼发布:DeepSeek V4 MoE架构深度解析

jack.yang

2026年4月24日,深度求索(DeepSeek)正式开源发布 DeepSeek-V4 系列预览版,一举引爆全球AI圈。这不仅是又一次模型迭代,更是对当前大模型...

28330

大模型玩家必看!OpenClaw 接 DeepSeek API 保姆级指南

不吃香菜AI

相信不少使用 OpenClaw 的玩家都有同款困扰:翻遍全网各类教程、技术社群、开源文档,始终找不到一套完整可用的 DeepSeek 官方 APIKey 配置方...

35630

云端MoE vs 本地Dense:DeepSeek与Gemma4 26B的选题策划能力量化对比评测

仙踪问道

​ 今天不聊概念,聊一次真实的 A/B 测试。我用 Hermes Agent 接入了国内各大平台的热搜数据,给两个大模型下达了相同的运营策划任务:结合"智能生活...

12010

想要免费体验 DeepSeek-V4-Flash ?AtomCode 可以试试

轻松玩K技

又有一个可以直接用 DeepSeek-V4-Flash 的地方 —— AtomCode。

28410

DeepSeek-V4 注意力机制 · 小白学习指南

xiaoHangXu

📖 一份从零开始理解 DeepSeek-V4 如何处理 100 万 token 超长文本的学习笔记

9320

实操教程:OpenClaw 对接 DeepSeek 大模型方法

AI先锋官

打开 DeepSeek 开放平台,进入后选择手机号验证码登录或微信扫码登录,完成账号登录操作。

52320

基于 DeepSeek 的编程智能体 TUI

勇哥AI笔记

今天发现有个面向DeepSeek V4的终端原生编程工具:DeepSeek TUI,一个完全运行在终端里的编程智能体。

25410

周一上线|Hexo 一夜丢了 40K Star,DeepSeek TUI 遭遇假仓库;AI 公司一边裁员一边融资

七牛开发者

上周技术圈最值得注意的,可能不是某一个模型更新了,而是 AI 公司正在重新分配资源。

17710

DeepSeek被曝融资500亿,梁文锋占大头,估值直冲3500亿!

Amusi

据外媒报道,中国人工智能明星公司DeepSeek正寻求完成一轮规模超过500亿元人民币(约73.5亿美元)的融资。若顺利达成,这将刷新中国AI公司单轮融资纪录,...

22210

当API价格差150倍:DeepSeek V4 vs GPT-5.5,大模型竞争的胜负手变了

陆业聪

• DeepSeek V4预览版发布:1.6万亿参数Pro + 285B参数Flash,百万上下文标配,MIT协议开源,API最低0.2元/百万Token

34010

DeepSeek V4 Pro 1个亿Token,到底要花多少钱?

Hello工控

自从DeepSeek发布V4 Pro和Flash模型来,我就第一时间把这个模型接入了Claude Code:如何在Claude Code里面用上DeepSeek...

92530
领券