首页
学习
活动
专区
圈层
工具
发布
首页标签DeepSeek

#DeepSeek

DeepSeek开源DSpark:推理速度提升85%

袁锐钦

但如果你在做AI应用——不只是在用聊天框——DSpark可能是本周跟你关系最大的发布。

2600

梁文锋亲自署名!DeepSeek发布DSpark,大模型推理一口气提速85%

乐小野

石化盈科信息技术有限责任公司 | 算法工程师 (已认证)

2026年6月27日,DeepSeek联合北京大学发布了一篇题为《DSpark: Confidence-Scheduled Speculative Decodi...

1600

2026年6月27日-行业日报-GPT-5.6三档模型限量发布-安全工具上线-DeepSeek扩招

小博测试成长之路

OpenAI发布Daybreak安全工具集:GPT-5.5-Cyber与Codex Security正式版上线

3700

DeepSeek 太快了!

勇哥AI笔记

不过昨天在官网对话,发现 DeepSeek 回答速度极快,几乎是刚按下回车键,马上开始输出。

2000

解密Prompt系列70. 从 MLA 到 CSA,聊聊大模型 Attention 的“瘦身”与“闪送”

风雨中的小七

这一章我们聊聊这两年注意力架构的技术演化路线。全文覆盖三个方向,每个方向都是上一个方向的"接力棒":

14600

DeepSeek搞了个DSpark,AI直接进入“秒回时代”,你还在傻等?

疯聊AI

2026年6月16日,DeepSeek刚拿下500亿融资,估值直接飙到500亿美元。梁文锋自己掏了200亿。

9010

大模型终于能读千页文档了!DeepSeek-OCR 用 1 招压缩 10 倍,准确率还能 97%

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

“给大模型喂一份 1000 页的财报,它要么‘内存爆炸’,要么切片段后逻辑全乱 —— 这难题终于被破解了!” 近期 DeepSeek 发布的 DeepSeek-...

7610

从 “各自为战” 到 “发布即适配”:DeepSeek 与寒武纪的联动,改写中国 AI 格局

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

打开深度求索的官方 App,“已更新至 DeepSeek-V3.2-Exp” 的弹窗格外醒目。这款被定义为 “实验性版本” 的大模型,藏着一个关键升级 ——De...

8610

父亲和母亲可以结婚吗?

PikeTalk

这个问题国内三个模型,推理模式下两个都回答对了 GLM4.6、DeepSeek-V3.2、Qwen3,就 DeepSeek 错了,这类问题对于 AI 来说 还是...

9210

Google研究员发现:DeepSeek-R1内部在"开会",这才是推理能力的真正来源

唐国梁Tommy

论文最有实证价值的发现,来自对 DeepSeek-R1 和 QwQ-32B 的研究。直觉上,这些模型"思考时间越长、表现越好"——但实验否定了这个简单解释。

10010

多线程饥饿死锁 - Claude Code 和 DeepSeek集体幻觉

码农戏码

线上碰到一个问题,当用户提交一个流程时,经常出现流程中途节点出现超长等待才会出现结果,甚至有时感觉系统hang了

7710

GPT-4训练花了1亿美元,DeepSeek只花了560万——AI模型的'参数军备竞赛'结束了

老周聊架构

DeepSeek-V3的数据最能说明问题:671B的知识量,37B的计算成本。 推理速度由激活参数决定(37B),而不是总参数(671B)。这意味着它的推理速度...

13210

DeepSeek融了510亿,我最关心的不是钱

袁锐钦

金额是510亿人民币,投后估值接近4000亿。投资方阵容包括腾讯(100亿)、宁德时代(50亿)、京东和网易(各30亿),以及IDG、砺思资本等机构。创始人梁文...

20210

2026年GEO优化乱象:RAG注入投毒、代码伪造、黑客入侵的信源权重之争

用户8979314

2026年,生成式AI的回答已经成为用户获取信息的首要入口。但鲜为人知的是,这些AI的答案并非凭空产生——它们依赖一种名为RAG(Retrieval-Augme...

16900

老周的AI极客工坊 [第二期] | 终端神器 deepseek-tui (CodeWhale) 打造本地 AI 编程助理

用户12547393

今天,老周带你用最硬核、最酷炫的“黑客流”玩法:在终端(命令行)中配置专为国产良心大模型 DeepSeek 打造的开源终端神器 —— deepseek-tui(...

26110

DeepSeek上线识图,却认不出自家老板梁文锋?

TechMiel

6 月 18 日,DeepSeek 识图模式同步上线网页端与 App,多家媒体实测发现人像识别存在明显漏洞。上传创始人梁文锋实拍照片反复测试,模型均无法精准匹配...

15010

DeepseekV4.1即将发布,网友期待「降价、打爆国外 AI」,它将如何改变AI市场格局?

鱼片粥来碗豆腐

看到技术白皮书和核心参数泄露图的瞬间,我整个人直接从人体工学椅上弹了起来。作为天天带队在算力前线跟 Token 账单、模型延迟、API 路由肉搏的技术负责人,我...

31000
领券