首页
学习
活动
专区
圈层
工具
发布
首页标签DeepSeek

#DeepSeek

DeepSeek 3FS源码分析(2) 协程如何突破单线程限制,实现多核并发

早起的鸟儿有虫吃

你有没有发现,在传统的电信行业,分布式数据库很少使用协程(Coroutine),而到了文件系统领域,3FS (Fire-Flyer File System) 直...

2000

DeepSeek V3.2爆火,Agentic性能暴涨40%解密

新智元

【新智元导读】DeepSeek V3.2的Agentic能力大增,离不开这项关键机制:Interleaved Thinking(交错思维链)。Interleav...

1300

DeepSeek的模型,让AI第一次学会了反思。

数字生命卡兹克

就在昨天晚上,DeepSeek悄悄地上了一个新模型,DeepSeekMath-V2。

1700

DeepSeek 接入 Claude Code:从踩 CCR 坑到发现“协议才是本体”

LeonAlgo

不会有太多代码,因为代码可以随时让 AI 再帮我写一遍; 我更想讲的是:一个新手,是怎么从 0 折腾到 1 的。

3300

突破显存瓶颈:基于 DeepSeek-V3.2-Exp 的 Latent Cache 卸载预取方案设计与模拟验证

深度学习与Python

DeepSeek-V3.2-Exp 所搭载的稀疏化 Attention 计算,在长上下文场景中成功降低了推理延迟。但在 PD 分离架构下,随着序列长度不断增长,...

1700

NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

机器之心

大模型推理的爆发,实际源于 scaling 范式的转变:从 train-time scaling 到 test-time scaling(TTS),即将更多的算...

2600

DeepSeek、Gemini谁更能提供情感支持?趣丸×北大来了波情绪轨迹动态评估

机器之心

AAAI 由国际人工智能促进协会(Association for the Advancement of Artificial Intelligence, AAA...

3400

从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?

机器之心

结果显示,MiniMax 新一代大模型 M2 的表现最佳,一举超越了 DeepSeek、GLM、Qwen、Kimi 等其他一众竞品厂商。

1700

vite7.2-deepseek流式ai对话|vue3.5+vant4+katex+mermaid智能ai打字会话模板

andy2018

​喜迎2026原创新作vite7.2+vue3.5+deepseek-v3.2从0-1纯手搓流式输出ai会话模板。

2720

“等忙完这阵就补单测”:程序员最大的谎言,今天被AI终结了

huizhudev

听完这句话,你的脊背有没有一阵发凉?根据墨菲定律,凡是觉得“没问题”的地方,往往就是下一次线上事故的爆发点。

9210

告别无效加班!DeepSeek全场景工作赋能指南,效率直接拉满

用户11944663

还在为写不完的报告、理不清的项目流程、改不完的方案头疼?别慌!企业级AI工具DeepSeek可不是简单的聊天机器人,而是能融入工作全流程的“超级助手”。无论是数...

9910

DeepSeek-R1 与 o3 的启示:Test-Time Compute 技术不再迷信参数堆叠

deephub

先是 DeepSeek-R1 证明了只要给予思考时间,Open-weights 模型也能展现出惊人的推理能力。紧接着 OpenAI o3 登场,通过在单个问题上...

10410

挖个InnoDB坑,出个题,答对有奖!(你以为DeepSeek说的就对?)

架构师之路

准备系统性讲下MySQL InnoDB的锁机制,开讲之前,先挖个坑。讲完之后,这些坑就都很容易了。

8510

ollama v0.13.0 发布:DeepSeek-OCR、Cogito-V2.1 全新支持,性能工具 Bench 正式上线

福大大架构师每日一题

2025 年 11 月 19 日,Ollama 发布了 v0.13.0 版本,本次更新带来了多个重要的新特性与性能优化,包括全新的 DeepSeek-OCR 模...

19910

DeepSeek倒逼vLLM升级!芯片内卷、MoE横扫千模,vLLM核心维护者独家回应:如何凭PyTorch坐稳推理“铁王座”

深度学习与Python

vLLM 的故事始于加州大学伯克利分校 Sky Computing Lab 里一群充满热情的学生与研究员。2023 年,他们开源了核心的 PagedAttent...

13810

那些年我们不敢动的“屎山”,今天终于有人敢动了

huizhudev

你盯着屏幕上那个长达 800 行的 processOrder 函数,手指悬在 Delete 键上方,微微颤抖。这个函数里充斥着 15 层 if-else 嵌套,...

14910

ollama v0.11.7发布:深度集成DeepSeek-V3.1与Turbo云端推理模式解析

福大大架构师每日一题

DeepSeek-V3.1是DeepSeek系列的最新版本,拥有超过671B(6710亿)参数,属于超大规模语言模型。这类模型在理解能力、生成质量和多任务处理方...

12110

神经推理的蜕变:从概率解码到 DeepSeek V3.2 的理性智能体架构演进

张善友

大型语言模型(Large Language Models, LLMs)的发展历程,长期以来被“下一个预测词”(Next Token Prediction)的范式...

20910

DeepSeek,你终于又杀回来了!

数智转型架构师

两个月前,当DeepSeek-V3.2-Exp(实验版)发布时,我写下了一篇分析,说我看到了开源世界向闭源巨头发起了有力冲击。如果说实验版是一份让人眼前一亮的“...

18010

拒绝“写后即忘”:用AI把正则表达式从“天书”变成“人话”

huizhudev

在开发者圈子里,正则表达式(Regex)一直是一个充满“魔幻现实主义”色彩的存在。它强大到令人发指,能用一行代码解决几百行 if-else 才能搞定的文本处理逻...

12910
领券