首页
学习
活动
专区
圈层
工具
发布
首页标签DeepSeek

#DeepSeek

别再用"抛硬币"决定技术栈了:架构师的体面,是AI给的

huizhudev

又有多少次,项目上线半年后,团队为了填补那个当初“脑一热”选定的数据库留下的坑,不得不通宵达旦地重构?

4010

把握关键!设备到数据的存储监控之路

腾讯蓝鲸助手

近年来,随着数据量的爆炸性增长,从传统的磁盘阵列和网络存储,到如今的云原生存储、分布式文件存储和对象存储,存储领域正在快速演进。然而,无论技术如何革新,存储系统...

3310

DeepSeek 3FS源码分析(2) 协程如何突破单线程限制,实现多核并发

早起的鸟儿有虫吃

你有没有发现,在传统的电信行业,分布式数据库很少使用协程(Coroutine),而到了文件系统领域,3FS (Fire-Flyer File System) 直...

6910

DeepSeek V3.2爆火,Agentic性能暴涨40%解密

新智元

【新智元导读】DeepSeek V3.2的Agentic能力大增,离不开这项关键机制:Interleaved Thinking(交错思维链)。Interleav...

16610

DeepSeek的模型,让AI第一次学会了反思。

数字生命卡兹克

就在昨天晚上,DeepSeek悄悄地上了一个新模型,DeepSeekMath-V2。

15710

DeepSeek 接入 Claude Code:从踩 CCR 坑到发现“协议才是本体”

LeonAlgo

不会有太多代码,因为代码可以随时让 AI 再帮我写一遍; 我更想讲的是:一个新手,是怎么从 0 折腾到 1 的。

33410

突破显存瓶颈:基于 DeepSeek-V3.2-Exp 的 Latent Cache 卸载预取方案设计与模拟验证

深度学习与Python

DeepSeek-V3.2-Exp 所搭载的稀疏化 Attention 计算,在长上下文场景中成功降低了推理延迟。但在 PD 分离架构下,随着序列长度不断增长,...

9610

NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

机器之心

大模型推理的爆发,实际源于 scaling 范式的转变:从 train-time scaling 到 test-time scaling(TTS),即将更多的算...

7310

DeepSeek、Gemini谁更能提供情感支持?趣丸×北大来了波情绪轨迹动态评估

机器之心

AAAI 由国际人工智能促进协会(Association for the Advancement of Artificial Intelligence, AAA...

11610

从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?

机器之心

结果显示,MiniMax 新一代大模型 M2 的表现最佳,一举超越了 DeepSeek、GLM、Qwen、Kimi 等其他一众竞品厂商。

10510

vite7.2-deepseek流式ai对话|vue3.5+vant4+katex+mermaid智能ai打字会话模板

andy2018

​喜迎2026原创新作vite7.2+vue3.5+deepseek-v3.2从0-1纯手搓流式输出ai会话模板。

9820

“等忙完这阵就补单测”:程序员最大的谎言,今天被AI终结了

huizhudev

听完这句话,你的脊背有没有一阵发凉?根据墨菲定律,凡是觉得“没问题”的地方,往往就是下一次线上事故的爆发点。

10910

告别无效加班!DeepSeek全场景工作赋能指南,效率直接拉满

用户11944663

还在为写不完的报告、理不清的项目流程、改不完的方案头疼?别慌!企业级AI工具DeepSeek可不是简单的聊天机器人,而是能融入工作全流程的“超级助手”。无论是数...

13410

DeepSeek-R1 与 o3 的启示:Test-Time Compute 技术不再迷信参数堆叠

deephub

先是 DeepSeek-R1 证明了只要给予思考时间,Open-weights 模型也能展现出惊人的推理能力。紧接着 OpenAI o3 登场,通过在单个问题上...

11310

挖个InnoDB坑,出个题,答对有奖!(你以为DeepSeek说的就对?)

架构师之路

准备系统性讲下MySQL InnoDB的锁机制,开讲之前,先挖个坑。讲完之后,这些坑就都很容易了。

9210

ollama v0.13.0 发布:DeepSeek-OCR、Cogito-V2.1 全新支持,性能工具 Bench 正式上线

福大大架构师每日一题

2025 年 11 月 19 日,Ollama 发布了 v0.13.0 版本,本次更新带来了多个重要的新特性与性能优化,包括全新的 DeepSeek-OCR 模...

24010

DeepSeek倒逼vLLM升级!芯片内卷、MoE横扫千模,vLLM核心维护者独家回应:如何凭PyTorch坐稳推理“铁王座”

深度学习与Python

vLLM 的故事始于加州大学伯克利分校 Sky Computing Lab 里一群充满热情的学生与研究员。2023 年,他们开源了核心的 PagedAttent...

14810

那些年我们不敢动的“屎山”,今天终于有人敢动了

huizhudev

你盯着屏幕上那个长达 800 行的 processOrder 函数,手指悬在 Delete 键上方,微微颤抖。这个函数里充斥着 15 层 if-else 嵌套,...

17110

ollama v0.11.7发布:深度集成DeepSeek-V3.1与Turbo云端推理模式解析

福大大架构师每日一题

DeepSeek-V3.1是DeepSeek系列的最新版本,拥有超过671B(6710亿)参数,属于超大规模语言模型。这类模型在理解能力、生成质量和多任务处理方...

14910

神经推理的蜕变:从概率解码到 DeepSeek V3.2 的理性智能体架构演进

张善友

大型语言模型(Large Language Models, LLMs)的发展历程,长期以来被“下一个预测词”(Next Token Prediction)的范式...

23910
领券