首页
学习
活动
专区
圈层
工具
发布

#性能

打破认知:GPU Warp的“分工革命”——从SIMT到最优调度

GPUS Lady

提到GPU的并行计算,很多人都知道一个基础概念:GPU会将线程分成32个一组的“线程束”(warp)来执行。但今天我们要聊的,远不是这个入门知识点——而是一个更...

600

vLLM 最新版来了,修复 DeepSeek-V4 跑不稳、跑不快的问题

Ai学习的老章

劳动节假期还没过完,vLLM 团队就给我加了道菜——0.20.1 紧急 patch 出炉了,主线就一句话:把 DSV4 跑不稳、跑不快的问题集中处理一遍

900

DeepSeek-V4-Flash 本地部署,2 x H20(96GB版本),性能简测

Ai学习的老章

docker pull vllm/vllm-openai:deepseekv4-cu129

100

Go 反射性能优化:如何在灵活与高效之间找到平衡?

技术圈

在 Go 语言的开发世界里,反射(Reflection)一直是一个让人又爱又恨的特性。爱它,是因为它赋予了程序在运行时检查和修改自身结构的能力,是实现通用库(如...

300

AI Agent 时代,万列级宽 JSON 的性能与成本如何平衡?|Apache Doris 4.1

SelectDB技术团队

导读:随着数据不断演进,尤其在 AI Agent、LLMOps 与可观测性系统快速发展的背景下,宽 JSON 的字段膨胀带来巨大的性能挑战。Apache Dor...

300

鲨鱼或有助于改进气候预测

气象学家

这是首个将动物携带的传感器数据实验性地整合到季节性气候模型中,并量化其对预报性能影响的研究,为未来的业务化应用提供了可能。

3010

Nat. Comput. Sci. | 利用大语言模型挖掘全球海洋微生物组的隐藏生物合成潜力

DrugOne

微生物来源的次级代谢产物具有重要的药用价值,但目前大多数已知分子仅来源于可培养微生物,而这仅占全球微生物多样性的一小部分。宏基因组学的发展揭示了大量潜在的生物合...

2500

Matter | 化学推理赋能大语言模型: 开启“策略感知”的合成规划与反应机理解析新时代

DrugOne

在基准测试中,最先进模型能够系统分析每一步反应,并结合整体路径判断其是否符合策略要求。性能随模型规模显著提升,小模型几乎接近随机,而大模型表现出明显的推理能力。

2500

Adv. Sci. | 审视基于靶标的从头分子生成:理性设计,抑或射箭画靶?

DrugOne

本文介绍一篇来自浙江大学康玉、侯廷军教授和王極可研究员团队联合发表在Advance Science的研究论文,浙江大学药学院博士生秦睿,计算机学院本科生陈子杰为...

2410

腾讯云 GooseFS+Lance:面向 AI 时代定义向量存储加速

云存储

腾讯云 | 云存储 (已认证)

?在4月11日的 Lance Meetup 2026 · 北京站上,腾讯云高级工程师于飏分享了“GooseFS+Lance:面向 AI 时代定义向量存储加速”主...

4010

从0和1到复杂计算:计算机是如何「思考」和处理信息的?

chouheiwa

时钟信号是这个流程的节拍器。1 GHz 时钟意味着每个周期 1ns。但性能并非只看频率,CPU 性能公式是指令数 × CPI(每指令周期数)÷ 时钟频率。Int...

6210

面试官最爱问的LAMP 30题,熬夜整理,建议收藏

一根头发丝的宽度

LAMP 是指 Linux、Apache、MySQL 和 PHP。它是一套用于构建动态网站和 Web 应用的开源技术栈。本文将介绍 30 道常见 LAMP 面试...

6310

台积电最新SoIC 3D封装蓝图曝光

芯智讯

随着人工智能(AI)与高性能计算(HPC) 对芯片性能的要求日益严苛,先进封装技术已成为驱动芯片性能提升的关键。台积电近期在2026年北美技术论坛上公布了最新的...

4510

破解GPU功耗墙:“空间光计算”将成AI算力新出路?

芯智讯

当电子芯片逼近摩尔定律的物理极限,人工智能(AI)算力需求的指数级增长,正使传统计算架构面临“功耗墙”与“内存墙”的双重瓶颈。光子——这个曾被限制在通信领域的信...

6410

面向AI半导体先进封装需求,京瓷宣布推出多层陶瓷核心基板

芯智讯

京瓷公司表示,近年来生成式人工智能(AI)与大型语言模型(LLM)的爆发性成长,带动了全球AI数据中心的扩建潮,进而推升市场对高性能xPU 与ASIC 半导体的...

8910

DeepSeek携手华为昇腾,推理成本暴降99%!

芯智讯

过去多年来,在人工智能(AI)算力市场上,英伟达的GPU凭借其强大的性能和CUDA生态优势,几乎所有大模型都奔跑在英伟达的芯片上。这也使得英伟达的GPU占据了超...

16610

WSL2 将会取代原生 Linux?

民工哥

游戏性能:玩家实测游戏性能比 Windows 提升了18%!原来那些在Linux 掌机上玩起来很卡且掉帧的游戏,现在完全没有问题了,运行相当流畅。

11110

腾讯云服务器(CVM)产品概要

IT资讯研究所

腾讯科技 | 研究员 (已认证)

核心技术属性与商业差异化卖点:集安全可靠、性能卓越、灵活弹性、简便使用、高性价比于一体,依托腾讯自研技术体系(含TencentOS、玄灵自研智能网卡架构、智能整...

13010

荣耀基于TencentOS构建高性能AI底座,大模型吞吐提升2倍

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

荣耀为突破大模型部署成本与算力调度瓶颈,依托腾讯云TencentOS Server AI底座部署了TACO-LLM加速模块。通过引入投机采样机制与底层框架优化,...

10010

结构化策略初始化加速大规模离散动作空间离线强化学习

CreateAMind

IMPROVING AND ACCELERATING OFFLINE RL INLARGE DISCRETE ACTION SPACES WITH STRUCT...

10010
领券