首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#gpu

RDMA - GDR GPU Direct RDMA快速入门2

晓兵

https://hpcadvisorycouncil.atlassian.net/wiki/spaces/HPCWORKS/pages/2791440385/G...

2200

RDMA - GDR GPU Direct RDMA快速入门1

晓兵

NVIDIA GPUDirect 是一系列技术, 用于增强 GPU间(P2P)或GPU与第三方设备(RDMA)间的数据移动和访问, 无论您是在探索海量数据、研究...

3510

实践教程|GPU 利用率低常见原因分析及优化

小白学视觉

本文的 GPU 利用率主要指 GPU 在时间片上的利用率,即通过 nvidia-smi 显示的 GPU-util 这个指标。统计方式为:在采样周期内,GPU 上...

10310

IC仿真软件汇总

tankaro

Palladium是美国Cadence公司生产的一种前端仿真器,基于FPGA芯片的快速验证平台。它通过快速原型验证(FPV)技术,将RTL级代码编译成硬件行为模...

8810

深度学习中GPU和显存分析

小白学视觉

这里推荐一个好用的小工具:gpustat,直接pip install gpustat即可安装,gpustat基于nvidia-smi,可以提供更美观简洁的展示,...

9110

速看!DeepSeek开源周第一弹:FlashMLA加速GPU计算!

AgenticAI

🚀DeepSeek开源周第一天,发布加速推理的基础设置FlashMLA,DeepSeek为 Hopper GPU 优化高效 MLA 解码内核,支持变长序列,并已...

4400

一文吃透:ABAQUS 怎样开展电脑及周边仿真分析

思茂信息

Abaqus在电子行业得到了广泛的应用,从微观的芯片级组装和失效分析,到宏观的个人电子用品如笔记本电脑、智能手机的抗震、跌落、模态和热流动分析。这种软件被各大电...

5300

Open-Sora 2.0全面开源,20万复刻百万级大片!11B媲美闭源巨头,224张GPU创奇迹

新智元

Open-Sora 2.0——全新开源的SOTA(State-of-the-Art)视频生成模型正式发布,仅用20万美元(224张GPU)成功训练出商业级11B...

8200

Hugging Face 发布了高效的跨 GPU 大语言模型训练指南

深度学习与Python

Hugging Face 发布了 《超大规模实战指南:在 GPU 集群上训练大语言模型(LLMs)》,这是一份开源指南,详细探讨了跨 GPU 集群进行大语言模型...

15710

「古董」GPU也能跑DeepSeek同款GRPO!显存只需1/10,上下文爆涨10倍

新智元

开源微调神器Unsloth带着黑科技又来了:上次更新把GRPO需要的内存见到了7GB,这次只需要5GB的VRAM,就能训练自己的推理模型Qwen2.5(1.5B...

8100

马斯克「大闹白宫」!美政府12000人将被GSAi优化,xAI 100万块GPU巨兽年底建成

新智元

据两位知情人士透露,马斯克领导的「政府效率部」(DOGE)正加速开发定制的GenAI应用「GSAi」,供美国总务管理局(GSA)使用。

8710

提供GPU算力!支持8卡H100部署满血版DeepSeek-R1

Datawhale

DeepSeek-R1 的热度还是居高不下,各个云计算厂商都在争着发布「免费的 DeepSeek-R1」,大家不断地在各个平台间转换。但就在这纷乱中,GpuGe...

22310

降本增效:英伟达H20 141G芯片横扫中国市场!

算力之光

英伟达H20 141G是一款专为AI计算和超算应用设计的高性能芯片,其主要使用场景和优势如下:

1.4K20

技术总结|十分钟了解GPU

用户1904552

最近在看《黄仁勋:英伟达之芯》,这本书讲述了英伟达是如何一步一步优化GPU,感觉创业不易,不过本文为了让大家更好了解GPU,所以简单汇总了一些知识点。

7810

DeepSeek-进阶版部署(Linux+GPU)

运维小路

前面几个小节讲解的Win和Linux部署DeepSeek的比较简单的方法,而且采用的模型也是最小的,作为测试体验使用是没问题的。如果要在生产环境使用还是需要用到...

42210

DeepSeek开源FlashMLA,从GPU架构进行优化开始......

AIGC新知

终于,中国的OpenAI----DeepSeek ,在全球爆火之后,开源了他们自己的第一天项目。

10910

RTX4060+ubuntu22.04.3+cuda12.4.1+cudnn9.1.1安装验证

tankaro

这款笔记本电脑因为触摸板驱动限制,需要选择ubuntu22.04.3以上版本;而RTX4060+cuda限制需要选择ubuntu22.04.3版本,更新版本的c...

15110
领券