首页
学习
活动
专区
圈层
工具
发布

#pytorch

PyTorch是一个基于Torch的 开源机器学习库,用于自然语言处理等应用程序。

37:uv快速安装GPU PyTorch:速度、稳定性与最佳实践

安全风信子

作者: HOS(安全风信子) 日期: 2024-10-18 主要来源平台: GitHub 摘要: 本文深入分析uv包管理器在GPU PyTorch安装中的...

500

用 PyTorch 实现 LLM-JEPA:不预测 token,预测嵌入

deephub

这篇文章从头实现 LLM-JEPA: Large Language Models Meet Joint Embedding Predictive Archite...

5000

30:【uv + torch】2026最快安装GPU PyTorch & 避开conda坑

安全风信子

作者: HOS(安全风信子) 日期: 2026-01-01 主要来源平台: GitHub 摘要: 本文详细分析2026年使用uv和torch快速安装GPU...

38610

27:【PyTorch】nvidia / triton依赖没装(2.6+版本常见)

安全风信子

作者: HOS(安全风信子) 日期: 2026-01-01 主要来源平台: GitHub 摘要: 本文详细分析2026年PyTorch 2.6+版本中常见...

16510

Quanto模型量化:PyTorch内存优化技术详解

用户11764306

基于Transformer的扩散模型正日益完善,并已被证明能够彻底改变文本到图像的生成模式。Transformer的能力提升了任何模型的可扩展性和性能,同时也增...

8210

DeepSpeed v0.18.5 发布:PyTorch 2.9 适配、ZeRO-3 优化与多项关键修复全面升级!

福大大架构师每日一题

2026 年 2 月 1 日,DeepSpeed 官方团队正式发布 v0.18.5 版本。本次更新带来了大量功能改进与稳定性增强,进一步完善了在多设备(尤其是 ...

29910

VLM视觉模型处理过程

aaronwjzhao

以Qwen2.5 VL 3B为例,patch_size=14,输入图像按照14 * 14划分成多个patch块。对于尺寸为(H * W)的图像,视觉token数...

17011

使用Torch编译缓存提升AI推理速度

用户11764306

很多模型,特别是FLUX系列的模型,会应用各种torch.compile技术/技巧来提高推理速度。

5910

陈天奇、贾扬清点赞:Vibe Coding版PyTorch,连论文都是AI写的

机器之心

前两天,Node.js 之父 Ryan Dahl 在 X 上断言:「人类编写代码的时代已经结束了。」该帖引发广泛讨论,浏览量更是已经超过了 700 万。而现在,...

14010

PyTorch Docker 容器化部署与生产运行实践

轩辕镜像

PyTorch是一款以Python为首要设计理念的深度学习框架,凭借简洁易用的Python接口、动态计算图机制及强大的灵活性,广泛应用于学术研究与工业开发。它在...

19010

医疗大模型LoRA微调实战:我用40行代码让AI学会看病

七夜zippoe

传统微调就像给房子重新装修——得把墙都砸了重来。LoRA的思路完全不同:房子不动,只加智能家居。它在大模型的权重矩阵旁边加两个小矩阵(A和B),通过低秩分解实现...

25910

神经辐射场NeRF入门:3D视图合成的原理与PyTorch代码实现

deephub

NeRF(Neural Radiance Fields,神经辐射场)的核心思路是用一个全连接网络表示三维场景。输入是5D向量空间坐标(x, y, z)加上视角方...

20710

基于pytorch框架搭建经典的LeNet-5架构

一个风轻云淡

LeNet的提出并非出于纯粹的理论兴趣,而是为了解决一个非常具体且具有巨大商业价值的实际问题:自动识别银行支票上的手写数字。

21020

vLLM优化模式下Mask生成

aaronwjzhao

Mask是注意力计算中的一个控制开关,用于在Softmax归一化之前,有选择地屏蔽掉(遮盖住)某些位置的信息,使其不参与当前步骤的注意力计算。

18310

Scikit-Learn 1.8.0 引入 Array API,支持 PyTorch 与 CuPy 张量的原生 GPU 加速

deephub

Scikit-Learn 1.8.0 更新引入了实验性的 Array API 支持。这意味着 CuPy 数组或 PyTorch 张量现在可以直接在 Scikit...

16710

PyTorch推理扩展实战:用Ray Data轻松实现多机多卡并行

deephub

单机 PyTorch 模型跑推理没什么问题,但数据量一旦上到万级、百万级,瓶颈就暴露出来了:内存不够、GPU 利用率低、I/O 拖后腿,更别说还要考虑容错和多机...

18410

开源 vs 商业:主流AI生态概览——从PyTorch到OpenAI的技术格局之争

@VON

在人工智能迅猛发展的今天,开发者和企业面临一个关键选择:是拥抱开放协作的开源生态,还是依赖高效便捷的商业平台?TensorFlow、PyTorch、Huggin...

35510

PyTorch v2.9.1 发布:重要 Bug 修复与性能优化详解

福大大架构师每日一题

近日,PyTorch 正式发布了 v2.9.1 版本,这是一次专注于修复回归问题和隐性正确性错误的 Bug Fix Release。本次更新主要针对 PyTor...

35910

DeepSeek倒逼vLLM升级!芯片内卷、MoE横扫千模,vLLM核心维护者独家回应:如何凭PyTorch坐稳推理“铁王座”

深度学习与Python

vLLM 的故事始于加州大学伯克利分校 Sky Computing Lab 里一群充满热情的学生与研究员。2023 年,他们开源了核心的 PagedAttent...

23710

Anaconda、Pytorch安装教程(全网最详细版,包含所有遇到的问题解决方案)

程序员三明治

美团 | 大模型后台开发 (已认证)

PyTorch是一个开源的深度学习框架,提供了各种张量操作并通过自动求导可以自动进行梯度计算,方便构建各种动态神经网络。支持使用GPU/TPU进行加速计算。(T...

4.4K10
领券