首页
学习
活动
专区
圈层
工具
发布

#pytorch

PyTorch是一个基于Torch的 开源机器学习库,用于自然语言处理等应用程序。

PyTorch Docker 容器化部署与生产运行实践

轩辕镜像

PyTorch是一款以Python为首要设计理念的深度学习框架,凭借简洁易用的Python接口、动态计算图机制及强大的灵活性,广泛应用于学术研究与工业开发。它在...

400

医疗大模型LoRA微调实战:我用40行代码让AI学会看病

七夜zippoe

传统微调就像给房子重新装修——得把墙都砸了重来。LoRA的思路完全不同:房子不动,只加智能家居。它在大模型的权重矩阵旁边加两个小矩阵(A和B),通过低秩分解实现...

2300

神经辐射场NeRF入门:3D视图合成的原理与PyTorch代码实现

deephub

NeRF(Neural Radiance Fields,神经辐射场)的核心思路是用一个全连接网络表示三维场景。输入是5D向量空间坐标(x, y, z)加上视角方...

7310

基于pytorch框架搭建经典的LeNet-5架构

一个风轻云淡

LeNet的提出并非出于纯粹的理论兴趣,而是为了解决一个非常具体且具有巨大商业价值的实际问题:自动识别银行支票上的手写数字。

14320

vLLM优化模式下Mask生成

aaronwjzhao

Mask是注意力计算中的一个控制开关,用于在Softmax归一化之前,有选择地屏蔽掉(遮盖住)某些位置的信息,使其不参与当前步骤的注意力计算。

13810

Scikit-Learn 1.8.0 引入 Array API,支持 PyTorch 与 CuPy 张量的原生 GPU 加速

deephub

Scikit-Learn 1.8.0 更新引入了实验性的 Array API 支持。这意味着 CuPy 数组或 PyTorch 张量现在可以直接在 Scikit...

10410

PyTorch推理扩展实战:用Ray Data轻松实现多机多卡并行

deephub

单机 PyTorch 模型跑推理没什么问题,但数据量一旦上到万级、百万级,瓶颈就暴露出来了:内存不够、GPU 利用率低、I/O 拖后腿,更别说还要考虑容错和多机...

12310

开源 vs 商业:主流AI生态概览——从PyTorch到OpenAI的技术格局之争

@VON

在人工智能迅猛发展的今天,开发者和企业面临一个关键选择:是拥抱开放协作的开源生态,还是依赖高效便捷的商业平台?TensorFlow、PyTorch、Huggin...

22310

PyTorch v2.9.1 发布:重要 Bug 修复与性能优化详解

福大大架构师每日一题

近日,PyTorch 正式发布了 v2.9.1 版本,这是一次专注于修复回归问题和隐性正确性错误的 Bug Fix Release。本次更新主要针对 PyTor...

19710

DeepSeek倒逼vLLM升级!芯片内卷、MoE横扫千模,vLLM核心维护者独家回应:如何凭PyTorch坐稳推理“铁王座”

深度学习与Python

vLLM 的故事始于加州大学伯克利分校 Sky Computing Lab 里一群充满热情的学生与研究员。2023 年,他们开源了核心的 PagedAttent...

17010

Anaconda、Pytorch安装教程(全网最详细版,包含所有遇到的问题解决方案)

程序员三明治

美团 | 大模型后台开发 (已认证)

PyTorch是一个开源的深度学习框架,提供了各种张量操作并通过自动求导可以自动进行梯度计算,方便构建各种动态神经网络。支持使用GPU/TPU进行加速计算。(T...

3.5K10

PyTorch中GRU与LSTM的构建与比较

用户11764306

循环神经网络(RNN)在处理序列数据方面具有天然优势,但在实际应用中,标准RNN面临着梯度消失或爆炸的挑战,这限制了其捕捉长距离依赖关系的能力citation:...

26510

PyTorch v2.8.0 正式发布:量化推理、编译优化与分布式检查点等多项重大更新

福大大架构师每日一题

近日,PyTorch 团队正式发布了 v2.8.0 版本,带来了多项重要功能更新、性能优化和错误修复。本文将详细介绍该版本的主要变化,帮助开发者更好地理解新特性...

21810

如何部署自己的模型:Pytorch模型部署实践

用户11754185

Pytorch是一个广泛使用的深度学习框架,但是在将模型部署到生产环境中时,需要注意一些细节和技巧。本文将讨论一些Pytorch模型部署的最佳实践。

23310

如何部署 PyTorch 模型

用户11754185

有 Web 开发经验的小伙伴可能首先想到的是用 HTTP 框架(例如 Flask)进行简单的封装,做一个简单的 HTTP 接口来对外提供服务。但既然是生产,那还...

12710

Python 项目示例,展示如何开发一个简单的命令行待办事项管理器

用户9919107

下面是一个完整的 Python 项目示例,展示如何开发一个简单的命令行待办事项管理器。这个项目包含了良好的代码结构、异常处理和基本功能。

12910

Flink与AI的完美融合:深入解析Flink ML库及TensorFlow/PyTorch联动

用户6320865

随着数字化转型的深入,数据已成为企业最核心的资产之一。而如何高效、实时地处理海量数据,并从中挖掘出智能洞察,成为技术领域的关键挑战。在这一背景下,Apache ...

30610

深度学习框架对比研究:TensorFlow与PyTorch的综合分析

一点人工一点智能

导读:深度学习作为人工智能的核心技术之一,已经在多个领域取得了突破性进展。TensorFlow和PyTorch作为当前最主流的深度学习框架,各自具有独特的设计理...

75910

PyTorch 分布式训练底层原理与 DDP 实战指南

deephub

深度学习模型参数量和训练数据集的爆炸式增长,以 Llama 3.1 为例:4050 亿参数、15.6 万亿 token 的训练量,如果仅靠单 GPU可能需要数百...

40610

从 0 搭建 LLM 不再难!这个 PyTorch 项目帮你吃透大模型底层逻辑

fangpin

如果你曾想深入理解大语言模型(LLM)的 “五脏六腑”,却被框架封装的黑盒接口、复杂的源码结构劝退;如果你希望亲手实现 Transformer 的每一个组件,而...

23800
领券