pytorch - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签pytorch

#pytorch

PyTorch是一个基于Torch的开源机器学习库，用于自然语言处理等应用程序。

从 0 搭建 LLM 不再难！这个 PyTorch 项目帮你吃透大模型底层逻辑

fangpin 4天前2025-11-17 22:30:48

如果你曾想深入理解大语言模型（LLM）的 “五脏六腑”，却被框架封装的黑盒接口、复杂的源码结构劝退；如果你希望亲手实现 Transformer 的每一个组件，而...

9800

144_推理时延优化：Profiling与瓶颈分析 - 使用PyTorch Profiler诊断推理延迟，优化矩阵运算的独特瓶颈

安全风信子 5天前2025-11-16 14:46:37

在2025年的大模型时代，推理时延优化已经成为部署LLM服务的关键挑战之一。随着模型规模的不断扩大（从数亿参数到数千亿甚至万亿参数），即使在最先进的硬件上，推理...

12110

66_框架选择：PyTorch vs TensorFlow

安全风信子 6天前2025-11-16 13:39:43

在2025年的大语言模型（LLM）开发领域，框架选择已成为项目成功的关键决定因素。随着模型规模的不断扩大和应用场景的日益复杂，选择一个既适合研究探索又能支持高效...

20410

130_知识蒸馏技术：温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现

安全风信子 6天前2025-11-16 13:14:34

随着大型语言模型（LLM）的规模不断增长，部署这些模型面临着巨大的计算和资源挑战。以DeepSeek-R1为例，其671B参数的规模即使经过INT4量化后，仍需...

10610

从零实现3D Gaussian Splatting:完整渲染流程的PyTorch代码详解

deephub 7天前2025-11-15 11:54:11

3D Gaussian Splatting（3DGS）现在几乎成了3D视觉领域的标配技术。NVIDIA把它整合进COSMOS，Meta的新款AR眼镜可以直接在设...

26310

Transformer自回归关键技术：掩码注意力原理与PyTorch完整实现

deephub 7天前2025-11-15 11:31:40

掩码注意力（Causal Attention）是生成式模型的核心技术，它传统自注意力机制有根本的不同，掩码注意力限制模型只能关注当前位置之前的tokens，确保...

15610

Neural ODE原理与PyTorch实现：深度学习模型的自适应深度调节

deephub 7天前2025-11-15 11:18:06

对于神经网络来说，我们已经习惯了层状网络的思维：数据进来，经过第一层，然后第二层，第三层，最后输出结果。这个过程很像流水线，每一步都是离散的。

21910

近端策略优化算法PPO的核心概念和PyTorch实现详解

deephub 7天前2025-11-15 11:05:17

近端策略优化(Proximal Policy Optimization, PPO)作为强化学习领域的重要算法，在众多实际应用中展现出卓越的性能。本文将详细介绍P...

32720

即插即用涨点系列 (六)：AAAI 2025，PConv & SD Loss 详解！融合风车卷积与动态损失的涨点新范式。

AITricks 8天前2025-11-14 10:37:01

论文原文 (Paper)：https://arxiv.org/pdf/2412.16986 官方代码 (Code)：https://github.com/JN-...

15310

23_Transformer架构详解：从原理到PyTorch实现

安全风信子 8天前2025-11-13 15:42:10

Transformer架构自2017年Google发表的论文《Attention Is All You Need》中提出以来，彻底改变了深度学习特别是自然语言处...

99310

如何解决Python pip的版本匹配错误：ERROR: Could not find a version that satisfies the require

猫头虎 15天前2025-11-06 17:40:06

如何解决Python pip的版本匹配错误：ERROR: Could not find a version that satisfies the require...

2.5K10

PyTorch分布式训练与混合精度技术详解

用户11764306 16天前2025-11-05 18:23:41

单GPU训练结果：总耗时69.03秒，训练1个epoch耗时13.08秒，测试准确率27%。

13110

PyTorch编译缓存加速模型推理技术解析

用户11764306 23天前2025-10-29 19:34:27

某机构现已缓存torch.compile编译产物，以缩短使用PyTorch框架模型的启动时间。

9710

【DGL系列】编译dgl源码时指定多个sm架构

小锋学长生活大爆炸 29天前2025-10-23 22:02:34

DGL 的 cmake/modules/CUDA.cmake 里写死了一个选择逻辑：

8700

【教程】DataLoader中各个参数的解释

小锋学长生活大爆炸 29天前2025-10-23 21:56:03

数据来源对象，告诉 DataLoader 去哪里拿样本。pytorch提供的torch.utils.data.Dataset类是一个抽象基类，供用户继承，编写自...

15410

如何解决 pip install 安装报错 ModuleNotFoundError: No module named 'pyarrow' 问题

猫头虎 2025-09-182025-09-18 15:36:03

在Python开发过程中，pip install是安装第三方模块的常用方式。然而，在一些特定的开发环境中，执行安装命令时可能会遇到ModuleNotFoundE...

51721

#pytorch

从 0 搭建 LLM 不再难！这个 PyTorch 项目帮你吃透大模型底层逻辑

144_推理时延优化：Profiling与瓶颈分析 - 使用PyTorch Profiler诊断推理延迟，优化矩阵运算的独特瓶颈

66_框架选择：PyTorch vs TensorFlow

130_知识蒸馏技术：温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现

从零实现3D Gaussian Splatting:完整渲染流程的PyTorch代码详解

Transformer自回归关键技术：掩码注意力原理与PyTorch完整实现

Neural ODE原理与PyTorch实现：深度学习模型的自适应深度调节

近端策略优化算法PPO的核心概念和PyTorch实现详解

即插即用涨点系列 (六)：AAAI 2025，PConv & SD Loss 详解！融合风车卷积与动态损失的涨点新范式。

23_Transformer架构详解：从原理到PyTorch实现

如何解决Python pip的版本匹配错误：ERROR: Could not find a version that satisfies the require

PyTorch分布式训练与混合精度技术详解

PyTorch编译缓存加速模型推理技术解析

【DGL系列】编译dgl源码时指定多个sm架构

【教程】DataLoader中各个参数的解释

如何解决 pip install 安装报错 ModuleNotFoundError: No module named 'pyarrow' 问题

热门专栏

腾讯云服务器团队的专栏

进击的Coder

腾讯技术工程官方号的专栏

AI科技大本营的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐