scaling - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签scaling

#scaling

腾讯云联合复旦大学提出 CYANSQL：基于聚类的Test-Time Scaling方法，提升复杂 NL2SQL 生成能力

腾讯QQ大数据 8天前2026-05-18 10:14:46

在自然语言到 SQL 转换（NL2SQL）方向，腾讯云联合复旦大学提出CYANSQL：Cluster-aware Yielded Augmentation fo...

12110

Scaling Law 已死，Data Law 当立！Datology AI 如何用「数据策展」让大模型训练提速 7.7 倍

不二小段 2026-04-092026-04-09 18:16:13

过去两年，整个 AI 行业因为大模型而狂踩油门：参数量从百亿推到万亿，算力预算从几千万美金飙升到几十亿美金。

12800

Anthropic 联合创始人最新演讲：物理学家眼中的 AGI 和 Scaling Law

不二小段 2026-04-092026-04-09 17:43:24

他特别提到了研究员 Andy Jones 在大约四年前的一项「个人项目」。当时，这位研究员仅凭自己的一块 GPU，无法复现 AlphaGo 的研究，于是选择了一...

21910

大模型原理三部曲-流形篇：从“点云”到“几何有效理论”，以及流形版Scaling Law

赛博解生 2026-04-092026-04-09 13:16:12

在代数篇里，我用“看不清 / 看不全”去引出系统与尺度的语言；到了流形篇，我更想把这句话彻底几何化——学习这件事，本质上是在一个未知的低维几何体上，把“局部可用...

23910

NVIDIA Digital Biology Labs | 当蛋白质设计遇上推理时计算，生物学的 Scaling Law 时刻来了

MindDance 2026-03-312026-03-31 17:41:30

2026年3月的GTC大会上，NVIDIA Digital Biology Labs 一口气放出了四篇重磅工作，从蛋白质结构生成到全原子结合物设计，从蛋白质复合...

43410

NVIDIA Digital Biology Labs | 当蛋白质设计遇上推理时计算，生物学的 Scaling Law 时刻来了

DrugOne 2026-03-252026-03-25 17:00:10

2026年3月的GTC大会上，NVIDIA Digital Biology Labs 一口气放出了四篇重磅工作，从蛋白质结构生成到全原子结合物设计，从蛋白质复合...

31110

【Scaling Law 的新边界】

贺公子之数据科学与艺术 2026-01-202026-01-20 14:15:35

Scaling Law 描述了模型性能与计算资源、数据规模和模型参数之间的幂律关系。近年来，研究者们不断探索其边界，包括在小规模数据、跨模态任务、稀疏化模型等场...

17410

继Ilya之后，KAN一作再发檄文：Scaling终将撞铁壁！

新智元 2026-01-132026-01-13 16:47:17

继Ilya之后，柯尔莫哥洛夫-阿诺德网络KAN一作向Scaling Law发出最新檄文！

15810

字节Seed团队: Scaling线性注意力首个超越AlphaFold3

DrugOne 2026-01-132026-01-13 15:39:40

近年来，生物分子结构预测已经成为构建生命科学基础模型的重要基石。从 AlphaFold2 到 AlphaFold3，深度学习模型不断刷新结构预测的精度上限。然而...

28710

Ilya警告、LeCun冷嘲、奥特曼沉默：Scaling Law时代还能走多远？

新智元 2025-12-312025-12-31 19:11:56

从ChatGPT到惊艳世界的DeepSeek，再到2025年底的Gemini 3、GPT-5.2等，所有这些顶级模型背后都是这个幽灵。

39210

LSTM之父劝不动Altman，但Transformer“亲爹”已跑路：一个赛道里卷没意思，无脑scaling也不行

深度学习与Python 2025-12-242025-12-24 13:27:19

我不认为游戏已经结束了，我不相信这就是最终架构，只要无脑 scaling 就行。我相信迟早会有新的突破出现，到时候回头看，大家又会发现：“哎呀，我们要早点醒悟就...

26610

Scaling Law 仍然成立，企业搜广推怎么做才能少踩“坑”？

深度学习与Python 2025-12-242025-12-24 12:55:02

当大模型从通用技术探索深入产业场景，搜索、广告与推荐系统作为连接用户需求与业务价值的核心链路，正迎来全链路智能重构。那么，生成式推荐真正落地后的关键挑战是什么？...

49710

Scaling时代终结了，Ilya Sutskever刚刚宣布

机器之心 2025-11-262025-11-26 17:26:14

当这句话出自 Ilya Sutskever 之口时，整个 AI 社区都无法忽视。作为 Safe Superintelligence Inc. 的创始人，他在最新...

45910

解决特斯拉「监督稀疏」难题，DriveVLA-W0用世界模型放大自动驾驶Data Scaling Law

机器之心 2025-11-262025-11-26 15:45:22

在自动驾驶领域，VLA 大模型正从学术前沿走向产业落地的 “深水区”。近日，特斯拉（Tesla）在 ICCV 的分享中，就将其面临的核心挑战之一公之于众 ——“...

51410

宇宙尺度压缩：Scaling law的边界，柏拉图表征收敛于物质和信息交汇，解决P与NP问题，Simulation假说

深度学习与Python 2025-11-262025-11-26 15:06:38

在语言和专用科学多任务数据集上的预训练能够平滑收敛，这表明大语言模型（LLMs）的 scaling law 可以超越语言范畴，延伸至物理世界。那么 Scalin...

26510

133_云端扩展：Kubernetes scaling - 设置自动缩放的阈值与LLM部署最佳实践

安全风信子 2025-11-162025-11-16 13:10:17

在大语言模型（LLM）部署的时代，如何高效地管理计算资源、应对动态负载并优化成本，成为了每个AI工程师必须面对的挑战。随着LLM应用的普及，用户请求模式变得日益...

51910

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

机器之心 2025-09-022025-09-02 17:28:53

这几天，一篇关于向量嵌入（Vector Embeddings）局限性的论文在 AlphaXiv 上爆火，热度飙升到了近 9000。

37910

深入解析强化学习中的混合精度训练：FP16累加误差与Loss Scaling补偿机制

用户6320865 2025-08-272025-08-27 15:15:08

在深度学习领域，混合精度训练已成为加速模型训练的核心技术之一。这项技术通过巧妙结合FP16（半精度浮点数）和FP32（单精度浮点数）两种数据格式，在保证模型精度...

1.3K10

简单几步解决神器Burp Suite 光标错位问题

逍遥子大表哥 2025-07-312025-07-31 14:36:27

其问题归根在于缩放位置上面，接下来我们一起解决此问题。首先点击Setting->User interface->Display->Scaling缩放设置为2(...

1.4K10

奖励模型终于迎来预训练新时代！上海AI Lab、复旦POLAR，开启Scaling新范式

机器之心 2025-07-122025-07-12 15:16:38

在大语言模型后训练阶段，强化学习已成为提升模型能力、对齐人类偏好，并有望迈向 AGI 的核心方法。然而，奖励模型的设计与训练始终是制约后训练效果的关键瓶颈。

37710

#scaling

腾讯云联合复旦大学提出 CYANSQL：基于聚类的Test-Time Scaling方法，提升复杂 NL2SQL 生成能力

Scaling Law 已死，Data Law 当立！Datology AI 如何用「数据策展」让大模型训练提速 7.7 倍

Anthropic 联合创始人最新演讲：物理学家眼中的 AGI 和 Scaling Law

大模型原理三部曲-流形篇：从“点云”到“几何有效理论”，以及流形版Scaling Law

NVIDIA Digital Biology Labs | 当蛋白质设计遇上推理时计算，生物学的 Scaling Law 时刻来了

NVIDIA Digital Biology Labs | 当蛋白质设计遇上推理时计算，生物学的 Scaling Law 时刻来了

【Scaling Law 的新边界】

继Ilya之后，KAN一作再发檄文：Scaling终将撞铁壁！

字节Seed团队: Scaling线性注意力首个超越AlphaFold3

Ilya警告、LeCun冷嘲、奥特曼沉默：Scaling Law时代还能走多远？

LSTM之父劝不动Altman，但Transformer“亲爹”已跑路：一个赛道里卷没意思，无脑scaling也不行

Scaling Law 仍然成立，企业搜广推怎么做才能少踩“坑”？

Scaling时代终结了，Ilya Sutskever刚刚宣布

解决特斯拉「监督稀疏」难题，DriveVLA-W0用世界模型放大自动驾驶Data Scaling Law

宇宙尺度压缩：Scaling law的边界，柏拉图表征收敛于物质和信息交汇，解决P与NP问题，Simulation假说

133_云端扩展：Kubernetes scaling - 设置自动缩放的阈值与LLM部署最佳实践

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

深入解析强化学习中的混合精度训练：FP16累加误差与Loss Scaling补偿机制

简单几步解决神器Burp Suite 光标错位问题

奖励模型终于迎来预训练新时代！上海AI Lab、复旦POLAR，开启Scaling新范式

热门专栏

机器学习、深度学习

10km的专栏

菩提树下的杨过

数据派THU

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐