LLM - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签LLM

#LLM

什么是大语言模型（LLM）

自贸港一哥 13小时前2026-03-03 17:44:17

大语言模型（Large Language Model，简称LLM）是一种旨在理解和生成人类语言的人工智能模型。它们通过在海量文本数据上进行训练，学习语言中的复杂...

1600

Open Code的免费API集成的使用教学

Tyenn_Siiwee 18小时前2026-03-03 12:20:21

1. 配置文件位置：可以根据项目的所在位置将 opencode.json 文件放置在项目根目录中，或者将其设置为全局的~/.config/opencode/op...

3600

langchaingo：用Go语言构建LLM应用的利器

编码如写诗 1天前2026-03-02 20:48:11

在AI大模型时代，LangChain已成为Python开发者构建LLM应用的首选框架。但对于Go开发者来说，有没有类似的工具呢？答案是肯定的——langchai...

7910

收藏! 2026最强开源AI编程工具清单：从代码补全到自主智能体

AI-Frontiers 1天前2026-03-02 13:41:25

原文: https://mp.weixin.qq.com/s/5viL2gJE3IfmVS1WxTlZAQ关注公zh: AI-Frontiers

37820

一文读懂 n-grams：大模型出现前，语言模型就靠它

ETL 小当家 1天前2026-03-02 09:47:45

在深度学习时代之前，让机器理解人类语言是一个巨大的挑战。早期的AI系统面对文本时，就像一个完全不懂中文的外国人看一本中文小说——每个字都认识，但组合起来就懵了。

6110

企业数字化新考题：告别广告思维，如何构建基于GEO的高可信品牌知识库？

万悉Trendee 4天前2026-02-27 21:10:31

2.1 什么是 GEO？ GEO 是指通过优化公开网络数据的结构、逻辑和语义，使大语言模型（LLM）能够更准确、更完整地理解和引用品牌信息的技术手段。

7110

从提示工程转向上下文工程，6种让LLM在生产环境中稳定输出的技术

deephub 4天前2026-02-27 12:46:17

RAG系统返回了完美的文本块，提示词写得很漂亮，但LLM还是在产生幻觉；文档加得越多，回复质量反而越差。这些问题问题不出在提示词上，而是出在上下文上。

9410

超越上下文窗口：CodeAct与RLM，两种代码驱动的LLM扩展方案

deephub 4天前2026-02-27 12:42:11

到这里可以看到 CodeAct 是怎么让模型动手干活的——写代码、执行、拿结果，LLM 有了"编程的手"，不再只是被动回答问题。

9210

LLM创造力可以被度量吗？一个基于提示词变更的探索性实验

deephub 4天前2026-02-27 12:40:08

从实践来看核心问题很少出在模型本身。更多时候是在于如何设计、评估和迭代应用模型的提示词。LLM应用的输入提示词必须适配具体任务，才能让模型在期望的输出范围内工作...

8710

LLM推理时计算技术详解：四种提升大模型推理能力的方法

deephub 4天前2026-02-27 12:28:09

2025年LLM领域有个有意思的趋势：与其继续卷模型训练，不如在推理阶段多花点功夫。这就是所谓的推理时计算（Test-Time / Inference-Time...

14610

用 PyTorch 实现 LLM-JEPA：不预测 token，预测嵌入

deephub 4天前2026-02-27 12:25:25

这篇文章从头实现 LLM-JEPA: Large Language Models Meet Joint Embedding Predictive Archite...

5600

[论文速递] LLM/Attention的引力场是存在的

windyrobin 4天前2026-02-27 11:45:20

人们一直惊叹于LLM/Transformer 的强大能力，但对它的核心能力-Attention 的内部原理/本质了解甚少或选择性忽略；

10310

Anthropic突然开火：中国大模型被指大规模蒸馏攻击

IvanCodes 6天前2026-02-25 18:02:25

近日，美国顶尖AI独角兽 Anthropic 突然在社交媒体 X 上发难，公开指控三家中国头部AI企业——DeepSeek、Moonshot AI 和 Mini...

41220

GLM 5 vs Qwen3.5 vs MiniMax M2.5 vs kimi k2.5

aaronwjzhao 4天前2026-02-27 11:29:33

1.1K00

第一章·你必须先看穿它：AI写小说的底层真相·AI写作底层原理

卓伊凡 7天前2026-02-25 00:00:37

很多人一上来就问我：“AI能不能直接写一本小说？”我通常反问一句：“你知道它是怎么生成一句话的吗？”

11910

LLM嵌入K-Means、DBSCAN聚类、PCA主成分分析新闻文本聚类研究|附代码数据

拓端 7天前2026-02-24 19:33:47

在信息爆炸的当下，如何高效处理海量无标注文本数据并按主题归类，是企业提升信息管理效率的核心需求。传统文本聚类方法如TF-IDF仅依赖词频统计，无法区分“自然树”...

8410

从ResNet到mHC：DeepSeek重构残差连接，额外开销仅6.7%，附复现代码

AI-Frontiers 7天前2026-02-24 13:35:12

原文: https://mp.weixin.qq.com/s/ZuA3zSpVHo1-bGB2tQuRpg关注公zh: AI-Frontiers

9100

一文搞懂模态编码：AI 是如何把图片、文字、声音“翻译“成数字的？

ETL 小当家 9天前2026-02-23 01:46:45

🚀 本文收录于 AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助，欢迎 ⭐ Star 支持！

11710

从 26 个字母到 50000 个 Token：现代 LLM 的语言密码

ETL 小当家 9天前2026-02-23 00:56:45

🚀 本文收录于 AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助，欢迎 ⭐ Star 支持！

12810

#LLM

什么是大语言模型（LLM）

Open Code的免费API集成的使用教学

langchaingo：用Go语言构建LLM应用的利器

收藏! 2026最强开源AI编程工具清单：从代码补全到自主智能体

一文读懂 n-grams：大模型出现前，语言模型就靠它

企业数字化新考题：告别广告思维，如何构建基于GEO的高可信品牌知识库？

从提示工程转向上下文工程，6种让LLM在生产环境中稳定输出的技术

超越上下文窗口：CodeAct与RLM，两种代码驱动的LLM扩展方案

LLM创造力可以被度量吗？一个基于提示词变更的探索性实验

LLM推理时计算技术详解：四种提升大模型推理能力的方法

用 PyTorch 实现 LLM-JEPA：不预测 token，预测嵌入

[论文速递] LLM/Attention的引力场是存在的

Anthropic突然开火：中国大模型被指大规模蒸馏攻击

GLM 5 vs Qwen3.5 vs MiniMax M2.5 vs kimi k2.5

第一章·你必须先看穿它：AI写小说的底层真相·AI写作底层原理

LLM嵌入K-Means、DBSCAN聚类、PCA主成分分析新闻文本聚类研究|附代码数据

从ResNet到mHC：DeepSeek重构残差连接，额外开销仅6.7%，附复现代码

一文搞懂模态编码：AI 是如何把图片、文字、声音“翻译“成数字的？

从 26 个字母到 50000 个 Token：现代 LLM 的语言密码

热门专栏

腾讯开源的专栏

腾讯云服务器团队的专栏

腾讯技术工程官方号的专栏

皮振伟的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

#LLM

什么是大语言模型（LLM）

Open Code的免费API集成的使用教学

langchaingo：用Go语言构建LLM应用的利器

收藏! 2026最强开源AI编程工具清单：从代码补全到自主智能体

一文读懂 n-grams：大模型出现前，语言模型就靠它

企业数字化新考题：告别广告思维，如何构建基于GEO的高可信品牌知识库？

从提示工程转向 上下文工程，6种让LLM在生产环境中稳定输出的技术

超越上下文窗口：CodeAct与RLM，两种代码驱动的LLM扩展方案

LLM创造力可以被度量吗？一个基于提示词变更的探索性实验

LLM推理时计算技术详解：四种提升大模型推理能力的方法

用 PyTorch 实现 LLM-JEPA：不预测 token，预测嵌入

[论文速递] LLM/Attention的引力场是存在的

Anthropic突然开火：中国大模型被指大规模蒸馏攻击

GLM 5 vs Qwen3.5 vs MiniMax M2.5 vs kimi k2.5

第一章·你必须先看穿它：AI写小说的底层真相·AI写作底层原理

LLM嵌入K-Means、DBSCAN聚类、PCA主成分分析新闻文本聚类研究|附代码数据

从ResNet到mHC：DeepSeek重构残差连接，额外开销仅6.7%，附复现代码

一文搞懂模态编码：AI 是如何把图片、文字、声音“翻译“成数字的？

从 26 个字母到 50000 个 Token：现代 LLM 的语言密码

腾讯开源的专栏

腾讯云服务器团队的专栏

腾讯技术工程官方号的专栏

皮振伟的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

从提示工程转向上下文工程，6种让LLM在生产环境中稳定输出的技术