greedy - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签greedy

#greedy

LLM中temperature参数设置为0

zhangjiqun 2025-05-162025-05-16 15:27:20

意味着采用贪婪解码（greedy decoding）策略。在每一步生成文本时，模型会选择概率最高的词元，从而使输出具有确定性，尽可能地输出最常见、最确定的回答，...

89200

【数据结构与算法】Greedy Algorithm

程序员波特 2024-10-082024-10-08 08:17:02

贪心算法是一种在每一步选择中都采取在当前状态下最好或最优(即最有利)的选择，从而希望导致结果是最好或最优的算法。这种算法通常用于求解优化问题，如最小生成树、背包...

54210

LLM中的解码（Decoding）

MySQLSE 2024-06-142024-06-14 14:31:37

解码是LLM中生成文本的过程，通常指的是将模型生成的数字表示（例如概率分布）转换为实际的文本输出的过程。

94210

GPT-3.5 Turbo 的 temperature 设置为 0 就是贪婪解码？

叶庭云 2024-05-252024-05-25 07:58:36

将 GPT-3.5 Turbo 的 temperature 设置为 0 通常意味着采用贪婪解码（greedy decoding）策略。在贪婪解码中，模型在每一步...

1.1K00

Python高级算法——贪心算法（Greedy Algorithm）

Echo_Wish 2023-12-112023-12-11 10:26:12

贪心算法是一种优化问题的解决方法，它每步选择当前状态下的最优解，最终希望通过局部最优的选择得到全局最优解。在本文中，我们将深入讲解Python中的贪心算法，包括...

2.5K10

GREEDY ALGORITHMS

Ywrby 2023-10-162023-10-16 19:22:08

贪心算法（Greedy Algorithm）是一种常见的优化算法，用于解决一类最优化问题。在每一步选择中，贪心算法总是选择当前看起来最优的选择，而不考虑该选择会...

1.3K20

GREEDY ALGORITHMS II

Ywrby 2023-10-162023-10-16 19:21:53

Dijkstra’s algorithm（迪杰斯特拉算法）是一种用于求解单源最短路径问题的经典算法。该算法可以计算从单个起始节点到图中所有其他节点的最短路径。D...

74310

GREEDY ALGORITHMS II

Ywrby 2023-10-162023-10-16 19:21:53

1K20

Q-learning算法探索与利用平衡问题

double 2023-08-082023-08-08 14:43:34

Q-learning算法中，探索与利用是一个重要的平衡性问题。怎么在算法中平衡，今天第十一篇讨论：Q-learning算法探索与利用平衡问题

73630

正则表达式

matt

腾讯｜后台开发 (已认证)

2022-10-252022-10-25 15:54:03

正则表达式（Regular Expression，简称Regex）是在一个主体字符串中从左到右匹配字符串时的一种样式。

95710

AAAI21 | Seq2Seq模型成为“复读机”的原因找到了？

godweiyang 2021-02-242021-02-24 16:30:40

经过学习，笔者发现该论文确实有不少可圈可点之处，值得一读。笔者对原论文中的分析过程做了一些精简、修正和推广，将结果记录成此文，供大家参考。此外，抛开问题背景不讲...

1.6K20

Array - 334. Increasing Triplet Subsequence

ppxai 2020-09-232020-09-23 17:07:11

Given an unsorted array return whether an increasing subsequence of length 3 exi...

59630

什么是 Q-learning？

杨熹 2020-03-202020-03-20 11:29:27

它是强化学习中的一种 values-based 算法，最终是会学习出一个表格 Q-Table，例如在一个游戏中有下面5种状态和4种行为，则表格为：

1.5K20

Xavier 初始化方法

刘笑江 2019-12-302019-12-30 16:24:45

在 Xavier Init 提出前，一般用 unsupervised pre-trainning 和 greedy layer-wise procedure 来...

1.4K30

#greedy

LLM中temperature参数设置为0

【数据结构与算法】Greedy Algorithm

LLM中的解码（Decoding）

GPT-3.5 Turbo 的 temperature 设置为 0 就是贪婪解码？

Python高级算法——贪心算法（Greedy Algorithm）

GREEDY ALGORITHMS

GREEDY ALGORITHMS II

GREEDY ALGORITHMS II

Q-learning算法探索与利用平衡问题

正则表达式

AAAI21 | Seq2Seq模型成为“复读机”的原因找到了？

Array - 334. Increasing Triplet Subsequence

什么是 Q-learning？

Xavier 初始化方法

热门专栏

刘笑江的专栏

杨熹的专栏

算法channel

算法码上来

Python进阶之路

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

#greedy

LLM中temperature参数设置为0

【数据结构与算法】Greedy Algorithm

LLM中的解码（Decoding）

GPT-3.5 Turbo 的 temperature 设置为 0 就是贪婪解码？

Python高级算法——贪心算法（Greedy Algorithm）

GREEDY ALGORITHMS

GREEDY ALGORITHMS II

GREEDY ALGORITHMS II

Q-learning算法 探索与利用平衡问题

正则表达式

AAAI21 | Seq2Seq模型成为“复读机”的原因找到了？

Array - 334. Increasing Triplet Subsequence

什么是 Q-learning？

Xavier 初始化方法

刘笑江的专栏

杨熹的专栏

算法channel

算法码上来

Python进阶之路

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

Q-learning算法探索与利用平衡问题