首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

机器能否自我提升从低级智能逐步提升为更高级的智能?

把这个问题分成两个层次来看:(1)一个低级的智能去执行一些低级、简单目标与评价机制+大量实例,用强化学习去训练一个高级的智能;(2)得到一个足够复杂、能够基本理解世界的智能体,然后就能自己训练自己,就像人类一样。

对于第一个问题,通过低级智能最后可以联合得到更高级的智能,这个是可行,但采用的不一定是强化学习,例如boosting算法和群智算法。

对于第二个问题,自己训练自己,就像人类一样。现在也有在研究,例如:

(1)模型通过协作完成复杂的软件工程项目,Self-collaboration Code Generation via ChatGPT,

https://www.zhihu.com/pin/1729159614464045056

(2)让大模型对自己的输出多一些“思考”,在“思考”的过程中改进。论文引入了自我改进方法,这是一种通过迭代反馈和改进来改进LLM初始输出的方法。Self-Refine: Iterative Refinement with Self-Feedback,

https://www.zhihu.com/pin/1728186245019246593

举例说明第一个问题:

Boosting算法是一种集成学习算法,其核心思想是将多个弱分类器组合成一个强分类器。

主要特点:

Boosting算法通过迭代地训练一系列基分类器(也称为弱分类器)并将它们组合起来,以构建一个强分类器。每个基分类器基于之前分类器的错误进行训练,旨在改进整体分类器的性能。Boosting算法使用加法模型,其中每个基分类器是模型的一个组成部分。通过将每个基分类器的预测结果加权求和,可以组合得到最终的预测结果。Boosting算法中的每个基分类器通常都是基于同一个特征集进行训练的,以便在组合时能够充分利用特征信息。

流程:

初始化训练数据集:对于初始的训练数据集,所有样本被赋予相同的权重。

迭代训练基分类器:在每一轮迭代中,根据当前样本权重,训练一个基分类器。这个基分类器的训练目标是使得在当前样本权重下,分类器的错误率最小。

计算分类器的权重:根据基分类器在训练数据上的表现,计算出该分类器的权重。权重的计算通常基于分类器的性能指标(如错误率)。

更新样本权重:根据基分类器的权重和预测结果,更新训练样本的权重。对于被正确分类的样本,权重会被降低;对于被错误分类的样本,权重会被提高。组合基分类器:将所有基分类器和其对应的权重组合起来,形成一个强分类器。这个强分类器在新的样本上进行预测时,会综合考虑每个基分类器的预测结果和其对应的权重。

Boosting算法有很多变种,如AdaBoost、Gradient Boosting和LogitBoost等。这些算法在实现细节和使用的损失函数上有所不同,但基本思想和流程是相似的。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OSydI9PN9H1tSt7pYdiVTOOQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券