Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >入门 | 从遗传算法到强化学习,一文介绍五大生物启发式学习算法

入门 | 从遗传算法到强化学习,一文介绍五大生物启发式学习算法

作者头像
机器之心
发布于 2018-05-10 03:30:00
发布于 2018-05-10 03:30:00
3.3K0
举报
文章被收录于专栏:机器之心机器之心

选自Medium

作者:Luke James

机器之心编译

参与:黄小天、路雪

本文是作者献上的一部「野外纪录片」,介绍了五个直接受大自然启发而产生的人工智能算法:人工神经网络、遗传算法、集群智能、强化学习和人工免疫系统。

在当今技术背景之下,人工智能的发展催生出很多美好事物。人类花费数十年研究如何优化数学计算以使复杂的学习算法运转起来,此外,我们还已经超越自身的物种,正努力创造新一代智能体。大自然及其所包含的一切,深深地植根于人工智能的运作之中,而这正是本文的主题。

David Attenborough 的野生动物纪录片令人震撼,他们通过高清晰的细节记录了地球上诸多物种的行为和特征,如何融入自然生态系统,并协同共存使得自然生机勃勃——使其成为「地球」。我虽然不是 David Attenborough,但是也要献上一部「野生动物纪录片」,介绍那些直接受大自然启发而产生的人工智能算法。在此之前,我首先介绍两个算法概念:搜索/路径寻找和预测建模。

搜索(路径寻找)算法

搜索算法本质上是一种程序,被设计用来发现通往目标的最优/最短的路径。例如,旅行推销员问题是一个典型的搜索优化问题,其中包含给定的一系列城市及其之间的距离。你必须为推销员找到最短路径,同时每个城市只经过一次,从而最小化旅行时间和开销(确保你回到起点城市)。这一问题的真实应用是运货车。假设伦敦有 100 个人在线下单,所有箱子要装进货车,快递员现在必须计算最高效的路线(平衡距离/所花费的时间),以便从仓库交付这些包裹(最终还要返回仓库),确保公司把时间和金钱消耗降到最低。

预测建模算法

如今,有关预测建模的炒作是最多的。全世界的数据科学正在强烈呼吁「神经网络」,而像谷歌这样的大公司也正努力通过人工智能及其各种不同变体解决世界上的难题。预测建模本质上借助统计学来预测结果。你经常听到数据科学家试图解决两类预测建模问题:回归和分类。回归是找到两组变量关联性的暗黑艺术;分类是确定数据集属于不同组的概率的过程。

5 个生物启发式学习算法

1. 人工神经网络

前馈神经网络——最基本类型的神经网络

  • 算法类型:预测建模
  • 生物启发:认知脑功能(神经元)
  • 用例:情感分析、图像识别/检测、语言修正、机器人

让我们从最基础的人工智能算法开始。神经网络是人工智能子范畴机器学习的一部分。神经网络的设计目的是在神经元层面上模拟大脑功能,通过轴突和树突的交互在系统之中把信息传递过一系列的层,生成一个预测性的输出。每个层提供一个数据表征的额外层,并允许你建模最复杂的问题。

神经网络很可能是使用最为广泛的机器学习算法,并且是目前为止数据科学和深度学习的最热趋势。这一概念最初起始于 1958 年的感知机,后来 Geoffrey Hinton 完善了它,并在谷歌、Facebook 等公司中大为流行。神经网络可用于解决一系列问题,比如自然语言处理、视觉识别。这一监督式学习算法可以解决回归和分类问题,其实例可在常规的消费产品中发现,比如智能手机和智能家居设备。

2. 遗传算法

遗传算法中的个体繁殖

  • 算法类型:搜索/路径寻找
  • 生物启发:适者生存/进化(细胞繁殖)
  • 用例:数据挖掘/分析、机器人、制造/设计、流程优化

遗传算法在连续的一代代个体之间采取适者生存的进化方法,以期解决搜索问题。每一代包含一群模拟 DNA 染色体的字符串。群体中的每个个体表征搜索空间中的一点,因此每个都是可能的候选方案。为了提升方案数量,我们使个体经历一次进化过程。

  • 群体之中的每个个体将会竞争资源和配偶。
  • 相比于表现差的个体,每次竞争中的最成功个体将(通常)产生更多个体。
  • 来自更多「理想」候选的基因在群体中传播,因此这些优秀的父母往往会产生潜力更大的后代。

3. 群集/集群智能(SWARM/COLLECTIVE INTELLIGENCE)

蚁群优化算法示例——一种集群智能算法

  • 算法类型:搜索/路径寻找
  • 生物启发:蚁群/鱼群/鸟群
  • 用例:机器人、视频游戏 AI、制造业、路径规划

蚁群优化(Ant Colony Optimisation)和粒子群优化(Particle Swarm Optimisation)是两种最广为人知的「集群智能」算法。从基础层面上来看,这些算法都使用了多智能体。每个智能体执行非常基础的动作,合起来就是更复杂、更即时的动作,可用于解决问题。

蚁群优化(ACO)与粒子群优化(PSO)不同。二者的目的都是执行即时动作,但采用的是两种不同方式。ACO 与真实蚁群类似,利用信息激素指导单个智能体走最短的路径。最初,随机信息激素在问题空间中初始化。单个智能体开始遍历搜索空间,边走边洒下信息激素。信息激素在每个时间步中按一定速率衰减。单个智能体根据前方的信息激素强度决定遍历搜索空间的路径。某个方向的信息激素强度越大,智能体越可能朝这个方向前进。全局最优方案就是具备最强信息激素的路径。

PSO 更关注整体方向。多个智能体初始化,并按随机方向前进。每个时间步中,每个智能体需要就是否改变方向作出决策,决策基于全局最优解的方向、局部最优解的方向和当前方向。新方向通常是以上三个值的最优「权衡」结果。

4. 强化学习

强化学习环境中的智能体行为

  • 算法类型:预测建模
  • 生物启发:经典条件反射
  • 用例:视频游戏、自动驾驶汽车、生产线软件、财务系统

强化学习受到心理学和经典条件反射的启发,为智能体的积极动作给予正值反应。学习强化学习的概念通常比学习流行的经典条件反射示例「巴甫洛夫的狗」更加简单。该示例是 1890 年代俄国心理学家伊万·巴甫洛夫执行的研究,旨在观察狗对食物的唾液分泌。详细解释可参阅:https://www.simplypsychology.org/pavlov.html。本质上,如果强化学习智能体执行了一个好的动作,即该动作有助于完成要求任务,则它会得到奖励。智能体将使用策略来学习在每一步中最大化奖励。将原始输入应用到算法中使得智能体开发出自己对问题的感知,以及如何以最高效的方式解决问题。

RL 算法常常与其他机器学习技术(如神经网络)一同使用,通常称为深度强化学习。神经网络通常用于评估 RL 智能体作出某个决策后所获得的奖励。DeepMind 在这方面取得了很大成果,它使用深度 Q 学习方法解决更通用的问题(如利用算法的能力玩 Atari 游戏、战胜围棋世界冠军)。DeepMind 现在在研究更复杂的游戏,如星际争霸 2。

Q 学习是强化学习算法的无模型版本,可用于对任意有限马尔可夫决策过程寻找最优的动作选择策略。程序初始化时,每个动作-价值对的 Q 值由开发者定义,并由 RL 算法在每个时间步进行更新。下图展示了 Q 值的更新公式。

Q 学习值更新公式

5. 人工免疫系统

人工免疫系统组件

  • 算法类型:预测建模
  • 生物启发:免疫系统
  • 用例:安全软件、自动导航系统、调度系统、故障检测软件

免疫系统通过免疫应答机制保护身体免受病原体等的侵袭。人工免疫系统(AIS)是一种适应性系统,受启发于理论免疫学和免疫功能在问题求解中的应用。AIS 是生物启发计算和自然计算的分支,与机器学习和人工智能联系紧密。以下算法常用于 AIS:

  • 克隆选择
  • 树突状细胞
  • 负选择
  • 人工免疫识别

和生物免疫系统一样,AIS 能够将所有「细胞」分类为「自己」或「非己」细胞。智能的分布式任务组(distributed task force)用于对所有细胞执行动作。免疫系统中最重要的两种细胞是 T 细胞和 B 细胞。T 细胞有三种类型:激活 B 细胞、摧毁入侵者、调节机体免疫问题。B 细胞生成抗体。人工免疫系统通常用于监控入侵检测,从而抵御网络攻击,通常被整合进企业级软件中。与上文提到的其他算法不同,这方面的在线免费学习资料较少,而且可能也是发展最慢的。

本文介绍了 5 种受生物启发的技术。影响 AI 系统的生物启发算法还有很多,欢迎分享。

原文地址:https://towardsdatascience.com/5-ways-mother-nature-inspires-artificial-intelligence-2c6700bb56b6

本文为机器之心编译,转载请联系本公众号获得授权。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-01-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
五类受自然启发的AI算法
摘要:本文主要讲解了受自然启发的五类AI算法以及各自的实际用例:神经网络、遗传算法、群集集体智慧、强化学习、人体免疫。 搜索/寻路算法 搜索算法本质上是一个程序,旨在找到到达目标的最佳或最短路径。例如,旅行商问题(TSP)就是一个典型的搜索优化问题:给出城市列表以及城市之间的距离,寻找可以遍历每个城市,并花费最少的时间和开支的最佳路线。送货卡车就是这个问题的一个实际应用,假设在伦敦有100个人提交了网络订单,所有箱子都装进了一个货车里, 现在快递公司(比方说DPD)必须计算出最有效的路线(平衡距离/所花
企鹅号小编
2018/02/02
1.2K0
五类受自然启发的AI算法
【干货】追本溯源:5种受生物启发的人工智能方法
【导读】1月15日,机器学习研究人员Luke James(简介见文末)发布一篇博文,介绍了5种受到生物启发的人工智能方法,包括人工神经网络(人脑神经元)、遗传算法(DNA染色体)、集群算法(蚁群优化和
WZEARW
2018/04/12
2K0
【干货】追本溯源:5种受生物启发的人工智能方法
独家 | 一文读懂优化算法
一、前言 模拟退火、遗传算法、禁忌搜索、神经网络等在解决全局最优解的问题上有着独到的优点,其中共同特点就是模拟了自然过程。模拟退火思路源于物理学中固体物质的退火过程,遗传算法借鉴了自然界优胜劣汰的进化思想,禁忌搜索模拟了人类有记忆过程的智力过程,神经网络更是直接模拟了人脑。它们之间的联系也非常紧密,比如模拟退火和遗传算法为神经网络提供更优良的学习算法提供了思路。把它们有机地综合在一起,取长补短,性能将更加优良。 这几种智能算法有别于一般的按照图灵机进行精确计算的程序,尤其是人工神经网络,是对计算机模
数据派THU
2018/01/30
3.6K0
独家 | 一文读懂优化算法
学界 | 启发式搜索:华为提出通用人工智能工程方法
选自arXiv 作者:Zengkun Li 机器之心编译 参与:刘晓坤、李泽南 鉴于当前认知神经科学和人工智能工程所遇到的困难,华为 2012 实验室的研究人员提出了一种新的通用人工智能工程方法:使用学习算法的稳定性作为在特定场景中的适合度函数的启发式搜索方法。论文将其方法与人工设计方法、仿生学方法进行了对比,结果表明该方法更加有望实现通用人工智能,并且和认知神经科学有更好的交互作用。 作者指出虽然可以直接在这篇论文中提出其工程方法,但为了刚好地解释这个方法的必要性和可行性,以及使无相关背景的读者能更好地理
机器之心
2018/05/09
8550
学界 | 启发式搜索:华为提出通用人工智能工程方法
强化学习vs遗传算法-人工智能在模拟领域的应用
强化学习(Reinforcement Learning)和遗传算法(Genetic Algorithm)都是受自然启发的AI方法,它们有何不同?更重要的是,在哪些情况下,其中一种会比另一种更受青睐?”
deephub
2021/08/20
8100
数学建模--智能算法之免疫算法
免疫算法是一种基于生物免疫系统机制的智能优化算法,广泛应用于解决复杂优化问题、模式识别和数据挖掘等领域。它模仿了人体免疫系统的自适应性、自组织性、多样性和免疫记忆等特性,通过模拟这些机制来处理信息和寻找最优解。
用户11315985
2024/10/16
2880
数学建模--智能算法之免疫算法
一文入门 深度强化学习
深度强化学习是人工智能最有趣的分支之一。它是人工智能社区许多显着成就的基石,它在棋盘、视频游戏、自动驾驶、机器人硬件设计等领域击败了人类冠军。
double
2022/01/26
1.3K0
一文入门 深度强化学习
人工智能:智能优化算法
优化问题是指在满足一定条件下,在众多方案或参数值中寻找最优方案或参数值,以使得某个或多个功能指标达到最优,或使系统的某些性能指标达到最大值或最小值。优化问题广泛地存在于信号处理、图像处理、生产调度、任务分配、模式识别、自动控制和机械设计等众多领域。优化方法是一种以数学为基础,用于求解各种优化问题的应用技术。各种优化方法在上述领域得到了广泛应用,并且已经产生了巨大的经济效益和社会效益。实践证明,通过优化方法,能够提高系统效率,降低能耗,合理地利用资源,并且随着处理对象规模的增加,这种效果也会更加明显。 在电子、通信、计算机、自动化、机器人、经济学和管理学等众多学科中,不断地出现了许多复杂的组合优化问题。面对这些大型的优化问题,传统的优化方法(如牛顿法、单纯形法等)需要遍历整个搜索空间,无法在短时间内完成搜索,且容易产生搜索的“组合爆炸”。例如,许多工程优化问题,往往需要在复杂而庞大的搜索空间中寻找最优解或者准最优解。鉴于实际工程问题的复杂性、非线性、约束性以及建模困难等诸多特点,寻求高效的优化算法已成为相关学科的主要研究内容之一。 受到人类智能、生物群体社会性或自然现象规律的启发,人们发明了很多智能优化算法来解决上述复杂优化问题,主要包括:模仿自然界生物进化机制的遗传算法;通过群体内个体间的合作与竞争来优化搜索的差分进化算法;模拟生物免疫系统学习和认知功能的免疫算法;模拟蚂蚁集体寻径行为的蚁群算法;模拟鸟群和鱼群群体行为的粒子群算法;源于固体物质退火过程的模拟退火算法;模拟人类智力记忆过程的禁忌搜索算法;模拟动物神经网络行为特征的神经网络算法;等等。这些算法有个共同点,即都是通过模拟或揭示某些自然界的现象和过程或生物群体的智能行为而得到发展;在优化领域称它们为智能优化算法,它们具有简单、通用、便于并行处理等特点。 **
全栈程序员站长
2022/08/31
1.5K0
焦李成院士:进化优化与深度学习的思考
作者丨焦李成整理丨维克多‍ 编辑丨青暮 2021年12月17日,西安电子科技大学人工智能学院教授、欧洲科学院外籍院士、IEEE Fellow焦李成受邀参加2021中国计算机大会“下一代演化计算发展趋势”论坛,并做了“进化优化与深度学习的思考”的主旨报告。 在报告中焦李成梳理了“进化”相关的发展渊源与思想起源,指出了当前人工智能的学术缺陷与实际困境,并从类脑的角度给出了解决路径: “神经网络不应该是目前的意义上进行权重调参,它的结构应该具备变化性、可塑性、学习性和动态性;在类脑感知的过程中,脑的奖惩、学习、信
AI科技评论
2022/03/03
5070
超越强化学习:生命启发的AI
构建自主的(即基于个人需求选择目标)和自适应的(即在不断变化的环境中生存)智能 体一直是人工智能(al)的圣杯。一个活的有机体是这种代理的一个主要例子,提供了 关于适应性自主的重要课程。在这里,我们把重点放在内感受上,这是一个监控体 内环境使其保持在一定范围内的过程,它保证了生物体的生存。为了开发具有内视 知觉的人工智能,我们需要从外部环境中分解代表内部环境的状态变量,并采用内 部环境状态的受生命启发的数学特性。这篇论文提供了一个新的视角,通过将控制 论的遗产与生命理论、强化学习和神经科学的最新进展相结合,内视知觉如何帮助 构建自主和适应的主体。
CreateAMind
2023/11/01
3530
超越强化学习:生命启发的AI
路径规划算法
随着机器人技术、智能控制技术、硬件传感器的发展,机器人在工业生产、军事国防以及日常生活等领域得到了广泛的应用。而作为机器人行业的重要研究领域之一,移动机器人行业近年来也到了迅速的发展。移动机器人中的路径规划便是重要的研究方向。移动机器人的路径规划方法主要分为传统的路径规划算法、基于采样的路径规划算法、智能仿生算法。传统的路径规划算法主要有A*算法、Dijkstra算法、D*算法、人工势场法,基于采样的路径规划算法有PRM算法、RRT算法,智能仿生路径规划算法有神经网络算法、蚁群算法、遗传算法等。
六四零
2021/11/12
2.4K0
从工厂到生活:算法 × 深度学习,正在改写自动化的底层逻辑
从工业革命时期的机械自动化,到信息时代的智能自动化,人类对自动化技术的追求从未停歇。近年来,随着物联网、大数据、云计算等技术的蓬勃发展,自动化系统的复杂度与智能化程度显著提升。算法与深度学习的深度介入,使得自动化设备不仅能够执行预设指令,更具备自主学习、智能决策的能力。这种变革正在重塑工业制造、交通运输、医疗健康等多个领域的生产与服务模式,成为推动社会经济发展的关键技术引擎。 在工业 4.0 与智能制造的大背景下,自动化设备需要处理海量且复杂的数据,传统的规则驱动型系统已难以满足需求。例如,在汽车生产线中,每分钟需要检测数百个零部件的尺寸与缺陷,人工设定的检测规则无法适应产品型号的快速迭代;而深度学习算法通过对大量图像数据的学习,能够自动识别复杂缺陷模式,将检测准确率提升至 99% 以上。此外,在智能交通领域,城市交通网络产生的动态数据规模庞大,依赖算法对交通流量进行实时预测与优化,才能有效缓解拥堵问题。
羑悻的小杀马特.
2025/05/02
1790
从工厂到生活:算法 × 深度学习,正在改写自动化的底层逻辑
从游戏AI到自动驾驶,一文看懂强化学习的概念及应用
强化学习(Reinforcement Learning,简称RL,又译为“增强学习”)这一名词来源于行为心理学,表示生物为了趋利避害而更频繁实施对自己有利的策略。例如,我每天工作中会根据策略决定做出各种动作。如果我的某种决定使我升职加薪,或者使我免遭处罚,那么我在以后的工作中会更多采用这样的策略。
IT阅读排行榜
2019/08/19
9930
从游戏AI到自动驾驶,一文看懂强化学习的概念及应用
入门 | 强化学习的基本概念与代码实现
选自DeepLearning4j 机器之心编译 参与:Nurhachu Null、李泽南 从 AlphaGo 到自动驾驶汽车,我们能在很多最先进的人工智能应用中找到强化学习的身影。这种技术是如何从零开始慢慢学会完成任务,成长为「超越人类水平」的专家的?本文将会进行一番简要介绍。 神经网络造就了最近我们在计算机视觉、机器翻译和时间序列预测等领域上的突破—同时它也可以和强化学习算法结合来创建一些惊人的成果,例如 AlphaGo(参阅:无需人类知识,DeepMind 新一代围棋程序 AlphaGo Zero 再次
机器之心
2018/05/10
5440
【DeepMin哈萨比斯长文】伟大的AI离不开神经科学:强化学习-Attention-连续学习
【新智元导读】DeepMind 联合创始人兼 CEO Demis Hassabis 等人日前在 Neuron(神经元) 发表评论文章,纵览神经科学对 AI 的启发。文章核心观点是,人工智能的过去、现在
新智元
2018/03/23
1.1K0
【DeepMin哈萨比斯长文】伟大的AI离不开神经科学:强化学习-Attention-连续学习
深入机器学习系列之强化学习
强化学习(reinforcement learning),又称再励学习,评价学习,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。本文将介绍强化学习的相关概念、算法及其应用实例。
数据猿
2019/07/31
1.2K0
深入机器学习系列之强化学习
IEEE预发:DeepMind主攻的深度强化学习3大核心算法及7大挑战
【新智元导读】深度强化学习将有助于革新AI领域,它是朝向构建对视觉世界拥有更高级理解的自主系统迈出的一步。本文将涵盖深度强化学习的核心算法,包括深度Q网络、置信区域策略优化和异步优势actor-critic算法(A3C)。同时,重点介绍深度强化学习领域的几个研究方向。 本文预计在IEEE信号处理杂志“图像理解深度学习”专刊发表。作者Kai Arulkumaran是伦敦帝国理工大学的博士生,Marc Peter Deisenroth是伦敦帝国理工大学的讲师,Miles Brundage是亚利桑那州立大学博士
新智元
2018/03/22
1.3K0
IEEE预发:DeepMind主攻的深度强化学习3大核心算法及7大挑战
[机器学习|理论&实践] 机器学习与生物启发式算法的融合
在现代科技的发展中,机器学习和生物启发式算法的结合为问题解决提供了一种创新的方式。本文将深入研究机器学习与生物启发式算法的融合,通过一个实例项目展示其部署过程,并探讨这一技术在未来的发展方向。
数字扫地僧
2024/01/20
3891
数学建模启发式算法篇(一)---遗传算法
最近在准备本月亚太赛,第一个学习的是这个模拟退火,但是今天想要更新的不是模拟退火,而是遗传算法;
阑梦清川
2025/02/24
1450
数学建模启发式算法篇(一)---遗传算法
脑启发的ANN学习机制综述
Brain-inspired learning in artificial neural networks: a review
CreateAMind
2023/09/01
4060
脑启发的ANN学习机制综述
推荐阅读
相关推荐
五类受自然启发的AI算法
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档