首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >IJCAI2022《对抗序列决策》教程

IJCAI2022《对抗序列决策》教程

作者头像
数据派THU
发布2022-08-29 10:41:00
发布2022-08-29 10:41:00
20800
代码可运行
举报
文章被收录于专栏:数据派THU数据派THU
运行总次数:0
代码可运行
代码语言:javascript
代码运行次数:0
运行
复制
来源:专知本文为教程,建议阅读5分钟本教程将概述在序列决策设置中的对抗性学习的最新研究。

本教程将概述在序列决策设置中的对抗性学习的最新研究。特别地,本教程将侧重于基于多臂赌博机、强化学习和多智能体交互的对抗性攻击和防御机制。本教程将暂时涵盖以下列出的内容。

https://adversarial-rl.org/ijcai2022/index.html

  • 介绍
    • 序列决策入门: 多臂赌博机,强化学习,多智能体交互,和博弈。
    • 对抗性序列决策如何不同于对抗性监督学习的高级概述。
    • 攻击策略和防御机制的高级概述。
  • 多臂赌博机
    • 不同反馈破坏模型和目标下的最优攻击策略。
    • 最近在设计鲁棒算法、关键挑战和开放问题方面的工作。
  • 强化学习
    • 讨论不同的学习范式(例如,模仿学习、离线学习和在线学习),以及它们在对抗性攻击中是如何区别的。
    • 测试时间、训练时间和后门攻击的最优攻击策略。
    • 不同数据破坏模型和攻击目标下的最优攻击策略。
    • 最近在设计鲁棒算法、关键挑战和开放问题方面的工作。
  • 多智能体相互作用和博弈论考虑
    • 多智能体系统中通过控制其他智能体的攻击和非健忘攻击。
    • 利用博弈论工具防御攻击。
  • 实际考虑和讨论
    •  针对学习代理的安全威胁案例研究。
    • 在对抗性序列决策中开发基准工具和数据集。
    •  与观众公开讨论,促进跨社区合作。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据派THU 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档