前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >有了ModelScope-Agent,小白也能打造专属智能体,附保姆级教程

有了ModelScope-Agent,小白也能打造专属智能体,附保姆级教程

作者头像
机器之心
发布于 2023-09-19 01:57:51
发布于 2023-09-19 01:57:51
3K0
举报
文章被收录于专栏:机器之心机器之心

机器之心专栏

机器之心编辑部

在当今的大模型时代,围绕大模型的自主智能体被认为是通向通用人工智能(AGI)最有希望的道路。随着 OpenAI 提出 plugin 增强大模型等能力,社区涌现出了一批 Agent 系统,如 LangChain,transformers agent, AutoGPT 等,能够通过自主规划和指令来完成任务。魔搭社区推出了大小模型协同解决方案 ModelScope-Agent,一个以开源大模型为核心的 Agent 系统。

ModelScope-Agent 提出了一个通用的、可定制的 Agent 框架,方便用户打造属于自己的智能体。它基于开源的大语言模型 (LLMs) 作为核心,提供了一个用户友好的系统库, 具有以下特点:

  • 可定制且功能全面的框架:提供可定制的引擎设计,涵盖了数据收集、工具检索、工具注册、存储管理、定制模型训练和实际应用等功能,可用于快速实现实际场景中的应用。
  • 开源 LLMs 作为核心组件:支持在 ModelScope 社区的多个开源 LLMs 上进行模型训练,并开源了配套的中英文工具指令数据集 MSAgent-Bench,用于增强开源大模型作为 Agent 中枢的规划调度能力。
  • 多样化且全面的 API,支持 API 检索:以统一的方式实现与模型 API 和常见的功能 API 进行无缝集成,默认提供开源 API 检索方案。
  • 论文链接:https://arxiv.org/abs/2309.00986
  • 代码链接:https://github.com/modelscope/modelscope-agent
  • ModelScope 体验地址:https://modelscope.cn/studios/damo/ModelScopeGPT/summary

能力展示

下面先展示一些基于 ModelScope-Agent 实现的 ModelScopeGPT (魔搭 GPT)的能力:

1. 单步工具调用,Agent 需要选择正确的工具并生成请求,并根据执行结果返回给用户。

2. 多步工具调用,Agent 需要多个工具的规划、调度、执行和回复。

3. 多轮对话中工具调用,Agent 需要从历史对话中挖掘需要传给工具的参数。

4.基于检索工具的社区知识问答。

框架介绍

ModelScope-Agent 框架是如何设计的

ModelScope-Agent 是一个通用的、可定制的 Agent 框架,用于实际应用程序开发,其基于开源的大语言模型 (LLMs) 作为核心,包含记忆控制、工具使用等模块。开源 LLM 主要负责任务规划、调度以及回复生成;记忆控制模块,主要包含知识检索以及 prompt (提示词)管理;工具使用模块,包含工具库以及工具检索和工具可定制化。ModelScope-Agent 系统架构如下:

ModelScope-Agent 框架是如何执行的

ModelScope-Agent 的工作原理是,把目标拆分成更小的任务,然后一项一项完成。比如,当用户请求「写一个简短故事,并用女声朗读,同时配个视频」时,ModelScope-Agent 会展示整个任务规划过程,先通过工具检索检索相关的语音合成工具,然后由开源 LLM 进行规划调度, 首先生成一段故事,然后调用对应语音生成模型,生成语音并用女声念出,展示给用户,最后再调用视频生成模型,针对生成的故事内容生成一段视频;这里全程不需要用户配置当前请求可能需要调用到的工具,极大提升了使用便捷性。

开源大模型训练框架:新的训练方法、数据和模型开源

除了 ModelScope-Agent 框架之外,研究团队还提出了新的工具指令微调训练方法:Weighted LM,通过对工具指令调用部分 token 进行 loss 加权,提升开源大模型工具指令调用能力。

研究团队还开源了一个包含60w具备多轮多步工具指令调用能力的高质量中英数据集MSAgent-Bench,基于该数据集新的训练方法,研究团队在 Qwen-7B 基础上优化训练了一个 MSAgent-Qwen-7B 模型,相关数据集和模型都已开源。

  • MSAgent-Bench:https://modelscope.cn/datasets/damo/MSAgent-Bench/summary
  • MSAgent-Qwen-7B:https://modelscope.cn/models/damo/MSAgent-Qwen-7B/summary

已集成的工具列表

目前 ModelScope-Agent 已经默认接入了自然语言处理、语音、视觉、多模态等众多 AI 模型,还默认集成了知识检索、API 检索等开源方案。

ModelScope-Agent 实践

ModelScope-Agent github 还提供了保姆级实践 demo 页,让小白新手也能搭建属于自己的智能体。

下载 demo notebook:https://github.com/modelscope/modelscope-agent/blob/master/demo/demo_qwen_agent.ipynb

1、首先拉取 ModelScope-Agent 代码并安装相关依赖

2、配置 config 文件,ModelScope token 和构建 API 工具检索引擎

3、中枢大模型启动

4、Agent 构建和使用,依赖之前构建好的大模型,工具 list,工具检索和记忆模块

注册新工具实践

1、拉取 ModelScope-Agent 代码后,进入 modelscope_agent/tools 里,通过代码层面新增工具 custom_tool.py 文件,配置 API 需要的:description,name 和 parameters;同时增加调用方式,可以选用 local_call 和 remote_call 两种

2、配置环境和大模型部署参考上个章节的 2、3 步

3、将注册的新工具构建 list,并且增加到 Agent 构建过程

4、agen.run () 输入 query,测试工具可以正常调用对应 API

5、agent 会自动调用对应的 API,并返回执行结果给大模型,大模型返回回复

One More Thing

开发者可以参考上述教程很容易搭建属于自己的智能体,ModelScope-Agent 依托魔搭社区,未来也会适配更多新增的开源大模型,推出更多基于 ModelScope-Agent 开发的应用,如客户服务 Agent、个人助理 Agent、story Agent、Motion Agent、multi-Agent(多模态 Agent) 等等。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-09-11 12:56,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用
光集成的工具就有这么多,比如NLP、语音、视觉、多模态等多种模型,以及默认集成知识检索、API检索等方案。
量子位
2023/09/19
3.1K0
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用
LLM 大模型学习必知必会系列(十):基于AgentFabric实现交互式智能体应用,Agent实战
**Modelscope **是一个交互式智能体应用基于ModelScope-Agent,用于方便地创建针对各种现实应用量身定制智能体,目前已经在生产级别落地。AgentFabric围绕可插拔和可定制的LLM构建,并增强了指令执行、额外知识检索和利用外部工具的能力。AgentFabric提供的交互界面包括:
汀丶人工智能
2024/05/26
6850
LLM 大模型学习必知必会系列(十):基于AgentFabric实现交互式智能体应用,Agent实战
首批开源超300个顶尖模型:这几家中国「AI主力军」,合力打造了一个AI模型社区「魔搭」
「模型即服务(Model as a Service)代表了未来的行业趋势,而魔搭 ModelScope 迈出了最重要的第一步。」
机器之心
2022/12/15
1.7K0
首批开源超300个顶尖模型:这几家中国「AI主力军」,合力打造了一个AI模型社区「魔搭」
LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
SWIFT支持了开源模型,尤其是中小型模型(7B、14B等)对Agent场景的训练,并将loss-scale技术应用到agent训练中,使中小模型API Call能力更稳定,并支持使用单张商业级显卡进行Agent推理和部署,可以直接在生产场景中全链路闭环落地使用。
汀丶人工智能
2024/05/26
1K0
LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
无外网环境部署 AgentFabric 及使用 AgentFabric 构建的 Agent
在可以访问外网的环境中,准备一个工作目录(如:/data/work),在这个目录下进行后续操作。
AlphaHinex
2024/04/16
4860
无外网环境部署 AgentFabric 及使用 AgentFabric 构建的 Agent
LLM 大模型学习必知必会系列(一):大模型基础知识篇
2023 年,随着 LLM 技术的发展,中国模型研究机构的开源模型迎来了爆发式的增长:
汀丶人工智能
2024/05/11
3.2K0
LLM 大模型学习必知必会系列(一):大模型基础知识篇
使用 modelscope 在离线环境部署模型服务关键点
在 ModelScope 的 本地启动服务[1] 文档中,介绍了使用 modelscope server 发布模型服务的方法。简单来说,就是执行如下命令:
AlphaHinex
2024/05/20
1.5K0
使用 modelscope 在离线环境部署模型服务关键点
每周AI论文速递(240715-240719)
SpreadsheetLLM:优化大语言模型处理电子表格的能力 电子表格因其广泛的双维网格、多样化的布局和格式选项,给大语言模型(LLMs)带来了显著挑战。为此,我们推出了SpreadsheetLLM,这是一种创新的编码方法,旨在充分发挥和优化LLMs在电子表格上的理解和推理能力。我们首先提出了一种包含单元格地址、值和格式的朴素序列化方法。然而,由于LLMs的Token限制,这种方法在实际应用中并不实用。为了解决这一问题,我们开发了SheetCompressor,这是一个创新的编码框架,专门用于有效压缩电子表格以适应LLMs。该框架包括三个模块:基于结构锚点的压缩、逆索引转换和数据格式感知的聚合。实验表明,在GPT4的上下文学习环境中,SheetCompressor在电子表格检测任务中的性能比朴素方法提高了25.6%。此外,经过SheetCompressor微调的LLM平均压缩比达到25倍,同时实现了78.9%的F1分数,超越了现有最佳模型的12.3%。最后,我们提出了电子表格链,用于电子表格理解的下游任务,并在一个新的、要求较高的电子表格QA任务中进行了验证。我们系统地利用了电子表格的固有布局和结构,证明了SpreadsheetLLM在多种电子表格任务中都非常有效。
叶子的技术碎碎念
2025/04/08
830
每周AI论文速递(240715-240719)
CLIP不接地气?你需要一个更懂中文的模型
机器之心专栏 作者:霜清 随着 CLIP 的提出,多模态预训练近年来发展迅速,但 CLIP 对于特定语言的理解有比较明显的欠缺。本文介绍的是达摩院魔搭社区 ModelScope 近期开源的中文 CLIP 大规模预训练图文表征模型,更加懂中文和中文互联网的图像,在图文检索、零样本图片分类等多个任务中实现最优效果,同时代码和模型已经全部开源,用户能够使用魔搭快速上手。 模型使用入口: https://modelscope.cn/models/damo/multi-modal_clip-vit-base-pat
机器之心
2023/03/29
1.5K0
CLIP不接地气?你需要一个更懂中文的模型
检索增强生成(RAG)实践:基于LlamaIndex和Qwen1.5搭建智能问答系统
LLM 会产生误导性的 “幻觉”,依赖的信息可能过时,处理特定知识时效率不高,缺乏专业领域的深度洞察,同时在推理能力上也有所欠缺。
汀丶人工智能
2024/05/07
4.1K0
检索增强生成(RAG)实践:基于LlamaIndex和Qwen1.5搭建智能问答系统
初识langchain[1]:Langchain实战教学,利用qwen2.1与GLM-4大模型构建智能解决方案[含Agent、tavily面向AI搜索]
大模型三大重点:算力、数据、算法,ReAct (reason推理+act行动)–思维链
汀丶人工智能
2024/07/25
1.5K0
初识langchain[1]:Langchain实战教学,利用qwen2.1与GLM-4大模型构建智能解决方案[含Agent、tavily面向AI搜索]
阿里Qwen2正式开源,性能全方位包围Llama-3
斯坦福团队套壳清华大模型的事件不断发酵后,中国模型在世界上开始得到了更多关注。不少人发现,原来中国已经有不少成熟的大模型正在赶超国外。
机器之心
2024/06/17
4740
阿里Qwen2正式开源,性能全方位包围Llama-3
Mobile-Agent-v2问世,自动化手机操作能力再上新台阶
徐海洋,阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模型mPLUG-Owl/Owl2,多模态文档大模型mPLUG-DocOwl,多模态智能体Mobile-Agent等,其中 mPLUG 工作在 VQA 榜单首超人类的成绩。在国际顶级期刊和会议ICML/CVPR/ICCV/ACL/EMNLP/MM/TOIS/IJCAI/AAAI等发表论文30多篇,并担任多个顶级和会议AC/PC/Reviewer。主导参与开源项目mPLUG,X-PLUG,AliceMind,DELTA。
机器之心
2024/06/17
2670
Mobile-Agent-v2问世,自动化手机操作能力再上新台阶
Today | 智谱AI Open Day
今天,智谱AI 在OpenDay正式开源了GLM4系列的小版本-GLM-4-9B系列。
AIGC新知
2024/10/08
1570
Today | 智谱AI Open Day
支付宝被AI调用,一句话运营小红书!国内最大MCP社区来了,开发者狂欢
今天,中国第一开源社区魔搭ModelScope重磅上线「MCP广场」,国内最大MCP中文社区真的来了。
新智元
2025/04/16
1380
支付宝被AI调用,一句话运营小红书!国内最大MCP社区来了,开发者狂欢
炼丹炉 | XTuner 大模型单卡低成本微调实战
※ 因此,你找到了一种叫 LoRA 的方法:只对玩具中的某些零件进行改动,而不是对整个玩具进行全面改动。
AIGC新知
2024/10/08
2880
炼丹炉 | XTuner 大模型单卡低成本微调实战
书生·浦语大模型全链路开源开放体系
9月20日,上海人工智能实验室(上海AI实验室)与商汤科技联合香港中文大学和复旦大学正式推出书生·浦语大模型(InternLM)200亿参数版本InternLM-20B,并在阿里云魔搭社区(ModelScope)开源首发。
AIGC新知
2024/10/08
1400
书生·浦语大模型全链路开源开放体系
语音识别系列︱利用达摩院ModelScope进行语音识别+标点修复(四)
终于有时间更新语音识别系列了,之前的几篇: 语音识别系列︱用python进行音频解析(一) 语音识别系列︱paddlehub的开源语音识别模型测试(二) 语音识别系列︱paddlespeech的开源语音识别模型测试(三)
悟乙己
2022/11/18
3.8K0
语音识别系列︱利用达摩院ModelScope进行语音识别+标点修复(四)
全新Mobile-Agent-v2发布,自动化手机操作助手全面升级!
Mobile-Agent 于今年年初发布,凭借强劲的自动化手机操作能力迅速在AI领域和手机制造商中引起广泛关注。短短五个月内,它已经在Github获得了2,000个Star。该系统采用纯视觉方案,通过视觉感知工具和操作工具完成智能体在手机上的操作,无需依赖任何系统级别的UI文件。得益于这种智能体中枢模型的强大,Mobile-Agent实现了即插即用,无需进行额外的训练和探索。
CV君
2024/06/17
6920
全新Mobile-Agent-v2发布,自动化手机操作助手全面升级!
LLM 大模型学习必知必会系列(三):LLM和多模态模型高效推理实践
代码演示:使用 ModelScope NoteBook 完成语言大模型,视觉大模型,音频大模型的推理
汀丶人工智能
2024/05/26
8910
LLM 大模型学习必知必会系列(三):LLM和多模态模型高效推理实践
推荐阅读
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用
3.1K0
LLM 大模型学习必知必会系列(十):基于AgentFabric实现交互式智能体应用,Agent实战
6850
首批开源超300个顶尖模型:这几家中国「AI主力军」,合力打造了一个AI模型社区「魔搭」
1.7K0
LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
1K0
无外网环境部署 AgentFabric 及使用 AgentFabric 构建的 Agent
4860
LLM 大模型学习必知必会系列(一):大模型基础知识篇
3.2K0
使用 modelscope 在离线环境部署模型服务关键点
1.5K0
每周AI论文速递(240715-240719)
830
CLIP不接地气?你需要一个更懂中文的模型
1.5K0
检索增强生成(RAG)实践:基于LlamaIndex和Qwen1.5搭建智能问答系统
4.1K0
初识langchain[1]:Langchain实战教学,利用qwen2.1与GLM-4大模型构建智能解决方案[含Agent、tavily面向AI搜索]
1.5K0
阿里Qwen2正式开源,性能全方位包围Llama-3
4740
Mobile-Agent-v2问世,自动化手机操作能力再上新台阶
2670
Today | 智谱AI Open Day
1570
支付宝被AI调用,一句话运营小红书!国内最大MCP社区来了,开发者狂欢
1380
炼丹炉 | XTuner 大模型单卡低成本微调实战
2880
书生·浦语大模型全链路开源开放体系
1400
语音识别系列︱利用达摩院ModelScope进行语音识别+标点修复(四)
3.8K0
全新Mobile-Agent-v2发布,自动化手机操作助手全面升级!
6920
LLM 大模型学习必知必会系列(三):LLM和多模态模型高效推理实践
8910
相关推荐
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档