话术管理模块可以基于数智人播报的内容(即话术),来配置数智人动作、语音、UI交互等各种配置。目前支持三类对话服务:
使用腾讯行业大模型(即大模型知识引擎)
使用云小微对话服务
使用其他对话服务(即数智人仅支持驱动服务,不含NLP服务)
以下将分别展开讲解相应的操作指引。
1. 话术管理-使用腾讯行业大模型(即大模型知识引擎)
使用腾讯行业大模型对话服务支持按场景指令配置话术。根据您的应用需求在此自定义场景,并配置各场景对应的指令、数智人动作&语音、特殊交互样式,配置内容将通过交互服务下发到应用端。
1.1 话术配置
添加话术
编辑问题以及相应答案,答案会自动同步至话术部分,可在话术编辑窗进行停顿/连续/动作等相应文本设置
预览:点击后出现预览窗口,可以查看为答案配置话术的播报效果。
注意:
1. 创建项目时若在对话文本模型创建方式选择了“输入appkey”绑定,则只有大模型应用调用权限、无编辑权限,即不可在数智人平台上被授权托管使用话术配置;
2. 话术自动同步答案文本,在话术编辑窗不可进行文本修改,仅可编辑数智人动作、发音等;
导入与导出
导入:可进行问答批量导入,下载模板填写完成后进行上传,单次仅允许上传单个文件,添加后可在列表查看,列表页入库方式显示为手动添加
导出:会以 xlsx 文件的形式导出,支持列表选择后批量导出以及全部导出
1.2 对话管理(直接创建大模型应用或绑定已有大模型应用可用)
能够进行文档的导入以及相应对话的测试;
若选择使用 appkey 绑定则可以查看相应大模型应用中已经配置好的部分,但无法进行新增/导入等编辑功能;
1.3 按场景指令配置列表页
根据应用需求在此自定义场景,并配置各场景对应的指令、数智人动作&语音、特殊交互样式,配置内容将通过交互服务下发到应用端。
1.4 动作标签使用说明
对于带动作的数智人,支持动作编辑能力。可以通过在文本中插入该形象对应的动作标签,从而可实现在播报对应位置内容时展现指定的动作。以下为插入动作的多种方法;
在话术配置页面的编辑话术部分进行【智能动作】自动识别段落文字并插入智能动作
在话术管理页面的“动作&语音配置”部分进行可视化的动作插入
在请求的话术中,人工增加动作标签,实现数智人的动作效果。
动作标签生效语法:<insert-action type="动作标签英文"/>
语法案例:你好,我是由人工智能驱动的数智人<insert-action type="waving_hand"/>,很高兴见到大家!我能像真人一样与人互动沟通,希望大家喜欢我。我模拟人类<insert-action type="sorry"/>说话时的声音、嘴唇动作和表情,并且将三者自然匹配,与真人几乎一致。
插入动作标签的注意事项:
由于单个动作时长3~5s,其中动作预计占2s左右,动作前后各有1s左右的过渡时间,因此动作前后需要预留相应时长的文字,才能保证动作的完整性。
注意:
在话术管理页面插入动作时,会实时请求tts,根据音色、语速计算预留文字的时长,从而判断能否插入动作。根据不同的音色、语速,预留的字数不同,一般来说:
1. 第1个动作前面、最后1个动作后,需有15个字。
2. 2个动作间,间隔30个字。
1.5 互动调优
可以在互动界面中输入问题验证效果,并且标记当前问答,稍后下载处理问答表导入大模型平台编辑问答文本。
2. 话术管理-使用云小微对话服务
当“使用云小微对话服务”时,在apaas实时调用过程中,如果遇到话术管理里不存在的话术,自动添加到话术管理中。
当“使用其他问答库对话服务”时,可通过接口里的入参(EnhanceText)来控制是否使用话术管理页面。
枚举值是:
➢ 0;为该参数的默认值,即不使用话术管理模块。
➢ 1;使用话术管理模块。
下图是交互数智人服务的整个调用流程,其中话术管理页面的作用见下图箭头处:
2.1 话术管理列表页
话术管理列表页的主要功能项包括:
添加回复语:支持人工添加,可单个输入、批量导入;支持自动添加,在数智人实时调用过程中,自动将新的话术自动入库。
话术管理列表页各个字段的含义:
入库方式:包含 手工添加、自动添加两种情况。
a.手工添加:即用户在该页面手工逐条或批量添加。
b.自动添加:指的是实时调用过程中,如果遇到话术管理里不存在的话术,自动添加到话术管理中。
回复语类型: 对于“使用云小微对话服务”来说,枚举值是对话服务里该话术的具体类型:包含闲聊、知识问答、任务型、其他。(对于“使用其他问答库对话服务”来说,取值默认为“其他”)
累计调用次数:即该话术被实际调用(即被数智人播报)的次数。
渲染情况:
a.如果该话术有预渲染的视频,则显示蓝色字体的“详情”,可以点击查看,交互同“预览”页面。
b.如果该话术没有预渲染,则显示黑色字体的“未渲染”,不能点击。
2.2 话术管理编辑页
配置回复语:
a) 当前内容来源:对应“云小微对话服务”里的回复语类型,包含“寒暄库”“问答知识库”“场景化问答”。
b) 数智人回复语:
内容来源 | 对应内容 |
寒暄库 | 能通过模糊搜索,拉取寒暄库里的“自定义寒暄”里配置的答案 |
问答知识库 | 能通过模糊搜索,拉取“问答知识库”里配置的答案 |
场景化问答 | 能通过模糊搜索,拉取“场景化问答”里配置的答案 |
动作&语音配置
支持对回复语进行语音、动作标注,可进行实时的效果预览。
UI交互配置
支持对回复语配置一些UI样式标注,选择题、图片等特殊的样式。这些配置需要业务系统读取这里的配置进行差异化的呈现.
下图是在小程序扫码体验时,选择题、图片和视频的效果。
2.3 按场景指令配置列表页
根据应用需求在此自定义场景,并配置各场景对应的指令、数智人动作&语音、特殊交互样式,配置内容将通过交互服务下发到应用端。