腾讯云智能数智人形象录制指引-交互场景

交互数智人与播报数智人的拍摄在结构与要求上有所不同，在交互场景中，为模拟真实的倾听与回应过程，数字人需具备两种动作结构：一是在“听”的状态下，保持自然、安静的静默姿态；二是在“表达”时，呈现贴合对话内容的表情与肢体动作。
因此，录制视频素材的核心在于围绕“交互动作”与“静默片段”进行循环录制。
﻿
一、专属/高精口型
交互数智人：视频素材由两部分构成：
第一部分为播报态，主要用于数智人口型的训练。
第二部分由“交互动作”与“静默片段”循环组成，用于实际交互场景。
﻿
播报态：本片段用于数智人口型训练，对手部动作无要求，可参考 形象录制指引-播报场景。
交互动作：本片段用于数智人交互场景中的问答环节，回复时会配合相应的手势动作，使对话更自然生动。
模特可做一些通用、中性的手部动作（如轻摊手掌、自然比划），单个动作时长不超过3秒，做完后尽快归位。示意图如下：
禁止使用指向性手势（如指人、比数字）或组合手势。
如果选择不做任何动作，则最终数智人也会保持无手势状态。
﻿
静默片段：本片段用于数智人交互场景中的待机、倾听等待状态，在用户未提问或聆听用户提问时播放使用。
模特手部自然放置（如在小腹前或自然下垂），面带微笑自然放松。示意图如下：
心里可默数5-8秒，保持自然呼吸，避免身体僵硬、表情呆板或头部动作频繁/幅度过大。
﻿
录制 Demo 参考视频如下：
﻿
﻿
﻿
二、通用口型
通用口型与专属口型相比，仅需录制“交互动作”与“静默片段”即可。
因通用口型无需对本人唇齿进行训练，故无需录制播报态，其余内容可参照专属口型执行。
﻿
﻿
﻿
形象录制指引-交互场景

本页目录：

一、专属/高精口型

二、通用口型