形象录制指引-交互场景

最近更新时间:2026-03-27 16:13:11

我的收藏
交互数智人播报数智人的拍摄在结构与要求上有所不同,在交互场景中,为模拟真实的倾听与回应过程,数字人需具备两种动作结构:一是在“听”的状态下,保持自然、安静的静默姿态;二是在“表达”时,呈现贴合对话内容的表情与肢体动作。
因此,录制视频素材的核心在于围绕“交互动作”与“静默片段”进行循环录制。


一、专属/高精口型

交互数智人:视频素材由两部分构成:
第一部分为播报态,主要用于数智人口型的训练。
第二部分由“交互动作”与“静默片段”循环组成,用于实际交互场景。

播报态:本片段用于数智人口型训练,对手部动作无要求,可参考 形象录制指引-播报场景
交互动作:本片段用于数智人交互场景中的问答环节,回复时会配合相应的手势动作,使对话更自然生动。
模特可做一些通用、中性的手部动作(如轻摊手掌、自然比划),单个动作时长不超过3秒,做完后尽快归位。示意图如下:
禁止使用指向性手势(如指人、比数字)或组合手势。
如果选择不做任何动作,则最终数智人也会保持无手势状态。

静默片段:本片段用于数智人交互场景中的待机、倾听等待状态,在用户未提问或聆听用户提问时播放使用。
模特手部自然放置(如在小腹前或自然下垂),面带微笑自然放松。示意图如下:
心里可默数5-8秒,保持自然呼吸,避免身体僵硬、表情呆板或头部动作频繁/幅度过大。

录制 Demo 参考视频如下:




二、通用口型

通用口型与专属口型相比,仅需录制“交互动作”与“静默片段”即可。
因通用口型无需对本人唇齿进行训练,故无需录制播报态,其余内容可参照专属口型执行。