J-CRe3是由京都大学等机构构建的,旨在推动现实世界多模态对话理解研究的日语数据集。该数据集涵盖了第一人称与第三人称视角的视频以及真实世界中两人对话的音频记录。这些对话记录了一台机器人如何协助其主人处理日常杂务,任务中包含了对各种物体的操作。共收录了93个不同场景下的对话,包含2,131句对话和11,024秒的视频素材且详细标注了物体和区域的边界框、文本关联、文本与物体的关联。此数据集适用于训练与评估多模态对话系统,尤其针对日语指代消解,为现实世界的指代消解研究提供重要数据支持。
数据集地址:https://www.5radar.com/result?key=J-CRe3
领取专属 10元无门槛券
私享最新 技术干货