在学习试验期间,策略空间受到限制,使得代理不能提供口头报告或观察纠正性反馈(即,它所能做的只是在其初始状态下“保持静止”并观察所呈现的特征模式)。...这允许代理以无人监督的方式学习概念(即,不被告知真实状态是什么或者它是正确的还是不正确的)。在学习之后,主动报告被启用, 并且 C 矩阵被设置为使代理更喜欢报告正确的信念。...我们定义了代理的偏好,使得它更喜欢正确地报告特定类别的知识,而反对不正确的报告。这确保了它只报告鸟和鱼的一般类别,除非对更具体的类别有足够的把握。...我们确认,如果代理已经开始完全了解动物概念(即,完全精确的 A 矩阵),它将100%正确地报告特定类别。...为了做到这一点,我们改变了模型,使它不再报告它所看到的,而是必须回答一个依赖于从特定跨类别特征组合中归纳出来的问题。具体来说,模型被展示给特定的动物,并被问到:“这能从远处看到吗?”