据 Siliconangle 报道,OpenAI 正在使用 GPT-4 来解释大型语言模型的行为。目前,该工具远未完成,但该公司已将代码开源并在 GitHub 上提供,供其他人探索和完善。在其研究中,OpenAI 试图使用 GPT-4 理解其前身之一的 GPT-2。
在今日的一篇博文中,OpenAI 解释称,LLMs 有时被说成是类似于一个“黑匣子”。很难理解为什么一个生成式人工智能模型会对某些类型的提示做出这样的反应。其“可解释性研究”的目的是试图更多地了解 LLMs 为什么会有这样的行为。“语言模型已经变得更有能力和更广泛的部署,但我们对它们内部如何工作的理解仍然非常有限,”OpenAI 的研究人员解释说。“例如,可能很难从它们的输出中发现它们是否使用了有偏见的启发式方法或参与欺骗。”
领取专属 10元无门槛券
私享最新 技术干货