IT之家 1 月 29 日消息,大型语言模型(LLM)的使用正在激增,尤其是 ChatGPT 最近非常火爆,然而由于其太过强大,甚至可以为学生生成论文。正因为如此,现在需要有检测机器生成的文本的系统。
最近,斯坦福大学的一个研究小组提出了一种名为 DetectGPT 的新方法,旨在成为打击高等教育中机器生成文本的首批工具之一。该方法基于的原理是:由 LLM 生成的文本通常在模型的对数概率函数的负曲率区域的特定区域徘徊。通过这个发现,该团队开发了一种新的指标,用于判断文本是否是机器生成的,并且不需要训练人工智能或收集大型数据集来比较文本。
这种方法被称为“零次学习(zero-shot)”,允许 DetectGPT 检测机器写的文本,而不需要了解用于生成文本的是什么人工智能工具。它的操作与其他需要训练“分类器”和真实及生成段落数据集的方法形成鲜明对比。
IT之家了解到,该团队在假新闻文章的数据集上测试了 DetectGPT,它在检测机器生成的文本方面的表现优于其他零次学习方法。该团队声称检测性能有了实质性的提高,并表明 DetectGPT 可能是一种有前途的方法,可以仔细检查机器生成的文本。
总之,DetectGPT 是一种检测机器生成的文本的新方法,它利用了 LLM 生成的文本的独特特征。它是一种不需要任何额外数据或训练的零次学习方法,使其成为识别机器生成的文本的高效和有效工具。随着 LLM 的使用继续增长,检测机器生成的文本的相应系统的重要性将变得越来越关键。DetectGPT 是一种很有前途的方法,可以在许多领域产生重大影响,它的进一步发展可能对许多领域都有利。
领取专属 10元无门槛券
私享最新 技术干货