据 IT 之家 6 月 14 日消息,有研究团队对用 AI 生成的结果来训练 AI 的“套娃式训练”进行了观察记录,结果显示,“在训练中使用模型生成的内容,将导致后续生成的模型出现不可逆转的缺陷”。论文的主要作者之一 Ilia Shumailov 同时表示“随着时间的推移,生成数据中的错误会迫使 AI 进一步错误地感知现实,我们惊讶地观察到模型崩溃发生的速度相当快,模型可以迅速忘记他们最初从中学习的大部分原始数据。”
此外,如果将 AI 生成的结果经过人工润色后再投入模型训练,也无法避免模型“退化”。对于任何大模型而言,由于其学习数据过多,它们都将不可避免地接触到其他 AI 生成的数据,因此研究人员表示“应当引入 AI 鉴定来挑出可能存在错误的学习数据”以提升模型的学习能力与准确性。
领取专属 10元无门槛券
私享最新 技术干货