据站长之家 11 月 14 日报道,澳大利亚麦考瑞大学的信息技术法学教授 Rita Matulionyte 在《对话》杂志的一篇文章中指出,AI 研究人员近一年来一直在敲响数据供应告急的警钟。根据去年 Epoch AI 人工智能预测组织的一项研究,AI 公司可能在 2026 年前耗尽高质量文本训练数据,而低质量文本和图像数据的枯竭时间可能介于 2030 年至 2060 年之间。
对于数据饥渴的 AI 公司来说,使用由 AI 模型生成的合成数据进行训练可能并非可行的解决方案。研究表明,训练 AI 模型使用 AI 生成的内容可能导致模型内在的畸形效应,使输出变得混乱和怪异。面对这一潜在问题,除非出现大规模人类内容农场,否则解决方法可能在于建立数据合作伙伴关系。这意味着拥有丰富高质量数据的公司或机构与 AI 公司达成协议,交换数据以换取资金。
领取专属 10元无门槛券
私享最新 技术干货