据Odaily星球日报消息,7月14日,Meta发布多模态语言模型CM3leon。CM3leon是一种检索增强、基于标记、仅解码器的多模态语言模型,能够生成和填充文本与图像。CM3leon是第一个使用改编自纯文本语言模型的配方进行训练的多模态模型,包括大规模检索增强预训练阶段和第二个多任务监督微调(SFT)阶段。作为一个通用模型,它可以进行文本到图像和图像到文本的生成,能够引入产生高质量输出的独立对比解码方法。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货