据站长之家 12 月 9 日报道, 华中科技大学与金山软件联合推出并开源了一个高性能多模态大模型“Monkey”,通过提高输入分辨率和引入多级描述生成方法,解决了现有模型在复杂场景和视觉细节处理方面的挑战。Monkey 可以基于现有视觉编辑器进行构建,无需从 0 预训练,可以基于现有视觉编辑器进行构建,将大模型的输入分辨率能力提高到 896 x1344 像素。
此外,Monkey 采用多级描述生成方法,可以为模型提供丰富的上下文信息,以指导模型学习场景和对象之间的关联。
领取专属 10元无门槛券
私享最新 技术干货