据品玩 11 月 9 日报道,Arxiv 页面显示,南洋理工大学研究团队近日发布了一款名为 OtterHD-8B 的多模态模型,专用于高分辨率视觉输入。研究团队表示,OtterHD-8B 由 Fuyu-8B 演变而来,具有处理灵活输入维度的能力,确保了其在各种推理需求中的多功能性。
研究显示,OtterHD-8B,在直接处理高分辨率内容输入时,其性能优于其同类模型。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货