近日,多模态人工智能模型基准评测集MMMU发布最新榜单,云知声旗下的山海多模态大模型UniGPT-mMed在激烈竞争中脱颖而出,以强悍的通用能力和医疗专业能力双双夺得榜首,力压包括GPT-4V在内的众多国际知名大模型,充分展示云知声在多模态人工智能领域的强大实力。
MMMU作为国内权威的多模态基准评测,由IN.AI Research等多家知名机构联合构建,旨在全面评估人工智能在解决大学层次多学科问题时的多模态理解与推理能力。此次评测涵盖艺术与设计、商科、科学、健康与医学、人文与社会科学、技术与工程等六大领域,共包含1.15万个精心设计的多模态问题,涉及30个不同科目和183个子领域,问题设置既广泛又深入,对参评大模型提出了极高要求。
MMMU评测的独特性在于其涵盖多种图像格式,从照片、绘画到图表、表格等,全面测试了大模型的感知能力。同时,评测要求AI模型能够将图像和文本信息有效结合,进行深入理解和复杂推理,这对模型的综合分析和应用能力提出严峻挑战。云知声的山海多模态大模型UniGPT-mMed在本次评测中表现出色,以总分57的优异成绩荣登榜首。特别是在健康与医学细分赛道上,UniGPT-mMed更是超越了GPT-4V等强劲对手,夺得第一,体现了其在医疗专业能力上的强悍实力。
UniGPT-mMed是云知声基于山海大模型底座精心打造的多模态大模型。通过精细化数据处理技术和多模态分析技术,UniGPT-mMed构建起一个包含数亿条高质量图文问答的数据集,为用户提供更加丰富、准确和可靠的信息检索和问答服务。此次荣登MMMU评测榜首,是云知声在多模态大模型领域持续深耕、不断创新的又一重要成果。
作为中国AI独角兽企业,云知声一直致力于推动大模型技术在多领域场景下的广泛应用。山海大模型作为云知声的核心技术底座,具备强大的通用能力和行业落地能力,能够满足更多场景的应用需求。目前,山海大模型已在多个权威评测中取得优异成绩,稳居国内大模型第一梯队。
此次荣登MMMU评测榜首,既是对云知声山海多模态大模型实力的充分认可,也继续激励云知声加大技术创新力度,不断迭代多模态大模型技术底座,推动大模型技术在更多领域实现广泛应用,为各行各业带来更多智能化变革。
领取专属 10元无门槛券
私享最新 技术干货