近日,人民网·人民数据针对AI市场提供的语义语料数据库正式面向市场提供服务。
今年以来,AI大模型迎来高热度,对经济社会发展产生深远影响,也面临着复杂挑战。当前,AI发展所需要的语料数据仍不充足,且获取成本往往较高,数据多为“小样本”,数据量也无法满足AI深度学习的要求。
为促进AI大模型的深入发展,基于人民日报及人民网的媒体资源优势,人民数据打造了新闻数据、问答数据等语义语料库,相关数据量达到了近3亿条。
该语义语料库面向人工智能大模型、通用人工智能、智能互联网等应用场景,提供高质量的语料生产、定制、供给服务,是支持人工智能行业安全可持续发展的刚需、急需资源库、种子库、基因库。
针对当前大模型普遍回答不了、回答不好却又必须直面、不容回避的重大问题、敏感问题、疑难问题、复杂问题,该语义语料库梳理了1万余个重点问题,并精心编撰建成优质问答语料库,助力解决大模型在语料方面的刚性需求、紧急需求、安全需求。
祁海峰
人民数据总经理助理
领取专属 10元无门槛券
私享最新 技术干货