IT之家 10 月 30 日消息,昆仑万维今日宣布开源百亿级大语言模型「天工」Skywork-13B 系列,并配套开源了 600GB、150B Tokens 开源中文数据集。
昆仑万维「天工」Skywork-13B 系列目前包括 130 亿参数的两大模型:Skywork-13B-Base 模型、Skywork-13B-Math 模型,IT之家附开源地址如下:
Skywork-13B 下载地址(Model Scope):https://modelscope.cn/organization/skywork
Skywork-13B 下载地址(Github):https://github.com/SkyworkAI/Skywork
除模型开源外,Skywork-13B 系列大模型还将开源 600GB、150B Tokens 的中文语料数据集 Skypile/Chinese-Web-Text-150B,号称是目前最大的开源中文数据集之一。
同时,昆仑万维「天工」Skywork-13B 系列大模型即将全面开放商用 —— 开发者无需申请,即可商用。
据介绍,本次开源的 Skywork-13B 系列模型在 CEVAL、CMMLU、MMLU、GSM8K 等几大评估基准中超越 LLaMA2-13B 等开源大模型(截至 10 月 25 日数据)。
在中文文本创作领域的评测中,Skywork-13B 系列大模型的成绩如下,在科技、金融、政务、企业服务、文创、游戏等领域表现不错。
领取专属 10元无门槛券
私享最新 技术干货