据艾伦AI研究所(AI2)官方博客,8月19日,艾伦AI研究所发布了包含3万亿个token(词例)的开放语料库。据悉,这些语料来自各种网络内容、学术出版物、代码、书籍和百科全书等材料,是迄今为止最大的开放文本数据集。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货