前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >艾伦人工智能研究院推出PyTorch上的NLP库 | 附paper+demo

艾伦人工智能研究院推出PyTorch上的NLP库 | 附paper+demo

作者头像
量子位
发布2018-03-27 14:58:17
1K0
发布2018-03-27 14:58:17
举报
文章被收录于专栏:量子位
李林 编译整理 量子位 出品 | 公众号 QbitAI

微软联合创始人保罗·艾伦建立的艾伦人工智能研究院(AI2)今天发布了一个PyTorch上的开源自然语言处理(NLP)研究库:AllenNLP。

这个库提供灵活的数据API,能实现智能的batching和padding,对文本处理中的常见操作进行高层抽象,还提供了一个模块化、可扩展的实验框架。

AllenNLP包含3个模型:机器理解、语义角色标注和文本蕴含。

其中,机器阅读理解(MC)模型能够从一段文本中选择一段,来回答自然语言问题。AllenNLP中的MC模型是Seo et al, 2017论文提出的BiDAF(双向注意流)的实现。AllenNLP的BiDAF模型在SQuAD数据集上测试的EM成绩是68.7,略好于原始BiDAF模型的67.7分,训练速度也是原来的10倍。

语义角色标注(SRL)模型能从一个句子中还原出它的潜在谓词参数结构,还能为回答“谁”对“谁”做了“什么”这类关于句子含义的基本问题而建立表示。AllenNLP的SRL模型是He et al, 2017论文提出的deep BiLSTM的实现,性能与原文的模型相当,在CoNLL 2012上的F1得分为78.9。

当处理一对句子的时候,文本蕴含(TE)模型能预测第一个句子中的事实是否隐含了第二个句子中的事实。AllenNLP的TE模型是Parikh et al, 2017论文中可分解注意模型的实现,在SNLI数据集上达到了84.7的准确率,接近原始模型86.3%的成绩。

AllenNLP由AI2与华盛顿大学等高校的研究者合作开发和维护。

关于这个库的更多信息,以及文中提到的3个模型,见以下链接:

AllenNLP主页:http://allennlp.org/

论文:http://allennlp.org/papers/AllenNLP_white_paper.pdf

GitHub地址:https://github.com/allenai/allennlp

Demo:http://demo.allennlp.org/

安装指南:http://allennlp.org/tutorials/installation

机器阅读理解模型 - BiDAF (Seo et al, 2017): https://www.semanticscholar.org/paper/Bidirectional-Attention-Flow-for-Machine-Comprehen-Seo-Kembhavi/007ab5528b3bd310a80d553cccad4b78dc496b02

语义角色标注模型 - deep BiLSTM model (He et al, 2017): https://homes.cs.washington.edu/~luheng/files/acl2017_hllz.pdf

文本蕴含模型 - 可分解注意模型(Parikh et al, 2017): https://www.semanticscholar.org/paper/A-Decomposable-Attention-Model-for-Natural-Languag-Parikh-T%C3%A4ckstr%C3%B6m/07a9478e87a8304fc3267fa16e83e9f3bbd98b27

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-09-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 李林 编译整理 量子位 出品 | 公众号 QbitAI
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档