前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >NER的过去、现在和未来综述-未来

NER的过去、现在和未来综述-未来

原创
作者头像
百川AI
修改2022-10-08 15:52:39
1.8K1
修改2022-10-08 15:52:39
举报
文章被收录于专栏:我还不懂对话

背景

命名实体识别(NER, Named Entity Recognition),是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。

关于NER的过去、现在可以参考 NER的过去、现在和未来综述-现在 NER的过去、现在和未来综述-过去

本文关于NER未来是在时间点2021以后的一些发展的点

  • Few-show & zero shot。如何通过少样本,甚至零样本能够获得性能不错的模型,例如怎么引入正则表达式的模板、prompt等方式。
  • 融入知识。之前在现在篇已经提到过一些,未来,随着预训练模型越来越大,如果能够将知识从中剥离,使用较小的语言模型来加速训练。然后通过另一些方式来融入知识,例如检索的方式,像DeepMind 的 RETRO 和 OpenAI 的WebGPT
  • 迁移学习。这个可能有点大,怎么利用语言模型学到的知识。为什么人可以识别到其中的实体,凭借的以往经验的迁移,达到举一反三;语法信息(句式等);特定的句式;模仿学习等。
  • 解码方式。个人觉得span、分类、序列标注似乎都并没有完美,span方式没有考虑整体序列标签之间的依赖关系;而分类的话还需要考虑实体长度,实际情况中实体长度可以是任意长度的(讲道理极限情况会存在);序列标注不能很好解决嵌套问题等。目前有一些结合的方法,例如Span+片段排列BIO+分类,但还是有优化空间。

个人观点,仅供参考。

Reference

image.png
image.png

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 背景
  • Reference
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档