首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >2020年NLP技术进展与工具发布回顾

2020年NLP技术进展与工具发布回顾

原创
作者头像
用户11764306
发布2025-08-19 09:18:23
发布2025-08-19 09:18:23
1940
举报

一月

🔮 1月28日:发布Thinc v8.0 alpha版本,这是一个轻量级深度学习库,提供基于类型检查的函数式编程API,支持与PyTorch、TensorFlow等框架的层组合,专为spaCy v3.0的新工作流重构。

二月

🎤 2月8日:在PyCon Colombia大会上分享《Python中NLP的未来》,探讨如何通过NLP技术进步缩小原型与生产环境的差距。

📺 同日接受访谈,讨论spaCy发展历程及NLP入门方法。

三月

📺 3月2日:发布《spaCy NLP入门》新章节,演示如何训练编程语言识别NER模型。

📺 3月16日:发布端到端视频教程,展示使用Prodigy工具通过半自动标注和迁移学习训练实体识别模型。

💻 3月20日:开源Typer库,基于Python类型提示构建现代化CLI工具。

📺 3月24日:演示Prodigy自定义图像标注流程及PyTorch模型集成。

四月

🏫 4月21日:发布德语版spaCy免费课程《Modernes NLP mit spaCy》。

五月

🏫 5月6日/11日:相继发布日语、西班牙语版spaCy课程。

📺 5月7日:发布实体链接模型训练教程,涵盖知识库消歧与数据创建。

六月

💫 6月16日:

  • 发布spaCy v2.3,新增中文等5种语言管道,优化15个模型家族的词向量与加载效率
  • Prodigy v1.10.0支持依赖关系标注、音视频标注及改进的图像标注界面undefined📺 发布新功能演示视频,涵盖生物医学事件抽取等场景

十月

💫 10月15日:发布spaCy v3.0 nightly版本,核心升级包括:

  • 基于transformer的SOTA精度管道
  • 支持多任务学习共享transformer
  • 可配置的PyTorch/TensorFlow模型集成
  • 通过spaCy projects实现端到端工作流定义

十一月

📻 11月4日:探讨构建健壮NLP应用的方法论。

技术亮点

  1. 架构革新:spaCy v3.0引入transformer管道与多框架模型支持
  2. 工具链完善:Thinc提供跨框架模型组合能力,Prodigy增强多模态标注
  3. 开发者生态:多语言课程、社区讨论板与可视化工具(spacy-streamlit)建设

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一月
  • 二月
  • 三月
  • 四月
  • 五月
  • 六月
  • 十月
  • 十一月
  • 技术亮点
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档