首页
学习
活动
专区
圈层
工具
发布
首页标签自然语言处理

#自然语言处理

自然语言处理(Natural Language Processing,简称NLP)是一种人工智能技术,它是指让计算机能够理解、处理和生成自然语言的能力

使用spaCy进行命名实体识别技术解析

用户11764306

在本视频系列中,数据科学讲师Vincent Warmerdam开始使用spaCy——一个用于Python自然语言处理的开源库。他的任务是构建一个系统,用于自动检...

4210

生成式人工智能驱动的钓鱼邮件攻击效能研究:语言特征演化与防御范式转型

草竹道人

中国互联网络信息中心 | 工程师 (已认证)

随着生成式人工智能技术的快速发展,其在社会工程学攻击中的滥用风险日益凸显。本文基于一项实证研究,系统分析主流大语言模型在生成高诱骗性钓鱼邮件方面的实际能力,评估...

5210

Python实现网页高频词提取

用户2423478

6410

Python从零基于词向量实现词语相似度计算

用户2423478

gensim是一个专注于无监督主题建模和自然语言处理的Python库,由Radim于2009年创建,专为处理大规模文本数据集而设计,具有内存效率高、可扩展性强的...

9010

Python文本特征提取(TF-IDF)

用户2423478

TF-IDF (Term Frequency-Inverse Document Frequency) 是一种统计方法,用于评估一个词对一个文档集或语料库中的某一...

6010

Python从零实现文本特征提取(词袋模型)

用户2423478

sklearn.feature_extraction.text 是 scikit-learn 库中专门用于文本特征提取的核心模块,它提供了一系列工具将原始文本数...

8910

信息抽取管道构建实用技巧

用户11764306

3210

实体链接技术突破:高效连接文本与知识库

用户11764306

实体链接是自然语言处理应用中的常见第一步,包括问答、信息提取和自然语言理解。它对于连接非结构化文本与知识库至关重要,使得能够访问大量经过整理的数据。

8110

让Transformer关注词序的新位置编码方法

用户11764306

Transformer是一种神经网络架构,因其能够识别长距离依赖关系而在自然语言处理任务中表现出色。例如,在一个包含"rented"单词的句子中,即使"rent...

9010

使用spaCy检测编程语言的NLP评估方法

用户11764306

在这个视频系列中,数据科学讲师Vincent Warmerdam开始使用spaCy——一个用于Python自然语言处理的开源库。他的任务是构建一个系统,用于自动...

7210

使用spaCy处理PDF和Word文档的技术指南

用户11764306

该插件与Docling集成,将PDF、Word文档和其他输入格式的结构化处理引入spaCy管道。它输出清洁的结构化数据,创建spaCy的Doc对象,可访问带标签...

8710

知识图谱问答新方法:联合实体识别与交集操作

用户11764306

问答系统是自然语言处理中的热门任务,模型需要回答诸如"蒙娜丽莎在哪个城市?"之类的问题。传统方法使用知识图谱存储结构化世界知识,但需要分别训练语义解析和实体识别...

8010

Prodigy-HF与Hugging Face集成技术解析

用户11764306

Prodigy是由某机构开发的标注工具,该公司以创建spaCy而闻名。这是一个完全可脚本化的产品,拥有庞大的社区。该产品具有许多功能,包括与spaCy的紧密集成...

8010

社交机器人挑战赛冠军揭晓与对话AI技术突破

用户11764306

加州大学圣塔芭芭拉分校(UCSB)团队荣获第五届Alexa Prize社交机器人挑战赛(SGC5)总冠军。此外,斯坦福大学团队获得科学创新一等奖——这是SGC5...

6010

机器推理面临的三大技术挑战

用户11764306

将自然语言转换为结构化语言、定义真理以及实现确定性推理仍然是自动推理领域的核心议题,但某机构新的自动推理检查功能有助于解决所有这些挑战。

6810

新版发布:Falcon支持与后端架构重构

用户11764306

新增:重构为从后端中心转向模型中心架构。注意:此为破坏性变更,需要调整配置文件 (#176)

6810

知识图谱加速COVID-19科研突破

用户11764306

知识图谱通过节点和边的网络结构组织信息,使其更易于探索和分析。在COVID-19知识图谱(CKG)中,节点代表实体,边表示实体间的关系。该图谱基于COVID-1...

7710

电子健康记录中神经症状标注的一致性研究

用户11764306

从电子健康记录中提取以自由文本记录的患者体征和症状对精准医学至关重要。一旦提取,体征和症状可以通过映射到本体论中的概念而变得可计算。从自由文本中提取体征和症状既...

11210
领券