首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >chatgpt实现NLP基本任务(实体识别、关系抽取、属性抽取、事件抽取、文本分类)

chatgpt实现NLP基本任务(实体识别、关系抽取、属性抽取、事件抽取、文本分类)

作者头像
机器学习AI算法工程
发布于 2024-04-25 08:30:34
发布于 2024-04-25 08:30:34
4320
举报

向AI转型的程序员都关注了这个号👇👇👇

基础函数

一、实体识别

抽取文本:

驻港部队从1993年初开始组建,1996年1月28日组建完毕,1997年7月1日0时进驻香港,取代驻港英军接管香港防务,驻港军费均由中央人民政府负担。《中华人民共和国香港特别行政区驻军法》规定了驻香港部队的职责为防备和抵抗侵略,保卫香港特别行政区的安全以及在特别时期(战争状态、香港进入紧急状态时 )根据中央人民政府决定在香港特别行政区实施的全国性法律的规定履行职责。

代码:

结果:

驻港部队:组织机构

1993年初:时间

1996年1月28日:时间

1997年7月1日0时:时间

香港:地点

驻港英军:组织机构

中央人民政府:组织机构

中华人民共和国香港特别行政区驻军法:组织机构

防备和抵抗侵略:组织机构

保卫香港特别行政区的安全:组织机构

特别时期:时间

战争状态:时间

香港进入紧急状态时:时间

中央人民政府决定:组织机构

香港特别行政区:地点

全国性法律:组织机构

二、关系抽取

抽取文本:

糖尿病是一种常见的慢性疾病,主要症状包括多饮、多尿、乏力、体重下降等。发病人群通常是肥胖、家族病史、不良饮食习惯等高风险人群。治疗方法主要包括定期血糖检测、饮食控制、锻炼、药物治疗和胰岛素注射。治愈周期因不同患者而异,但坚持正确的治疗和生活方式改变,能有效控制病情、预防并发症的发生。

代码:

结果:

糖尿病-症状-多饮

糖尿病-症状-多尿

糖尿病-症状-乏力

糖尿病-症状-体重下降

糖尿病-发病人群-肥胖

糖尿病-发病人群-家族病史

糖尿病-发病人群-不良饮食习惯

糖尿病-治疗方法-定期血糖检测

糖尿病-治疗方法-饮食控制

糖尿病-治疗方法-锻炼

糖尿病-治疗方法-药物治疗

糖尿病-治疗方法-胰岛素注射

糖尿病-治愈周期-因不同患者而异

糖尿病-治愈周期-坚持正确的治疗和生活方式改变

三、属性抽取

抽取文本:

该款智能手机搭载高通骁龙处理器,内置5000mAh电池,支持快充功能,采用6.5英寸全高清显示屏,照方面具备6400万像素后置摄像头和1600万素前置摄像头。操作系统为Android 11,存储容量64GB,可扩展至512GB。

代码:

结果:

处理器-高通骁龙处理器

电池容量-5000mAh

功能-快充功能

屏幕尺寸-6.5英寸

分辨率-全高清

后置摄像头像素-6400万像素

前置摄像头像素-1600万像素

操作系统-Android 11

存储容量-64GB

四、事件抽取

抽取文本:

当地时间7月5日,俄罗斯铁路公司发布消息表示,俄罗斯铁路网站和移动应用程序遭受大规模黑客攻击。

代码:

结果:

事件类型:黑客攻击

事件论元:

时间-当地时间7月5日

地点-俄罗斯

事件主体-俄罗斯铁路公司

事件客体-俄罗斯铁路网站和移动应用程序

造成影响-大规模黑客攻击

五、文本分类

抽取文本:

中国国家女子足球队将于7月7日从广州出发,飞赴澳大利亚阿德莱德队伍大本营,踏上2023年女足世界杯之旅。抵达澳大利亚之后,队伍还计划于13日和17日分别与巴西国家女子足球队和哥伦比亚国家女子足球队进行热身赛。

代码:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习AI算法工程 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
辞旧迎新,胖了几斤?数据告诉你,这种东西你就不该吃
导读:辞旧迎新,胖了几斤?年夜饭都吃了啥?除了大餐里的各种硬菜,手边是不是还有取之不尽的零食?肥宅快乐水之类的含糖饮料,是不是又喝多了?
IT阅读排行榜
2019/03/04
4800
辞旧迎新,胖了几斤?数据告诉你,这种东西你就不该吃
基因检测和健康保险,慢病管理上下游的掘金者
作者: 张远 孙骋 转自:钛媒体 摘要: App是慢病管理最快捷的入口,因为慢病患者的用户黏度高、日活跃度高,流量有很强的变现渠道。 前一阵沸沸扬扬的百度卖吧风波让“病友群体”这一互联网上不容小觑的人群走入人们的视线。当贴吧中空降的“三无吧主”身份越来越可疑、社区内的资源信息越来越真假难辨时,开辟在贴吧之外新的根据地就成了病友们的当务之急。 令人欣慰的是,糖尿病这样的“大众病”、慢性病病友们已经形成了多个交流圈。在App Store里搜索糖尿病,你可以发现几十个糖尿病社区。在其中,病友们不仅可以交流病情、求
大数据文摘
2018/05/22
7330
数据分类分级 数据识别-实现部分敏感数据识别
通过内置数据识别规则或用户数据识别规则,对其结构化表进行整体扫描,自动识别敏感数据,进行分级
鲲志说
2025/04/07
1240
数据分类分级 数据识别-实现部分敏感数据识别
中国医疗大数据发布!怎样推翻你身上的“三座大山”?
点击标题下「大数据文摘」可快捷关注 导读:近日德勤咨询发布了《2020年健康医疗预测报告》,其中中国的医疗健康状况大数据让人触目惊心。面对压在中国居民身上的三座“健康大山”,用户究竟该如何翻山越岭,医疗服务究竟该如何颠覆,才可以让我们彻底地成为身体的主人?本文给出了一一解读。 近日,国际知名的咨询公司德勤咨询发布了《2020年健康医疗预测报告》,这其中也反映了中国人群的医疗大数据。 在总人口为13亿多的中国人中,中国高血压人口有1.6~1.7亿人,高血脂的有将1亿多人,糖尿病患者达到9240万人,超重或者
大数据文摘
2018/05/23
7510
肺癌:早期治疗快过感冒?是真的!
根据国家癌症中心最新发布的《2015年中国恶性肿瘤流行情况分析》,肺癌高居恶性肿瘤发病率榜首,在392.9万例新发恶性肿瘤病例中,约有1/5都是肺癌患者(全球发病率为11.6%,死亡率18.4%)。肺癌多发生于40岁以后,高峰发病年龄在70~79岁之间。男性多于女性,在我国男、女性比例为2.13:1。但是,胸外科大咖何建行却表示肺癌并不可怕,关键是要早期发现,做好这些事,治愈早期肺癌甚至快过感冒!(本文综合整理自南山呼吸公众号——钟南山院士团队的科普公众号)
芒果先生聊生信
2020/08/05
6970
PaddleNLP通用信息抽取技术产业应用实例
每天给你送来NLP技术干货! ---- 写在前面 我们在《大一统信息抽取技术,PaddleNLP绝了》中介绍了 PaddleNLP安装及安装过程中的问题解决,也小试了一把 PaddleNLP,当时就惊叹了 PaddleNLP 的能力。今天我们就一起来通过这篇更详尽的文章继续了解强大的 PaddleNLP 。 0. PaddleNLP 一键预测能力 Taskflow API之三大特性 功能全面 全场景支持:覆盖NLU和NLG领域十一大经典任务。 文档级输入:支持文档级输入,解决预训练模型对输入文本的长度限
zenRRan
2022/09/20
1.2K0
PaddleNLP通用信息抽取技术产业应用实例
世界旅游联盟吁全球旅游业界共克时艰
近日,随着新型冠状病毒引发的肺炎疫情蔓延,引发了世界关注。世界旅游联盟本着服务联盟会员的宗旨,发布了致会员的一封信,多角度、全方位的整理了有关疫情的信息。 世界旅游联盟在信中表示,疫情是一时的,而合作是长久的。面对公共卫生危机,希望全球业界和中国旅游人一道,团结合作,共克时艰,早日打赢这场疫情防控阻击战。 全文如下: 中国,此时此刻 尊敬的联盟会员: 受到新型冠状病毒感染肺炎疫情的影响,世界旅游联盟不得不取消了2020年第一季度计划举办的几场会员活动。此刻的您也许和我们一样密切关注着疫情的发
腾讯文旅
2020/06/17
5930
NLP标记集资料
title: 标记集 tags: grammar_cjkRuby: true ---
JadePeng
2019/06/13
7840
搞定实体识别、关系抽取、事件抽取,我用指针网络
代码地址:https://github.com/taishan1994/PointerNet_Chinese_Information_Extraction
西西嘛呦
2022/12/07
1.7K0
搞定实体识别、关系抽取、事件抽取,我用指针网络
CNCC | 深度学习如何“助攻”医学影像?我们来听听学界大拿的解释
AI 科技评论消息, 10 月 26 日上午 8:30 分,由中国计算机学会(CCF)主办,福州市人民政府、福州大学承办,福建师范大学、福建工程学院协办的 2017 中国计算机大会(CNCC 2017
AI科技评论
2018/03/14
1.6K0
CNCC | 深度学习如何“助攻”医学影像?我们来听听学界大拿的解释
python解析word拆分Excel选择题格式(3、判断题)
文件名【国家危化经营取证判断题.docx】,创个文件直接复制进去即可进行python的读取操作,输出的时候会uuid的方式生成uuid.csv文件
红目香薰
2022/11/30
2.6K0
主持人李咏因癌症在美国去世,关于癌症,我们都应该读读这篇文章 ...
主持人李咏因癌症在美国去世,妻子哈文发文:在美国,经过17个月的抗癌治疗,2018年10月25日凌晨5点20分,永失我爱。
Rookie
2018/12/05
8970
精准医学 | Nat.Med | 肥胖的亚分类用于精确预测心血管代谢疾病
◉ 流程图展示了我们对BMI-生物标志物不一致性的总体分析步骤,以及用于将BMI-生物标志物不一致性划分成概率分布的算法集合的详细信息。PCA代表主成分分析。◉ Flowchart depicting the overall steps in our analysis of BMI–biomarker discordance, with details about the ensemble of algorithms used to partition BMI–biomarker discordance into probabilistic profiles. PCA, principal components analysis.
生信菜鸟团
2025/02/27
1600
精准医学 | Nat.Med | 肥胖的亚分类用于精确预测心血管代谢疾病
DNSPod十问秦勇:为什么医疗AI最爱眼科?
秦勇,鹰瞳科技(Airdoc)COO,中国人工智能学会智慧医疗专委会委员,长期从事医疗人工智能方向的工作,拥有丰厚的项目经验、管理经验和技术积累,参与多个医院人工智能应用基地的建设项目,对人工智能在医学特别是眼科领域的应用有深入的研究,在核心期刊发表高水平论文十余篇。2021年11月5日,鹰瞳科技在香港联交所主板上市,被誉为“医疗AI第一股”。
腾讯云DNSPod团队
2023/08/03
4060
DNSPod十问秦勇:为什么医疗AI最爱眼科?
智能战疫动态精选:卫健委称最快4-5月份有部分疫苗进入临床试验;苹果推迟低价iPhone发布时间,富士康产能不足50%
机器之心最新推出「智能战疫日报」,围绕「人工智能直接应用于抗击疫情」和「人工智能助力产业应对非常时期各项困难」两大主题,提供相关政策、人工智能应用和解决方案、行业洞察、研究进展等每日动态,便于大家关注趋势变化,辅助决策;同时发布抗击疫情需求、产业需求或难题、人工智能资源等信息,促进产业与技术、场景与资源之间的高效合作。文末识别二维码即可开启订阅。
机器之心
2020/02/26
7400
人工智能在医疗产业最先落地?五大应用场景及典型案例
image.png 中国信息通信研究院与腾讯研究院AI联合课题组   赵淑珏 中国信息通信研究院互联网法律研究中心研究员   近年来,智能医疗在国内外的发展热度不断提升。有人提出,“尽管安防和智能投顾最为火热,但 AI 在医疗领域可能会率先落地。”一方面,图像识别、深度学习、神经网络等关键技术的突破带来了人工智能技术新一轮的发展。大大推动了以数据密集、知识密集、脑力劳动密集为特征的医疗产业与人工智能的深度融合。另一方面,随着社会进步和人们健康意识的觉醒,人口老龄化问题的不断加剧,人们对于提
腾讯研究院
2018/02/01
2.8K0
人工智能在医疗产业最先落地?五大应用场景及典型案例
ChatIE:通过多轮问答问题实现实命名实体识别和关系事件的零样本信息抽取,并在NYT11-HRL等数据集上超过了全监督模型
零样本信息抽取(Information Extraction,IE)旨在从无标注文本中建立IE系统,因为很少涉及人为干预,该问题非常具有挑战性。但零样本IE不再需要标注数据时耗费的时间和人力,因此十分重要。近来的大规模语言模型(例如GPT-3,Chat GPT)在零样本设置下取得了很好的表现,这启发我们探索基于提示的方法来解决零样本IE任务。我们提出一个问题:不经过训练来实现零样本信息抽取是否可行?我们将零样本IE任务转变为一个两阶段框架的多轮问答问题(Chat IE),并在三个IE任务中广泛评估了该框架:实体关系三元组抽取、命名实体识别和事件抽取。在两个语言的6个数据集上的实验结果表明,Chat IE取得了非常好的效果,甚至在几个数据集上(例如NYT11-HRL)上超过了全监督模型的表现。我们的工作能够为有限资源下IE系统的建立奠定基础。
汀丶人工智能
2023/07/30
5260
ChatIE:通过多轮问答问题实现实命名实体识别和关系事件的零样本信息抽取,并在NYT11-HRL等数据集上超过了全监督模型
NLP入门:CNN,RNN应用文本分类,个性化搜索,苹果和乔布斯关系抽取(2)
前篇 一文了解自然语言处理的每个范畴用到的核心技术,难点和热点(1), 这部分涉及的NLP范畴包括: 中文分词 词性标注 句法分析 文本分类背景 下面介绍,文本分类常用的模型,信息检索,信息抽取。 8文本分类模型 近年来,文本分类模型研究层出不穷,特别是随着深度学习的发展,深度神经网络模型也在文本分类任务上取得了巨大进展。文本分类模型划分为以下三类: 基于规则的分类模型 基于规则的分类模型旨在建立一个规则集合来对数据类别进行判断。这些规则可以从训练样本里自动产生,也可以人工定义。给定一个测试样例,我们可以
double
2018/04/02
1.3K0
Nature medicine:阿尔茨海默病AD的新兴诊断和治疗方法
摘要:阿尔茨海默病(AD)是世界上最常见的痴呆症诱因,但直到最近,减缓或预防其临床进展的策略在很大程度上仍然难以捉摸。本文重点介绍了生物标志物技术和治疗进展的最新进展,以提高AD的诊断和治疗。我们回顾了最近的研究结果,利用神经影像学和基于液体的生物标志物对AD进行病理分期,特别强调了淀粉样蛋白、tau蛋白和神经炎症在疾病发病机制中的作用。我们讨论了从随机对照试验中获得的经验教训,包括一些支持某些抗淀粉样蛋白抗体在AD轻度症状阶段减缓认知能力下降的建议。此外,我们强调了新发现的治疗靶点的证据,这些靶点可能能够改变AD的发病机制和进展。总的来说,这些最近的发现——以及它们所开启的研究方向——有可能将阿尔茨海默病的临床护理推向对患者最大利益的疾病改善治疗策略。
悦影科技
2023/10/20
8820
Nature综述|整合组学分析护航健康,推动精准医学时代的到来!
Konrad J. Karczewski, and Michael P. Snyder撰写的关于整合多组学在疾病研究中的应用一文《Integrative omics for health and disease》,于2018年2月26日发表在nature reviews genetics (Nature系列综述, 2018 IF: 41.465)。
生信宝典
2019/10/06
6.1K0
推荐阅读
辞旧迎新,胖了几斤?数据告诉你,这种东西你就不该吃
4800
基因检测和健康保险,慢病管理上下游的掘金者
7330
数据分类分级 数据识别-实现部分敏感数据识别
1240
中国医疗大数据发布!怎样推翻你身上的“三座大山”?
7510
肺癌:早期治疗快过感冒?是真的!
6970
PaddleNLP通用信息抽取技术产业应用实例
1.2K0
世界旅游联盟吁全球旅游业界共克时艰
5930
NLP标记集资料
7840
搞定实体识别、关系抽取、事件抽取,我用指针网络
1.7K0
CNCC | 深度学习如何“助攻”医学影像?我们来听听学界大拿的解释
1.6K0
python解析word拆分Excel选择题格式(3、判断题)
2.6K0
主持人李咏因癌症在美国去世,关于癌症,我们都应该读读这篇文章 ...
8970
精准医学 | Nat.Med | 肥胖的亚分类用于精确预测心血管代谢疾病
1600
DNSPod十问秦勇:为什么医疗AI最爱眼科?
4060
智能战疫动态精选:卫健委称最快4-5月份有部分疫苗进入临床试验;苹果推迟低价iPhone发布时间,富士康产能不足50%
7400
人工智能在医疗产业最先落地?五大应用场景及典型案例
2.8K0
ChatIE:通过多轮问答问题实现实命名实体识别和关系事件的零样本信息抽取,并在NYT11-HRL等数据集上超过了全监督模型
5260
NLP入门:CNN,RNN应用文本分类,个性化搜索,苹果和乔布斯关系抽取(2)
1.3K0
Nature medicine:阿尔茨海默病AD的新兴诊断和治疗方法
8820
Nature综述|整合组学分析护航健康,推动精准医学时代的到来!
6.1K0
相关推荐
辞旧迎新,胖了几斤?数据告诉你,这种东西你就不该吃
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档