前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >人工智能与自然语言处理概述:AI三大阶段、NLP关键应用领域

人工智能与自然语言处理概述:AI三大阶段、NLP关键应用领域

作者头像
不知雨
发布于 2018-08-21 06:10:03
发布于 2018-08-21 06:10:03
1.4K0
举报

近日,Xenonstack 上推出了一篇名为《Overview of Artificial Intelligence and Role of Natural Language Processing in Big Data》文章,作者为 Jagreet Kaur,其全面概述了人工智能及其各个细分领域的状况,并着重介绍了大数据自然语言处理的发展,对自然语言处理在大数据中扮演的角色作了探讨。机器之心对文章进行了编译,原文链接附于文末。

人工智能概述

AI 指代「人工智能」,是让机器能够像人类一样完成智能任务的技术。AI 使用智能完成自动化任务。

「人工智能」包含两个关键点:

  • 自动化
  • 智能

人工智能的目标

  • 推理
  • 自动学习&调度
  • 机器学习
  • 自然语言处理
  • 计算机视觉
  • 机器人
  • 通用智能

人工智能三大阶段

  • 阶段 1——机器学习:智能系统使用一系列算法从经验中进行学习。
  • 阶段 2——机器智能:机器使用的一系列从经验中进行学习的高级算法,例如深度神经网络。人工智能目前处于此阶段。
  • 阶段 3——机器意识:不需要外部数据就能从经验中自学习。

人工智能的类型

  • ANI(狭义人工智能):它包含基础的、角色型任务,比如由 Siri、Alexa 这样的聊天机器人、个人助手完成的任务。
  • AGI(通用人工智能):通用人工智能包含人类水平的任务,它涉及到机器的持续学习。
  • ASI(强人工智能):强人工智能指代比人类更聪明的机器。

什么使得系统智能化?

  • 自然语言处理
  • 知识表示
  • 自动推理
  • 机器学习

NLP、人工智能、机器学习、深度学习和神经网络之间的区别

  • 人工智能:建立能智能化处理事物的系统。
  • 自然语言处理:建立能够理解语言的系统,人工智能的一个分支。
  • 机器学习:建立能从经验中进行学习的系统,也是人工智能的一个分支。
  • 神经网络:生物学启发出的人工神经元网络。
  • 深度学习:在大型数据集上,建立使用深度神经网络的系统,机器学习的一个分支。

什么是自然语言处理?

自然语言处理(NLP)是指机器理解并解释人类写作、说话方式的能力。

NLP 的目标是让计算机/机器在理解语言上像人类一样智能。最终目标是弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。

下面是三个不同等级的语言学分析:

  • 句法学:给定文本的哪部分是语法正确的。
  • 语义学:给定文本的含义是什么?
  • 语用学:文本的目的是什么?

NLP 处理语言的不同方面,例如:

  • 音韵学:指代语言中发音的系统化组织。
  • 词态学:研究单词构成以及相互之间的关系。

NLP 中理解语义分析的方法:

  • 分布式:它利用机器学习和深度学习的大规模统计策略。
  • 框架式:句法不同,但语义相同的句子在数据结构(帧)中被表示为程式化情景。
  • 理论式:这种方法基于的思路是,句子指代的真正的词结合句子的部分内容可表达全部含义。
  • 交互式(学习):它涉及到语用方法,在交互式学习环境中用户教计算机一步一步学习语言。

我们为什么需要 NLP

有了 NLP,有可能完成自动语音、自动文本编写这样的任务。

由于大型数据(文本)的存在,我们为什么不使用计算机的能力,不知疲倦地运行算法来完成这样的任务,花费的时间也更少。

这些任务包括 NLP 的其他应用,比如自动摘要(生成给定文本的总结)和机器翻译

NLP 流程

如果要用语音产生文本,需要完成文本转语音任务

NLP 的机制涉及两个流程:

  • 自然语言理解
  • 自然语言生成

自然语言理解(NLU)

NLU 是要理解给定文本的含义。文本内每个单词的特性与结构需要被理解。在理解结构上,NLU 要理解自然语言中的以下几个歧义性:

  • 词法歧义性:单词有多重含义
  • 句法歧义性:语句有多重解析树
  • 语义歧义性:句子有多重含义
  • 回指歧义性(Anaphoric Ambiguity):之前提到的短语或单词在后面句子中有不同的含义。

接下来,通过使用词汇和语法规则,理解每个单词的含义。

然而,有些词有类似的含义(同义词),有些词有多重含义(多义词)。

自然语言生成(NLG)

NLG 是从结构化数据中以可读地方式自动生成文本的过程。自然语言生成的问题是难以处理。

自然语言生成可被分为三个阶段:

1. 文本规划:完成结构化数据中基础内容的规划。

2. 语句规划:从结构化数据中组合语句,来表达信息流。

3. 实现:产生语法通顺的语句来表达文本。

NLP 与文本挖掘(或文本分析)之间的不同

自然语言处理是理解给定文本的含义与结构的流程。

文本挖掘或文本分析是通过模式识别提起文本数据中隐藏的信息的流程。

自然语言处理被用来理解给定文本数据的含义(语义),而文本挖掘被用来理解给定文本数据的结构(句法)。

例如,在「I found my wallet near the bank」一句中,NLP 的任务是理解句尾「bank」一词指代的是银行还是河边。

大数据中的 NLP

如今所有数据中的 80% 都可被用到,大数据来自于大公司、企业所存储的信息。例如,职员信息、公司采购、销售记录、经济业务以及公司、社交媒体的历史记录等。

尽管人类使用的语言对计算机而言是模糊的、非结构化的,但有了 NLP 的帮助,我们可以解析这些大型的非结构化数据中的模式,从而更好地理解里面包含的信息。

NLP 可使用大数据解决商业中的难题,比如零售、医疗、金融领域中的业务。

什么是聊天机器人?

聊天机器人或自动智能代理

  • 指代你能通过聊天 app、聊天窗口或语音唤醒 app 进行交流的计算机程序。
  • 也有被用来解决客户问题的智能数字化助手,成本低、高效且持续工作。

聊天机器人的重要性

  • 聊天机器人对理解数字化客服和频繁咨询的常规问答领域中的变化至关重要。
  • 聊天机器人在一些领域中的特定场景中非常有帮助,特别是会被频繁问到高度可预测的的问题时。

聊天机器人的工作机制

  • 基于知识:包含信息库,根据客户的问题回应信息。
  • 数据存储:包含与用户交流的历史信息。
  • NLP 层:它将用户的问题(任何形式)转译为信息,从而作为合适的回应。
  • 应用层:指用来与用户交互的应用接口。

聊天机器人每次与用户交流时都能进行学习,使用机器学习回应信息库中的信息。

NLP 中为什么需要深度学习

  • 它使用基于规则的方法将单词表示为「one-hot」编码向量。
  • 传统的方法注重句法表征,而非语义表征。
  • 词袋:分类模型不能够分别特定语境。

深度学习的三项能力

  • 可表达性:这一能力描述了机器如何能近似通用函数。
  • 可训练性:深度学习系统学习问题的速度与能力。
  • 可泛化性:在未训练过的数据上,机器做预测的能力。

在深度学习中,当然也要考虑其他的能力,比如可解释性、模块性、可迁移性、延迟、对抗稳定性、安全等。但以上是主要的几项能力。

NLP 中深度学习的常见任务

传统 NLP 和深度学习 NLP 的区别

日志分析与日志挖掘中的 NLP

什么是日志?

不同网络设备或硬件的时序信息集合表示日志。日志可直接存储在硬盘文档中,也可作为信息流传送到日志收集器。

日志提供维持、追踪硬件表现、参数调整、紧急事件、系统修复、应用和架构优化的过程。

什么是日志分析?

日志分析是从日志中提取信息的过程,分析信息中的句法和语义,解析应用环境,从而比较分析不同源的日志文档,进行异常检测、发现关联性。

什么是日志挖掘?

日志挖掘或日志知识发现是提取日志中模式和关联性的过程,从而挖掘知识,预测日志中的异常检测。

日志分析和日志挖掘中使用到的技术

下面介绍了完成日志分析的不同技术:

  • 模式识别:将日志信息与模式薄中的信息进行对比,从而过滤信息的技术。
  • 标准化:日志信息的标准化是将不同的信息转换为同样的格式。当来自不同源的日志信息有不同的术语,但含义相同时,需要进行标准化。
  • 分类 & 标签:不同日志信息的分类 & 标签涉及到对信息的排序,并用不同的关键词进行标注。
  • Artificial Ignorance:使用机器学习算法抛弃无用日志信息的技术。它也可被用来检测系统异常。

日志分析 & 日志挖掘中的 NLP

自然语言处理技术被普遍用于日志分析和日志挖掘。

词语切分、词干提取(stemming)、词形还原(lemmatization)、解析等不同技术被用来将日志信息转换成结构化的形式。

一旦日志以很好的形式组织起来,日志分析和日志挖掘就能提取信息中有用的信息和知识。

深度自然语言处理

自然语言处理是一个复杂的领域,处于人工智能、计算语言学和计算机科学的交叉领域。

从 NLP 开始

用户需要输入一个包含已写文本的文件;接着应该执行以下 NLP 步骤:

  • 语句分割 - 在给定文本中辨识语句边界,即一个语句的结束和另一个语句的开始。语句通常以标点符号「.」结束。
  • 标记化 - 辨识不同的词、数字及其他标点符号。
  • 词干提取 - 将一个词还原为词干。
  • 词性标注 - 标出语句中每一个词的词性,比如名词或副词。
  • 语法分析 - 将给定文本的部分按类划分。
  • 命名实体识别 - 找出给定文本中的人物、地点、时间等。
  • 指代消解 - 根据一个语句的前句和后句界定该句中给定词之间的关系。

NLP 的其他关键应用领域

除了在大数据、日志挖掘及分析中的应用,NLP 还有一些其他主要应用领域。

尽管 NLP 不如大数据、机器学习听起来那么火,但我们每天都在使用它:

  • 自动摘要 - 在给定输入文本的情况下,摈弃次要信息完成文本摘要。
  • 情感分析 - 在给定文本中预测其主题,比如,文本中是否包含判断、观点或评论等。
  • 文本分类 - 按照其领域分类不同的期刊、新闻报道。多文档分类也是可能的。文本分类的一个流行示例是垃圾电子邮件检测。基于写作风格,可检测作者姓名。
  • 信息提取 - 建议电子邮件程序自动添加事件到日历。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
「X」Embedding in NLP|初识自然语言处理(NLP)
为了方便大家能够深入了解向量数据库与 NLP 的关系及应用,我们上线了「X」Embedding in NLP 系列专题,分为初阶和进阶两部分。本文为初阶第一篇,将详细介绍 NLP 以及以 Zilliz Cloud、Milvus 为代表的向量数据库是如何为 NLP 赋能的。
Zilliz RDS
2023/11/22
3300
「X」Embedding in NLP|初识自然语言处理(NLP)
自然语言处理(NLP)——简介
自然语言处理(NLP Natural Language Processing)是一种专业分析人类语言的人工智能。就是在机器语⾔和⼈类语言之间沟通的桥梁,以实现人机交流的目的。 在人工智能出现之前,机器智能处理结构化的数据(例如Excel里的数据)。但是网络中 大部分的数据都是非结构化的,例如:文章、图片、音频、视频... 在非结构数据中,文本的数量是最多的,他虽然没有图片和视频占用的空间大,但是他的 信息量是最大的。 为了能够分析和利用这些文本信息,我们就需要利用NLP技术,让机器理解这些文本信息,并加以利用。
SpringSun
2021/07/14
2.8K0
自然语言处理(NLP)——简介
自然语言处理如何快速理解?有这篇文章就够了!
原文来源:codeburst.io 作者:Pramod Chandrayan 「雷克世界」编译:嗯~阿童木呀、我是卡布达 现如今,在更多情况下,我们是以比特和字节为生,而不是依靠交换情感。我们使用一种称之为计算机的超级智能机器在互联网上进行交易和沟通。因此,我们觉得有必要让机器明白我们在说话时是如何对其进行理解的,并且试图用人工智能,一种称之为NLP——自然语言处理技术为它们提供语言。作为一种研究结果,聊天机器人正在成为一种可靠的聊天工具,使用这种非人为依赖的智能工具与人类进行交流。 我强烈的感受到:
企鹅号小编
2018/03/05
2.8K3
自然语言处理如何快速理解?有这篇文章就够了!
自然语言处理 (NLP) 的 5 个步骤
如今,我们的世界在数字化连接方面达到了前所未有的水平。信息、见解和数据不断争夺我们的注意力,我们不可能全部消化。对于你的企业来说,挑战在于了解客户和潜在客户对你的产品和服务的看法,但时间和资源的限制使得这一点难以有效实现。
数据科学工厂
2024/12/30
2450
自然语言处理 (NLP) 的 5 个步骤
《NLP》你真的了解”自然语言处理(NLP)“吗?
上一周,清华大学AMiner发布了《2018自然语言处理研究报告》(下载地址:https://pan.baidu.com/s/1IXuZLgGVHjfYyyX63jcVHQ),因为时间原因,没能及时的更新,希望大家见谅。现在作者以初学者的态度整理了一下该报告的主要内容,希望能帮助大家。
ShuYini
2019/08/08
1.4K0
《NLP》你真的了解”自然语言处理(NLP)“吗?
自然语言处理实战--文末送书
1950年,艾伦·图灵(Alan Turing)发表了一篇题为“ 计算机机械与智能(Computing Machinery and Intelligence) ” 的文章,提出了著名的“图灵测试(Turing Test)”。这当中涉及了自动解释和自然语言的生成,作为判断智能的条件,这就是自然语言处理(Natural Language Processing,NLP)发展的开端。
FunTester
2020/11/12
5130
自然语言处理实战--文末送书
NLP(自然语言处理)扫盲
最近在学NLP,给自己扫扫盲,看看NLP具体干什么,本文先学学概念,后面再深入。(不是很深入的文章,高手误入。) 自然语言处理(简称NLP),是研究计算机处理人类语言的一门技术,是人工智能(AI)的一个子领域,包括: 1.句法语义分析:对于给定的句子,进行分词、词性标记、命名实体识别和链接、句法分析、语义角色识别和多义词消歧。 2.信息抽取:从给定文本中抽取重要的信息,比如,时间、地点、人物、事件、原因、结果、数字、日期、货币、专有名词等等。通俗说来,就是要了解谁在什么时候、什么原因、对谁、做了什么事、有什
大数据和云计算技术
2018/03/08
1.6K0
自然语言处理-NLP
自然语言处理(Natural Language Processing,简称NLP)被誉为人工智能皇冠上的明珠,是计算机科学和人工智能领域的一个重要方向。
zhangjiqun
2024/12/14
2480
自然语言处理-NLP
干货!「自然语言处理(NLP)」你真的了解NLP吗?
你真的了解NLP吗?本文主要是对当前自然语言处理领域的主要研究内容进行了梳理,共包含五个部分:NLP概述、NLP相关技术分类、NLP研究人员分布、NLP的应用、NLP的发展趋势。该篇文章能够帮助刚刚入坑NLP的小伙伴尽快找到自己的定位,同时也能协助已经在坑中挣扎多年的小伙伴看清该领域的全貌。
ShuYini
2020/03/12
2.5K0
互联网十万个为什么之什么是自然语言处理?
自然语言处理(Natural Language Processing,简称NLP)属于人工智能的一个分支,旨在让计算机能够理解并处理人类语言,从中提取出有用的信息,帮助人类更高效地处理各种任务。
linus_lin
2024/09/06
1250
互联网十万个为什么之什么是自然语言处理?
为什么说自然语言处理是人工智能的核心
关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 如果一台计算机能够欺骗人类,让人相信它是人类,那么该计算机就应当被认为是智能的。 ——阿兰·图灵 机器能跟我们人类交流吗,能像我们人类一样理解文本吗,这是大家对人工智能最初的幻想。如今,它已成为人工智能的核心领域——自然语言处理(简称:NLP)。自然语言处理是一门融语言学、计算机科学、人工智能于一体的科学,解决的是“让机器可以理解自然语言”——这一到目前为止都还只是人类独有的特权,因此
昱良
2018/04/08
2.2K0
为什么说自然语言处理是人工智能的核心
自然语言处理(NLP)全面指南
自然语言处理(NLP)是人工智能领域中最热门的技术之一,它通过构建能够理解和生成人类语言的机器,正在不断推动技术的发展。本文将为您提供NLP的全面介绍,包括其定义、重要性、应用场景、工作原理以及面临的挑战和争议。
数据科学工厂
2024/04/02
2.5K0
自然语言处理(NLP)全面指南
绝干货! | 最有用的自然语言处理(NLP)入门资料
一周的时间转瞬即逝,今天作者给大家分享一下最近收集关于自然语言处理的一些资料,与大家分享,记得保存喲~不然到期了你还得给我要,^_^
ShuYini
2019/08/08
1.7K0
绝干货! | 最有用的自然语言处理(NLP)入门资料
量子+AI:自然语言处理
人工智能可分为深度学习、自然语言处理、计算机视觉、智能机器人、自动程序涉及、数据挖掘等六大领域。随着互联网的普及和社交网络的急速发展,自然语言相关数据海量增长。
量子发烧友
2023/03/08
1.1K0
量子+AI:自然语言处理
自然语言处理概述
自然语言处理(Natural Language Processing,NLP)是计算机科学、人工智能和语言学的交叉学科,其范畴广泛,比如:语音合成、分词、词法分析、问答系统、机器翻译、情感分析等等。
老齐
2022/12/09
3.4K0
绝干货! | (改)最有用的自然语言处理(NLP)入门资料
今天突然看到有人留言说,原来和大家分享的资料网盘链接根本打不开,今天才看到,这里要和大家说句抱歉。为此作者今天重新整理了一下,希望大家能及时的保存。
ShuYini
2019/08/08
9998
绝干货! | (改)最有用的自然语言处理(NLP)入门资料
AI: 人工智能领域概念总结
人工智能(Artificial Intelligence,简称AI)是一个广泛而复杂的领域,涉及许多相关的概念和技术。理解这些概念及其相互关系,可以帮助我们更好地掌握人工智能的整体结构和发展趋势。以下是一些主要概念的总结:
运维开发王义杰
2024/07/10
3770
AI: 人工智能领域概念总结
Awesome-Chinese-NLP:中文自然语言处理相关资料
推荐Github上一个很棒的中文自然语言处理相关资料的Awesome资源:Awesome-Chinese-NLP ,Github链接地址,点击文末"阅读原文"可直达:
AINLP
2019/10/10
5.7K1
Awesome-Chinese-NLP:中文自然语言处理相关资料
自然语言处理-Natural language processing | NLP
在人工智能出现之前,机器智能处理结构化的数据(例如 Excel 里的数据)。但是网络中大部分的数据都是非结构化的,例如:文章、图片、音频、视频…
easyAI
2019/12/18
1.4K0
自然语言处理-Natural language processing | NLP
深度学习6:自然语言处理-Natural language processing | NLP
在人工智能出现之前,机器智能处理结构化的数据(例如 Excel 里的数据)。但是网络中大部分的数据都是非结构化的,例如:文章、图片、音频、视频…
zhangjiqun
2024/12/14
1610
深度学习6:自然语言处理-Natural language processing | NLP
推荐阅读
相关推荐
「X」Embedding in NLP|初识自然语言处理(NLP)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档