Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >基于机器学习的自动问答系统构建

基于机器学习的自动问答系统构建

作者头像
sparkexpert
发布于 2018-01-09 08:03:15
发布于 2018-01-09 08:03:15
1.8K0
举报

  自动问答系统是当前自然语言处理领域一个非常热的方向。它综合运用了知识表示、信息检索、自然语言处理等技术。自动问答系统能够使用户以自然语言提问的形式而不是关键词的组合,提出信息查询需求,系统依据对问题进行分析,从各种数据资源中自动找出准确的答案。从系统功能上讲,自动问答分为开放域自动问答和限定域自动问答。开放域是指不限定问题领域,用户随意提问,系统从海量数据中寻找答案;限定域是指系统事先声明,只能回答某一个领域的问题,其他领域问题无法回答。

  为了测试这个方面可行与否,近期,利用百度知道的相关问答语料,测试了下。

  具体步骤:

  (1)数据预处理:将百度知道的原始数据通过预处理整合成格式规范的数据导入数据库中,方便后续处理,就形成了训练数据所需的原始数据集。

   (2)构建分类器:利用所给数据训练文本分类器模型,在用户提出测试问题时可以将测试问题贴上类别标签,锁定答案的知识范围;、

  (3) 相似问题检索:将测试问题与训练语料库中相同类别下的其它问题进行文本相似度计算,找出相似度较高的问题作为相似问题集合

(4) 答案抽取:将相似问题集合中的所有答案进行排序,选出最佳答案反馈给用户。

里面的核心技术是分类器的构建,由于还没采用深度学习的办法,目前只采用SVM分类器进行测试,发现还是可行的。而相似问题计算这种,有很多现成的东东。

  用JAVA代码实现,测试结果如下:

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2016年09月06日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
基于多搜索引擎和深度学习技术的自动问答
聊天机器人本质上是一个范问答系统,既然是问答系统就离不开候选答案的选择,利用深度学习的方法可以帮助我们找到最佳的答案。
机器学习AI算法工程
2019/10/28
1.2K0
基于多搜索引擎和深度学习技术的自动问答
下一代信息服务新风口:以自然语言为基本输入方式的问答系统综述(附两篇论文)
自动问答(Question Answering, QA)是指利用计算机自动回答用户所提出的问题以满足用户知识需求的任务。不同于现有搜索引擎,问答系统是信息服务的一种高级形式,系统返回用户的不再是基于关键词匹配排序的文档列表,而是精准的自然语言答案。
double
2018/07/25
1.1K0
下一代信息服务新风口:以自然语言为基本输入方式的问答系统综述(附两篇论文)
一周论文 | 基于知识图谱的问答系统关键技术研究#4
作者丨崔万云 学校丨复旦大学博士 研究方向丨问答系统,知识图谱 领域问答的基础在于领域知识图谱。对于特定领域,其高质量、结构化的知识往往是不存在,或者是极少的。本章希望从一般文本描述中抽取富含知识的句子,并将其结构化,作为问答系统的知识源。特别的,对于不同的领域,其“知识”的含义是不一样的。有些数据对于某一领域是关键知识,而对于另一领域则可能毫无意义。传统的知识提取方法没有考虑具体领域特征。 本章提出了领域相关的富含知识的句子提取方法,DAKSE。DAKSE 从领域问答语料库和特定领域的纯文本文档中学习富
机器之心
2018/05/08
1.7K0
一周论文 | 基于知识图谱的问答系统关键技术研究#4
基于文档的限定领域对话式问答系统设计说明
为了从整体上描述基于文档的限定领域对话式问答系统要实现的功能,使用户能够对本系统有一个全面正确的认识,同时给程序开发者一个关于系统的使用,系统的功能模块,以及系统的各种技术解决方案一个详细的说明。
故事尾音
2019/12/18
2.1K0
达观文辉:知识图谱构建下的自动问答KBQA系统实战
问答系统(Qusstion Answering System,QA System)在大家的日常生活中随处可见,2014年微软率先推出了小冰智能聊天机器人,直至现在越来越多如siri移动生活助手和智能音箱等的面市,问答作为一种信息获取方式愈发受到大众和厂商的关注和投入。问答系统能够接受用户以自然语言形式描述的提问,并从大量的异构数据中查到或者推理出用户想要的答案。相比传统的信息检索系统,问答系统场景的核心在于用户的信息需求相对比较明确,而系统直接输出用户想要的答案,这个答案的形式可能是文档、结构化的表格或者推理加工的自然语言文本。
用户10103085
2022/11/09
1.3K0
达观文辉:知识图谱构建下的自动问答KBQA系统实战
基于深度学习的FAQ问答系统
| 导语 问答系统是信息检索的一种高级形式,能够更加准确地理解用户用自然语言提出的问题,并通过检索语料库、知识图谱或问答知识库返回简洁、准确的匹配答案。相较于搜索引擎,问答系统能更好地理解用户提问的真实意图, 进一步能更有效地满足用户的信息需求。问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。 一、引言        问答系统处理的对象主要包括用户的问题以及答案。根据问题所属的知识领域,问答系统可分为面向限定域的问答系统、面向开放域的问答系统、以及面向常用问题集(Fre
腾讯知文实验室
2018/08/28
18.1K7
基于深度学习的FAQ问答系统
独家 | 一文读懂自然语言处理NLP(附学习资料)
前言 自然语言处理是文本挖掘的研究领域之一,是人工智能和语言学领域的分支学科。在此领域中探讨如何处理及运用自然语言。 对于自然语言处理的发展历程,可以从哲学中的经验主义和理性主义说起。基于统计的自然语言处理是哲学中的经验主义,基于规则的自然语言处理是哲学中的理性主义。在哲学领域中经验主义与理性主义的斗争一直是此消彼长,这种矛盾与斗争也反映在具体科学上,如自然语言处理。 早期的自然语言处理具有鲜明的经验主义色彩。如1913年马尔科夫提出马尔科夫随机过程与马尔科夫模型的基础就是“手工查频”,具体说就是
数据派THU
2018/01/30
3.5K0
独家 | 一文读懂自然语言处理NLP(附学习资料)
基于知识图谱的问答系统,BERT做命名实体识别和句子相似度
了解知识图谱的基本概念,也做过一些demo的实践,毕竟是做问答方向的,所以就比较关注基于知识图谱的问答。其实构建知识图谱的核心在于命名实体识别和关系抽取,围绕这两个方面也有很多细致的工作,比如如何解决实体的歧义,进行实体消歧;如何进行多关系的抽取等。从最近各大公司举行的比赛,我们也可以看出来,今年的主要工作就在这上面,这也是技术落地的一个重要标志。最近也在捣鼓BERT,想着就将基于KB的QA流程撸一遍,于是就有了这个demo。
机器学习AI算法工程
2019/10/28
3.7K0
基于知识图谱的问答系统,BERT做命名实体识别和句子相似度
做项目一定用得到的NLP资源【分类版】
原文链接:https://github.com/fighting41love/funNLP
流川疯
2022/09/20
2.1K0
基于大语言模型构建知识问答系统
打造 特定领域知识(Domain-specific Knowledge) 问答 系统,具体需求有:
小虫飞飞
2023/05/08
6.5K3
基于bert的中文语义匹配模型,判断两句话是不是同一个意思
本文的核心是句子相似度的计算,可以使用TF-IDF和word2vec两种方法对问句进行向量化,并在此基础上使用进行句子相似度的计算。
机器学习AI算法工程
2019/10/28
2.6K0
基于bert的中文语义匹配模型,判断两句话是不是同一个意思
如何用大语言模型构建一个知识问答系统
打造 特定领域知识(Domain-specific Knowledge) 问答 系统,具体需求有:
腾讯技术工程官方号
2023/07/15
3.6K1
如何用大语言模型构建一个知识问答系统
用机器学习打造聊天机器人(三) 设计篇
本项目基于chatterbot0.8.7来开发,但不仅于此。让我们先对chatterbot做一个简单的了解。
程序员一一涤生
2019/12/09
1.5K0
用机器学习打造聊天机器人(三) 设计篇
快速搭建对话机器人,就用这一招!
问答系统是自然语言处理领域一个很经典的问题,它用于回答人们以自然语言形式提出的问题,有着广泛的应用。其经典应用场景包括:智能语音交互、在线客服、知识获取、情感类聊天等。常见的分类有:生成型、检索型问答系统;单轮问答、多轮问答系统;面向开放领域、特定领域的问答系统。本文涉及的主要是在检索型、面向特定领域的问答系统,通常称之为——智能客服机器人。
Zilliz RDS
2020/04/20
1.1K0
快速搭建对话机器人,就用这一招!
深度学习系列 | 知识库上的问答系统:实体、文本及系统观点
编者:本文来自复旦大学博士崔万云在携程技术中心主办的深度学习Meetup上的主题演讲,分享了复旦大学研发的基于知识图谱的QA系统。戳上面的“携程技术中心”(ctriptech)关注,可获知更多技术分享信息哦。 崔万云老师的分享可点下面的视频看回放,下载演讲PPT请点击阅读原文。 QA系统用于回答人们以自然语言形式提出的问题,其在互联网、通信及医疗等领域获得显著的成功。其中,IBM研发的Watson系统就在与人类的答题比赛中获胜并首次获得100万美金奖励;苹果的Siri系统成功运行于iPhone之中,改变人与
携程技术
2018/03/16
1.2K0
深度学习系列 | 知识库上的问答系统:实体、文本及系统观点
深度学习实现问答机器人
摘 要 在问答系统的应用中,用户输入一个问题,系统需要根据问题去寻找最合适的答案 针对该应用场景,有三种处理方式: 1:采用句子相似度的方式。根据问题的字面相似度选择相似度最高的问题对应的答案,但是采
IT派
2018/03/29
8260
深度学习实现问答机器人
NLP学习路线总结
自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究人与计算机之间用自然语言进行有效通信的理论和方法。融语言学、计算机科学、数学等于一体的科学。旨在从文本数据中提取信息。目的是让计算机处理或“理解”自然语言,以执行自动翻译、文本分类和情感分析等。自然语言处理是人工智能中最为困难的问题之一。
全栈程序员站长
2022/11/10
1.3K0
NLP学习路线总结
【NLP-ChatBot】我们熟悉的聊天机器人都有哪几类?
本篇是专栏中介绍聊天机器人的第一篇,会大概介绍聊天机器人的历史、特点、分类以及技术框架,让大家对聊天机器人有一个大致的了解。
用户1508658
2019/10/10
1.3K0
【NLP-ChatBot】我们熟悉的聊天机器人都有哪几类?
【NLP论文速递&&源码】Bert模型优化、自回归预训练、键值记忆网络、大规模问答系统训练
本次论文分享内容主要包括以下内容:鲁棒优化Bert模型(RoBERTa)、自回归预训练模型(XLNet)、无监督多任务学习语言模型、生成预训练语言理解、深层上下文单词表示、键值记忆网络、大规模问答系统训练等 。
ShuYini
2021/12/08
7140
【NLP论文速递&&源码】Bert模型优化、自回归预训练、键值记忆网络、大规模问答系统训练
利用ChatGPT 和Milvus快速搭建智能问答机器人
智能问答机器人是 自然语言处理领域一个很经典的问题,它用于回答人们以自然语言形式提出的问题,有着广泛的应用。其经典应用场景包括:智能语音交互、在线客服、知识获取、情感类聊天等。常见的分类有:生成型、检索型问答系统;单轮问答、多轮问答系统;面向开放领域、特定领域的问答系统。
张善友
2023/03/09
3.7K1
利用ChatGPT 和Milvus快速搭建智能问答机器人
推荐阅读
相关推荐
基于多搜索引擎和深度学习技术的自动问答
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档