客服数据集_发现数据集验证数据集_客服数据库 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

基于Siamese Network进行问题句子相似性判定sentence-similarity

问题句子相似度计算，即给定客服里用户描述的两句话，用算法来判断是否表示了相同的语义。项目地址：https://github.com/yanqiangmiffy/sentence-similarity

01

京东AI研究院获QuAC机器阅读理解竞赛冠军，EL-QA模型能力业界领先

机器之心发布机器之心编辑部近日，在斯坦福大学、华盛顿大学、Allen AI 和 UMass 联合发起的机器阅读理解（QuAC[1] (Choi et al., 2018)）比赛上，京东 AI 研究院语音语言实验室提出的 EL-QA 模型（Single Model）登顶 QuAC Leaderboard，全部三项指标均获得第一名。其中，在 F1-Measure(又称为 F1-Score) 指标上达到 74.6，大幅拉近了机器与人类在该任务上的水平差距。这也意味着以零售、物流、金融、客服等优质场景为依托的

01

您找到你想要的搜索结果了吗？

是的

没有找到

Interspeech 2019 | 基于多模态对齐的语音情感识别

语音领域顶级学术会议 Interspeech于2019年9月15-19日在奥地利格拉茨举行。

02

（含源码）问答对生成（QAG）| 你竟还在手工梳理问答对！？

AI时代，不同的行业都有自己的智能客服，比如银行智能客服、导购智能客服、后期服务支持智能客服等。训练客服机器人需要利用高质量、大量业务场景问答对（QA）作为语料进行训练，但是梳理问答对语料将会耗费大量人力成本。能否做到QA问答对的自动生成呢？答案是肯定的。

02

干货 | 弱监督学习框架 Snorkel 在大规模文本数据集"自动标注"任务中的实践

近年来，得益于深度学习的巨大发展，自然语言处理（NLP）领域也爆发了多个如 BERT 等state-of-the-art模型，供从业人员使用。但是这些开源的最先进的模型大多是在通用的基准数据集上训练得到的，当我们在具体工业场景中使用时往往还是需要在具体使用场景的数据集上进行微调。获得这些特定领域数据集的传统方式是人工标注。这些手工标注的数据集创建起来既昂贵又耗时，特别是对于一些比较难的任务往往人工标记的准确度也无法达到要求。

02

当AI客服遇上「图文混排」提问，京东给电商AI来了场摸底考试

对于很多人来说，决定自己网购体验的，除了快递的速度，还有AI客服咨询的流畅和智能水平。

02

数据科学教材没有教给你的三件事

有问题直接微信我吧！大家好，PPV课大数据微信开通了人工客服，大家有问题可以在工作时间：9：00-18:00直接通过微信与客服联系！如果你还没有听说的话，那么我告诉你，数据科学简直太疯狂了。相关的

04

Kaggle文本语义相似度计算Top5解决方案分享

今年和去年前后相继出现了多个关于句子相似度判定的比赛，即得定两个句子，用算法判断是否表示了相同的语义或者意思。其中第4、5这个2个比赛数据集格式比较像，2、3 的数据集格式比较像，本仓库基于2、3数据集做实验

02

资源 | 最新中文NLP开源工具箱来了！支持6大任务，面向工业应用

对于开发者来说，又有一个新的NLP工具箱可以使用了，代号PaddleNLP，目前已开源。

03

最新中文NLP开源工具箱来了！支持6大任务，面向工业应用 | 资源

对于开发者来说，又有一个新的NLP工具箱可以使用了，代号PaddleNLP，目前已开源。

02

最新中文NLP开源工具箱来了！支持6大任务，面向工业应用 | 资源

对于开发者来说，又有一个新的NLP工具箱可以使用了，代号PaddleNLP，目前已开源。

06

哔哩哔哩从0到1自研智能客服IM系统的技术实践之路

本文将要分享的是哔哩哔哩从0到1自研智能客服IM系统的技术实践过程，包括整体架构设计和主要核心功能的技术实现思路等，希望带给你启发。

01

七夕礼物没送对？飞桨PaddlePaddle帮你读懂女朋友的小心思

“女孩儿的心思男孩你别猜，你猜来猜去也猜不明白。不知道她为什么掉眼泪，也不知她为什么笑开怀……”

03

强烈推荐| 飞桨十大中文NLP开源工具详解

PaddleNLP是基于飞桨（PaddlePaddle）开发的工业级中文NLP开源工具与预训练模型集，将自然语言处理领域的多种模型用一套共享骨架代码实现，可大大减少开发者在开发过程中的重复工作。PaddleNLP提供依托于百度百亿级大数据的预训练模型，适应全面丰富的 NLP任务，方便开发者灵活插拔尝试多种网络结构，并且让应用最快速达到工业级效果。下面小编就带你一一了解PaddleNLP支持的十大NLP任务和工具。

03

Sovit2D对接MQTT数据源的方法及测试

Sovit2D最近又更新了一个新功能——对接MQTT数据源，该功能实现了通过MQTT协议连接获取物联网设备数据并实时推送到场景中。

02

IBM人工智能可以预测你会不会精神分裂，还能通过声音判断情绪

允中编译整理量子位出品 | 公众号 QbitAI IBM的人工智能继续在健康领域实践探索。最近，IBM和阿尔伯塔大学联手进行了一项开创性的研究，使用简单的MRI（磁共振成像）扫描加一个神经网络

05

宫廷玉液酒减小锤？OpenAI最新语言模型能当客服能写代码，连这篇文章也是它写的！

大数据文摘出品作者：ChatGPT 这几天OpenAI的ChatGPT真的太火了。先不看技术上，这个AI聊天机器人有多厉害，咱就说在理解力这一块，是不是给你整的明明白白？聊天机器人其实大家多多少少都接触过，比如电商智能客服这种，但是这些智能客服的效果，显然不如ChatGPT那么条理清晰，往往把你气的半死，最后转人工。不仅思维非常清晰，ChatGPT甚至可以帮你写代码。比如你想在股票赚大钱（当韭菜），也可以找ChatGPT帮忙写一个“有效的股市指标框架”。不仅如此，ChatGPT还能让文摘菌痛

02

七夕礼物没送对？飞桨PaddlePaddle帮你读懂女朋友的小心思

“女孩儿的心思男孩你别猜，你猜来猜去也猜不明白。不知道她为什么掉眼泪，也不知她为什么笑开怀……”

03

不容错过，飞桨产业级PaddleNLP全景图大揭秘！

https://github.com/PaddlePaddle/models/tree/v1.5.1/PaddleNLP

01

AI时代的产业智能化改造，被一家通讯公司玩转

大量 AI 公司开始重新思考商业逻辑的合理性，而投资者也变得理性而谨慎。泥沙俱下的商业环境里，什么公司才能在这个 AI 的下半场赢得漂亮？

02

利用ChatGPT 和Milvus快速搭建智能问答机器人

智能问答机器人是自然语言处理领域一个很经典的问题，它用于回答人们以自然语言形式提出的问题，有着广泛的应用。其经典应用场景包括：智能语音交互、在线客服、知识获取、情感类聊天等。常见的分类有：生成型、检索型问答系统；单轮问答、多轮问答系统；面向开放领域、特定领域的问答系统。

02

ChatGPT和GPT-3有什么区别？

ChatGPT丨小智ai丨chatgpt丨人工智能丨OpenAI丨聊天机器人丨AI语音助手丨GPT-3.5丨开源AI平台

04

决胜智能客服下一个十年，容联全面布局AI客服垂直化应用

“深度学习携手大数据引领的第三次AI热潮，最大特点是人工智能技术真正突破了人类的心理阈值，达到了大多数人心目中‘可用’的标准。以此为基础，人工智能技术在语音识别、机器视觉、数据挖掘等领域走进了业界的真实应用场景，与商业模式紧密结合”。

03

TensorFlow2.0实战强化专栏开篇

本公众号先后推出了由作者小猴锅倾力打造的Tensorflow2.0原创入门专栏以及上手实战专栏，均在发出后取得了不错的反响。

01

阿里iDST鄢志杰：深度学习不可一味强调大数据、大模型、大计算

12月10-12日， 2015中国大数据技术大会将在北京召开。会议前夕，我们特采访了本次会议的深度学习分论坛演讲嘉宾阿里巴巴iDST语音组高级专家鄢志杰，以期对其从事工作和演讲内容有进一步的了解。鄢志杰将在12月11日下午的深度学习分论坛进行题为“Deep Learning 助力客服小二:数据技术及机器学习在客服中心的应用”的主题演讲，分享基于DNN、CNN、RNN（LSTM）及其各种组合模型的语音识别、自然语言处理技术在客服领域的应用。鄢志杰在接受采访时表示，他的分享内容将包括Deep Learni

07

R语言从入门到精通：Day14（PCA & tSNE)

主成分分析(Principle component analysis, PCA)前面我们已经用两期教程跟大家讲过理论和实际绘图（在线主成分分析Clustvis和主成分分析绘图）。今天，我们就从PCA的数理统计层面入手，去讲讲完整的PCA应该怎么操作。

01

大火的多模态，落地了吗？

01 多模态机器学习多模态机器学习，英文全称 MultiModal Machine Learning (MMML)，旨在通过机器学习的方法实现处理和理解多源模态信息的能力。每一种信息的来源或者形式，都可以称为一种模态。例如，人有触觉，听觉，视觉，嗅觉；信息有语音、视频、文字等媒介；多种多样的传感器，如雷达、红外、加速度计等。以上的每一种都可以称为一种模态。模态也可以有非常广泛的定义，比如我们可以把两种不同的语言当做是两种模态，甚至在两种不同情况下采集到的数据集，亦可认为是两种模态。 02 爆火的多

02

落魄“贵族”Nuance想东山再起？太难

近日，著名的语音识别与图像处理解决方案提供商Nuance Communications（以下称Nuance）宣布，已经以2.15亿美元完成了对客户服务与互动解决方案提供商TouchCommerce的收

05

信息检索&FAQ硬核技术！SimNet模型

导读：飞桨PaddlePaddle致力于让深度学习技术的创新与应用更简单。飞桨开源的百度自研SimNet-BOW-Pairwise语义匹配模型，在真实的FAQ问答场景中，比其他基于字面的相似度方法AUC提升了5%以上。在公开语义匹配数据集（LCQMC）进行评测准确率也达到了0.7532，性能超越同等复杂的CBOW基线模型。SimNet 显著改善了长冷 query 的搜索效果，提升了搜索智能化的水平，在百度搜索以及其它产品线广泛应用。

04

300万奖金池，第二届“中国版ImageNet”开赛

近日，由创新工场、搜狗、美团点评、美图公司联合主办的“2018 AI Challenger 全球 AI 挑战赛”正式开赛。

06

【教程】看看大神的思路！机器学习界网红7分钟教你如何搭建Chatbot？（中文版）

Siraj Raval 作为深度学习领域的自媒体人在欧美可以说是无人不知、无人不晓。凭借在 Youtube 上的指导视频，Siraj Raval 在全世界吸粉无数，堪称是机器学习界的网红。说他是全

07

上亿商品的语言处理需求 | 京东AI NLP技术的研究与落地

从2010年起，深度神经网络开始在各个领域引发人工智能技术的重大突破。在语音识别领域，截止到2017年，借助于深度学习技术语音识别在Switchboard数据集上的词错误率下降到5.1%，基本可与人工识别相媲美；而在图像识别领域、机器翻译、语音合成技术等其他领域也取得了巨大进步，使得机器基本已经做到和人一样能听、能看、能说。随着人工智能技术这些领域的不断突破，人们也更期待看到自然语言处理技术（NLP）带来更多的创新。

02

解密：依图如何一年实现语音识别指标超巨头玩家

12 月 11 日，擅长计算机视觉技术解决方案的依图科技在北京公开展示了语音识别领域的最新技术成果，并表示将在近期开放依图语音识别 API 接口以及部分测试数据集。同时，依图科技还宣布，将基于其语音识别技术与微软 Azure、华为推出联合方案平台。

03

智能问答：视觉问答系统在客户服务中的创新

对于智能问答系统的部署过程和创新应用，这里将展示详细的部署步骤，并结合实际示例和代码解释。智能问答系统的应用在客户服务中具有重要意义，可以提高服务效率和用户体验，下面是部署过程的详细说明：

01

【机器学习】让大模型变得更聪明

当前的大模型，尽管能够生成类似人类的文本和在特定任务中表现优异，但在真正理解上下文和语义方面仍存在局限。例如，GPT-3等模型可以生成流畅的文章，但在遇到复杂逻辑推理或多步骤推理时，容易出现错误。这说明，模型在语义理解和逻辑推理方面的能力还有待提升。

01

阿里90后科学家研发，达摩院开源新一代AI算法模型

AI科技大本营7月5日消息，阿里达摩院宣布开源新一代人机对话模型ESIM。该算法模型提出两年多，已被200多篇论文引用，更曾在国际顶级对话系统评测大赛（DSTC7）上获得双料冠军，将人机对话准确率的纪录提升至94.1%。

00

ChatGPT +RPA=？——对话ALBERT蓝振忠&实在智能孙林君

如果要问目前科技界最火的话题是什么，很多人的答案将是ChatGPT。而且，ChatGPT大有“破圈”之势，不仅业界人士在关注，各行各业的普通人也在大量讨论。

02

大羊驼、羊驼、小羊驼和ChatGPT比差在哪儿？CMU副教授测评了7个类ChatGPT大模型

机器之心报道机器之心编辑部大语言模型「七雄争霸」，看谁拔得了头筹。大型语言模型（LLM）正在风靡全球，它们的一个重要应用就是聊天，并在问答、客服和其他许多方面都有应用。然而，聊天机器人是出了名的难以评估。究竟这些模型在什么情况下最好用，我们目前尚不明晰。因此，LLM 的测评非常重要。此前一位名叫 Marco Tulio Ribeiro 的 Medium 博主在一些复杂任务上对 Vicuna-13B、MPT-7b-Chat 和 ChatGPT 3.5 进行了测试。结果表明，Vicuna 对于许多任务来

01

斗鱼基于 kubernetes 的深度学习实践

我们首先说一下深度学习在斗鱼的应用场景。斗鱼在深度学习这一块，有两个部门在做这个事，基本上就是分为两大场景，一个是大数据场景，一个是视觉场景。

02

2016-2018年机器学习大赛TOP开源作品汇总

本次大赛要求参赛者基于提供的讯飞 AI 营销云的海量广告投放数据，通过人工智能技术构建来预测模型预估用户的广告点击概率。比赛提供了 5 类数据，包括基础广告投放数据、广告素材信息、媒体信息、用户信息和上下文信息，总共为 1001650 初赛数据和 1998350 条复赛数据（复赛训练数据为：初赛数据+复赛数据）。

02

快速搭建对话机器人，就用这一招！

问答系统是自然语言处理领域一个很经典的问题，它用于回答人们以自然语言形式提出的问题，有着广泛的应用。其经典应用场景包括：智能语音交互、在线客服、知识获取、情感类聊天等。常见的分类有：生成型、检索型问答系统；单轮问答、多轮问答系统；面向开放领域、特定领域的问答系统。本文涉及的主要是在检索型、面向特定领域的问答系统，通常称之为——智能客服机器人。

02

国内“谁”能实现chatgpt，短期穷出的类ChatGPT简评（算法侧角度为主），以及对MOSS、ChatYuan给出简评，一文带你深入了解宏观技术路线。

ChatGPT（全名：Chat Generative Pre-trained Transformer），美国OpenAI 研发的聊天机器人程序，于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，甚至能完成撰写邮件、视频脚本、文案、翻译、代码，写论文等任务。

02

国内“谁”能实现chatgpt，短期穷出的类ChatGPT简评（算法侧角度为主），以及对MOSS、ChatYuan给出简评，一文带你深入了解宏观技术路线。

ChatGPT（全名：Chat Generative Pre-trained Transformer），美国OpenAI 研发的聊天机器人程序，于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，甚至能完成撰写邮件、视频脚本、文案、翻译、代码，写论文等任务。

04

Bagging算法

Bagging算法（bootstrap aggregation）由Leo Breiman提出。是一种在每个自助样本集上建立基分类器，通过投票指派得到测试样本最终类别的方法。 Bagging算法从数据集有放回的随机抽取样本，生成多个自助样本集，每个自助样本集大小与原数据集一致，因此一些样本可能在同一个自助样本集中出现多次。对每个自助样本集训练一个基学习器，常用的基学习器为二元决策树，因为对于有复杂决策边界的问题，二元决策树性能不稳定，这种不稳定可以通过组合多个决策树模型来客服。最终，对于回归问题，结果为基学

06

业界 | ATEC蚂蚁人工智能大赛正式启动，我们从现场带来了Michael I. Jordan和蚂蚁金服算法专家们的解题攻略

机器之心报道作者：高静宜在大咖们的助力下，你对拿下百万奖金势在必行了吗？「经常有人问我，AI 的未来是什么？你对未来有着怎样的展望？我通常会说，那些金融科技公司所处的生态领域内的发展，将是未来A

09

干货 | 为了给你更好的体验，携程做了个“一站式”客服机器人

经纬，从事客服机器人的算法研发工作，专注于nlp领域的算法研究和应用，喜欢数据和场景驱动的算法研发。

04

AI 入行那些事儿（10）人工智能的应用领域

图像处理领域中，最基本的技术是图像识别技术，现在应用最广泛也最成熟的就是人脸识别技术。无论在中国还是在美国，都有很多相关创业公司，其中不乏这种垂直领域的独角兽。

02

2018 机器阅读理解技术竞赛冠军 Naturali 分享问答系统新思路

AI 研习社按：7 月 28 日，由中国中文信息学会和中国计算机学会联合举办的第三届语言与智能高峰论坛于北京语言大学举办，Naturali 奇点机智团队作为 2018 机器阅读理解技术竞赛冠军团队，受邀参加本次活动的「机器阅读理解评测论坛及颁奖仪式」，Naturali 联合创始人兼 CTO、国际计算语言学协会会士（ACL Fellow）林德康作为代表进行了 2018 阅读理解技术竞赛系统报告。

01

干货 | 2018 机器阅读理解技术竞赛冠军 Naturali 分享问答系统新思路

AI 科技评论按：7 月 28 日，由中国中文信息学会和中国计算机学会联合举办的第三届语言与智能高峰论坛于北京语言大学举办，Naturali 奇点机智团队作为 2018 机器阅读理解技术竞赛冠军团队，受邀参加本次活动的「机器阅读理解评测论坛及颁奖仪式」，Naturali 联合创始人兼 CTO、国际计算语言学协会会士（ACL Fellow）林德康作为代表进行了 2018 阅读理解技术竞赛系统报告。

03

小 Mil 来了！Milvus 智能问答机器人上线

它究竟有什么功能，又是怎么实现的呢？今天我要带大家来了解这个基于 Milvus 的 FAQ 问答机器人-MilMil。

05

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭