前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >【NAACL 2021】RCI:在基于 Transformer 的表格问答中行和列语义捕获

【NAACL 2021】RCI:在基于 Transformer 的表格问答中行和列语义捕获

作者头像
小爷毛毛_卓寿杰
发布于 2022-11-02 09:55:07
发布于 2022-11-02 09:55:07
84200
代码可运行
举报
文章被收录于专栏:Soul Joy HubSoul Joy Hub
运行总次数:0
代码可运行

1、简介

  • ​论文地址:https://arxiv.org/pdf/2104.08303.pdf

最近,基于 Transformer 的架构被用于越来越多被应用于Table QA。在本文中,作者提出了两种新颖的方法,证明一种方法可以在不使用任何这些专门的预训练技术的情况下在 Table QA 任务上实现卓越的性能。

  • 第一个模型称为 RCI Interaction ,它利用基于 Transformer 的架构,该架构独立地对行和列进行分类以识别相关单元格。该模型在最近的基准测试中查找单元格值时产生了极高的准确性。
  • 作者还提出的第二种模型,称为 RCI Representation,通过实现现有表的嵌入,为在线 QA 系统提供了优于表的显着效率优势。

在最近的基准上实验证明,所提出的方法可以有效地定位表格上的单元格值(在 WikiSQL 查找问题上高达 ∼98% 的 Hit@1 准确率)。此外,RCI Interaction 模型优于最先进的基于 Transformer 在非常大的表语料库(TAPAS 和 TABERT)上进行预训练的方法,在标准 WikiSQL 基准上实现了 ∼3.4% 和 ∼18.86% 的额外精度提高。

2、模型介绍

2.1 模型结构

RCI使用文本匹配来定位答案所在的行或者列,其中一个文本是Question,另一个文本是行或者列。

  • RCI Interaction:序列化文本会使用[CLS]和[SEP]将问题与行或者列文本进行拼接,然后这个序列对被输入至ALBERT 。最终[CLS] 隐藏层的输出用于后面的线性层和softmax,判断行或者列是否包含答案。
  • RCI Representation:

问题的向量表示和列或者行的向量表示会先被分别算出来。然后,这两个向量按如上图所示的方式进行拼接,并使用带有softmax层的全连接层对拼接后的向量进行分类。

2.2 表格序列化

我们了解了模型的结构后,还有个问题没介绍,那就是行和列是怎么序列化为文本的?作者这里采用的方案是:

  • 行:每个单元格的序列化为:单元格的值与该单元格所对应的列标题的拼接,再将该行的每个单元格序列化拼接,构成行的序列化。
  • 列:将该列列表头与该列的各个单元格值进行拼接,构成列的序列化。

举个例子,如上所示的表。该表格的第一行被转换为:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Name:Benjamin Contee|Took office:1789|Left office:1791|Party:Anti-Administration|Note/Events:|

该表的第二列被转换为

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Took office : 1789 | 1791 | 1792 | 1793 | 1795 |

3. 扩展到聚合问题

虽然 RCI 的重点是解决表格查找问题,但也可以通过添加问题分类器扩展到聚合问题。训练另一个Transformer将“问题-表头”序列对分类为六类之一:lookup, max, min, count, sum 和average。因为表格标题是和,诸如“How many wins do the Cubs have?”之类的问题是相关的。可以由 lookup、count 或者 sum操作得到答案,具体取决于表的结构。

对 RCI 模型的单元级别置信度设置一个阈值,并按预测的问题类型,进行聚合,产生最终答案,即可用于单元格的查找问题,也可以用于聚合成单个数字的问题。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-10-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
表格问答2:模型
说回正题,今天我们将介绍两个NL2SQL模型,X-SQL和HydraNet。它俩都来自微软,分别推出于2019年和2020年。X-SQL跟它之前的方案比如SQlNET[2]、SQLOVA[3]都比较像,很有代表性;HydraNet对前人解决问题的大框架做了一些修改,变得更加简洁,也更符合预训练语言模型的使用习惯,应该会给大家一点启发。
朴素人工智能
2020/04/20
1.2K0
【NLP】ACL2020表格预训练工作速览
近年来预训练语言模型(BERT、ERNIE、GPT-3)迅速发展,促进了NLP领域各种任务上的进步,例如阅读理解、命名实体识别等任务。但是目前的这些预训练模型基本上都是在通用文本上进行训练的,在需要一些需要对结构化数据进行编码的任务上(如Text-to-SQL、Table-to-Text),需要同时对结构化的表格数据进行编码,如果直接采用现有的BERT等模型,就面临着编码文本与预训练文本形式不一致的问题。
yuquanle
2020/08/27
5.9K0
【NLP】ACL2020表格预训练工作速览
ACL 2020 | 用BERT解决表格问答任务,谷歌提出弱监督表格解析器TaPas
世上许多信息都是以表格形式存储的,这些表格见诸于网络、数据库或文件中。它们包括消费产品的技术规格、金融和国家发展统计数据、体育赛事结果等等。目前,要想找到问题的答案,人们仍需以人工方式查找这些表格,或使用能提供特定问题(比如关于体育赛事结果的问题)的答案的服务。如果可通过自然语言来查询这些信息,那么取用这些信息会容易很多。
代码医生工作室
2020/06/18
1.1K0
ACL 2020 | 用BERT解决表格问答任务,谷歌提出弱监督表格解析器TaPas
【微软】【ICLR 2022】TAPEX:通过学习神经 SQL 执行器进行表预训练
论文:https://arxiv.org/abs/2107.07653 代码:https://github.com/microsoft/Table-Pretraining
小爷毛毛_卓寿杰
2022/12/02
1.2K0
常用的表格检测识别方法——表格结构识别方法(上)
表格结构识别是表格区域检测之后的任务,其目标是识别出表格的布局结构、层次结构等,将表格视觉信息转换成可重建表格的结构描述信息。这些表格结构描述信息包括:单元格的具体位置、单元格之间的关系、单元格的行列位置等。
合合技术团队
2023/05/24
1.4K0
常用的表格检测识别方法——表格结构识别方法(上)
GPT 大型语言模型可视化教程
欢迎来到 GPT 大型语言模型演练!在这里,我们将探索只有 85,000 个参数的 nano-gpt 模型。
此星光明
2024/05/16
2340
GPT 大型语言模型可视化教程
【人工智能】Transformers之Pipeline(十六):表格问答(table-question-answering)
pipeline(管道)是huggingface transformers库中一种极简方式使用大模型推理的抽象,将所有大模型分为音频(Audio)、计算机视觉(Computer vision)、自然语言处理(NLP)、多模态(Multimodal)等4大类,28小类任务(tasks)。共计覆盖32万个模型
LDG_AGI
2024/09/11
3660
【人工智能】Transformers之Pipeline(十六):表格问答(table-question-answering)
Table-GPT:让大语言模型理解表格数据
llm对文本指令非常有用,但是如果我们尝试向模型提供某种文本格式的表格数据和该表格上的问题,LLM更有可能产生不准确的响应。
deephub
2023/10/27
1.1K0
Table-GPT:让大语言模型理解表格数据
常用的表格检测识别方法——表格结构识别方法 (下)
表格结构识别是表格区域检测之后的任务,其目标是识别出表格的布局结构、层次结构等,将表格视觉信息转换成可重建表格的结构描述信息。这些表格结构描述信息包括:单元格的具体位置、单元格之间的关系、单元格的行列位置等。在当前的研究中,表格结构信息主要包括以下两类描述形式:1)单元格的列表(包含每个单元格的位置、单元格 的行列信息、单元格的内容);2)HTML代码或Latex代码(包含单元格的位置信息,有些也会包含单元格的内容)。
合合技术团队
2023/06/01
3.1K0
常用的表格检测识别方法——表格结构识别方法 (下)
论文Express | 自然语言十项全能:转化为问答的多任务学习
Salesforce最新论文提出了一个可处理多项自然语言处理的通用模型:decaNLP,处理机器翻译、文本分类等NLP任务统统不在话下!
大数据文摘
2018/07/31
7720
论文Express | 自然语言十项全能:转化为问答的多任务学习
结构化数据,最熟悉的陌生人
而本文着重提及的结构化数据则是指数据点之间具有清晰的、可定义的关系,并包含一个预定义的模型的数据(如图 1 所示)。看起来结构化数据应该更容易处理,而基于机器学习的特性(特征提取),大家更多的注意力集中在了对文本这类非结构化数据的处理,好像对于结构化数据的处理过去都不怎么热门。但是随着机器学习的发展,过去传统的结构化数据分析方法已经不能满足我们的需求了,而且这些结构化数据其实都是质量很高的数据,如何在神经网络中利用这些数据也是很重要的任务。
机器之心
2020/12/17
6880
结构化数据,最熟悉的陌生人
从图像中检测和识别表格,北航&微软提出新型数据集TableBank
TableBank 开源地址:https://github.com/doc-analysis/TableBank
机器之心
2019/04/29
2.7K0
从图像中检测和识别表格,北航&微软提出新型数据集TableBank
解密Prompt系列32. LLM之表格理解任务-文本模态
这一章我们聊聊大模型表格理解任务,在大模型时代主要出现在包含表格的RAG任务,以及表格操作数据抽取文本对比等任务中。这一章先聊单一的文本模态,既你已经通过OCR或者多模态等方式从PDF或者图片中获取了表格的文本数据。和前文相同,我们分别介绍微调和基于Prompt的两种方案。
风雨中的小七
2024/06/20
1K0
解密Prompt系列32. LLM之表格理解任务-文本模态
AAAI 2020 提前看 | 三篇论文解读问答系统最新研究进展
在本篇提前看中,我们重点聚焦 AAAI 2020 中与问答系统(Q&A)相关的文章。问答系统是自然语言处理领域的一个重要研究方向,近年来各大国际会议、期刊都发表了大量与问答系统相关的研究成果,实际工业界中也有不少落地的应用场景,核心算法涉及机器学习、深度学习等知识。问答系统(Q&A)的主要研究点包括模型构建、对问题/答案编码、引入语义特征、引入强化学习、内容选择、问题类型建模、引入上下文信息以及实际应用场景问题解决等。在本次 AAAI2020 中,直接以「Question/Answer」作为题目的论文就有 40 余篇。本文选取了其中三篇进行详细讨论,内容涉及语义特征匹配、模型构建和医学场景应用等。
机器之心
2020/02/24
1.5K0
AAAI 2020 提前看 | 三篇论文解读问答系统最新研究进展
矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见
一位软件工程师Brendan Bycroft制作了一个「大模型工作原理3D可视化」网站霸榜HN,效果非常震撼,让你秒懂LLM工作原理。
新智元
2023/12/05
1.6K0
矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见
Transformers 4.37 中文文档(九十四)
SpeechEncoderDecoderModel 可用于使用任何预训练语音自编码模型作为编码器(例如 Wav2Vec2,Hubert)和任何预训练自回归模型作为解码器初始化语音到文本模型。
ApacheCN_飞龙
2024/06/26
2840
Transformers 4.37 中文文档(九十四)
赠书 | 新手指南——如何通过HuggingFace Transformer整合表格数据
不可否认,Transformer-based模型彻底改变了处理非结构化文本数据的游戏规则。截至2020年9月,在通用语言理解评估(General Language Understanding Evaluation,GLUE)基准测试中表现最好的模型全部都是BERT transformer-based 模型。如今,我们常常会遇到这样的情形:我们手中有了表格特征信息和非结构化文本数据,然后发现,如果将这些表格数据应用到模型中的话,可以进一步提高模型性能。因此,我们就着手构建了一个工具包,以方便后来的人可以轻松实现同样的操作。
AI科技大本营
2020/12/08
1.6K0
赠书 | 新手指南——如何通过HuggingFace Transformer整合表格数据
常用的表格检测识别方法-表格区域检测方法(上)
表格检测识别一般分为三个子任务:表格区域检测、表格结构识别和表格内容识别。本章将围绕这三个表格识别子任务,从传统方法、深度学习方法等方面,综述该领域国内国外的发展历史和最新进展,并提供几个先进的模型方法。
合合技术团队
2023/05/18
1.6K0
常用的表格检测识别方法-表格区域检测方法(上)
前端入门2-HTML标签声明正文-HTML标签
作为一个前端小白,入门跟着这四个来源学习,感谢作者的分享,在其基础上,通过自己的理解,梳理出的知识点,或许有遗漏,或许有些理解是错误的,如有发现,欢迎指点下。
请叫我大苏
2018/12/04
2.7K0
前端入门2-HTML标签声明正文-HTML标签
数据太多太凌乱?教你打造一个能"看懂"表格图片的数据助手
在当前大数据时代的背景下,我们每天面临着各种形式的数据,其中有结构化的,也有非结构化的。特别是对图片形式这种非结构化的数据,如何高效地获取、处理以及分析仍旧是一系列颇有挑战的任务。我们常常会拿到一份表格的数据材料, 或许是一页传单,或许是书页上的数据整理,或许是一页实验报告,又或许是某产品规格参数等等,然后基于传统的操作方式, 将数据逐项录入到系统,存储到数据库,通过SQL命令跟数据库交互,并二次处理后返回给用户。整个过程比较繁琐,更重要的是,要求用户具备数据库和其他IT技能。本项目探索了一种新的思路,即直接解析表格图片的数据并用人类自然语言直接查询所需数据, 让普通用户更好的满足该场景下的数据需求。
用户1386409
2021/11/17
9370
数据太多太凌乱?教你打造一个能"看懂"表格图片的数据助手
推荐阅读
相关推荐
表格问答2:模型
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档