首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

复现腾讯表格识别解析| 鹅厂技术

对连通区域进行过滤,长度太小丢弃。对剩下每个有效连通区域,分别拟合折线,即得到大量线段。对线段角度进行统计,横、竖两种线段与x轴夹角均值应接近0和90度,若否,则认为识别失败终止。...校正方法使用投影变换,也即拟合一个单应矩阵H,使得HX=X',X每一是在每条直线上固定距离采样齐次坐标,X'对应列是该点校正后齐次坐标。...每个文本中有若干字符,附带字符坐标对判断其所属单元格就十分重要了。下图是我司某个OCR平台所返回识别结果。 ? 4 识别表格结构 接下来需要识别表格结构,跟OCR结果进行匹配。...我们提出一套高效算法从表格线推导出每行(高()和所有单元格坐标。...由表格线推导行(高()比较容易,只需对所有的横(竖)线按从上(左)到下(右)排序,相临线形成一行(),所以只需计算相临线y坐标(x坐标)差即可。

2.8K20

动态RCNN | 动态训练实现高质量目标检测(附源码)

卷积 一维卷积一般都用于对文本进行卷积操作,它分为卷积(wide convolution)和窄卷积(narrow convolution),卷积输出使feature map 宽度更宽,类似n-gram...卷积比窄卷积有一些优势: 卷积可以确保过滤器中所有权重达到整个句子,包括边缘单词。 卷积保证了滤波器应用到输入语句上,总会产生一个有效非空结果c,独立于滤波器宽度m和句子长度s。...动态k-max池化意义在于,从不同长度句子中提取出相应数量语义特征信息,保证后续卷积层统一性。...由上图第一和第二可知,两组实验是设定相同IoU阈值。随着训练过程进行,模型产生更多高质量样本,造成回归目标的均值和方差均减小。...IoU动态变化过程如下:首先计算候选框与其匹配标注交并比I,然后选择第KI大值作为当前IoU阈值Tnow。随着训练过程,Tnow会随着I增大而增大。

1.5K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    走进AI时代文档识别技术 之表格图像识别

    对连通区域进行过滤,长度太小丢弃。对剩下每个有效连通区域,分别拟合折线,即得到大量线段。对线段角度进行统计,横、竖两种线段与x轴夹角均值应接近0和90度,若否,则认为识别失败终止。...校正方法使用投影变换,也即拟合一个单应矩阵H,使得HX=X',X每一是在每条直线上固定距离采样齐次坐标,X'对应列是该点校正后齐次坐标。...每个文本中有若干字符,附带字符坐标对判断其所属单元格就十分重要了。下图是我司某个OCR平台所返回识别结果。 2.4 识别表格结构 接下来需要识别表格结构,跟OCR结果进行匹配。...我们提出一套高效算法从表格线推导出每行(高()和所有单元格坐标。...由表格线推导行(高()比较容易,只需对所有的横(竖)线按从上(左)到下(右)排序,相临线形成一行(),所以只需计算相临线y坐标(x坐标)差即可。

    15.6K60

    Excel 常用九十九个技巧 Office 自学教程快速掌握办公技巧

    9、批量处理行高、点击表格内行列,选中需要统一行区域,鼠标移至行列之间线上,待鼠标变化为黑色带双向箭头时候拖拽行标或标之间线就能实现行列统一行高距离。...10、自动适应内容在表格区域内选中所有需要调整行列,鼠标放在行标或标之间线上,当鼠标变化为黑色带双向箭头时候双击鼠标左键。...67、固定长度编号录入选中编号单元格区域,按【Ctrl+1】打【设置单元格格式】窗口,选择【自定义】;,在类型文本框内输入【00000】,点击【确定】,编号前在用 0 补齐了。...82、固定长度编号只需要将整列格式调整成文本格式后,我们再输入 001 就不会变掉了。83、冻结首行单元格全选首行单元格 -【视图】-【冻结窗格】- 选择【冻结首行】即可。...86、取消固定单元格首先全选固定单元格,然后点击【视图】-【冻结窗格】-【取消固定单元格】即可。

    7.1K21

    windows编程学习笔记(三)ListBox使用方法

    设置 LBS_MULTIPLESEL   用户可以同时选择多项(用户单击一项时这项被选中,单击另一项时,这两项都被选中,选择多项时只需要点击不同项,不需要用组合键方式,同一项第一次单击时选中,第二次单击时取消选中...添加文件名列表 LB_FINDSTRING 返回列表一个字符索引 LB_FINDSTRINGEXACT 在列表查找第一个与特定字符匹配字符返回它索引 LB_GETANCHORINDEX...LB_GETTEXT  获取指定项字符串 LB_GETTEXTLEN 获得指定项字符串长度 LB_GETTOPINDEX 获取列表中显示第一索引,当使用滚动条使显示内容发生变化时,这个索引也会发生改变...在多选模式下,设置给定索引值矩形设置为焦点矩形,如果该值没有显示,那么滚动条将会自动滚动到相应行 LB_SETCOLUMNWIDTH 在多模式下设置所有项,使用这个消息必须保证列表有LBS_MULTICOLUMN...风给 LB_SETCOUNT 设置列表项总数,用于具有LBS_NODATA风给但是不具有LBS_HASSTRINGS风格列表 LB_SETCURSEL 设置某项处于被选中状态,并将该项加亮显示 LB_SETHORIZONTALEXTENT

    3.5K20

    学习笔记:delphi之TStringGrid

    1、说明 最近加入了一个项目组,使用开发工具是delphi6,想想又要开始搞这个工具有点小忧伤,但没办法谁让咱就是个打杂尼。。。...FixedRows:固定行数,设置为1,因为一行是表格头 FixedCols:固定数,设置1,用一个固定可以显示序号,同时也可以用于鼠标调整行高度 Options.goVertLine:数据区域垂直网格线...DrawText(Self.Label1.Canvas.Handle, PChar(sData), Length(sData), rect, DT_WORDBREAK or DT_CALCRECT); 设定一个固定矩形...这样就得到了实际文本高度。 DT_CALCRECT 就是用于计算文本矩形高哦。 调用上面那句代码后,cellRect就会计算出文本显示矩形大小了。同样就得到了高。...也就是画个,再画个文本。。

    1.8K50

    git可视化工具乌龟git新版本一些功能提升

    ,TortoiseGitMerge丢失文本选择 *再次使用VS2019 16.4进行构建规避代码生成问题 =版本2.10.0.1 = 发行日期:2020-03-19 ==错误修复== *修复问题#...*修复了同步对话中可能数据争用 =版本2.10.0 = 发行:2020-03-01 ==功能== *修复了问题#3448:修订图:使箭头方向可配置 *固定问题#3263:将父修订版与工作树进行比较...==错误修复== *修复了问题#3449:缩进短行(按Tab键)时崩溃 *固定问题#3463:“检查更新”对话-按钮未对齐 *固定问题#3442:修改提交后提交和推送总是导致推送失败 *修复了问题.../滑块/分隔线位置和) * LogDlg:修复过滤时闪烁 *修复问题#3505:TortoiseGitProc和TGitCache在具有损坏core.worktree路径存储库上崩溃...* SSHAskPass:将窗口调整为文本大小 *已修复问题#3386:TortoiseGitUDiff中行列可能会被切断 *已修复问题#3454:“日志消息”对话控件未对齐

    2.5K10

    网页布局基础

    这种情况发生在把一些文本添加到一个块级元素(比如 div)开头。即使没有把这些文本定义为段落,它也会被当作段落对待: some text Some more text....它除了能实现横向多布局以外,还可以实现许多复杂定位,例如: 带有遮罩层效果提示 ? Paste_Image.png 2.固定层效果 ? Paste_Image.png 全屏广告 ?...(固定定位): 元素表现类似于将 position 设置为 absolute,不过其包含块是视窗本身。...使用绝对定位ablolute实现横向两布局 — 常用于一固定宽度,另一宽度自适应情况 主要应用技能: relative—父元素相对定位 absolute—自适应宽度元素绝对定位 注意:固定宽度高度...>自适应宽度(因为绝对定位元素会导致父元素高度塌陷,所以一定要保证固定宽度高度>自适应宽度,才能让绝对定位元素放进父容器里)

    1.8K20

    一个合格初级前端工程师需要掌握模块笔记

    // space 相同间距平铺且填充满整个容器 背景图片定位background-attachment background-attachment:fixed // 背景图像是否固定或者随着页面的其余部分滚动...文本大小写text-transform capitalize 文本每个单词大写字母开头。...range 生成一个拖动条,通过拖动条,使得用户只能输入指定范围,指定步长值 search 生成一个专门用于输入搜索关键字文本 tel 生成一个只能输入电话号码文本 url 生成一个...background-size 设置背景大小 cover/contain/长度/百分比 新增字体文本相关属性 text-overflow 设置当文本溢出元素时处理方式 clip/ellipsis...表单 :input 匹配所有 input, textarea, select 和 button 元素 :text 匹配所有的单行文本 :password 匹配所有密码 :radio 匹配所有单选按钮

    3.7K10

    “Excel格式”最风骚玩法,炫技加薪就靠它了

    001 自定义格式概述 01 调出单元格格式对话 选中需要设置格式单元格,按「CTRL+1」快捷键打开「设置单元格格式」对话。...从上图可见,可以利用代码0来让数值显示前导零,让数值固定按指定位数显示。下图是使用#与0组合为最常用带小数数字格式。 ? 04、"?" 注释:数字占位符。...在小数点两边为无意义零添加空格,以便当按固定宽度时,小数点可对齐;也可以用于具有不同位数分数。 ? 05、"@" 注释:文本占位符。...06、"*"注释:重复下一次字符,直到充满 代码:@*-。123 显示为 123------------------- ? 07、"," 注释:千位分隔符 代码 #,### 。..."DD"或"D":两位(01~31)或一位(1-31)来表示天。 ? 12、“_" 注释:在数字格式中创建N个字符空格 ? 13、空 注释:表示隐藏 ?

    2.4K30

    EAST、PixelLink、TextBoxes++、DBNet、CRNN…你都掌握了吗?一文总结OCR必备经典模型(二)

    这样就可以输出一些文本了,但是文章为了防止一些噪声影响,将检查结果中短边小于10或者面积小于300文本进行滤除,从而得到最终文本检查结果。 PixelLink完整结构如图3。...在测试阶段应用非最大抑制,合并所有6个文本结果。"...在训练过程中,default box通过计算与ground truthoverlap来匹配ground truth,匹配策略和SSD相同。...采用这种处理方式是因为文本图像多数都是高较小而较长,所以其feature map也是这种高小矩形形状。...在作者原文设置中,每一宽度被固定为单像素。 RNN 有梯度消失问题,不能获取更多上下文信息,所以 CRNN 中使用是 LSTM,LSTM 特殊设计允许它捕获长距离依赖。

    94431

    【深度学习】光学字符识别(OCR)

    3)OCR难点 文本检测,尤其是复杂自然场景下文本检测,非常具有挑战性,主要难点有: 文本存在多种分布,文本排布形式多样; 文本大小、长度固定文本存在多个方向; 多种语言混合。...其基本思想是先使用固定宽度(16像素)文本对图像进行检测,得到一系列含有文字区域,然后对这些区域进行合并,合并成大、完整文本。 2)具体步骤 CTPN主要包含以下几个步骤: 检测文本。...然后通过顺序连接具有相同提议对来构建文本行; CTPN检测有(红色)和没有(黄色虚线框)边缘细化。细粒度提议边界颜色表示文本/非文本分数。...这意味着第i个特征向量是所有特征图第i连接。在我们设置中每宽度固定为单个像素。由于卷积层,最大池化层和元素激活函数在局部区域上执行,因此它们是平移不变。...首先,RNN具有很强捕获序列内上下文信息能力。对于基于图像序列识别使用上下文提示比独立处理每个符号更稳定且更有帮助。场景文本识别为例,字符可能需要一些连续帧来完全描述(参见图2)。

    6.4K10

    前端基础篇css

    父元素{height:value;} 缺点:给父元素固定高度违背了高度自适应原则,不建议使用 b) 给父元素添加overflow:hidden; 优点:简单 缺点:当子元素存在定位时,定位在父元素之外部分将会被隐藏掉...E[attr^=value] 匹配含有attr属性并且值value开头E元素 eg: a[href^=http]{font-size:12px;} 匹配含有href属性并且属性值http开头a标签...E[attr$=value] 匹配含有attr属性并且值value结尾E元素 eg: a[href$=com]{color:blue;} 匹配含有href属性并且属性值com结尾a标签 5....E[attr|=value] 匹配含有attr属性,并且值value-开头或值为valueE元素 eg: a[class|=link]{color:blue;} 匹配含有class属性并且值link...:first-line 匹配段落文本第一行 4. :first-letter 匹配段落文本第一个字符 5.

    1.7K30

    CTPN、TextBoxes、SegLink、RRPN、FTSN、DMPNet…你都掌握了吗?一文总结OCR必备经典模型(一)

    分段(黄)和链接(未显示)由卷积预测器在多个特征层(l = 1 ... 6为索引)上检测,通过组合算法组合成整个单词 SegLink完整工作流程如下: 主干网络沿用SSD网络结构,修改了最后...Segments表示一个文本一个部分,可以是一个文字也可以是多个文字。segment是一个增加了方向信息五元组x、y、w、h、θ,分别表示:中心坐标,矩形高,矩形角度。...接着通过仿射变换将子区域转换成平行于坐标轴矩形,最后通过Max Pooling得到长度固定特征向量。...后处理 为了得到最终检测结果,使用非最大抑制机制(NMS)来过滤重叠文本实例,保留那些具有最高分文本。在NMS之后,为每个文本实例生成一个覆盖掩码最小四边形,如图7所示。...为了解决这些问题,提出了一种新基于卷积神经网络(CNNs)方法,命名为深度匹配先验网络( Deep Matching Prior Network ,DMPNet),检测具有更紧密四边形文本

    49030

    HTML5 与CSS3 相关笔记

    输入域 文本域 (多行输入) 定义 元素标签,一般为输入标题 定义一组相关表单元素,使用外包含起来...(2)placeholder:为文本提示用户输入 (3)required:规定文本不能为空.../height (2)border-box:盒子或高度等于元素内容或高度 (即 该内容/高度=盒子/高度-border-padding ) (3)inherit:使元素继承父元素盒子模型模式...(4)fixed固定定位 a.特性:直接浏览器窗口为基准定位,偏移位置不受窗口滚动条滚动影响。 b.使用场景:窗口边缘固定广告、返回顶部图标、边缘固定导航栏等。...tx表示X轴(横坐标)上移动向量长度,正值向右,负值向左。 ty表示Y轴(纵坐标)上移动向量长度,正值向下,负值向上。

    5.4K30

    CSS布局解决方案(上)

    (2)代码实例 (3)优缺点 优点:只设置了parent 缺点:兼容性存在一定问题 定+自适应 1)使用float+overflow (1)原理、用法 原理:通过将左边框脱离文本流,设置右边规定当内容溢出元素时发生事情达到多布局...(2)代码实例 (3)优缺点 优点:简单 缺点:不支持ie6 2)使用float+margin (1)原理、用法 原理:通过将左脱离文本流,加上右向右移动一定距离,达到视觉上布局。...100%,给左框子元素一个固定宽度从而达到自适应。...(2)代码实例 (3)优缺点 缺点:ie6 ie7不支持 3)使用flex (1)原理、用法 原理:通过设置CSS3布局利器flex中flex属性达到多布局,加上给左内容定、给右设置flex...(2)代码实例 (3)优缺点 优点:flex很强大 缺点:兼容性存在一定问题,性能存在一定问题 两不定+一自适应 (1)原理、用法 原理:这个情况与一不定+一自适应查不多。

    1.2K40

    表格控件:计算引擎、报表、集算表

    对于 SpreadJS Designer,当右键单击任何这些对象时,还提供了一个新“另存为图片”选项: 报表插件 行高自适应 SpreadJS 报表插件现在支持行和自动调整。...表 自定义样式 新版本中,SpreadJS 允许用户自定义表格样式 集算表 预定义 SpreadJS 集算表新版本支持添加、更新和删除具有有意义类型帮助轻松设计表格。...类型如下: 类型 数据类型 描述 数值 数值 用于大多数具有指定格式数值 文本 文本 用于常见文本 公式 取决于结果 根据记录中其他字段计算值 查找 取决于相关字段 查找相关记录中特定字段 日期...电话 文本 掩码验证指示数字字符串 邮件 文本 掩码验证指示电子邮件地址 链接 文本 指示 URL 文本 创建时间 日期 在创建记录时设置日期 修改时间 日期 在记录字段更新时设置日期 附件 对象...数据透视表分组兼容性更新 Excel 更改了数据透视表中分组方式,因此我们更新了 SpreadJS 数据透视表分组策略匹配

    11810
    领券