Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >浙江大学和海康威视提出:视频场景文本定位算法SVST(集成检测,跟踪和识别于一体)

浙江大学和海康威视提出:视频场景文本定位算法SVST(集成检测,跟踪和识别于一体)

作者头像
Amusi
发布于 2019-05-05 09:56:31
发布于 2019-05-05 09:56:31
2.2K0
举报
文章被收录于专栏:CVerCVer

前戏

【导读】本文分享一篇浙江大学和海康威视最新联合提出的视频场景文本定位(Video Scene Text Spotting)方向的算法:SVST(spotting video scene text)。之前CVer曾分享过场景文本检测相关的论文

正文

《Efficient Video Scene Text Spotting: Unifying Detection, Tracking, and Recognition》

arXiv: https://arxiv.org/abs/1903.03299

github: None

作者团队:浙江大学 & 海康威视

注:2019年03月08日刚出炉的paper

Abstract:本文提出了一个统一的框架,用于有效地发现/定位视频中的场景文本(scene text)。 该方法定位并跟踪每个帧中的文本,并一次性识别每个跟踪的文本流。具体而言,我们首先训练空间 - 时间(spatial-temporal)文本检测器,用于定位连续帧中的文本区域。其次,训练设计良好的文本跟踪器(tracker),用于将定位的文本区域分组成相应的裁剪文本流。为了有效地发现视频文本,我们使用文本区域质量评分机制一次性识别每个跟踪的文本流,而不是逐个识别裁剪的文本区域。两个公共 benchmarks 测试的实验表明,我们的方法实现了很高效的性能。

本文算法(SVST)

SVST算法如下图所示,主要包含4个模块:

  • 文本检测器:spatial-temporal text detector(SVTD)
  • 文本跟踪器:text tracker(TRIN)
  • 质量评分器:quality scorer(TSSN)
  • 文本识别器:text recognizor

其中特征提取的网络是使用:ResNet Backbone + Conv Blocks组合

1 视频文本检测

文本检测框架如下图所示,将 EAST算法的backbone作为本算法的backbone。在这里,通过时空聚合(spatial-temporal aggregation)策略来学习连续帧之间的关系,以改善视频文本检测过程,可以分为三个步骤:1)利用特征变形机制增强帧之间的时间相干性,2)具有比较和匹配策略的帧之间的空间匹配,3)时间聚合。

2 文本区域跟踪

跟踪任务旨在将相应的文本区域分组为文本流(text streams),如下图所示。 直观地,跟踪器应该能够确保一个流中的文本区域的特征应该与相同流中的文本区域的特征具有比其他流更接近的距离,这意味着:1)这些特征必须具有足够的辨别力,以容忍无约束场景中的各种干扰,2)如果用良好的距离测量训练,模块可能会更好。

3 文本流评分

在本模块中,通过引用QAN(quality aware network)来构建文本流评分网络(TSSN),如下图所示。

4 文本识别

在本算法中,文本识别模块不是关注的焦点,所以只选择基于注意力(attention-based)的方法作为解码器。如下图所示:

5 联合学习TRIN和TSSN

实际上,如果 TRIN(文本跟踪器)TSSN(质量评分器)共享相同的神经网络(如下图所示)并且同时进行训练会更好,因为1)度量学习可以帮助提取文本流评分的高判别性特征,2)由文本脚本驱动的文本流评分任务可以帮助增强特征对不同文本的区分,以及 3)参数共享进一步降低了计算成本。

实验结果

本文在 IC13 和 IC15 数据集上进行测试,项目代码是基于Caffe框架进行实现。

文本检测实验结果:

文本跟踪实验结果

质量评分实验结果

文本识别实验结果

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-03-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CVer 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Python应该要会一点吧
近期看了一下《Python编程 从入门到实践》这本书,然后写了一些笔记,和大家分享一下。
生信技能树
2023/02/27
1.8K0
Python应该要会一点吧
Python入门三部曲(三)
在函数greet_user()中,变量username是一个形参—-函数完成其工作所需要的一项信息.在代码greet_user(‘kobe’)中,值’kobe’是一个实参。
龙哥
2018/10/22
1.2K0
入门必备!面向对象编程之Python函数与类
Python支持大多数面向对象编程技术。在Python中所有东西都是对象,包括类、函数、数和模块。它允许多态性,不只是在类层级之内而且通过采用鸭子类型的方式。任何对象可以用于任何类型,只要它有适当的方法和特性就能工作。
数据STUDIO
2021/06/24
7820
Python函数初识
​ 计算机语言中的函数是类比于数学中的函数演变来的,但是又有所不同。前面的知识中我们学会了运用基础语法(列表、字典)和流程控制语句貌似也能处理一些复杂的问题,但是相对于相似的大量重复性的操作我们就没办法用之前的逻辑方法来解决了,这时候就需要一个可以概括这些重复性操作的统一代码来描述其特征来实现,所以函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。
py3study
2020/01/17
7820
Python基础
输入install ,选择Package Control:Install Package
仓颉cahr
2022/04/09
1.2K0
Python基础
快速掌握Python基础语法(下)
接着上一篇,这篇继续来讲 Python 的基础语法,如果你还没有看过之前的那一篇文章,可以看一下。
SuperFeng
2019/09/26
5150
函数
函数是带名字的代码块,用于完成具体的工作。通过使用函数,程序的编写、阅读、测试和修复都将更容易。
狼啸风云
2019/01/18
7630
Python函数(二)
经常会发现,向函数传递列表很有用,其中包含的可能是名字、数或更复杂的对象(如字典)。将列表传递给函数后,函数就能直接访问其内容。下面使用函数来提高处理列表的效率。假设有一个用户列表,我们要问候其中的每位用户。下面的示例将包含名字的列表传递给个名为 greet_users() 的函数,这个函数问候列表中的每个人:
Francek Chen
2025/01/22
600
函数
要执行函数定义的特定任务,可调用该函数。需要在程序中多次执行同一项任务时,无需反复编写完成该任务的代码,而只需调用执行该任务的函数,让Python运行其中的代码。
清菡
2020/12/02
8740
函数
全网最详细超长python学习笔记、14章节知识点很全面十分详细,快速入门,只用看这一篇你就学会了!
注意事项:本博客是我早起自己写的python笔记word版本,现在转成博客形式,由于ipython文件找不到了,很多代码都会以图片形式出现,不过放心不影响学习,对于比较长的程序例子我回重新贴好代码放入。
汀丶人工智能
2022/12/21
1.2K0
全网最详细超长python学习笔记、14章节知识点很全面十分详细,快速入门,只用看这一篇你就学会了!
关于“Python”的核心知识点整理大全18
这就是一种导入方法:只需编写一条import语句并在其中指定模块名,就可在程序中使用该 模块中的所有函数。如果你使用这种import语句导入了名为module_name.py的整个模块,就可使 用下面的语法来使用其中任何一个函数:
用户10920956
2024/01/19
1260
关于“Python”的核心知识点整理大全18
Python函数(一)
下面是一个打印问候语的简单函数,名为 greet_user() :
Francek Chen
2025/01/22
810
Python函数(一)
0基础小白想学Python不知道怎么入门从何学起?十分钟带你快速入门 Python(初学者必看,收藏必备!!!)
本文以 Eric Matthes 的《Python编程:从入门到实践》为基础,以有一定其他语言经验的程序员视角,对书中内容提炼总结,化繁为简,将这本书的精髓融合成一篇10分钟能读完的文章。
全栈程序员站长
2022/09/08
3.3K0
关于“Python”的核心知识点整理大全15
注意 大家有时候会形参、实参不分,因此如果你看到有人将函数定义中的变量称为实参或将 函数调用中的变量称为形参,不要大惊小怪。
用户10920956
2024/01/19
1940
关于“Python”的核心知识点整理大全15
#小手一抬学Python# Python字典已经掌握了【附源码】
已经学完了列表与元组,那这两个都是按照顺序排列的,所以可以用索引取到值,本篇博客要学习的是字典,由上文可知,字典肯定就是不能按照索引取到值,就是没顺序,非序列的数据结构。
程序员迪迪
2022/01/04
7460
python函数
python函数 本文目录 1 调用函数 2 定义函数 3 形式参数与实际参数 4 四种参数 4.1 位置参数 4.2 关键字参数 4.3 默认参数 4.4 不定长参数 5 不可变类型与可变类型的参数
mwangblog
2018/07/04
9860
超详解——python函数定义和调用——小白篇
Python 不支持传统意义上的函数重载(即同名函数的不同定义),但是可以通过使用可变参数和默认参数来实现类似的功能。这种方法使得一个函数可以根据传递的参数数量和类型表现出不同的行为。下面我们详细讨论如何利用这些特性实现函数的“重载”。
小李很执着
2024/06/15
1060
Python基础学习-函数
一:定义函数: ① 函数是带名字的代码块,用于完成具体的工作。 ② 函数使用关键字def来定义,最后,定义以冒号结尾。 ③ 每个函数后面都应紧跟一个文档字符串,来描述函数是做什么的, 文档字符
爱吃西瓜的番茄酱
2018/04/03
7530
Python基础学习-函数
十分钟快速入门 Python,看完即会,不用收藏!
读完本篇文章后,可对 Python 语言特性、编码风格有一定了解,并可写出简单的 Python 程序。
一墨编程学习
2019/05/15
3K0
Python 函数知识大全
函数能提高应用的模块性,和代码的重复利用率。你已经知道Python提供了许多内建函数,比如print()。但你也可以自己创建函数,这被叫做用户自定义函数。
Python知识大全
2020/02/13
9390
相关推荐
Python应该要会一点吧
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档