DAS 2020 (Document Analysis System,文档分析系统研讨会) 于 7月26-29日在武汉召开,本次研讨会中有不少精彩的内容,昨天向大家推荐了来自华南理工大学金连文老师的 keynote Speech :Optical Character Recognition in Deep Learning Era.
点击这里查看:
DAS 2020 Keynote Speech | 深度学习时代的 OCR
不少同学反馈很有帮助。
今天向大家推荐在该会议上来自 Adode 研究院 Sun Tong 博士的分享:The Future of Documents:A New Frontier in the Post-Pandemic Era.
Sun Tong 博士的分享从工业界文档分析的时代趋势出发,总结出当前文档分析技术的发展要以 3C 的维度深度服务业务。如下图:
即 Content 、Components、Consumer。
并分享了文档分析技术在 Adobe 研究院的研究与开发实践,主要内容包括:
1. 跨域的文档目标检测;
文档的类型和风格差异很大,跨域的研究很有必要。
2. 通过显著区域图对目标检测算法解释;
3. 文档分析中表格、图表、信息图的提取;
4. 基于文档中图表的问答;
5. 智能文档识别:文字区域提取,文档数据扭曲增广;
6. 专门面向合同文本的NLP理解(ContractBERT、条款识别)等。
Sun Tong 博士的分享向我们展现如何从业务的角度驱动技术研究,欢迎大家参考。
以下为完整PDF,52CV 获得授权发布。大家也可以在我爱计算机视觉公众号后台回复“文档AI”获取PDF文件全文。