首页
学习
活动
专区
圈层
工具
发布

#ocr

让大模型读懂三千年汉字:中国古文字识别评测基准 Chronicles-OCR 发布

小腾资讯君

当我们用 AI 识别一份合同、一张菜单、一篇 PDF 论文时,模型几乎已经能做到"指哪读哪"。但如果我们把摄像头对准一片殷墟出土的龟甲、一座西周青铜鼎的内壁、一...

21610

DeepSeek-OCR上下文感知压缩提升识别效率

梯度不陡

在传统大模型处理长文本时,单页文档往往包含上千词,推理计算量会激增至原来的数十倍。现有方法随内容扩展,序列长度迅速膨胀,造成服务器资源消耗剧增。DeepSeek...

10510

营业执照识别技术深度融合深度学习、OCR 与 NLP 技术,构建了从图像预处理到智能校验的全链路技术体系

中科逸视OCR专家

在数字化转型加速推进的背景下,营业执照作为企业法人身份的核心凭证,其信息的高效、精准采集与核验,成为政务服务、金融风控、企业管理等多个领域流程优化的关键环节。营...

15110

视频审核中的OCR文本识别技术:如何精准捕获画面中的违规文字?

gavin1024

摘要: 视频中的违规信息不只藏在画面和声音里,还经常隐匿在画面文字中——弹幕、字幕、水印、广告文案、联系方式、谐音暗号……传统的画面审核只"看图"不"读字",让...

16910

点播视频多维度审核实战:画面、音频、OCR文本三管齐下杜绝违规

gavin1024

摘要: 只审画面不审音频?只看图片不识文字?单一维度的视频审核就像只锁前门不锁后门,违规内容总能找到漏洞。本文详解腾讯云VM如何通过画面、音频、OCR文本三个维...

17910
领券