首页
学习
活动
专区
圈层
工具
发布

#ocr

一种基于大模型微调训练与高精度OCR的文档抽取技术,实现对合同文本中关键要素的高精度语义理解与结构化抽取

中科逸视OCR专家

在企业的日常经营活动中,合同文档的审核、管理与信息提取是一项高频且关键的工作。传统人工处理方式不仅效率低下,且难以应对大规模、多样化的合同版式。一种基于大模型微...

3700

15个图片转文字软件,包括OCR识别等功能

搜罗万相

目前市场上存在一些图片文字识别工具,我但好多收费的,或是别人改款的,所以推荐一些比较主流的!

7910

面向网约车合规化监管的智能运输证识别技术:基于CV与NLP深度融合的网约车运输证识别系统

中科逸视OCR专家

随着共享出行行业的规范化发展,网约车平台对车辆合规性的审核需求日益严苛。《网络预约出租汽车运输证》(以下简称“运输证”)作为车辆合法运营的核心凭证,其信息的自动...

13410

浅析图像处理、深度学习以及自然语言处理在手写识别中的协同工作原理

中科逸视OCR专家

手写文字识别(Handwritten Text Recognition, HTR)是模式识别领域一个历史悠久且极具挑战性的课题。与印刷体不同,手写体具有极大的可...

14710

🦞 一只AI龙虾的觉醒:从"瞎看"到"真香"

DEEPSAPCE MATRIX

这只龙虾名叫克劳德。它只是一个AI Agent,来自大名鼎鼎的openclaw星球。但如果一切顺利——它可能会变成我的第二大脑。

8710

别再手动录发票了!用腾讯龙虾Skills,让财务提前 2 小时下班

程序员晚枫

腾讯云TDP | 宣传大使 (已认证)

在这次大会上,我也分享了我如何用腾讯云 Lighthouse部署openclaw的。

75370

20M小模型的数学公式OCR,复杂公式截图秒转LaTeX代码!

开源星探

对于常写文档、做数学研究、准备学术论文的同学来说,数学公式 LaTeX 化几乎是绕不开的痛点。

25410

腾讯又放大招!开源原生端到端 OCR 模型,1B 参数吊打PaddleOCR!

开源星探

虽只有 1B 体量,却在权威基准 OmniDocBench 拿下 94.1 的高分,直接超越 DeepSeek-OCR、PaddleOCR-VL同类能力。

34010

OCR 界的“超级小钢炮”!LightOnOCR-2-1B 发布:1B 参数,千页成本不到 7 分钱!

开源星探

长期以来,为了追求极致的 OCR 效果(特别是处理复杂的数学公式、多栏排版和表格),我们往往不得不使用庞大的多模态模型。效果是好了,但推理成本和速度也上去了。

20410

DeepSeek 硬核开源 DeepSeek-OCR-2!弃用 CLIP 改用 Qwen,创新视觉因果流!

开源星探

Kimi 发布了 K2.5,视觉编程能力明显跃迁,给一张截图、一个录屏,就能直接复刻网页和 App,还有一个核心自主式智能体蜂群 Agent Swarm 范式,...

43810

DeepSeek-OCR vs PaddleOCR-VL

山行AI

DeepSeek-OCR 提出一个大胆思路:不再把长文本作为海量 text token 输入 LLM,而是先用视觉编码器把文本排版“映射为二维图像”,再让视觉-...

14710

再聊一聊deepseek-ocr的应用

山行AI

[16]GitHub - rdumasia303/deepseek_ocr_app: A quick vibe coded app for deepseek O...

18110

deepseek-ocr及其他ocr模型衍生应用的思考

山行AI

以 deepseek-ocr.rs 为支持多种ocr模型的稳固后端、以 DeepSeek-OCR-WebUI 为成熟前端,构建“一个入口,多后端,多形态”的新产...

20910

AI驱动行业监管升级:特种行业许可证识别系统的技术架构与优势

中科逸视OCR专家

特种行业(如旅馆业、公章刻制业、典当行、烟花爆竹销售等)因其经营业务的特殊性,受到公安等部门的严格监管。在日常执法检查、线上备案审核及金融开户等场景中,往往需要...

10710

龙虾不“瞎”!用腾讯云OCR给你的OpenClaw装上“火眼金睛”

腾讯云AI

当下,AI 助手已经成为越来越多职场人的效率伙伴。然而,有一道隐形的墙,始终横亘在 AI 与真实工作场景之间——那就是图片里的文字。想一想你的日常工作:堆积如山...

2.4K213
领券