简介

最近更新时间:2025-08-05 02:08:54

我的收藏

概述

腾讯云文字识别(Optical Character Recognition,OCR),基于腾讯优图实验室的深度学习和多模态大模型技术,将图片上的文字内容,智能识别为可编辑的文本或提取结构化的信息。OCR支持身份类证件、银行卡、发票票据等制式类卡证票据等识别,也支持各种复杂格式的行业文档 如交通物流磅单、托书,医疗行业如诊断书、费用清单的识别。
本章节介绍的文字识别 API 接口均为 API 3.0 接口。
您可以调用 API 对文字识别进行操作,例如通用文字识别、卡证文字识别、票据识别和文档智能等。
文字识别支持的所有接口信息,请参见 API概览

术语表

文字识别 API 接口的常见术语请参见下表:

术语 描述
对象简谱 是一种轻量级的数据交换格式,任何 JavaScript 语言支持的类型都可以通过 JSON 来表示,例如字符串、数字、对象、数组等。
SDK 是软件工程师为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合。

使用限制

对于 API 接口的参数限制,请参考各接口文档中的参数说明。

API 快速入门

您可以使用 API Explorer 工具在线调用 API。
本文以调用通用印刷体识别(高精度版)为例,通过 API Explorer 工具调用 API 接口的步骤如下:
1、注册腾讯云账号并通过实名认证后,登录 文字识别 控制台,点击立即开通,即可获得文字识别的 API 接口调用权限。
2、进入 API Explorer 页面。更多 API Explorer 工具使用信息,请参见 文档
3、调用 GeneralAccurateOCR 接口。
4、输入相应参数后在线调用查看响应结果。具体输入参数说明可见 接口文档