前言:在当今数字化快速发展的时代,光学字符识别(OCR)技术已成为众多领域不可或缺的工具,它能够将图像中的文字信息快速、准确地转化为可编辑的文本格式,极大地提高了数据处理的效率和准确性。腾讯云的智能结构化 OCR 平台作为行业内的领先解决方案,具备强大且丰富的功能,涵盖了从商户门头照识别到票据识别以及众多其他应用场景,旨在满足不同用户在不同业务场景下的多样化需求。
本文介绍腾讯云智能结构化 OCR 平台的使用方法,通过逐步的操作指引和实际案例展示。
进入腾讯云的智能结构化OCR主页,点击开通服务,如下链接
认证之后,点击立即开通
然后点击进入控制台
搜索 API Explorer
选择左侧API Explorer进入如下界面,在搜索框搜索OCR
接下来进行实际场景的应用实践
首先,准备商户门头照的图片,例如下图
然后接着以下页面,首先选择该场景的应用为商户门头照,第二步输入参数(默认),第三步上传准备好的商户门头照图片,第四步,点击发送请求,得到响应结果
如下为调用后识别的结果,提供识别后的结构化数据。
{
"Response": {
"Angle": -1.6752146482467651,
"RequestId": "5d75952d-adaf-4284-ab9f-4379dc62fde9",
"StoreInfo": [
{
"Name": "商店名称",
"Rect": {
"Height": 131,
"Width": 454,
"X": 298,
"Y": 200
},
"Value": "进口超市"
}
],
"StoreLabel": [
"标准门头照"
]
}
}
以下是基于 HTTP 的 GET 请求 API的程序示例,来调用API
import requests
def call_api():
api_url = "替换为实际的 API 地址"
try:
response = requests.get(api_url)
response.raise_for_status() # 检查请求是否成功
data = response.json()
print(data)
# 在这里可以根据返回的数据结构进行进一步处理
angle = data["Response"]["Angle"]
request_id = data["Response"]["RequestId"]
store_info = data["Response"]["StoreInfo"]
store_label = data["Response"]["StoreLabel"]
print(f"Angle: {angle}")
print(f"RequestId: {request_id}")
print(f"StoreInfo: {store_info}")
print(f"StoreLabel: {store_label}")
except requests.exceptions.RequestException as e:
print(f"请求 API 时发生错误: {e}")
except KeyError as e:
print(f"解析 API 响应数据时发生错误: {e}")
if __name__ == "__main__":
call_api()
首先,准备发票的图片,例如下图的一张发票
然后接着以下页面,首先选择该场景的应用为通用票据识别(高级版),第二步输入参数(默认),第三步上传准备好的发票图片,第四步,点击发送请求,得到响应结果
如下为调用后识别的结果,提供识别后的结构化数据。
{
"Response": {
"MixedInvoiceItems": [
{
"Angle": 0,
"Code": "OK",
"CutImage": "",
"ItemPolygon": [],
"Page": 1,
"Polygon": {
"LeftBottom": {
"X": 0,
"Y": 546
},
"LeftTop": {
"X": 0,
"Y": 0
},
"RightBottom": {
"X": 846,
"Y": 546
},
"RightTop": {
"X": 846,
"Y": 0
}
},
"SingleInvoiceInfos": {
"AirTransport": null,
"BusInvoice": null,
"ElectronicFlightTicketFull": null,
"ElectronicTrainTicketFull": null,
"MachinePrintedInvoice": null,
"MedicalHospitalizedInvoice": null,
"MedicalOutpatientInvoice": null,
"MotorVehicleSaleInvoice": null,
"NonTaxIncomeElectronicBill": null,
"NonTaxIncomeGeneralBill": null,
"OtherInvoice": null,
"QuotaInvoice": null,
"ShippingInvoice": null,
"TaxiTicket": null,
"TollInvoice": null,
"TrainTicket": null,
"UsedCarPurchaseInvoice": null,
"VatCommonInvoice": null,
"VatElectronicCommonInvoice": {
"AcquisitionMark": 0,
"AgentMark": 0,
"BlockChainMark": 0,
"Buyer": "深圳市联云计算机科技有限公司",
"BuyerAddrTel": "深圳市南山区西丽大勘工业区工业二路6号3080755-88357790",
"BuyerBankAccount": "中国银行深圳分行754957928561",
"BuyerTaxID": "91440300555442072M",
"CheckCode": "01282388107430782375",
"Ciphertext": "00-9864668**29112*65606376-2,441*/*-315<566><<-7<>*<-6>80,99/2385-<70>*942701<+*790/+-,//-7*10-+*+655019170195/+6+6",
"City": "深圳市",
"Code": "044032000111",
"CodeConfirm": "",
"CompanySealContent": "",
"CompanySealMark": 0,
"Date": "2020年07月23日",
"ElectronicFullMark": 0,
"ElectronicFullNumber": "",
"FormName": "",
"FormType": "",
"Issuer": "管理员",
"Kind": "服务",
"MachineCode": "917000204032",
"Number": "24835712",
"NumberConfirm": "",
"OilMark": 0,
"PretaxAmount": "0.99",
"Province": "广东省",
"QRCodeMark": 1,
"Receiptor": "管理员",
"Remark": "",
"Reviewer": "管理员",
"Seller": "深圳市优优然科技有限公司",
"SellerAddrTel": "深圳市南山区西丽街道大勘工业区工业二路6号3070755-88357790",
"SellerBankAccount": "招商银行股份有限公司深圳泰然金谷支行755941044110601",
"SellerTaxID": "91440300MA5F9J49XQ",
"ServiceName": "",
"SubTax": "",
"SubTotal": "",
"Tax": "0.01",
"TaxSealContent": "全国统一发票监制章,国家税务总局,深圳市税务局",
"Title": "深圳增值税电子普通发票",
"Total": "1.00",
"TotalCn": "壹圆整",
"TransitMark": 0,
"TravelTax": "",
"VatInvoiceItemInfos": [
{
"DateEnd": "",
"DateStart": "",
"LicensePlate": "",
"Name": "*研发和技术服务*研发服务",
"Price": "",
"Quantity": "",
"SerialNumber": "",
"Specification": "",
"Tax": "0.01",
"TaxRate": "1%",
"Total": "0.99",
"Unit": "",
"VehicleType": ""
}
]
},
"VatElectronicInvoiceBlockchain": null,
"VatElectronicInvoiceFull": null,
"VatElectronicInvoiceToll": null,
"VatElectronicSpecialInvoice": null,
"VatElectronicSpecialInvoiceFull": null,
"VatInvoiceRoll": null,
"VatSalesList": null,
"VatSpecialInvoice": null
},
"SubType": "VatElectronicCommonInvoice",
"SubTypeDescription": "增值税电子普通发票",
"Type": 3,
"TypeDescription": "增值税发票"
}
],
"RequestId": "185c33dd-2b59-41d2-8073-551f39bcb56b",
"TotalPDFCount": 1
}
}
以上是在线调用的示例,实际开发中我们更多会用程序调用API的方法,下面是票据识别API的调用示例:
.NET代码示例:
using System;
using System.Threading.Tasks;
using Newtonsoft.Json;
using TencentCloud.Common;
using TencentCloud.Common.Profile;
using TencentCloud.Ocr.V20181119;
using TencentCloud.Ocr.V20181119.Models;
namespace TencentCloudExamples
{
class VatInvoiceOCR
{
static void Main(string[] args)
{
try
{
Credential cred = new Credential {
SecretId = "********",
SecretKey = "********"
};
ClientProfile clientProfile = new ClientProfile();
HttpProfile httpProfile = new HttpProfile();
httpProfile.Endpoint = ("ocr.tencentcloudapi.com");
clientProfile.HttpProfile = httpProfile;
OcrClient client = new OcrClient(cred, "", clientProfile);
VatInvoiceOCRRequest req = new VatInvoiceOCRRequest();
VatInvoiceOCRResponse resp = client.VatInvoiceOCRSync(req);
Console.WriteLine(AbstractModel.ToJsonString(resp));
}
catch (Exception e)
{
Console.WriteLine(e.ToString());
}
}
}
}
还有更多的应用场景,例如通用文字识别相关接口、卡证文字识别相关接口、票据单据识别相关接口、文本图像增强相关接口、特定场景识别相关接口、智能扫码相关接口、智能结构化识别相关接口、文字识别API2022相关接口、其他接口等等很多应用场景
如下链接进入OCR的产品demo体验
如下所示对文档进行解析识别
如下所示对商户门头照识别
如下所示对通用文本图像告警识别
还有很多OCR体验就不一一展示了,可以登录体验更多内容
腾讯云的智能结构化 OCR 平台展现出了其在 OCR 领域的深厚技术实力和广泛的应用潜力。从使用体验来看,其简洁明了的操作界面和丰富多样的功能模块令人印象深刻。在商户门头照识别和票据识别场景中,不仅能够准确地提取关键信息,而且提供的结构化数据具有高度的可用性,例如在商户门头照识别中,详细的商店信息(包括名称、位置和标签等)能够直接为商业数据分析提供有力支持;票据识别中对于各类发票的精准解析,涵盖了从基本的发票抬头、金额到复杂的税务信息等,有助于企业财务流程的自动化和精准化管理。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。