前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >【玩转OCR】腾讯云智能结构化OCR文字识别应用场景与技术应用

【玩转OCR】腾讯云智能结构化OCR文字识别应用场景与技术应用

原创
作者头像
阿齐Archie
发布2024-12-31 12:13:56
发布2024-12-31 12:13:56
1680
举报

前言:在当今数字化快速发展的时代,光学字符识别(OCR)技术已成为众多领域不可或缺的工具,它能够将图像中的文字信息快速、准确地转化为可编辑的文本格式,极大地提高了数据处理的效率和准确性。腾讯云的智能结构化 OCR 平台作为行业内的领先解决方案,具备强大且丰富的功能,涵盖了从商户门头照识别到票据识别以及众多其他应用场景,旨在满足不同用户在不同业务场景下的多样化需求。

本文介绍腾讯云智能结构化 OCR 平台的使用方法,通过逐步的操作指引和实际案例展示。

1.腾讯云的智能结构化OCR平台使用介绍

进入腾讯云的智能结构化OCR主页,点击开通服务,如下链接

智能结构化OCR_定制模板OCR_自定义文字识别-腾讯云

认证之后,点击立即开通

 然后点击进入控制台

搜索 API Explorer

选择左侧API Explorer进入如下界面,在搜索框搜索OCR

接下来进行实际场景的应用实践

2.OCR场景应用

2.1 商户门头照识别

首先,准备商户门头照的图片,例如下图

然后接着以下页面,首先选择该场景的应用为商户门头照,第二步输入参数(默认),第三步上传准备好的商户门头照图片,第四步,点击发送请求,得到响应结果 

如下为调用后识别的结果,提供识别后的结构化数据。

代码语言:txt
复制
{
  "Response": {
    "Angle": -1.6752146482467651,
    "RequestId": "5d75952d-adaf-4284-ab9f-4379dc62fde9",
    "StoreInfo": [
      {
        "Name": "商店名称",
        "Rect": {
          "Height": 131,
          "Width": 454,
          "X": 298,
          "Y": 200
        },
        "Value": "进口超市"
      }
    ],
    "StoreLabel": [
      "标准门头照"
    ]
  }
}

以下是基于 HTTP 的 GET 请求 API的程序示例,来调用API 

代码语言:txt
复制
import requests
 
 
def call_api():
    api_url = "替换为实际的 API 地址"
    try:
        response = requests.get(api_url)
        response.raise_for_status()  # 检查请求是否成功
        data = response.json()
        print(data)
        # 在这里可以根据返回的数据结构进行进一步处理
        angle = data["Response"]["Angle"]
        request_id = data["Response"]["RequestId"]
        store_info = data["Response"]["StoreInfo"]
        store_label = data["Response"]["StoreLabel"]
        print(f"Angle: {angle}")
        print(f"RequestId: {request_id}")
        print(f"StoreInfo: {store_info}")
        print(f"StoreLabel: {store_label}")
    except requests.exceptions.RequestException as e:
        print(f"请求 API 时发生错误: {e}")
    except KeyError as e:
        print(f"解析 API 响应数据时发生错误: {e}")
 
 
if __name__ == "__main__":
    call_api()

2.2 票据识别

首先,准备发票的图片,例如下图的一张发票

然后接着以下页面,首先选择该场景的应用为通用票据识别(高级版),第二步输入参数(默认),第三步上传准备好的发票图片,第四步,点击发送请求,得到响应结果

如下为调用后识别的结果,提供识别后的结构化数据。

代码语言:txt
复制
{
  "Response": {
    "MixedInvoiceItems": [
      {
        "Angle": 0,
        "Code": "OK",
        "CutImage": "",
        "ItemPolygon": [],
        "Page": 1,
        "Polygon": {
          "LeftBottom": {
            "X": 0,
            "Y": 546
          },
          "LeftTop": {
            "X": 0,
            "Y": 0
          },
          "RightBottom": {
            "X": 846,
            "Y": 546
          },
          "RightTop": {
            "X": 846,
            "Y": 0
          }
        },
        "SingleInvoiceInfos": {
          "AirTransport": null,
          "BusInvoice": null,
          "ElectronicFlightTicketFull": null,
          "ElectronicTrainTicketFull": null,
          "MachinePrintedInvoice": null,
          "MedicalHospitalizedInvoice": null,
          "MedicalOutpatientInvoice": null,
          "MotorVehicleSaleInvoice": null,
          "NonTaxIncomeElectronicBill": null,
          "NonTaxIncomeGeneralBill": null,
          "OtherInvoice": null,
          "QuotaInvoice": null,
          "ShippingInvoice": null,
          "TaxiTicket": null,
          "TollInvoice": null,
          "TrainTicket": null,
          "UsedCarPurchaseInvoice": null,
          "VatCommonInvoice": null,
          "VatElectronicCommonInvoice": {
            "AcquisitionMark": 0,
            "AgentMark": 0,
            "BlockChainMark": 0,
            "Buyer": "深圳市联云计算机科技有限公司",
            "BuyerAddrTel": "深圳市南山区西丽大勘工业区工业二路6号3080755-88357790",
            "BuyerBankAccount": "中国银行深圳分行754957928561",
            "BuyerTaxID": "91440300555442072M",
            "CheckCode": "01282388107430782375",
            "Ciphertext": "00-9864668**29112*65606376-2,441*/*-315<566><<-7<>*<-6>80,99/2385-<70>*942701<+*790/+-,//-7*10-+*+655019170195/+6+6",
            "City": "深圳市",
            "Code": "044032000111",
            "CodeConfirm": "",
            "CompanySealContent": "",
            "CompanySealMark": 0,
            "Date": "2020年07月23日",
            "ElectronicFullMark": 0,
            "ElectronicFullNumber": "",
            "FormName": "",
            "FormType": "",
            "Issuer": "管理员",
            "Kind": "服务",
            "MachineCode": "917000204032",
            "Number": "24835712",
            "NumberConfirm": "",
            "OilMark": 0,
            "PretaxAmount": "0.99",
            "Province": "广东省",
            "QRCodeMark": 1,
            "Receiptor": "管理员",
            "Remark": "",
            "Reviewer": "管理员",
            "Seller": "深圳市优优然科技有限公司",
            "SellerAddrTel": "深圳市南山区西丽街道大勘工业区工业二路6号3070755-88357790",
            "SellerBankAccount": "招商银行股份有限公司深圳泰然金谷支行755941044110601",
            "SellerTaxID": "91440300MA5F9J49XQ",
            "ServiceName": "",
            "SubTax": "",
            "SubTotal": "",
            "Tax": "0.01",
            "TaxSealContent": "全国统一发票监制章,国家税务总局,深圳市税务局",
            "Title": "深圳增值税电子普通发票",
            "Total": "1.00",
            "TotalCn": "壹圆整",
            "TransitMark": 0,
            "TravelTax": "",
            "VatInvoiceItemInfos": [
              {
                "DateEnd": "",
                "DateStart": "",
                "LicensePlate": "",
                "Name": "*研发和技术服务*研发服务",
                "Price": "",
                "Quantity": "",
                "SerialNumber": "",
                "Specification": "",
                "Tax": "0.01",
                "TaxRate": "1%",
                "Total": "0.99",
                "Unit": "",
                "VehicleType": ""
              }
            ]
          },
          "VatElectronicInvoiceBlockchain": null,
          "VatElectronicInvoiceFull": null,
          "VatElectronicInvoiceToll": null,
          "VatElectronicSpecialInvoice": null,
          "VatElectronicSpecialInvoiceFull": null,
          "VatInvoiceRoll": null,
          "VatSalesList": null,
          "VatSpecialInvoice": null
        },
        "SubType": "VatElectronicCommonInvoice",
        "SubTypeDescription": "增值税电子普通发票",
        "Type": 3,
        "TypeDescription": "增值税发票"
      }
    ],
    "RequestId": "185c33dd-2b59-41d2-8073-551f39bcb56b",
    "TotalPDFCount": 1
  }
}

以上是在线调用的示例,实际开发中我们更多会用程序调用API的方法,下面是票据识别API的调用示例:

.NET代码示例:

代码语言:txt
复制
using System;
using System.Threading.Tasks;
using Newtonsoft.Json;
using TencentCloud.Common;
using TencentCloud.Common.Profile;
using TencentCloud.Ocr.V20181119;
using TencentCloud.Ocr.V20181119.Models;
 
namespace TencentCloudExamples
{
    class VatInvoiceOCR
    {
        static void Main(string[] args)
        {
            try
            {
                Credential cred = new Credential {
                    SecretId = "********",
                    SecretKey = "********"
                };
                ClientProfile clientProfile = new ClientProfile();
                HttpProfile httpProfile = new HttpProfile();
                httpProfile.Endpoint = ("ocr.tencentcloudapi.com");
                clientProfile.HttpProfile = httpProfile;
                OcrClient client = new OcrClient(cred, "", clientProfile);
                VatInvoiceOCRRequest req = new VatInvoiceOCRRequest();
                VatInvoiceOCRResponse resp = client.VatInvoiceOCRSync(req);
                Console.WriteLine(AbstractModel.ToJsonString(resp));
            }
            catch (Exception e)
            {
                Console.WriteLine(e.ToString());
            }
        }
    }
}

2.3其他应用场景

还有更多的应用场景,例如通用文字识别相关接口、卡证文字识别相关接口、票据单据识别相关接口、文本图像增强相关接口、特定场景识别相关接口、智能扫码相关接口、智能结构化识别相关接口、文字识别API2022相关接口、其他接口等等很多应用场景

3.OCR产品demo体验

如下链接进入OCR的产品demo体验

OCR Demo

如下所示对文档进行解析识别

 如下所示对商户门头照识别

如下所示对通用文本图像告警识别 

还有很多OCR体验就不一一展示了,可以登录体验更多内容 

4.个人见解

腾讯云的智能结构化 OCR 平台展现出了其在 OCR 领域的深厚技术实力和广泛的应用潜力。从使用体验来看,其简洁明了的操作界面和丰富多样的功能模块令人印象深刻。在商户门头照识别和票据识别场景中,不仅能够准确地提取关键信息,而且提供的结构化数据具有高度的可用性,例如在商户门头照识别中,详细的商店信息(包括名称、位置和标签等)能够直接为商业数据分析提供有力支持;票据识别中对于各类发票的精准解析,涵盖了从基本的发票抬头、金额到复杂的税务信息等,有助于企业财务流程的自动化和精准化管理。

体验链接

智能结构化OCR_定制模板OCR_自定义文字识别-腾讯云

文字识别特惠活动_文字识别购买_文字识别选购- 腾讯云

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.腾讯云的智能结构化OCR平台使用介绍
  • 2.OCR场景应用
    • 2.1 商户门头照识别
    • 2.2 票据识别
    • 2.3其他应用场景
  • 3.OCR产品demo体验
  • 4.个人见解
    • 体验链接
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档