Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >C#实战:基于腾讯云智能体开发平台原子能力提供的文档解析API快速提取图片信息为MD文档

C#实战:基于腾讯云智能体开发平台原子能力提供的文档解析API快速提取图片信息为MD文档

原创
作者头像
小明互联网技术分享社区
修改于 2025-02-26 01:32:29
修改于 2025-02-26 01:32:29
33300
代码可运行
举报
文章被收录于专栏:IT技术分享社区IT技术分享社区
运行总次数:0
代码可运行

今天借助腾讯云智能体开发平台原子能力提供的文档解析API快速提取图片信息为MD文档的WinFomr应用小案例,感兴趣的朋友可以看一下!

一、腾讯云智能体开发平台 LKE介绍

官方介绍:腾讯云智能体开发平台(LLM Knowledge Engine),是面向企业客户及合作伙伴的,基于大模型的应用构建平台,结合企业专属数据,更快更高效地搭建Agent、RAG、工作流等多种模式应用,推动大语言模型在企业中的应用落地。

腾讯云智能体开发平台 LKE: https://cloud.tencent.com/product/lke

1.1 如何开通服务?

点击【产品体验】按钮进入服务开通页面大概需要半分钟左右的时间,具体如下图:

开通成功之后如下图:

1.2 腾讯云智能体开发平台组成

腾讯云智能体开发平台主要分为四个模块:

应用管理:个人创建的大模型应用管理主界面。如果没有创建应用的话,默认为创建界面。

原子能力:已API接口的方式提供给开发者自行构建大模型专属应用。主要包括多轮改写、Embedding、重排序、文档解析四大能力。

插件中心:通过插件能帮助知识引擎开发应用拓展功能,支持有开发能力者丰富应用内容,相当于是知识引擎应用能力的补充。

体验中心:基于知识引擎推出的最佳实践应用,大家可以基于推荐的应用创建为自己的应用,然后进行功能进一步丰富。

腾讯云2月8日上线DeepSeek-R1及V3原版模型API接口,依托腾讯云强大的公有云服务,为大家提供了稳定优质的接口调用服务。这里主要依靠腾讯云提供的API接口来实现。

二、案例实战

使用技术:C#+VS2022+WinFrom

完整的案例流程如下图:

2.1、创建项目

首先打开vs2022创建一个Winfrom项目

点击下一步输入项目名称【TDeepSeekChengYuDemo】,然后点击创建按钮。

空白项目创建之后效果如下图:

2.2、引入腾讯腾讯云智能体开发平台 LKE调用SDK依赖库

Nuget包管理器(推荐)

打开NuGet包管理器搜索”TencentCloudSDK.Lke“

然后点击安装即可。安装成功之后效果如下图:

命令行方式

打开程序包管理控制台输入如下命令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
dotnet add package TencentCloudSDK.Lke

2.3、代码编写

然后新建一个工具类库ImageOCRUtils.cs用来调用大模型API接口,创建如下图:

主要代码逻辑

创建文档解析任务的方法

参考官方SDK示例进行封装方法如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 /// <summary>
 /// 第一步 创建文档解析任务
 /// </summary>
 /// <param name="imageUrl"></param>
 /// <returns></returns>
 public static string CreateImageOcrTask(string imageUrl)
 {
     try
     {
 
         // 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取
         Credential cred = new Credential
         {
             SecretId = "",
             SecretKey = ""
         };
         // 实例化一个client选项,可选的,没有特殊需求可以跳过
         ClientProfile clientProfile = new ClientProfile();
         // 实例化一个http选项,可选的,没有特殊需求可以跳过
         HttpProfile httpProfile = new HttpProfile();
         httpProfile.Endpoint = ("lke.tencentcloudapi.com");
         clientProfile.HttpProfile = httpProfile;

         // 实例化要请求产品的client对象,clientProfile是可选的
         LkeClient client = new LkeClient(cred, "ap-guangzhou", clientProfile);
         // 实例化一个请求对象,每个接口都会对应一个request对象
         CreateReconstructDocumentFlowRequest req = new CreateReconstructDocumentFlowRequest();        
         req.FileUrl = imageUrl;
         CreateReconstructDocumentFlowConfig createReconstructDocumentFlowConfig1 = new CreateReconstructDocumentFlowConfig();
         createReconstructDocumentFlowConfig1.TableResultType = "1";
         createReconstructDocumentFlowConfig1.ResultType = "0";
         req.Config = createReconstructDocumentFlowConfig1;
         // 返回的resp是一个CreateReconstructDocumentFlowResponse的实例,与请求对象对应
         CreateReconstructDocumentFlowResponse resp = client.CreateReconstructDocumentFlowSync(req);
         // 输出json格式的字符串回包
         Console.WriteLine(AbstractModel.ToJsonString(resp));
         
         return resp.TaskId;
     }
     catch (Exception e)
     {
         Console.WriteLine(e.ToString());
         return "-1";
     }
 }

输入参数引用官方文档

参数名称

必选

类型

描述

Action

String

公共参数,本接口取值:CreateReconstructDocumentFlow。

Version

String

公共参数,本接口取值:2023-11-30。

Region

String

公共参数,详见产品支持的 地域列表。

FileType

String

文件类型。支持的文件类型:PDF、DOC、DOCX、PPT、PPTX、MD、TXT、XLS、XLSX、CSV、PNG、JPG、JPEG、BMP、GIF、WEBP、HEIC、EPS、ICNS、IM、PCX、PPM、TIFF、XBM、HEIF、JP2。示例值:PDF

FileBase64

String

文件的 Base64 值。支持的文件大小:所下载文件经Base64编码后不超过 8M。文件下载时间不超过 3 秒。支持的图片像素:单边介于20-10000px之间。文件的 FileUrl、FileBase64 必须提供一个,如果都提供,只使用 FileUrl。

FileUrl

String

文件的Url地址。文件下载时间不超过15秒。支持的图片像素:单边介于20-10000px之间。文件存储于腾讯云的Url可保障更高的下载速度和稳定性,建议文件存储于腾讯云。非腾讯云存储的 Url 速度和稳定性可能受一定影响。所下载文件经 Base64 编码后不超过支持的文件大小:文件类型支持的文件大小PDF200MDOC200MDOCX200MPPT200MPPTX200MMD10MTXT10MXLS20MXLSX20MCSV20MPNG20MJPG20MJPEG20MBMP20MGIF20MWEBP20MHEIC20MEPS20MICNS20MIM20MPCX20MPPM20MTIFF20MXBM20MHEIF20MJP220M

FileStartPageNumber

Integer

当传入文件类型为PDF、DOC、DOCX、PPT、PPTX,用来指定文件识别的起始页码,识别的页码包含当前值。默认为1,表示从文件的第1页开始识别。示例值:1

FileEndPageNumber

Integer

当传入文件类型为PDF、DOC、DOCX、PPT、PPTX,用来指定文件识别的结束页码,识别的页码包含当前值。默认为100,表示识别到文件的第100页。单次调用最多支持识别1000页内容,即FileEndPageNumber-FileStartPageNumber需要不大于1000。示例值:100

Config

CreateReconstructDocumentFlowConfig

创建文档解析任务配置信息。示例值:{"TableResultType":"1"}

输出参数参考官方文档如下图:

正确返回参数json示例

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
{
    "TaskId": "cf79a3db3a3446cea2f96a14439091f3",
    "RequestId": "5a734b18-cfd4-43ad-851c-511fcc8bcb03"
}

查询文档解析结果逻辑

根据上一步获取的TaskId查询文档解析结果,返回值为文件URL,文件类型为压缩包,具体代码如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
  / /// <summary>
 /// 第二步 根据任务ID获取文档地址
 /// </summary>
 /// <param name="taskId"></param>
 /// <returns></returns>
 public static string GetResultDocumentUrl(string taskId)
 {

     try
     {

         // 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取
         Credential cred = new Credential
         {
             SecretId = "",
             SecretKey = ""
         };
         // 实例化一个client选项,可选的,没有特殊需求可以跳过
         ClientProfile clientProfile = new ClientProfile();
         // 实例化一个http选项,可选的,没有特殊需求可以跳过
         HttpProfile httpProfile = new HttpProfile();
         httpProfile.Endpoint = ("lke.tencentcloudapi.com");
         clientProfile.HttpProfile = httpProfile;

         // 实例化要请求产品的client对象,clientProfile是可选的
         LkeClient client = new LkeClient(cred, "ap-guangzhou", clientProfile);
         // 实例化一个请求对象,每个接口都会对应一个request对象
         GetReconstructDocumentResultRequest req = new GetReconstructDocumentResultRequest();
         req.TaskId = taskId;
         // 返回的resp是一个GetReconstructDocumentResultResponse的实例,与请求对象对应
         GetReconstructDocumentResultResponse resp = client.GetReconstructDocumentResultSync(req);
         // 输出json格式的字符串回包
         Console.WriteLine(AbstractModel.ToJsonString(resp));
         return resp.DocumentRecognizeResultUrl;
     }
     catch (Exception e)
     {
         Console.WriteLine(e.ToString());
         return e.ToString();
     }
 }

输入参数,引用官方文档如下图:

输出参数,引用官方文档如下图:

特别注意:

  • 文档解析的结果文件,存储在腾讯云COS的下载URL,下载URL的有效期为10分钟。
  • 需要创建和获取自己的API开发密钥,具体请访问 https://console.cloud.tencent.com/cam/capi
  • 一定要妥善保存自己的开发API密钥,避免造成不必要的损失

正确返回json示例

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
{
    "Status": "Success",
    "DocumentRecognizeResultUrl": "https://document-restruction-prod-1258344699.cos.ap-guangzhou.myqcloud.com/doc_parse%2Foutput_files%2F2025-02-25%2Fcf79a3db3a3446cea2f96a14439091f3.zip?q-sign-algorithm=sha1&q-ak=AKIDlWFap6HLNbidLwPqOrAKGzXrx40scL7l&q-sign-time=1740465273%3B1740465873&q-key-time=1740465273%3B1740465873&q-header-list=host&q-url-param-list=&q-signature=e03d151f58f281cc743c9968f6ce449c32a82cc9",
    "FailedPages": [

    ],
    "RequestId": "e3cbb116-2650-4f09-ba7a-98c339360479"
}

第三步根据文档URL下载压缩包到本地

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
/// <summary>
/// 第三步 根据文档url下载文档识别后的ZIP
/// </summary>
/// <param name="fileUrl"></param>
public static string DownloadFile(string fileUrl)
{       
   // 获取当前时间
    DateTime now = DateTime.Now;

    // 格式化时间戳,确保文件名合法且不包含非法字符
    string timestamp = now.ToString("yyyyMMdd_HHmmss_fff");
    string filePath = @"D:\OCRTest\"+ timestamp+".zip"; // 文件保存路径          
    try
    {
        using (WebClient client = new WebClient())
        {
            // 下载文件到指定路径
            client.DownloadFile(fileUrl, filePath);
            return UnzipFile(filePath, timestamp); 
        }
    }
    catch (Exception ex)
    {
        MessageBox.Show($"下载失败: {ex.Message}");
        return "-1";
    }
}

说明:根据时间戳命名下载结果文件的Zip压缩包文件。

解压压缩包到指定目录,这里使用了SharpZipLib类库,大家直接使用nuget搜索安装即可。具体如下图:

解压压缩包主要是为了得到目录结构进行TreeView控件展示,主要代码如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 /// <summary>
 /// 第四步 解压zip 用来展示结果文件
 /// </summary>
 /// <param name="zipFilePath"></param>
 /// <param name="destinationFolder"></param>
 private static string UnzipFile(string zipFilePath,string fileName)
 {
     try
     {
         string destinationFolder = @"D:\OCRTest\"+ fileName;
         // 确保目标文件夹存在
         if (!Directory.Exists(destinationFolder))
         {
             Directory.CreateDirectory(destinationFolder);
         }

         // 解压ZIP文件到指定的目标文件夹

         (new FastZip()).ExtractZip(zipFilePath,destinationFolder, "");

         Console.WriteLine("解压完成!");
         return destinationFolder;
     }
     catch (Exception ex)
     {
         Console.WriteLine($"解压过程中发生错误: {ex.Message}");
         return "-1";
     }
 }

2.4、界面设计

因为接口调用为异步调用为了方便快速实现分成了三个按钮:【创建文档解析任务】、【获取解析文件URL】、【获取解析结果】按照顺序点击进行解析结果的获取,界面效果如下图:

主要代码如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
        private void LoadFolderStructure(string folderPath)
        {
            // 清除现有的节点
            treeView1.Nodes.Clear();

            // 创建根节点
            TreeNode rootNode = new TreeNode(new DirectoryInfo(folderPath).Name);
            rootNode.Tag = folderPath; // 存储路径信息以便后续使用
            rootNode.Expand();
            treeView1.Nodes.Add(rootNode);

            // 开始递归加载子文件夹
            PopulateTreeView(rootNode, folderPath);
        }

        private void PopulateTreeView(TreeNode parentNode, string folderPath)
        {
            try
            {
                // 获取所有子文件夹
                DirectoryInfo dirInfo = new DirectoryInfo(folderPath);
                DirectoryInfo[] subDirs = dirInfo.GetDirectories();

                foreach (DirectoryInfo dir in subDirs)
                {
                    TreeNode node = new TreeNode(dir.Name);
                    node.Tag = dir.FullName; // 存储路径信息以便后续使用
                    parentNode.Nodes.Add(node);

                    // 递归调用以加载子文件夹
                    PopulateTreeView(node, dir.FullName);
                    node.Expand();
                }

                FileInfo[] files = dirInfo.GetFiles();
                foreach (FileInfo file in files)
                {
                    TreeNode fileNode = new TreeNode(file.Name);
                    fileNode.Tag = file.FullName;
                    fileNode.ImageIndex = 1; // 文件图标索引
                    fileNode.SelectedImageIndex = 1;
                    parentNode.Nodes.Add(fileNode);
                }
            }
            catch (UnauthorizedAccessException ex)
            {
                MessageBox.Show($"访问被拒绝: {ex.Message}", "错误", MessageBoxButtons.OK, MessageBoxIcon.Error);
            }
            catch (Exception ex)
            {
                MessageBox.Show($"发生错误: {ex.Message}", "错误", MessageBoxButtons.OK, MessageBoxIcon.Error);
            }
        }

        private void btnFirst_Click(object sender, EventArgs e)
        {
            if (string.IsNullOrWhiteSpace(txtFileUrl.Text))
            {
                MessageBox.Show("请输入需要解析的图片URL");
            }
            else
            {
                string taskId = ImageOCRUtils.CreateImageOcrTask(txtFileUrl.Text);
                txtTaskId.Text = taskId;
            }

        }

        private void btnResult_Click(object sender, EventArgs e)
        {
            string documentUrl = txtDocumentUrl.Text;
            if (string.IsNullOrWhiteSpace(documentUrl))
            {
                MessageBox.Show("请先获取解析结果文档URL");
            }
            else
            {
                if (documentUrl == "-1")
                {
                    MessageBox.Show("解析结果文档UR获取失败!");
                }
                else
                {
                    string result = ImageOCRUtils.DownloadFile(documentUrl);
                    // 可以在窗体初始化时加载文件夹结构
                    LoadFolderStructure(result);
                    MessageBox.Show(result);
                }
            }
        }
        /// <summary>
        /// 获取文档URL
        /// </summary>
        /// <param name="sender"></param>
        /// <param name="e"></param>
        private void button1_Click(object sender, EventArgs e)
        {
            string taskId = txtTaskId.Text;
            if (string.IsNullOrWhiteSpace(taskId))
            {
                MessageBox.Show("请先获取创建文档任务返回的TaskId");
            }
            else
            {
                if (taskId == "-1")
                {
                    MessageBox.Show("TaskId获取失败!");
                }
                else
                {
                    string documentUrl = ImageOCRUtils.GetResultDocumentUrl(taskId);
                    txtDocumentUrl.Text = documentUrl;
                }
            }
           
        }

说明:主要包括按钮点击事件和加载解析结果的树形结构逻辑。

这里选择我之前文章的一个图片(主要是DeepSeek-R1模型介绍的图片)进行解析,图片如下:

具体调用最终效果

说明:需要按钮步骤进行文档解析结果。

我们打开解析后的MarkDown文档查看解析的实际效果

文档结构如下:

接着使用Typoa进行打开效果如下:

整体解析的效果还是非常棒的。并且生成的MD文件进行了段落比较合理的分组。

三、总结

以上是基于腾讯云智能体开发平台原子能力提供的文档解析接口轻松实现图片解析为MarkDown文档的小案例。整体接口调用不管是稳定性还是准确度都是非常可靠的,感兴趣的朋友可以基于腾讯云智能体开发平台提供的各种能力创造出更多提升工作效率的专属应用,针对该案例大家如果有相关问题的话欢迎沟通交流!

GitHub案例代码

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
腾讯云智能体开发平台×DeepSeek | 企业应用快速接入手册
其实早就该写这篇文章的,只是有各种原因耽搁了,一方面是由于确实想好好写,想写一点大家可以用的上的东西,考虑的太多反而不敢下笔;另一方面也是因为一直没想好写哪个方向的内容。本次的 腾讯云智能体开发平台×DeepSeek 的测评活动一共提供了两个方向:应用搭建模式(低代码) 和 API开发模式(代码态) 。两个方向各有特点,不同的文章创作者适合不同的写作方向。本来是准备写应用搭建模式(低代码)方向的,但是根据官方活动群的反馈,应用搭建模式方向写的人比较多,那么就切换到 API开发模式方向来创作吧。本次活动的链接:https://cloud.tencent.com/developer/article/2496399 这里也期待更多的技术从业者能够参与进来,来帮助企业探索好产品,同时也可以促进官方产品更完善。多余的话就不说了,下面开始正文内容…
六月的雨在Tencent
2025/03/24
6750
C#实战:基于腾讯云智能体开发平台×DeepSeekAPI接口快速搭建成语知多少小应用
成语作为中国汉字文化当中非常重要的一部分,很多成语都蕴含着古代的智慧、做人准则。了解成语对于大家的好处还是非常多的。今天借助腾讯云智能体开发平台×DeepSeek提供的API接口写一个成语知识知多少的WinFomr应用小案例,感兴趣的朋友可以看一下!
小明互联网技术分享社区
2025/03/31
1930
C#实战:基于腾讯云智能体开发平台×DeepSeekAPI接口快速搭建成语知多少小应用
腾讯云智能体开发平台 API 的开发实战:基于RAG的论文阅读助手
科研工作者,尤其是那些奋战在知识前沿的探索者们,正面临着信息洪流的巨大挑战。每天都有如潮水般涌来的学术论文,这既是机遇,也是重负。
Lion 莱恩呀
2025/03/02
6371
腾讯云智能体开发平台 API 的开发实战:基于RAG的论文阅读助手
C#实战:使用腾讯云识别服务轻松提取火车票信息
公司内部涉及到车票报销的时候一个个输入火车票信息非常麻烦,尤其是出差比较多的企业,这对于财务人员的涉及报销单据录入还是非常麻烦的。今天给大家分享使用腾讯云车票识别服务,轻松提取火车票信息。这样可以方便把识别服务集成到业务系统,可以大大减轻财务人员录入单据信息的工作量。今天采用C#编程语言给大家提供一个可用的Demo,感兴趣的朋友可以了解一下!
小明互联网技术分享社区
2024/11/07
3000
C#实战:使用腾讯云识别服务轻松提取火车票信息
腾讯云ES原子服务:RAG应用开发的"全能助手" | 6大核心API全解析
腾讯云ES原子服务是一个专为AI应用开发设计的一站式工具平台,它将RAG应用开发中的关键环节抽象为独立的API服务,使开发者能够灵活组合使用,大幅简化开发流程。这些服务涵盖了从数据准备、文本处理、向量化、检索到最终生成的完整链路,为RAG应用提供了全方位支持。
点火三周
2025/05/15
1201
腾讯云ES原子服务:RAG应用开发的"全能助手" | 6大核心API全解析
C#实战:基于腾讯云的图像服务实现图片清晰度增强介绍和案例实践
基于腾讯云深度学习等人工智能技术,消除图片因有损压缩导致的噪声,改善因使用滤镜、拍摄失焦等导致的图像模糊问题,让图片的边缘和细节更加清晰自然。
小明互联网技术分享社区
2024/04/24
5190
C#实战:基于腾讯云的图像服务实现图片清晰度增强介绍和案例实践
C#实战:使用腾讯云智能结构化识别服务轻松提取物流送货单信息,解决仓储物流信息录入的效率问题
对于生产制造型企业来说,信息化建设是非常重要的环节,如何高效的解决信息过程中信息高效率的录入对于信息化建设的推进和人工效率的提升非常的有帮助,今天从物流环节给大家介绍一下如何通过腾讯云智能结构化识别服务轻松提取送货单的信息,通过该功能可以减少物流人员信息的录入也可以大幅度减少人工录入出错后无法排查追溯原因的困境。本文通过C#+WinForm的方式给出一个实际的案例来实现,希望对大家能有所帮助!
小明互联网技术分享社区
2024/12/16
4300
C#实战:使用腾讯云智能结构化识别服务轻松提取物流送货单信息,解决仓储物流信息录入的效率问题
【图片PDF区域识别改名】基于WPF和腾讯云API实现PDF文档扫描、指定区域文字识别、固定位置文字识别以及文件批量重命名功能
票据处理:例如发票、收据等,在这些票据上特定位置通常包含关键信息,如发票号码、金额、日期等。通过指定识别区域,可以快速准确地提取这些信息并整理到 Excel 表格中,便于财务人员进行数据统计和管理。
不负众望
2025/02/25
7770
【图片PDF区域识别改名】基于WPF和腾讯云API实现PDF文档扫描、指定区域文字识别、固定位置文字识别以及文件批量重命名功能
C#实战:使用腾讯语音识别服务轻松完成音频文件识别功能
今天给大家分享一下使用腾讯语音识别服务轻松完成音频文件识别功能。这里使用的是C#编写的窗体应用。希望对大家了解和快速接入腾讯语音识别服务的朋友提供一些帮助!
小明互联网技术分享社区
2024/05/23
6920
C#实战:使用腾讯语音识别服务轻松完成音频文件识别功能
【批量图片区域识别改名】有没有可以自动批量识别jpg图片上的区域文字,并直接提取文字命名的软件么? 没有我们教你基于WPF和腾讯api的方案做一个
在很多实际工作场景中,我们可能会遇到大量的图片文件,这些图片中包含特定区域的文字信息,比如发票图片上的发票号码、合同图片上的合同编号等。手动识别并为图片命名效率极低且容易出错。使用自动批量识别 JPG 图片上的区域文字,并直接提取文字为图片命名的软件,可以大大提高工作效率,减少人工操作带来的错误。
不负众望
2025/02/24
3930
【批量图片区域识别改名】有没有可以自动批量识别jpg图片上的区域文字,并直接提取文字命名的软件么? 没有我们教你基于WPF和腾讯api的方案做一个
解锁云原生后端开发新姿势:腾讯云大模型API实战攻略
用户10679102
2025/03/23
2680
解锁云原生后端开发新姿势:腾讯云大模型API实战攻略
【图片区域识别】OCR指定区域图片自动识别内容重命名,指定图片多个识别区域,识别文字并批量对图片文件改名,基于WPF和腾讯OCR的完整实现方案
在快速发展的电商行业中,商品上架是一项繁琐且关键的工作。某电商店铺每天都要上架大量新商品,每个商品都配有多张展示图片,这些图片往往是从不同渠道收集而来,原始文件名毫无规律,如 “IMG_001.jpg”“product_pic2.png” 等。在上架商品时,运营人员需要逐一查看图片内容,确认商品款式、颜色、尺码等信息,然后手动将图片重命名为有意义的格式,例如 “商品名称_颜色_尺码_展示角度.jpg”,以便后续在商品详情页精准调用。这个过程耗时费力,一旦图片数量众多,还容易出现信息匹配错误。运用 OCR 指定区域图片自动识别内容重命名技术后,情况大为改观。运营人员预先设定好图片中包含商品名称、规格参数等信息的区域,OCR 系统自动识别这些区域文字,按照设定规则批量重命名图片。这一技术极大地提高了商品上架效率,降低出错率,让电商店铺运营更加高效有序,助力业务快速发展。
不负众望
2025/02/25
4470
【图片区域识别】OCR指定区域图片自动识别内容重命名,指定图片多个识别区域,识别文字并批量对图片文件改名,基于WPF和腾讯OCR的完整实现方案
如何批量识别图片文字并重命名,批量区域识别图片内容对图片改名,基于WPF和腾讯OCR的解决方案
在日常工作和生活中,我们常常需要处理大量的图片文件,这些图片可能包含重要的文字信息。手动识别这些文字并进行相应的处理(如重命名图片文件)既耗时又容易出错。为了解决这一问题,本项目旨在开发一个基于WPF(Windows Presentation Foundation)的桌面应用程序,结合腾讯OCR(光学字符识别)技术,实现批量识别图片中的文字并根据识别结果对图片进行重命名或区域内容识别后处理。
不负众望
2025/03/26
3320
如何批量识别图片文字并重命名,批量区域识别图片内容对图片改名,基于WPF和腾讯OCR的解决方案
基于腾讯云 DeepSeek 的 AI 智能阅读助手开发实践
在当今信息爆炸的时代,快速而高效地阅读文档和整理信息变得极其重要。专业人士、学生和学术研究者通常需要阅读大量的资料,而这些文档往往篇幅冗长、内容专业,需要耗费大量时间才能完全理解。特别是面对技术文档、学术论文或行业报告时,即使是领域专家也常常需要反复阅读才能掌握核心内容。
陈明勇
2025/03/19
60112
基于腾讯云 DeepSeek 的 AI 智能阅读助手开发实践
腾讯云API弹性公网IP踩坑
由于自己管理的云服务器数量比较多,时不时需要更换IP,在管理台上一下下点击,实在浪费时间,于是就想到了通过API调用的方式,将更换IP一系列动作,全部集成到Python代码里面,实现一行命令,完成IP更换,由于人懒,就先
用户2174879
2018/10/23
32.3K1
腾讯云API弹性公网IP踩坑
腾讯云语音识别.net-sdk使用笔记0818
github的地址:https://github.com/TencentCloud/tencentcloud-sdk-dotnet/tree/master/TencentCloud/Asr/V20190614
算法发
2020/08/18
1.9K0
腾讯云语音识别.net-sdk使用笔记0818
基于python利用腾讯云API Explorer实现家用宽带的动态DNS解析
先介绍了应用背景:用来使得域名能够正确对应上动态IP。然后介绍了完成这项功能需要用到的API接口,并简单实现了对应的API接口调用框架。最后为了使用更加简洁,对程序逻辑作了进一步优化。实践证明真理就在实践中!
EatRice
2021/11/04
14.1K4
腾讯云智能体开发平台驱动DeepSeek满血版能源革命大模型:架构、优势与产业变革
1. 按照以下步骤获取腾讯云大模型API密钥:这将为你提供SecretId和SecretKey,用于后续的身份验证。
Lethehong
2025/03/04
3610
腾讯云智能体开发平台驱动DeepSeek满血版能源革命大模型:架构、优势与产业变革
基于腾讯云语音产品的最佳技术实践 | 如何助力 CRM 传统营销方式降本增效
CRM 客户关系管理系统 通常是企业为提高核心竞争力,利用相应的信息技术以及互联网技术协调企业与客户间在销售、营销和服务上的交互,从而通过不断的优化,提升企业管理方式,向客户提供创新式的个性化的客户交互和服务的过程。
六月的雨在Tencent
2024/06/26
4120
腾讯云智能结构化OCR初体验:开启高效数据提取之旅
在数字化浪潮的推动下,企业面临着海量文档数据的处理挑战。传统的人工录入方式不仅效率低下,而且容易出错,严重影响了企业的运营效率。光学字符识别(OCR)技术的出现,为这一难题提供了有效的解决方案。腾讯云智能结构化OCR,凭借其卓越的技术实力和广泛的应用场景,正在成为企业数字化转型的重要助力。
LucianaiB
2025/01/10
1840
推荐阅读
腾讯云智能体开发平台×DeepSeek | 企业应用快速接入手册
6750
C#实战:基于腾讯云智能体开发平台×DeepSeekAPI接口快速搭建成语知多少小应用
1930
腾讯云智能体开发平台 API 的开发实战:基于RAG的论文阅读助手
6371
C#实战:使用腾讯云识别服务轻松提取火车票信息
3000
腾讯云ES原子服务:RAG应用开发的"全能助手" | 6大核心API全解析
1201
C#实战:基于腾讯云的图像服务实现图片清晰度增强介绍和案例实践
5190
C#实战:使用腾讯云智能结构化识别服务轻松提取物流送货单信息,解决仓储物流信息录入的效率问题
4300
【图片PDF区域识别改名】基于WPF和腾讯云API实现PDF文档扫描、指定区域文字识别、固定位置文字识别以及文件批量重命名功能
7770
C#实战:使用腾讯语音识别服务轻松完成音频文件识别功能
6920
【批量图片区域识别改名】有没有可以自动批量识别jpg图片上的区域文字,并直接提取文字命名的软件么? 没有我们教你基于WPF和腾讯api的方案做一个
3930
解锁云原生后端开发新姿势:腾讯云大模型API实战攻略
2680
【图片区域识别】OCR指定区域图片自动识别内容重命名,指定图片多个识别区域,识别文字并批量对图片文件改名,基于WPF和腾讯OCR的完整实现方案
4470
如何批量识别图片文字并重命名,批量区域识别图片内容对图片改名,基于WPF和腾讯OCR的解决方案
3320
基于腾讯云 DeepSeek 的 AI 智能阅读助手开发实践
60112
腾讯云API弹性公网IP踩坑
32.3K1
腾讯云语音识别.net-sdk使用笔记0818
1.9K0
基于python利用腾讯云API Explorer实现家用宽带的动态DNS解析
14.1K4
腾讯云智能体开发平台驱动DeepSeek满血版能源革命大模型:架构、优势与产业变革
3610
基于腾讯云语音产品的最佳技术实践 | 如何助力 CRM 传统营销方式降本增效
4120
腾讯云智能结构化OCR初体验:开启高效数据提取之旅
1840
相关推荐
腾讯云智能体开发平台×DeepSeek | 企业应用快速接入手册
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验