首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >用于将pdf转换为word的asp.net web应用程序

用于将pdf转换为word的asp.net web应用程序
EN

Stack Overflow用户
提问于 2012-10-31 08:02:57
回答 2查看 642关注 0票数 0

有没有明确和适当的过程来转换一个pdf文件到一个word文件中的所有格式和图像在asp.net网络应用程序?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-11-01 23:17:54

要做到这一点,最好的方法是使用OCR。它将识别PDF文件中的文本和图像,然后您可以将其保存到DOC文件中。我知道一个名为leadtools的第三方工具包,它应该可以帮助您满足您的需求,因为它支持ASP.NET环境。您可以查看他们的Online OCR Demo,也可以查看他们的网站以了解更多信息,或者联系他们的支持团队。

票数 1
EN

Stack Overflow用户

发布于 2012-10-31 15:16:43

PDF是一种表示格式,其中所有内容都按绝对位置放置。没有段落和其他结构化元素(除非它是带标签的PDF)。从技术上讲,您可以按任意顺序逐个字符输出每个单词,但从视觉上看,它看起来就像一个普通文本。因此,为了正确地转换为word,需要进行内容识别或某种类型的光学字符识别(例如ABBYY FineReader)

市场上有一些付费组件,允许进行文本提取,也有一些可以将页面转换为图像(显然,这不是转换为word的理想方法)。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13149363

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档